Cách truy vấn tìm kiếm TRƯỚC "có thể dùng để RE hạng kết quả tìm kiếm

Nó có thể cho người tìm kiếm truy vấn trước đó là công cụ tìm kiếm ảnh hưởng đến những gì bạn thấy trong kết quả tìm kiếm . Hãy tưởng tượng một công cụ tìm kiếm làm điều này:

Bạn tìm kiếm cho ” con chó ” trong công cụ tìm kiếm .
Công cụ tìm kiếm lấy một danh sách các trang mà nó tìm thấy có liên quan đến những kết quả.
Có vẻ thông qua các bản ghi truy vấn để tìm các truy vấn thường xuyên nhất ocurring bao gồm các từ ” chó ” như ” giống chó , tên con chó , con chó đống , các nhà lai tạo con chó , hình ảnh chó, chó đào tạo , sức khỏe con chó , con chó giường , thức ăn cho chó , con chó cũi , hình ảnh con chó , con nuôi con chó , con chó để bán, ” và số lần người tìm kiếm những người.
Công cụ tìm kiếm cũng nhìn vào những bản ghi truy vấn để tìm các truy vấn tìm kiếm thường xuyên nhất xảy ra mà đến ngay trước hoặc sau khi tìm kiếm cho những truy vấn khác có chứa từ ” con chó “, chẳng hạn như ” con mèo, vật nuôi, pitbull , Jack Russell Terrier , con chó con , động vật, collie biên giới , chihuahua , trò chơi . ”
Một mô hình ” ngôn ngữ” được tạo ra cho truy vấn của bạn , dựa trên những tìm kiếm khác từ các tập tin đăng nhập của người dùng, và nó được sử dụng để rerank kết quả tìm kiếm ban đầu.

Một ứng dụng bằng sáng chế vừa được công bố từ Microsoft mô tả chi tiết hơn cách người dùng truy vấn có thể được đưa vào như một sự mở rộng truy vấn và quá trình reranking .

Kết quả tìm kiếm lại xếp hạng dựa trên truy vấn nhật ký

Được phát minh bởi Silviu – Petru Cucerzan và Ziming Zhuang

Giao cho Microsoft
Ứng dụng bằng sáng chế Mỹ 20070214131
Publshed ngày 13 tháng 9 2007
Nộp : ngày 13 tháng 3 năm 2006

trừu tượng

Một hệ thống (s) và / hoặc phương pháp (s) để tạo điều kiện cải thiện sự liên quan của kết quả tìm kiếm thông qua sử dụng một bản ghi truy vấn. Sự liên quan của kết quả tìm kiếm cho một truy vấn mục tiêu có thể được đánh giá dựa trên một hoặc nhiều truy vấn trong nhật ký có liên quan đến các truy vấn mục tiêu về thời gian và / hoặc từ vựng . Sự đa dạng của các kết quả tìm kiếm hàng đầu xếp hạng có thể được tăng lên và / hoặc giảm dựa trên một quá trình tái cấp lặp đi lặp lại của tập kết quả tìm kiếm.

Điều thú vị về việc này là nó không chỉ có thông tin mà nó tìm thấy trên web để trở lại trang có liên quan để tìm kiếm , nhưng mà nó cũng xử lý các truy vấn tìm kiếm trước đó như một nguồn thông tin để đi vào xem xét khi cung cấp kết quả tìm kiếm cho người dân.

Trong quá trình này , cả số lượng các truy vấn khác , và tần số và recency rằng họ đang thực hiện với có thể ảnh hưởng đến reranking kết quả, cũng như ngôn ngữ thực tế được sử dụng trong các truy vấn ban đầu của chính nó.

Công cụ tìm kiếm sẽ được thực hiện một số ” suy luận ” trong việc sử dụng trước đây cho các truy vấn tìm kiếm bao gồm các hạn hoặc các điều khoản được tìm kiếm . Tôi thích đoạn này từ khi nộp đơn sáng chế, trong đó mô tả những gì từ ” suy luận ” có nghĩa là trong bối cảnh của tài liệu này : công ty seo website

Như sử dụng ở đây , thuật ngữ ” suy luận ” là nói chung đến quá trình suy luận về suy luận hoặc trạng thái của hệ thống , môi trường, và / hoặc người sử dụng từ một tập hợp các quan sát như nắm bắt thông qua các sự kiện và / hoặc dữ liệu.

Suy luận có thể được sử dụng để xác định một ngữ cảnh hoặc hành động cụ thể , hoặc có thể tạo ra một phân bố xác suất trên các trạng thái , ví dụ.

Suy luận có thể xác suất – có nghĩa là, các tính toán của một phân bố xác suất trên các trạng thái của lãi suất dựa trên việc xem xét dữ liệu và các sự kiện .

Suy luận cũng có thể tham khảo các kỹ thuật được sử dụng để soạn thảo các sự kiện cấp cao hơn từ một tập hợp các sự kiện và / hoặc dữ liệu. Kết quả suy luận như vậy trong việc xây dựng các sự kiện hoặc hoạt động mới từ một tập hợp các sự kiện quan sát và / hoặc dữ liệu sự kiện được lưu trữ , có hoặc không có các sự kiện tương quan trong thời gian gần gần , và liệu các sự kiện và dữ liệu đến từ một hoặc một số sự kiện và dữ liệu nguồn .

Hệ thống phân loại khác nhau và / hoặc hệ thống (ví dụ , máy vector hỗ trợ, mạng lưới thần kinh , hệ thống chuyên gia , mạng lưới niềm tin Bayesian , logic mờ , động cơ dữ liệu tổng hợp … ) có thể được sử dụng trong kết nối với thực hiện hành động tự động và / hoặc suy luận liên quan các phương án được chủ đề.

Nói cách khác, công cụ tìm kiếm được trả kết quả bằng cách cố gắng để làm cho quan sát hợp lý về cách mà những người khác đang sử dụng các từ tìm kiếm, và cho phép những người quan sát ảnh hưởng đến kết quả tìm kiếm được trả lại cho một người tìm kiếm .

Một vài định nghĩa từ các ứng dụng bằng sáng chế : công ty seo

Mở rộng truy vấn – các điều khoản mà mở rộng một truy vấn ngắn vào một truy vấn lớn hơn.

Truy vấn liền kề – truy vấn trước hoặc theo một truy vấn trong một phiên tìm kiếm của người dùng.

Ý tưởng đằng sau hệ thống này nhìn vào cả hai loại dữ liệu từ các bản ghi truy vấn là họ có thể hữu ích trong việc cung cấp thông tin liên quan đến mục đích tìm kiếm của người dùng.

Đây là một ví dụ về cách này có thể làm việc :

Ví dụ ; một người dùng gửi các truy vấn ” trường hợp ổ cứng ” mặc dù một mô tả tốt hơn hoặc chính xác hơn (ví dụ , thường được chấp nhận và sử dụng thường xuyên hơn trên web) là ” ổ đĩa cứng bao vây ” .

Các kết quả cho một truy vấn như vậy sẽ đau khổ vì một công cụ tìm kiếm sẽ xếp hạng các tài liệu dựa trên phù hợp với các điều khoản truy vấn , bao gồm tần số hạn và gần gũi mặc dù một số trang lấy ra có thể chứa các điều khoản chính xác hơn ( chẳng hạn như ” ổ ” và ” bao vây ” ) .

Một hệ thống sử dụng thông tin lẫn nhau dựa trên số liệu thống kê truy vấn bản ghi có thể xác định ” đĩa cứng ” như một tiền tố có liên quan cho các truy vấn và sau đó tạo ra các phần mở rộng phổ biến ” ổ “, ” phục hồi dữ liệu “, ” sửa chữa “, ” tiện ích ” , “thất bại” , “vấn đề” , ” tẩy “, ” bao vây “, vv

Từ phiên tìm kiếm , hệ thống cũng có thể lấy lại xảy ra đồng thời truy vấn, chẳng hạn như ” đĩa cứng di động “, ” usb ổ cứng bên ngoài” , và “thùng usb . ”
Các từ trong các phần mở rộng và các truy vấn có thể được sử dụng để tái cấp kết quả tìm kiếm lấy cho truy vấn ban đầu, theo giả định rằng thông tin bổ sung như vậy có thể giúp đại diện tốt hơn thực tế mục đích tìm kiếm của người sử dụng điển hình, trong sự phù hợp với những phát hiện trước đó.

Trong việc xây dựng một mô hình ” ngôn ngữ” từ các bản ghi truy vấn và các trang được tìm thấy trong kết quả tìm kiếm , để rerank trang, một số thuộc tính của tài liệu trong những kết quả có thể được xem xét , chẳng hạn như URL, tiêu đề trang , nội dung trang , và những đoạn trên các trang kết quả tìm kiếm cho các phần mở rộng truy vấn khác nhau và các truy vấn liền kề.

Một thành phần xếp hạng reranks kết quả tìm kiếm ban đầu sẽ sử dụng mô hình ngôn ngữ để tạo ra một tỷ số trận đấu cho mỗi tài liệu trong những kết quả tìm kiếm , làm việc với các bảng xếp hạng ban đầu của những kết quả.

Nộp bằng sáng chế đi vào rất nhiều chi tiết về cách hệ thống reranking này có thể làm việc , và cũng cung cấp một cái nhìn thoáng qua của nó như thế nào có thể làm việc với lịch sử tìm kiếm của người dùng để cung cấp kết quả cá nhân hoá.