RERANKING KẾT QUẢ TÌM KIẾM dựa trên khái niệm trong các truy vấn NGƯỜI SỬ DỤNG '

Truy vấn người sử dụng có thể được sử dụng hiệu quả như thông tin phản hồi, để rerank kết quả công cụ tìm kiếm? Có thể, nếu họ có thể được hiểu như là khái niệm đầu tiên.

Truy vấn tìm kiếm có thể được chia ra thành bộ phận cấu thành được gọi là các đơn vị. Một động cơ xử lý truy vấn phân hủy một truy vấn tìm kiếm thành các đơn vị sử dụng phương pháp thống kê. Một đơn vị là một hoặc nhiều trình tự từ mà thường tương ứng với một khái niệm tự nhiên như “thành phố New York” hay “chim săn mồi” công ty seo

Theo thống nhất: thông tin phản hồi liên quan sử dụng các bản ghi truy vấn của người dùng, Yahoo đã được sử dụng đơn vị Concept được tạo ra từ các truy vấn tìm kiếm như là một trong những yếu tố đầu vào trong của họ Ngoài ra Hãy thử tính năng để hiển thị kết quả tinh chế từ mùa xuân năm 2003.

Bài viết mô tả các thử nghiệm trực tiếp của kết quả tìm kiếm reranking dựa trên “các đơn vị khái niệm” trên một tỷ lệ phần trăm nhỏ của những người dùng Yahoo trong thời gian một tuần. Ý tưởng này của các đơn vị khái niệm đã xuất hiện trong hồ sơ bằng sáng chế khác từ Yahoo, và các loại reranking dựa trên khái niệm đơn vị là trọng tâm của một ứng dụng bằng sáng chế đã được công bố tuần trước. Các báo ở trên là từ tài liệu đó.
Reranking và tăng sự liên quan của kết quả tìm kiếm trên Internet
Được phát minh bởi Shyam Kapur và Jignashu Parikh
Giao cho Yahoo
Ứng dụng bằng sáng chế Mỹ 20060206476
Công bố 14 tháng 9 năm 2006
Nộp: ngày 10 tháng 3 năm 2005

Trừu tượng

Kỹ thuật được cung cấp cho reranking và tăng sự liên quan của kết quả tìm kiếm trên Internet. Một truy vấn tìm kiếm ban đầu phân tích thành các đơn vị cá nhân. Mỗi đơn vị tương ứng với một hoặc nhiều từ đại diện cho một khái niệm tự nhiên. Một mạng lưới khái niệm được phân tích để xác định vị trí các khái niệm có liên quan đến các đơn vị trong truy vấn tìm kiếm. Khái niệm cụ thể được lựa chọn từ các mạng khái niệm. Tìm kiếm Internet độc lập được thực hiện cho mỗi khái niệm lựa chọn. Kết quả tìm kiếm từ những tìm kiếm sau đó được so sánh với các đơn vị trong các truy vấn tìm kiếm ban đầu và xếp hạng theo sự liên quan của họ với truy vấn tìm kiếm ban đầu.

Ý tưởng cơ bản đằng sau các ứng dụng bằng sáng chế là nó nhằm làm cho kết quả tìm kiếm kết quả tìm kiếm phù hợp hơn với ý định của người dùng. Nó sẽ làm điều này bằng reranking kết quả truy vấn tìm kiếm bằng cách xác định sự liên quan của kết quả tìm kiếm cho các đơn vị, hiệp hội đơn vị, và phần mở rộng đơn vị trong những truy vấn tìm kiếm.

Tóm tắt Trước khi Reranking

Truy vấn tìm kiếm phân tích thành các đơn vị cá nhân sử dụng phương pháp thống kê.
Mỗi đơn vị là một hoặc nhiều từ đại diện cho một khái niệm tự nhiên như “thành phố New York” hay “chim săn mồi”.
Công cụ tìm kiếm lấy nội dung từ các trang web phù hợp với truy vấn tìm kiếm và gửi những kết quả một lắp ráp trang.
Lắp ráp trang sắp xếp các kết quả theo sự liên quan của họ để truy vấn và trình bày chúng trong một trật tự dễ dàng nhất để hiển thị một người tìm kiếm, trong một màn hình hiển thị kết quả tìm kiếm.
“. Đơn vị mở rộng” một số truy vấn có thể chứa nhiều hơn một đơn vị, có thể được sáp nhập với nhau nếu họ đây là các loại khác nhau được đề cập trong bằng sáng chế nộp hồ sơ công ty seo website

1) đơn vị liên kết – hai hay nhiều đơn vị trong một truy vấn, không đầy đủ liên quan để tạo thành một đơn vị mới.
2) đơn vị mở rộng – hai hoặc nhiều đơn vị trong một truy vấn liên quan đủ để tạo thành một đơn vị mới.

Tài liệu lưu trữ bằng sáng chế liên quan từ Yahoo!

Ý tưởng của đơn vị sử dụng khái niệm, và các mạng lưới khái niệm dựa trên tìm kiếm truy vấn xuất hiện trong một số lượng tốt của hồ sơ bằng sáng chế từ Yahoo. Sớm nhất đã được cấp vào tháng Năm năm nay, và hai mới nhất được publised ngày 14 tháng chín. Trong khi bài này bao gồm một trong những hồ sơ mới nhất, các applicationr bằng sáng chế tập trung nhiều hơn vào các kết quả tìm kiếm trả tiền và một liên kết đến nó xuất hiện ở dưới cùng của danh sách này.

Một tỷ lệ tốt của cuộc thảo luận về tối ưu hóa công cụ tìm kiếm trên web xem xét nội dung và liên kết, mà không đào sâu quá sâu vào cách thức một công cụ tìm kiếm có thể xem xét các truy vấn phù hợp để trang. Nếu bạn muốn tìm hiểu sâu hơn như thế nào Yahoo có thể sử dụng đơn vị khái niệm, Nó sẽ giúp đỡ để nhìn vào những.

Hệ thống và phương pháp để tạo ra các đơn vị khái niệm từ các truy vấn tìm kiếm – 7.051.023 – ứng dụng bằng sáng chế đăng ngày 07 tháng 10 2004 – Bằng sáng chế Cấp ngày 23 tháng năm 2006
Hệ thống giao diện tìm kiếm phổ quát và các phương pháp – 20040249801 – Xuất bản 09 Tháng 12 năm 2004
Hệ thống và phương pháp để xử lý tìm kiếm sử dụng superunits – 20050080795 – đăng ngày 14 Tháng Tư 2005
Hệ thống và phương pháp để xử lý truy vấn tìm kiếm bằng cách sử dụng phân tích xu hướng – 20050102259 – Xuất bản ngày 12 tháng năm 2005
Xử lý tìm kiếm với tự động phân loại truy vấn – 20060122979 – Xuất bản 08 tháng 6 năm 2006
Tự động thế hệ của nguyên tắc phân loại cho các truy vấn phân loại và xử lý truy vấn tìm kiếm bằng cách sử dụng nguyên tắc phân loại – 20060122994 – đăng ngày 08 Tháng Sáu năm 2006
Hệ thống và phương pháp để quản lý và sử dụng nhiều mạng khái niệm cho hỗ trợ xử lý tìm kiếm – 20060167896 – Xuất bản ngày 27 tháng 7 năm 2006
Hệ thống để sửa đổi các truy vấn trước khi trình bày với một máy phát tìm kiếm tài trợ hoặc kết hợp hệ thống khác được những thay đổi cải thiện bảo hiểm mà không giảm tương ứng chính xác – 20060206474 – Xuất bản 14 tháng chín năm 2006
Khái niệm mạng

Một mạng lưới khái niệm liên quan đến mối quan hệ giữa các khái niệm liên quan, và mỗi đơn vị trong một truy vấn tìm kiếm có thể được tìm thấy trong một mạng lưới khái niệm. Mạng lưới khái niệm được sử dụng để xác định các khái niệm có liên quan đến các đơn vị truy vấn tìm kiếm.

Sau khi một đơn vị truy vấn tìm kiếm đã được đặt trong một mạng lưới khái niệm, khái niệm liên quan trong mạng lưới khái niệm được lựa chọn. Một mạng lưới khái niệm liên kết đến các khái niệm liên quan đến sử dụng một số kỹ thuật. Dưới đây là những cách mà các khái niệm trong một đơn vị khái niệm có thể liên quan với nhau:

khái niệm là từ đồng nghĩa,
khái niệm có một ý nghĩa cụ thể hơn,
khái niệm có một ý nghĩa tổng quát hơn,
ví dụ thực tế cụ thể của khái niệm, và;
Điều nổi tiếng hoặc tên mà âm thanh tương tự như khái niệm hoặc sử dụng một số từ tương tự.
Ví dụ

Một đơn vị trong một truy vấn tìm kiếm là “tòa nhà chọc trời.”

Hệ thống định vị khái niệm “nhà chọc trời” trong mạng lưới khái niệm và xác định các khái niệm liên quan:

Nhiều điều khoản chung – chẳng hạn như “xây dựng” và “dinh thự”.
Điều khoản tương tự – như “tăng cao.”
Ví dụ cụ thể – như “tòa nhà Empire State.”
Khái niệm xây dựng mạng lưới từ tần số của quá khứ truy vấn

Truy vấn tìm kiếm trước đó đã gửi có thể được xem xét để xác định mức độ thường xuyên các khái niệm liên quan xuất hiện cùng nhau trong những câu truy vấn. Một mạng lưới khái niệm có thể được xây dựng bằng cách liên kết các khái niệm đã xuất hiện cùng nhau.

Phiên Dựa Khái niệm mạng

Mạng khái niệm có thể dựa trên khái niệm xuất hiện cùng nhau trong các truy vấn do tất cả người dùng. Một mạng lưới khái niệm có thể là một phiên dựa trên mạng khái niệm, liên kết các khái niệm xuất hiện cùng nhau trong các truy vấn tìm kiếm được gửi bởi một người dùng cụ thể, hoặc một nhóm người dùng.

Ví dụ về khái niệm mạng phiên dựa.

Khái niệm chính “báo đốm” có thể được liên kết với các khái niệm liên quan đến xe sau vì các truy vấn quá khứ của một người dùng cụ thể liên kết chúng lại với nhau:

Sang trọng ô tô,
Công ty ô tô XYZ, và;
Đua xe.
Một người sử dụng khác nhau có thể gửi các truy vấn trước khi tỏ ra quan tâm ở động vật báo đốm. Người sử dụng tạo ra một mạng lưới khái niệm khác nhau liên kết “báo đốm” những khái niệm liên quan đến động vật như

mèo,
sở thú, hoặc;
safari.
Khái niệm và sự bùng Networks

Một mạng lưới khái niệm có thể liên kết các khái niệm xuất hiện cùng nhau thường xuyên nhất trong các truy vấn trước được gửi trong một khoảng thời gian quy định bởi một hoặc nhiều người sử dụng.

Ví dụ về một thời gian giới hạn mạng khái niệm:

Trong ví dụ này, một khái niệm “Jane Doe” được liên kết với các khái niệm liên quan:

Jane Doe sống biểu diễn,
Jane Doe Âm nhạc CD, và;
nhạc cụ.
Các khái niệm liên quan là những khái niệm đã xuất hiện thường xuyên nhất với “Jane Doe” trong các truy vấn tìm kiếm trước đó trong một khoảng thời gian quy định, mà có thể là 24 giờ qua, tuần qua, hoặc tháng qua.

Hãy tưởng tượng trong ví dụ này, mạng lưới khái niệm này là từ các khái niệm liên quan đến một ca sĩ tên là Jane Doe dựa trên các truy vấn tìm kiếm phổ biến nhất trong 24 giờ qua.

Bây giờ, trong khoảng thời gian 24 giờ sau đó, các truy vấn tìm kiếm phổ biến nhất bao gồm “Jane Doe” có thể liên quan đến một chính trị gia có cùng tên.

Nếu điều đó xảy ra, mạng lưới khái niệm cho “Jane Doe” có thể được thay đổi để bao gồm các liên kết đến các khái niệm liên quan đến “Jane Doe Mỹ Thượng nghị sĩ” và “Sáng kiến ​​Doe.”

Bùng nổ này của các truy vấn mới liên quan đến những gì có vẻ là một ý định khác nhau đằng sau tìm kiếm “Jane Doe” kết quả trong mạng khái niệm được cập nhật để bao gồm các khái niệm đã xuất hiện thường xuyên nhất trong các truy vấn gần đây với các đơn vị “Jane Doe”.

Lựa chọn khái niệm cho reranking

Quá trình lựa chọn này có thể dựa trên một số tiêu chí khác nhau.

Ví dụ:

Năm thường xuyên xảy ra nhất các khái niệm liên quan đến đầu từ mạng khái niệm có thể được lựa chọn, hoặc;
Top 50% hoặc trên 25% của các khái niệm có liên quan thường xuyên nhất xảy ra có thể được lựa chọn, hoặc;
Nhiều kỹ thuật lựa chọn khác có thể được sử dụng.
Sử dụng kết nối trực tiếp và gián tiếp trong Khái niệm mạng

Các khái niệm liên quan chặt chẽ nhất từ ​​mạng lưới khái niệm được lựa chọn. Những người có thể được tất cả các khái niệm được liên kết trực tiếp đến các khái niệm chính trong mạng lưới khái niệm.

Các khái niệm khác có thể được liên kết với các khái niệm chính gián tiếp thông qua một trong những khái niệm liên quan trực tiếp, chẳng hạn như kết nối gián tiếp giữa các khái niệm “Jane Doe” và “cây đàn” thông qua “nhạc cụ”.

Tìm kiếm Dựa trên khái niệm lựa chọn

Một khi khái niệm này được lựa chọn từ các mạng khái niệm cho các đơn vị trong một truy vấn, tìm kiếm web độc lập được thực hiện cho một hoặc nhiều hơn các khái niệm liên quan.

Nếu có bốn đơn vị trong một truy vấn tìm kiếm, và một khái niệm có liên quan được lựa chọn cho từng đơn vị, sau đó bốn tìm kiếm Internet độc lập được thực hiện.

Nếu một số lượng lớn các khái niệm liên quan được lựa chọn, sau đó tìm kiếm web chỉ được thực hiện cho một tập hợp các khái niệm. Vì vậy, nếu 20 khái niệm được lựa chọn, tìm kiếm có thể được thực hiện chỉ trong 5 khái niệm đầu có liên quan đến tất cả các đơn vị trong một truy vấn tìm kiếm.

Công cụ tìm kiếm thực hiện tìm kiếm web độc lập cho các khái niệm được lựa chọn, và nó có thể được thực hiện bằng cách sử dụng bất kỳ nổi tiếng kỹ thuật tìm kiếm Internet (chẳng hạn như sử dụng Google hoặc công nghệ tìm kiếm Yahoo!).

Bộ riêng biệt của kết quả tìm kiếm được lấy cho mỗi tìm kiếm Internet cá nhân được thực hiện bởi công cụ tìm kiếm, và những người được sắp xếp theo sự liên quan của họ với nhau khái niệm liên quan công ty seo website

Reranking Dựa trên khái niệm khác

Reranking kết quả tìm kiếm lấy từ các tìm kiếm web sau đó xảy ra bằng cách lấy những kết quả và các kết quả từ một tìm kiếm được thực hiện trên toàn bộ truy vấn tìm kiếm ban đầu.

Mỗi phòng trong số kết quả tìm kiếm được so sánh với các đơn vị, hiệp hội đơn vị, và phần mở rộng đơn vị trong các truy vấn tìm kiếm ban đầu, và mỗi kết quả được gán một cấp bậc hoặc điểm số dựa trên sự liên quan của nó với truy vấn tìm kiếm ban đầu.

Phân công một số

Kết quả tìm kiếm được phân tích để xác định mức độ thường xuyên các đơn vị, các hiệp hội của các đơn vị, và các phần mở rộng đơn vị từ các truy vấn tìm kiếm xuất hiện trong kết quả tìm kiếm, và chỉ định một số điểm dựa trên các tần số (hoặc tần số tương đối) mà trường hợp của những người xuất hiện trong kết quả tìm kiếm.

Sự xuất hiện nhiều hơn, điểm số càng cao. Số điểm được sử dụng để rerank kết quả.

Điều hướng truy vấn

Kết quả tìm kiếm nhận được từ một số loại truy vấn có thể được cho điểm số cao hơn.

Ví dụ, kết quả lấy từ các truy vấn hàng hải có thể được xếp hạng cao hơn kết quả tìm kiếm lấy từ các truy vấn khác. Những điểm số cao hơn cho các truy vấn định hướng dựa trên một giả định rằng các truy vấn định hướng thường lấy kết quả tìm kiếm phù hợp hơn.

Sắp xếp Dựa Khi Điểm

Một lần rerank điểm số được gán cho mỗi kết quả tìm kiếm dựa trên sự liên quan của họ với truy vấn tìm kiếm ban đầu, kết quả tìm kiếm được sắp xếp từ điểm cao nhất đến điểm rerank rerank thấp nhất.

Điểm số cao nhất rerank phải trỏ đến nội dung phù hợp nhất với truy vấn tìm kiếm ban đầu, và kết quả với điểm số thấp nhất rerank nên được nội dung ít liên quan nhất với truy vấn ban đầu công ty seo

Quá trình này làm tăng sự liên quan của kết quả tìm kiếm bằng cách định vị khái niệm phù hợp với nội dung liên quan đến các đơn vị trong truy vấn tìm kiếm. Kết quả tìm kiếm sau đó được kết hợp với kết quả tìm kiếm từ một tìm kiếm web chuẩn dựa trên toàn bộ truy vấn tìm kiếm và sắp xếp theo sự liên quan của họ với truy vấn tìm kiếm.

Giả định đằng sau Reranking

Mạng lưới khái niệm được sử dụng để tăng số lượng các kết quả tìm kiếm lấy trong một tìm kiếm.

Điều này sẽ dẫn đến ít nhất một số kết quả tìm kiếm là khả năng là rất phù hợp với truy vấn tìm kiếm và ý định của người dùng. Mở rộng này sẽ cho phép các công cụ tìm kiếm để xác định một số lượng lớn các kết quả tìm kiếm liên quan.

Trong thực tế, điều này cũng cung cấp một vòng phản hồi vào tìm kiếm, bằng cách nhìn thấy những gì người tìm kiếm đã được tìm kiếm trong các đơn vị tìm thấy trong các truy vấn của họ, mà được xác định trong các bản ghi truy vấn tìm kiếm. Sử dụng một khoảng thời gian, như đã đề cập ở trên, có thể trả về kết quả là khá kịp thời.

Kết luận

Kết quả từ các tìm kiếm trên các khái niệm liên quan có thể được sử dụng để thêm vào kết quả và rerank kết quả từ các truy vấn tìm kiếm ban đầu. Họ cũng có thể được trình bày như là tìm kiếm liên quan hoặc đưa vào các kết quả ban đầu trong khoảng thời gian xác định trước.