Họ cung cấp một ví dụ về một tiêu đề xấu trên trang web hội nghị SIGIR tại "

Đôi khi bạn tìm kiếm ở một trong những công cụ tìm kiếm , bạn sẽ thấy một thiết lập thêm các liên kết hiển thị theo một trong các danh sách trong những kết quả tìm kiếm . Được gọi là một trong hai kết nhanh hoặc liên kết trang web , thường là những người sẽ xuất hiện trong danh sách ở trên cùng của kết quả tìm kiếm như trong hình dưới đây :

Một kết quả tìm kiếm cho WordPress , hiển thị các liên kết bổ sung theo danh sách cho trang chính mà chỉ đến các trang khác trên trang web.

Đôi khi, các liên kết thêm cũng sẽ xuất hiện cho các trang được liệt kê một chút futher xuống trong kết quả tìm kiếm là tốt. Rất nhiều câu hỏi đã được đặt ra về cách những công cụ tìm kiếm quyết định trang để hiển thị như kết nhanh hoặc liên kết trang web , và lý do tại sao . Tôi đã viết một số bài viết về trang trắng và hồ sơ bằng sáng chế từ các công cụ tìm kiếm đã cung cấp một số manh mối để trả lời những câu hỏi , và có một danh sách các liên kết đến những bài viết ở dưới cùng của bài viết này .

Nhưng , bí ẩn khác xung quanh những kết nhanh hoặc liên kết trang web , mà là làm thế nào công cụ tìm kiếm có thể quyết định khi các văn bản được sử dụng trong các liên kết này . Tôi chưa thấy một câu trả lời từ bất kỳ các công cụ tìm kiếm trước đó. Ít nhất , cho đến bây giờ .

Yahoo công bố một ứng dụng bằng sáng chế cung cấp một số gợi ý về cách tiếp cận của họ để quyết định liên kết văn bản để sử dụng trong kết nhanh của họ.

Các ứng dụng bằng sáng chế là :

Tạo ra tựa đề ngắn gọn cho các URL Web
Được phát minh bởi Shanmugasundaram Ravikumar , Deepayan Chakrabarti , và Kunal Punera
Giao cho Yahoo! , Inc
Ứng dụng bằng sáng chế Mỹ 20100049709
Công bố ngày 25 tháng 2 năm 2010
Nộp : 19 Tháng Tám 2008

trừu tượng

Phương pháp, chương trình máy tính , và các hệ thống để tạo ra một tiêu đề liên kết cho một URL ( Uniform Resource Locator ) trong một trang web bối cảnh được hiển thị như là một kết quả web được cung cấp. Phương pháp đánh giá các thông số thế hệ cho một đa số nguồn để chọn từ trong tiêu đề liên kết . Hơn nữa, phương pháp này tạo ra các ứng cử viên cho danh hiệu liên kết, và một khả năng được tính cho mỗi ứng cử viên .

Khi tính toán các khả năng , các thông số thế hệ , các trang web bối cảnh và các từ được xem xét. Ngoài ra, phương pháp lựa chọn một ứng cử viên có khả năng cao nhất từ tất cả các khả năng xảy ra tính toán và trình bày các URL với các ứng cử viên được lựa chọn như tiêu đề.

Tôi thường thích để có một bằng sáng chế nộp hồ sơ như thế này, và cố gắng để phá vỡ nó ra thành tiếng Anh đơn giản , cắt ra rất nhiều ngôn ngữ pháp lý và toán học được trình bày để cung cấp cho một bản tóm tắt các ý tưởng đằng sau một cách tiếp cận . May mắn thay, Yahoo cũng đã công bố một báo cáo chính thức và một bài thuyết trình powerpoint về chủ đề này , trong đó cung cấp một cái nhìn tại những ý tưởng trong việc nộp bằng sáng chế trong ngôn ngữ đơn giản hơn .

Các báo cáo chính thức được công bố cho KDD 2008 – Khám phá tri thức và Hội nghị khai thác dữ liệu , tổ chức tại Las Vegas, Nevada , vào tháng Tám năm 2008, trong khoảng thời gian tương tự mà các bằng sáng chế đã được nộp, và cổ phiếu cùng tên – Tạo tựa đề ngắn gọn cho các URL Web ( pdf) .

Trình bày powerpoint ( cùng tên ) trình bày những ý tưởng trong việc nộp bằng sáng chế trong tiếng Anh thậm chí còn đơn giản hơn . Xem : Tạo tựa đề ngắn gọn cho các URL Web (ppt) . Lưu ý , nếu bạn không có powerpoint, và bạn muốn xem trình bày , hãy xem xét tải về Open Office bộ phần mềm mã nguồn mở miễn phí, có thể hiển thị các bài thuyết trình powerpoint .

Trong khi những người tạo ra các trang web thường dành một số tiền hợp lý của thời gian quyết định khi tiêu đề cho trang mà họ tạo ra mô tả nội dung của các trang , cũng như neo văn bản cho các liên kết trỏ đến các trang này, có đôi khi là vấn đề với những sự lựa chọn của văn bản mà làm họ ít hơn ý tưởng để sử dụng như các văn bản cho kết nhanh .

Một trong những là một công cụ tìm kiếm thường muốn sử dụng một số lượng hạn chế của các từ trong kết nhanh của họ , và tiêu đề trang cho các trang trỏ đến bởi kết nhanh có xu hướng dài hơn những gì các công cụ tìm kiếm muốn sử dụng trong các liên kết của họ.

Một vấn đề khác là, theo tác giả nộp bằng sáng chế của , khoảng 17 phần trăm của các trang họ chạy trên trên web đang thiếu tiêu đề trang .

Yahoo có thể nhìn vào một số lựa chọn khác nhau để lựa chọn văn bản từ sử dụng trong kết nhanh . Một số các lựa chọn có thể bao gồm :

Neo văn bản trỏ đến trang từ các liên kết trên cùng một trang web
Neo văn bản trỏ đến trang từ các liên kết từ các trang web khác
Truy vấn tìm kiếm mà trang đã được trả lại trong top 10 kết quả
Truy vấn tìm kiếm mà trang đã được trả lại kết quả là
Truy vấn tìm kiếm mà trang là kết quả đầu tiên
Truy vấn tìm kiếm mà trang được nhấp vào kết quả tìm kiếm
Từ chiết xuất như cụm từ khóa từ trang
Thẻ cho cho trang từ delicious.com
Các ứng dụng bằng sáng chế mô tả một số vấn đề tiềm ẩn có thể được tìm thấy trong một số trong những sự lựa chọn. Ví dụ, họ cho chúng tôi biết rằng các truy vấn tìm kiếm được sử dụng để tìm thấy một số trang có thể chứa lỗi chính tả . Họ cũng cho chúng ta biết những lỗi chính tả không xuất hiện thường xuyên trong các truy vấn tìm kiếm được click vào .

Bạn có thể đã nhận thấy rằng họ không bao gồm các chức danh của các trang có thể liên kết văn bản trong kết nhanh . Lý do của họ không sử dụng tiêu đề trang :

1. Một phân tích của một triệu URL ngẫu nhiên mà họ thực hiện cho thấy ít nhất 17 phần trăm của các tài liệu HTML thiếu tiêu đề .
2 . Tiêu đề trang thường có sai sót, không đầy đủ, dài, hoặc chỉ đơn giản là không phải là danh hiệu tốt nhất .

Họ cung cấp một ví dụ về một tiêu đề xấu trên trang web hội nghị SIGIR tại ” www.sigir2008.org/schedule.html ” mà sử dụng tiêu đề ” SIGIR’08 -Singapore, ” bởi vì một sự lựa chọn tốt hơn cho một Quicklink sẽ là ” Hội nghị lịch trình “, mà không phải là rất rõ ràng từ đó tiêu đề trang.

Chúng tôi cũng nói rằng các liên kết dài nhanh chóng cung cấp một trải nghiệm người dùng xấu trên một trang kết quả tìm kiếm , vì bất động sản hạn chế trên các trang kết quả tìm kiếm .

Nó có giá trị chi tiêu một số thời gian trên trình bày , giấy, và các ứng dụng bằng sáng chế nếu bạn muốn tìm hiểu thêm về cách Yahoo có thể quyết định giữa những sự lựa chọn khác nhau mà họ có khi lựa chọn văn bản cho một Quicklink .

Nếu bạn xuất bản một trang web, và bạn sẽ không hiểu nhiều hơn về kết nhanh hoặc liên kết trang web , cũng như khi nào và lý do tại sao công cụ tìm kiếm có thể cho họ thấy , một số bài viết trước đây của tôi về những loại liên kết có thể trả lời một số câu hỏi bạn có thể có :