Sáng chế của IBM CẤP Pagerank

Tại quốc tế World Wide Web Hội nghị thứ mười, một poster từ John Tomlin, Andrew Tomkins, Jasmine Novak, và Arvind Arasu đã được trình bày có tựa đề tính toán PageRank và cấu trúc của trang web: Các thí nghiệm và giải thuật (pdf). Ba tác giả đầu tiên đã viết bài viết như nhân viên của IBM, và đồng tác giả Arvind Arasu được liệt kê trên tài liệu như một thành viên của Vụ Khoa học máy tính tại Đại học Stanford.

Ba trong số bốn tác giả được liệt kê như các nhà phát minh của một bằng sáng chế mới được cấp trong đó mô tả một cách nhanh chóng tính toán PageRank, mà đã được nộp cho Văn phòng Bằng sáng chế Mỹ trong khoảng thời gian tương tự như trình bày của bài báo. John Tomlin và Andrew Tomkins hiện nay ở Yahoo, và Arvind Arasu là một nhà nghiên cứu tại Microsoft.

Hệ thống và phương pháp tính toán nhanh chóng của PageRank công ty seo website
Được phát minh bởi John Anthony Tomlin, Andrew S. Tomkins, và Arvind Arasu
Giao cho IBM
US Patent 7.089.252
Cấp ngày 08 Tháng Tám 2006
Nộp 25 tháng 4 năm 2002
trừu tượng

Một phương pháp xếp hạng được đa số các tài liệu liên quan. Phương pháp này bao gồm việc có được một đa số tài liệu, và xác định thứ hạng của mỗi tài liệu.

Cấp bậc của mỗi tài liệu nói chung là một chức năng của một cấp bậc của tất cả các tài liệu khác trong đa số các tài liệu mà chỉ các tài liệu và được xác định bằng cách giải quyết, bằng các phương pháp phương trình giải quyết (bao gồm cả Gauss-Seidel lặp đi lặp lại và phân vùng) của một tập hợp các phương trình trong đó:. alpha .. alpha .. lần .. lần .. lần .. lần. # # # # EQU00001 nơi x.sub.i là thứ hạng của trang lập chỉ mục của tôi, alpha.. là một số đúng giữa 0 và 1.0, tổng kết là trên tất cả các chỉ số j như vậy mà điểm trang j đến trang i, và a.sub.ij được định nghĩa là nghịch đảo của số lượng các liên kết trỏ từ trang j (ký hiệu là d sub.j). nếu điểm trang j đến trang tôi, và không khác.

Chứ không phải là mô tả những gì các bằng sáng chế có, tôi sẽ khuyên bạn nên nhìn vào giấy tôi đề cập đến trong đoạn đầu tiên của bài viết này, đó là một bản tóm tắt tuyệt vời của nhiều ý tưởng trong các bằng sáng chế. Cả hai bằng sáng chế và giấy thảo luận khó khăn như thế nào để tính toán PageRank cho tất cả các trang trên trang web, và đưa ra một số giải pháp làm tăng tốc độ trong khi cũng làm giảm các lỗi có thể. Như các tác giả lưu ý trong một “kết luận” trong các bằng sáng chế:

Các sáng chế là hướng đến trang web quy mô tính toán của PageRank chức năng xếp hạng tĩnh, kết hợp cả hai kỹ thuật công ty seo  thuật toán rút ra từ phân tích số, và cấu trúc đặc biệt trong trường hợp vấn đề rút ra từ web đặc.

Thuật toán, các tính năng của sáng chế tiếp cận vấn đề bằng cách sử dụng giải quyết hơn là eigensystem kỹ thuật phương trình.

Cách tiếp cận này mang lại những cải tiến hiệu suất đáng kể trên lặp đi lặp lại quyền lực. Hơn nữa, nó cho phép khai thác nổi tiếng “nơ” đặc tính của các trang web để phân vùng các vấn đề vào bài toán độc lập.

Cuối cùng, các đặc tính của các thuộc tính mở rộng của đồ thị như một toàn so với đồ thị của kết nối liên trang web giải thích sự yếu kém của sự lặp lại quyền lực.

Đối với bất kỳ người đọc bằng sáng chế và giấy và muốn đào sâu nghiên cứu sâu hơn, sau đây được trích dẫn trong các bằng sáng chế như tài liệu tham khảo:

Các tài liệu sáng chế Hoa Kỳ

Phương pháp cho nút xếp hạng trong một cơ sở dữ liệu, bằng sáng chế liên quan 6.285.999, phát minh bởi Lawrence Page, cấp tháng 9 năm 2001
Phương pháp và thiết bị để xếp hạng kết quả tìm kiếm trang Web, bằng sáng chế 6.560.600, phát minh bởi Andrei Z. Broder, cấp tháng 5 năm 2003
Phương pháp và thiết bị đào tạo inerative của một hệ thống phân loại, bằng sáng chế 6.571.229, phát minh bởi William Michael Campbell, cấp tháng 5 năm 2003
Hệ thống và phương pháp để xếp hạng các văn bản siêu liên kết dựa trên một quá trình backoff ngẫu nhiên, bằng sáng chế 6.792.419, phát minh bởi Prabhakar Raghavan, cấp tháng 9 năm 2004
Xếp hạng các nút trong một đồ thị, ứng dụng bằng sáng chế tài liệu 20030050909, phát minh bởi Mihai Preda, xuất bản tháng 3 năm 2003
tài liệu tham khảo khác

Các nhà chức trách tìm kiếm và trạm trung chuyển từ cấu trúc liên kết trên World Wide Web