Cá nhân QUA ba THEO DÕI CỦA NGƯỜI SỬ DỤNG, VƯỚNG MẮC VÀ CÁC TRANG WEB

Giá trị những gì có thể theo dõi các liên kết đến các trang web mà người tìm kiếm click vào trong các trang kết quả tìm kiếm có để tìm kiếm cá nhân ?

Hãy tưởng tượng một lưu giữ theo dõi công cụ tìm kiếm của mỗi người dùng (u) , khi họ thực hiện một truy vấn (q) trên các công cụ tìm kiếm, và nhìn thấy những trang (p) họ nhấp vào , và thu thập những lựa chọn trong những gì họ gọi là ” ba ” của dữ liệu , đại diện như thế này – (u, q , p) .

Sau đó xem xét rằng các công cụ tìm kiếm có thể vẽ bản đồ và so sánh những ba thông tin với nhau để xem những gì các loại mối quan hệ và các hiệp hội tồn tại giữa những người làm các tìm kiếm tương tự , phải đối mặt với kết quả tương tự . Thông tin mà sau đó có thể được sử dụng để cá nhân hoá kết quả hiển thị cho các cá nhân .

Bạn đã có thể nhìn thấy một cái gì đó tương tự ở Amazon Books, nơi họ nói với bạn rằng Thay vì chỉ nhìn vào hai điểm dữ liệu “những người mua cuốn sách này, cũng mua những cuốn sách khác . ” – Cuốn sách đầu tiên , và cuốn sách thứ hai , điều này phương pháp sẽ xem xét ba – người tìm kiếm người là, những gì họ đang tìm kiếm , và những gì những người có thể chia sẻ lợi ích tương tự tiến hành tìm kiếm tương tự khác có thể lựa chọn trong quá khứ.

Đó là chủ đề của một ứng dụng bằng sáng chế mới từ Microsoft. Nộp bằng sáng chế chia sẻ một số tác giả với một bài nghiên cứu của Microsoft dường như liên quan chặt chẽ , CubeSVD : Một cách tiếp cận tiểu thuyết để cá nhân Tìm kiếm Web . Cả hai bằng sáng chế và giấy rất nặng toán học, nhưng các khái niệm đằng sau họ là đáng để theo đuổi .
Ba làm tăng người sử dụng, truy vấn, và tài liệu sử dụng ít phân hủy giá trị
Được phát minh bởi Hua -Jun Zeng , Jian -Tao Sun, Wei- Ying Ma , Zheng Chen , Zhang và Benyu
Giao cho Microsoft
Ứng dụng bằng sáng chế Mỹ 20070055646
Công bố 08 Tháng ba 2007
Nộp ngày 08 Tháng Chín năm 2005

trừu tượng công ty seo website.

Một hệ thống làm tăng dữ liệu nhấp chuột qua các thông tin tiềm ẩn có trong dữ liệu nhấp chuột để sử dụng trong việc tạo ra kết quả tìm kiếm là phù tốt hơn cho nhu cầu thông tin của người sử dụng gửi một truy vấn được cung cấp .

Hệ thống tăng thêm tạo ra một ma trận ba chiều với kích thước của người sử dụng , truy vấn, và tài liệu. Hệ thống tăng thêm sau đó thực hiện một ba – trật tự phân hủy ít giá trị của ma trận ba chiều để tạo ra một ma trận giá trị cốt lõi ít ba chiều và một ma trận số ít để lại cho mỗi chiều.

Hệ thống tăng thêm cuối cùng nhân với ba chiều lõi ma trận giá trị ít bởi các ma trận số ít còn lại để tạo ra một ma trận tăng cường ba chiều một cách rõ ràng có chứa các thông tin đã tiềm ẩn trong un – tăng cường ma trận ba chiều .

Cá nhân không có tiểu công ty seo.

Nộp bằng sáng chế không phải là tất cả các số và biểu tượng. Nó có chứa một số văn bản mà cố gắng để giải thích các quá trình liên quan đến tiếng Anh. Nó nói về một vài phương pháp xếp hạng nổi tiếng , bao gồm PageRank của Google , và lưu ý rằng một trong những thiếu sót của các phương pháp đó là họ không chú ý đến người được gửi một truy vấn. Đây là những gì họ nói :

Ví dụ, một nhà động vật học người nộp truy vấn ” báo đốm ” sẽ nhận được kết quả tương tự như một người đam mê xe người nộp cùng một truy vấn . Trong trường hợp này , các nhà động vật học có thể quan tâm trong các trang web liên quan đến động vật , trong khi những người đam mê xe hơi có thể quan tâm trong các trang web liên quan đến xe ô tô.

Nó cũng thảo luận về những khó khăn của một số phương pháp cá nhân ngày nay mà cố gắng để tạo hồ sơ người sử dụng cơ sở mà kết quả họ sẽ hiển thị cho các cá nhân . Các phương pháp thường cố gắng để tùy chỉnh kết quả cho mỗi người dùng bằng cách căn cứ kết quả cho thấy họ trên hồ sơ cá nhân được tạo ra bằng tay hoặc tự động , và sau đó thích ứng với kết quả tìm kiếm dựa trên những hồ sơ cá nhân .

Một khó khăn trong việc sử dụng hồ sơ cá nhân là nếu chúng được tạo ra bằng tay, người có xu hướng không muốn chia sẻ thông tin cá nhân của họ với một công cụ tìm kiếm – vì vậy yêu cầu mọi người điền vào một số lượng phong phú của thông tin liên quan đến lợi ích của họ không có khả năng dẫn đến nhiều người sử dụng một dịch vụ như vậy .

Tạo ra một hồ sơ cá nhân tự động ở chế độ nền , dựa trên tìm kiếm trước đây có thể yêu cầu một số lượng lớn các dữ liệu lịch sử sử dụng được thu thập . Bất kể một phương pháp thủ công hoặc tự động để tạo ra một hồ sơ cá nhân được theo sau , chúng tôi đang nói trong các bằng sáng chế mà có một câu hỏi là liệu ” hành vi người dùng phức tạp có thể được mô hình hóa chính xác bởi một hồ sơ cá nhân. ”

kết luận

Hãy tưởng tượng thay vì một hệ thống chú ý trong khi bạn đang tìm kiếm , so sánh và lựa chọn tìm kiếm của bạn trong một phiên họp với những người khác thực hiện các truy vấn tương tự, và chọn kết quả tương tự . Sau đó nó có thể bắt đầu reranking kết quả mà bạn nhìn thấy dựa trên tìm kiếm mà bạn thực hiện và các lựa chọn mà bạn thực hiện .

Nếu bạn muốn tìm hiểu thêm về một số toán học mô tả trong giấy và các ứng dụng bằng sáng chế, một điểm khởi đầu tốt có thể hướng dẫn Tiến sĩ E. Garcia trên Singular Value Decomposition (SVD) và tiềm ẩn Semantic Indexing (LSI) . Ngoài việc là một nguồn thông tin về những chủ đề , các hướng dẫn cũng làm một công việc tuyệt vời của vạch trần những huyền thoại tiếp thị xung quanh chỉ mục ngữ nghĩa tiềm ẩn , và đang rất khuyến khích .