Bạn sẽ làm gì VỚI CƠ SỞ DỮ LIỆU CỦA CÁC VƯỚNG MẮC AOL USER?

Đôi khi bạn nhìn thấy một ý tưởng xuất hiện lặp lại chính nó trong thế giới của công cụ tìm kiếm, khi nói đến sở hữu trí tuệ.

Hãy tưởng tượng rằng bạn có thể mất một cơ thể của các truy vấn, và phân loại chúng để bạn có thể nhận được một cảm giác về những gì ý định của người tìm kiếm được. Cũng xem xét quan điểm cho rằng sau đó bạn có thể chia ra một cơ sở dữ liệu lớn vào một số cơ sở dữ liệu chuyên ngành nhỏ hơn, do đó khi có ai đó làm một tìm kiếm, chỉ có một số những cơ sở dữ liệu cần thiết để được xem xét để cung cấp kết quả dựa trên việc phân loại các truy vấn, với kết quả từ nhiều hơn một cơ sở dữ liệu sáp nhập với nhau.

Phương pháp này sẽ dẫn đến kết quả tìm kiếm hiệu quả hơn và có liên quan, với việc xử lý ít tốn kém?

Định tuyến các kết quả dựa trên phân loại có thể gọi vào chơi cơ sở dữ liệu khác hoặc các quá trình tìm kiếm bằng cách xem xét các truy vấn đệ trình lên công cụ tìm kiếm và các mẫu nhận thấy trong các cụm từ truy vấn.
Một ứng dụng bằng sáng chế mới từ AOL nhìn vào những ý tưởng, và những người khác liên quan đến phân loại các truy vấn.

Nó khám phá cách truy vấn có thể được phân loại, và làm thế nào phân loại có thể giúp kết quả trở lại một cách hiệu quả, cũng như khám phá phân loại chuyên đề của câu truy vấn. Ngay cả quảng cáo có thể được phân loại dựa trên chứ không phải là từ khóa được sử dụng.

Phân loại truy vấn web
Được phát minh bởi Abdur R. Chowdhury, Steven Michael Beitzel, David Lewis Dolan, Aleksander Kolcz
Ứng dụng bằng sáng chế Mỹ 20060190439
Giao cho AOL
Công bố ngày 24 tháng 8 năm 2006
Nộp vào ngày 27 tháng một năm 2006

Trừu tượng

Một cụm từ truy vấn có thể được tự động phân loại vào một hoặc nhiều chủ đề quan tâm (ví dụ, danh mục) để hỗ trợ trong việc định tuyến các cụm từ truy vấn với một hoặc thích hợp hơn cơ sở dữ liệu phụ trợ. Một kỹ thuật phân loại ưu tiên truy vấn selectional có thể được sử dụng để phân loại các cụm từ truy vấn dựa trên sự so sánh giữa cụm từ truy vấn và các mẫu của cụm từ truy vấn. Thêm vào đó, hoặc cách khác, một sự kết hợp của kỹ thuật phân loại truy vấn có thể được sử dụng để phân loại các cụm từ truy vấn. Phân loại chuyên đề của một cụm từ truy vấn cũng có thể được sử dụng để hỗ trợ một hệ thống tìm kiếm trong việc cung cấp thông tin phụ trợ cho người dùng nhập cụm từ truy vấn. Quảng cáo, ví dụ, có thể được thiết kế dựa trên phân loại thay vì từ khoá truy vấn.

Tương tự như New Google Bằng sáng chế?

Trong nhiều cách, điều này làm tôi nhớ đến bằng sáng chế đã được chỉ cấp cho Google mà tôi đã viết về vào thứ ba: Google xem xét vấn đề và Reranking Dựa trên ý kiến ​​biên tập. Nó đi vào chi tiết về một số lợi ích của việc phân loại truy vấn, nhưng thảo luận về các phương pháp phân loại mà dường như rất giống với những gì được trình bày trong hồ sơ bằng sáng chế của Google.

Nó cũng nói về một số quyết tâm hướng về những gì các trang web là những người tốt để đáp ứng với các truy vấn nhất định, và một cách tiếp cận máy học dựa trên những quyết định dẫn sử dụng, trong đó có vẻ tương tự như “ủng hộ” và “không ủng hộ” các trang web được đề cập trong tài liệu Google . Như này AOL ghi chú tài liệu, một cụm từ truy vấn có thể được phân loại vào một thể loại đặc biệt, thủ công bằng một trình soạn thảo của con người, hoặc bằng cách lập trình so sánh nó với một danh sách các truy vấn cụm từ trước đây được phân loại bằng tay.

Một phân loại tự động cũng có thể xảy ra thông qua một hệ thống đã học được từ một tập huấn luyện các cụm từ truy vấn phân loại.

Không có thảo luận ở đây trong các tài liệu AOL kết quả reranking dựa trên những quyết định biên tập. Nhưng nó xuất hiện rằng phương pháp này sẽ ảnh hưởng đến bảng xếp hạng thực tế, có nghĩa là không cần thiết cho một “reranking.”

Có sự khác biệt giữa hai tài liệu, và nếu bạn muốn đào sâu hơn vào ứng dụng bằng sáng chế này, bạn có thể tìm thấy nó thú vị để giữ hồ sơ Google và AOL lên side-by-side và so sánh những điểm tương đồng và khác biệt.

Tóm tắt quá trình truy vấn phân loại

Một truy vấn tìm kiếm được gửi,
Cụm từ truy vấn được chia thành bộ phận cấu thành,
Mô hình liên kết với một hoặc nhiều loại được truy cập từ các thông tin phân loại lưu trữ bao gồm mô hình của cụm từ truy vấn,
Một quyết định được thực hiện để xem liệu một phần của cụm từ truy vấn nộp tương ứng với ít nhất một subportion của một mô hình truy cập,
Nếu có một sự tương ứng như vậy, các thể loại kết hợp với mô hình cũng được gắn liền với cụm từ truy vấn hoặc một phần cấu thành của nó, và;
Ít nhất một nguồn tìm kiếm để đáp ứng các cụm từ truy vấn dựa trên các thể loại liên quan được xác định.
Một số tính năng có thể tham gia vào việc thực hiện quá trình này:

Định tuyến của cụm từ truy vấn ít nhất một nguồn lực tìm kiếm xác định có thể được kích hoạt,
Kết hợp các thể loại có thể bao gồm kết hợp các loại bằng cụm từ truy vấn,
Kết hợp các thể loại có thể bao gồm kết hợp các loại với phần cấu thành, và;
Nhiều hơn một thể loại có thể được liên kết với các cụm từ truy vấn hoặc một phần cấu thành.
Dựa trên cụm từ truy vấn gửi, kết quả tìm kiếm có thể được nhận được từ ít nhất một nguồn tìm kiếm xác định (trong số có thể nhiều cơ sở dữ liệu – nghĩ về những điều như vậy đây là cơ sở dữ liệu với các chủ đề khác nhau, tìm kiếm địa phương, tìm kiếm mua sắm, một cơ sở dữ liệu quảng cáo, vv ) và trình bày ít nhất một kết quả tìm kiếm cho người sử dụng có thể được kích hoạt.

Các thể loại hoặc loại kết hợp với truy vấn tìm kiếm có thể được so sánh với các thuộc tính liên quan đến các nguồn lực tìm kiếm nhiều, để định tuyến một cụm từ truy vấn ít nhất một nguồn tìm kiếm có thể liên quan đến việc sửa đổi cụm từ truy vấn và định tuyến một phiên bản sửa đổi của cụm từ truy vấn đến tập hợp con của nhiều nguồn lực tìm kiếm dựa trên kết quả so sánh đó.

Sửa đổi cụm từ truy vấn có thể có nghĩa là:

thêm từ vào cụm từ truy vấn,
loại bỏ từ trong cụm từ truy vấn, và / hoặc;
tái đặt hàng từ trong cụm từ truy vấn.
Các bằng sáng chế cũng thảo luận về một “selectional truy vấn ưu tiên phân loại kỹ thuật” khi đào tạo một hệ thống phân loại queries.f Nó bao gồm:

Nhận được một cụm từ truy vấn đào tạo bao gồm cả bộ phận cấu thành,
Phân tích nó vào ít nhất một phần,
Nhận cụm từ truy vấn hơn mà chia sẻ một phần cấu thành bằng cụm từ truy vấn đào tạo,
Công nhận mô hình của cụm từ truy vấn đào tạo có ít nhất một phần thành phần phổ biến,
Xác định một thể loại kết hợp với ít nhất một phần thành phần phổ biến,
Liên kết các mô hình của cụm từ truy vấn đào tạo với các hạng mục liên quan đến ít nhất một phần thành phần phổ biến, và;
Sử dụng các mẫu để phân loại cụm từ truy vấn.
Nếu bạn nhìn lại những gì tôi đã viết về những bằng sáng chế của Google, nó mô tả một quá trình đến với các quy định cụ thể để xác định phân loại của câu truy vấn. Một ví dụ được sử dụng là:

Cho truy vấn chủ đề “trang web cung cấp phần mềm tải về miễn phí,” các quy tắc có thể yêu cầu rằng các truy vấn có chứa từ “miễn phí” và “tải”.

Điều này nghe hơi tương tự như quá trình AOL mô tả ở trên.

Hơn về phân loại kỹ thuật truy vấn

Cụm từ truy vấn có thể được phân loại bằng tay hoặc thông qua một quá trình phân loại truy vấn máy học có giám sát.

Kết quả của các kỹ thuật phân loại truy vấn có thể được so sánh, và cụm từ truy vấn có thể được phân loại theo một trọng tài phân loại nếu so sánh cho biết kết quả không phù hợp sản xuất bởi các kỹ thuật phân loại truy vấn công ty seo website

Loại cho các cụm từ truy vấn có thể được xác định bằng cách sử dụng nhiều hơn hai kỹ thuật phân loại truy vấn:

(1) Các cụm từ truy vấn có thể được phân loại sử dụng nhiều phương thức, và sau đó bằng việc có một trọng tài phân loại quyết định dựa trên phân loại xác định theo đa số kỹ thuật phân loại được sử dụng.

(2) Tương tự như trên, ngoại trừ rằng cả hai phân loại sẽ được dựa trên cả một phần lớn các kỹ thuật và số liệu phân loại tổng thể của các kỹ thuật phân loại truy vấn.

(3) Tài liệu hướng dẫn kỹ thuật phân loại truy vấn có thể được sử dụng như những hạt giống cho sở thích selectional và truy vấn kỹ thuật phân loại học máy có giám sát.

Kết luận công ty seo

Nó hơi kỳ lạ để xem bằng sáng chế từ Google và ứng dụng bằng sáng chế này từ AOL đi ra trong cùng một tuần, và có rất nhiều điểm tương đồng.

Đã có rất nhiều cuộc thảo luận ở những nơi khác nhau trên trang web, về một thông cáo gây tranh cãi của một cơ sở dữ liệu của các truy vấn người sử dụng AOL. Đáng buồn thay, dữ liệu không được phát hành để nhận diện cá nhân hoặc gây tổn hại cho bất cứ ai, hoặc xâm nhập vào riêng tư của họ, nhưng thay vì được dự định để cho phép người dân để thực hiện quá trình nghiên cứu liên quan như những mô tả trong ứng dụng bằng sáng chế này. Đó là một sự xấu hổ mà dữ liệu có thể được sử dụng để xác định người, và đáng tiếc rằng những người bị mất việc làm trên phiên bản đó, rằng những nỗ lực của AOL đã được mụn, và rằng mọi người đã tìm kiếm riêng của họ tiếp xúc.