Phân tích cách tìm kiếm và lựa chọn của Google

Tại trình bày Searchology gần đây của Google , một trong những tính năng mới được mô tả như được sử dụng bởi Google đã phân tích tâm lý .

Trong bản tóm tắt về các sự kiện từ Matt Cutts của Google , ông nói với chúng ta rằng : công ty seo uy tín

Nếu bạn sắp xếp theo đánh giá, Google sẽ thực hiện phân tích tâm lý và làm nổi bật ý kiến ​​thú vị .

Tôi đã nhìn thấy một số giấy tờ từ Google trên phân tích tình cảm, và nộp bằng sáng chế gần đây , vì vậy tôi quyết định để xem xét kỹ hơn một số những kết quả tìm kiếm xem xét.
Google xem xét ví dụ

Đối với một số kết quả tìm kiếm , khi bạn chọn “Tùy chọn hiển thị” liên kết sau khi tìm kiếm của bạn , và sau đó là ” đánh giá ” liên kết, sau đó trong khu vực đoạn cho kết quả tìm kiếm bạn có thể thấy báo giá từ các đánh giá, bao quanh bởi dấu ngoặc kép. Thử nghiệm này, tôi đã thấy một số kết quả mà các đoạn là trong dấu ngoặc kép , và khi tôi đến thăm những trang văn bản trích dẫn có xu hướng chủ yếu là từ đánh giá thực tế . Tôi nhìn một số ý kiến ​​cho nhà hàng , âm nhạc, và các sản phẩm .

Dưới đây là một ví dụ từ một kết quả trên một tìm kiếm mà tôi đã làm cho [ nhà hàng hải sản york mới] : công ty seo chất lượng

” Aquavit , mà nằm ở một trong những ngôi nhà phố cũ của gia đình nổi tiếng của , có thể là lựa chọn tốt nhất . ” … ” Lưu chỗ cho một trong những món tráng miệng hấp dẫn. ” … ” Với thực đơn hầu như chỉ dành cho hải sản, Aquagrill là một tuyệt vời chọn cho những ai muốn lựa chọn tuyệt vời và các tùy chọn tuyệt vời. ”

Trên một tìm kiếm cho ban nhạc [ Led Zeppelin ] , có dấu ngoặc kép sau đây đã được chọn lọc từ hai đánh giá khác nhau trên Amazon.com mà đã có một số ý kiến ​​:

“Đây là giờ tốt nhất của Led Zeppelin , và do đó một cách đúng đắn giữ yêu cầu bồi thường # 1 album của tất cả các thời gian . ” … “Tôi sở hữu nó và đã nghe qua nó hơn một trăm lần như vậy tôi nhiều hơn quen thuộc với nó , cùng với phần còn lại âm nhạc Zeppelin . “…” Bốn Sticks nặng , nhưng không có gì đặc biệt. ”

Trên một tìm kiếm cho [ chất tẩy rửa màu xanh lá cây ] , những lời nói đã bị kéo từ một vài ý kiến ​​khác nhau trên một trang :

” Nói chung tôi cảm thấy tốt về việc sử dụng các sản phẩm này . ” … ” Người kia dường như làm việc ok, nhưng nhìn chung, tôi thực sự khuyên bạn GreenWorks thương hiệu Clorox thay thế. ” … ” Tôi hy vọng tiếp tục sử dụng , nó cũng sẽ hỗ trợ trong việc loại bỏ các vết bẩn trong khuôn các dòng vữa . ”

Chính xác tại sao Google chọn báo giá cụ thể mà nó cho thấy ?

Tình cảm của khía cạnh khác nhau

Một bài báo gần đây từ Google mô tả một số quá trình suy nghĩ có thể giải thích một số lý do tại sao báo cáo nhất định có thể được bao gồm. Xây dựng một Summarizer Niềm tin cho các địa phương xét dịch vụ ( pdf) , chúng tôi thấy các ví dụ sau đây trích dẫn từ các ý kiến ​​phân phát theo khía cạnh khác nhau , chẳng hạn như ” dịch vụ “, ” giá trị ” và ” ý kiến ​​chung . ” Các khía cạnh được định nghĩa trong một trong các giấy tờ của Google trên phân tích tình cảm như “tài sản của một đối tượng có thể được đánh giá bởi một người dùng . ”

Đánh giá của một thợ cắt tóc cho thấy tình cảm về dịch vụ , giá trị, kiểu tóc , và ý kiến ​​chung của Google

Trừu tượng cho tờ báo cho chúng ta biết :

Trong bài báo này , chúng tôi trình bày một hệ thống tóm tắt tình cảm của ý kiến ​​cho một dịch vụ địa phương như nhà hàng hoặc khách sạn . Đặc biệt , chúng tôi tập trung vào mô hình tổng kết dựa trên khía cạnh , trong đó một bản tóm tắt được xây dựng bằng cách chiết xuất các khía cạnh liên quan của một dịch vụ , chẳng hạn như dịch vụ hoặc giá trị , tập hợp tình cảm mỗi khía cạnh , và chọn văn bản khía cạnh có liên quan.

Vì vậy, khi chúng tôi được thể hiện nhiều dấu ngoặc kép, một mục tiêu mà Google có thể cố gắng để đạt được là để cung cấp thông tin tình cảm về các khía cạnh khác nhau của một mục hoặc dịch vụ.

Các giấy tờ khác của Google trên phân tích tình cảm cũng đáng xem hơn bao gồm:

Các thí nghiệm so sánh về phân loại Niềm tin cho Online Nhận xét sản phẩm (pdf)
Tổng kết tình cảm : Đánh giá và học tập User Preferences (pdf)
Một mô hình phần của văn bản và Aspect Ratings cho niềm Tổng kết (pdf)
Sáng của Google trên niềm Phân tích

Các ứng dụng bằng sáng chế là thú vị để suy nghĩ về vì nó cung cấp một số thông tin về cách Google có thể thực sự lựa chọn văn bản từ các ý kiến ​​để trình bày . Nộp bằng sáng chế xuất hiện ở :

Miền cụ thể phân loại Tình cảm
Inventewd bởi Tyler J. Neylon , Kerry L. Hannan, Ryan T. McDonald , Michael Wells, Jeffrey C. Reynar
Giao cho Google
Ứng dụng bằng sáng chế Mỹ 20090125371
Công bố ngày 14 tháng 5 năm 2009
Nộp ngày 23 tháng 8 2007

Một trong những tài liệu của chính trọng tâm là khi mô tả cách các từ khác nhau hoặc các điều khoản có thể xuất hiện trong phần đánh giá có thể có ý nghĩa hoàn toàn khác nhau khi áp dụng cho các sản phẩm hoặc dịch vụ khác nhau . Một vài ví dụ minh họa đầu này rất tốt :

Từ ” nhỏ ” thường chỉ ra tâm lý tích cực khi mô tả một thiết bị điện tử cầm tay , nhưng có thể chỉ ra tâm lý tiêu cực khi được sử dụng để mô tả kích thước của một phần phục vụ nhà hàng.

Như vậy, từ đó tích cực trong một miền có thể được tiêu cực trong một.

Hơn nữa, từ có liên quan trong một miền có thể không có liên quan trong phạm vi khác. Ví dụ, ” tuổi thọ pin ” có thể là một khái niệm quan trọng trong lĩnh vực máy nghe nhạc di động nhưng không liên quan trong lĩnh vực nhà hàng.

Trừu tượng từ khi nộp bằng sáng chế cung cấp một cái nhìn tổng quan mức độ khá cao của những gì các tài liệu có chứa :

Một tình cảm phân loại tên miền cụ thể mà có thể được sử dụng để ghi bàn cực và độ lớn của tình cảm thể hiện bằng văn bản tên miền cụ thể được tạo ra. Một tình cảm từ vựng độc lập với miền được thành lập và phân loại sử dụng từ vựng để ghi tình cảm của tài liệu tên miền cụ thể .

Bộ tài liệu – tình cảm cao có phân cực tích cực và tiêu cực được xác định. N- gram trong các tài liệu – tình cảm cao được lọc để loại bỏ rất phổ biến n- gram. Các lọc n- gram được lưu như một tình cảm từ vựng tên miền cụ thể và được sử dụng như các tính năng trong một mô hình .

Mô hình này được huấn luyện sử dụng một tập hợp các tài liệu đào tạo có thể được bằng tay hoặc tự động dán nhãn là để tình cảm tổng thể của họ để sản xuất điểm tâm lý cho các n- gram trong tình cảm từ vựng tên miền cụ thể . Từ vựng này được sử dụng bởi tâm lý phân loại tên miền cụ thể .

Nếu bạn muốn tìm hiểu sâu hơn vào quá trình thực sự đằng sau như thế nào tình cảm khác nhau được xác định đối với các loại sản phẩm , dịch vụ, bạn có thể muốn dành thời gian với nộp hồ sơ bằng sáng chế này và các giấy tờ liên quan đến tôi trên. Tôi cũng muốn khuyên bạn nên nhìn vào một số ý kiến ​​cho sản phẩm và dịch vụ trong các lĩnh vực khác nhau để có được một ý tưởng về cách Google đang sử dụng phân tích tâm lý trong thực tế .