Sự khôn ngoan của đám đông TÌM KIẾM: GOOGLE NGHIÊN CỨU VƯỚNG MẮC DATAMINING

“World Wide Web của Sự kiện ” là chủ đề của một vài giấy tờ từ một nhà nghiên cứu của Google, Marius Pasca . Có khả năng trích xuất các thuộc tính lớp cho sự kiện từ như một Web của sự kiện có thể cung cấp một số lợi ích cho một số người .

Mới nhất trong các giấy tờ , Tổ chức và tìm kiếm World Wide Web của Sự kiện Bước hai: Khai thác trí tuệ của Đám đông (pdf) , đã được thảo luận tại 16 Thế giới quốc tế rộng Hội nghị Web (WWW -07) , và Tổ chức trước đó một , và tìm kiếm World Wide Web của sự kiện – Bước Một : Một triệu Fact – Khai thác Challenge (pdf) , đã được trình bày tại Hội nghị quốc gia 21 trí tuệ nhân tạo ( AAAI -06 )

Trong chiết xuất thực tế từ các trang lỏng lẻo tổ chức của trang web , các thuộc tính cho các lớp học liên quan đến những sự kiện cũng có thể được lấy từ các trang web và từ các truy vấn tìm kiếm ‘ mà kết quả trong một chuyến thăm tới các trang , và những thuộc tính lớp chiết xuất có thể được sử dụng trong một số cách :

Xuất bản web – những thuộc tính lớp có thể được sử dụng để đề nghị chủ đề cho các nhà văn con người tự thêm mục mới vào các trang web như Wikipedia . Vì vậy , ví dụ, một trang trên một thiên thể mới được phát hiện có thể được tăng cường với các đề xuất tự động bao gồm các thuộc tính lớp như bán kính , trọng lực bề mặt , và vận tốc quỹ đạo .
Câu hỏi Dịch vụ trả lời – ( chẳng hạn như ” ? Các ngày sinh của Stephen Hawking là những gì ” ) , các thuộc tính lớp có thể được sử dụng để mở rộng câu hỏi trả lời để trang trải những câu hỏi mới và câu trả lời , và để hiểu những gì loại câu hỏi sẽ là hữu ích trong việc điều chỉnh các hệ thống để đáp ứng nhu cầu tìm kiếm thông tin thường xuyên .

Web tìm kiếm – Kết quả trả lại cho một truy vấn để đề cập một thực thể cụ ​​thể được đặt tên (ví dụ , Pink Floyd ) có thể được cải thiện bằng cách có thể cung cấp một tập hợp các dữ kiện cụ thể , dựa trên các thuộc tính trích trước cho các lớp học mà các thực thể có tên thuộc . Truy vấn mà cũng có thể được tinh chế thành các đề xuất truy vấn ngữ nghĩa hợp lý , bằng cách nối nó với một trong những thuộc tính chiết xuất hàng đầu cho các lớp tương ứng (ví dụ , Pink Floyd album cho Pink Floyd ) .

Tìm kiếm mới Dọc – có thể được đề nghị cho các lĩnh vực như y tế và du lịch, bằng việc có thể bán tự động trích xuất các thuộc tính cho các sự kiện trong những chủ đề  công ty seo website

Tôi đã viết một chút về loại hình này khai thác các thuộc tính lớp từ thuật ngữ tìm kiếm trong khai thác mỏ truy vấn tài để giải nén thông tin từ trang web . Bài viết này chỉ ra cụ thể những gì tác giả của nó xem xét một trong những khía cạnh quan trọng nhất là phải chú ý đến các truy vấn tìm kiếm ‘ có thể là:

Có lẽ khía cạnh hấp dẫn nhất của các truy vấn , tuy nhiên, khả năng gián tiếp nắm bắt kiến thức của con người, chính xác như họ hỏi về những gì đã được biết đến . Thật vậy, người sử dụng xây dựng các truy vấn của họ dựa trên những kiến ​​thức thông thường mà họ đã sở hữu tại thời điểm tìm kiếm công ty seo

Truy vấn tìm kiếm chơi hai vai trò cùng một lúc : ngoài yêu cầu thông tin mới, họ cũng gián tiếp truyền đạt kiến thức trong quá trình này . Nếu kiến ​​thức nói chung là nổi bật hoặc có liên quan , người cuối cùng sẽ hỏi về nó , đặc biệt là khi số lượng người dùng và số lượng và chiều rộng của sự gia tăng kiến thức sẵn có , vì nó là trường hợp với các Web như một toàn thể . Bản ghi truy vấn truyền đạt kiến thức thông qua các yêu cầu có thể được trả lời bằng những kiến ​​thức khẳng định trong văn bản mô tả của bộ sưu tập.

Các giấy tờ đi vào chiều sâu trong thảo luận về các thử nghiệm và đánh giá được tiến hành trong trích xuất thuộc tính lớp từ các truy vấn , và từ các trang . Thật thú vị để xem làm thế nào các thông tin chứa trong những gì mọi người tìm kiếm có thể được sử dụng để cải thiện khả năng của các công cụ tìm kiếm để cung cấp câu trả lời cho câu hỏi yêu cầu một công cụ tìm kiếm .