TRIỂN VỌNG THỜI GIAN VÀ QUYẾT ĐỊNH

Tìm kiếm các từ ” ô tô ” tại Google, và các công cụ tìm kiếm có thể mở rộng tìm kiếm của bạn để bao gồm kết quả cho từ “xe hơi ” là tốt, vì nó là một từ đồng nghĩa của ô tô từ. Vô tình viết sai chính tả các từ như ” automoble ” và Google có thể tự động sửa lỗi chính tả của bạn và tìm kiếm cho ” ô tô. ”

Theo đó với một tìm kiếm cho từ ” lái xe” và Google có thể mở rộng truy vấn của bạn bằng cách sử dụng một quá trình gọi là xuất phát để nhìn vào thư mục gốc của từ ( driv – ) và thêm các hậu tố chung với nó, để đến với , và bao gồm trong việc tìm kiếm , các từ như ” lái xe “, và ” lái xe . ”

Loại mở rộng truy vấn là nhằm mục đích cung cấp tìm kiếm với kết quả tìm kiếm tốt hơn. Phương pháp này mở rộng truy vấn có thể không xảy ra chưa ( mặc dù đôi khi nó xuất hiện để cho sửa chữa lỗi chính tả ít nhất) , và nó có thể không xảy ra trong tất cả tìm kiếm .

Cách tiếp cận điển hình để truy vấn mở rộng bao gồm:

Xuất phát từ,
Sửa lỗi chính tả , và ;
Augmentating truy vấn tìm kiếm bằng cách làm những việc như sử dụng các từ đồng nghĩa của từ mà xảy ra trong truy vấn ban đầu .
Một vài giấy tờ trắng từ Google và một ứng dụng bằng sáng chế vừa được công bố khám phá một số trong những cách mà Google có thể sử dụng máy dịch thuật để tìm từ đồng nghĩa cho từ ngữ để mở rộng điều kiện tìm kiếm mà bạn có thể sử dụng .

Có một vài cách khác nhau mà mở rộng truy vấn bằng cách sử dụng các từ đồng nghĩa có thể được thực hiện.

1) Từ đồng nghĩa của một từ có thể được tìm thấy trong từ điển , nơi những từ đồng nghĩa đã được xác định bởi các chuyên gia , hoặc một bản thể học từ vựng ( một vốn từ vựng của tổ chức từ).

2) Từ đồng nghĩa có thể được xác định từ các truy vấn tìm kiếm khác có cú pháp tương tự ( một đặt hàng của và mối quan hệ giữa các từ trong cụm từ tương tự ) để truy vấn ban đầu .

Một thách thức đối với các phương pháp đó là khi một từ có nhiều từ đồng nghĩa tiềm năng , với ý nghĩa rất khác nhau . Ví dụ, trong các truy vấn ” Làm thế nào để gửi một chiếc hộp” từ ” tàu ” có thể có từ đồng nghĩa như ” thuyền ” và ” gửi “.

Nếu truy vấn được mở rộng dựa trên ý nghĩa thuyền , nó có thể cung cấp kết quả tìm kiếm rất không liên quan đến một người tìm kiếm , người có lẽ không mong đợi để xem kết quả tìm kiếm liên quan đến tàu đánh cá .

Các ứng dụng bằng sáng chế của Google liên quan đến phương pháp cũng được khám phá trong các giấy tờ từ Google , dịch truy vấn vào Snippets để nâng cao mở rộng truy vấn (pdf) , và thống kê máy dịch để mở rộng truy vấn trong trả lời Retrieval (pdf) .

Các ứng dụng bằng sáng chế liệt kê một vài nhà phát minh người cũng tác giả của những giấy tờ :

Máy dịch để mở rộng truy vấn
Được phát minh bởi Stefan Riezler , Alexander L. Vasserman
Giao cho Google
Ứng dụng bằng sáng chế Mỹ 20080319962
Công bố 25 tháng 12 năm 2008
Nộp : ngày 17 tháng 3 năm 2008

trừu tượng

Phương pháp, hệ thống và thiết bị , bao gồm cả các sản phẩm chương trình máy tính , để mở rộng truy vấn tìm kiếm . Một phương pháp bao gồm nhận được một truy vấn tìm kiếm , lựa chọn một từ đồng nghĩa của một từ trong truy vấn tìm kiếm dựa trên một bối cảnh xuất hiện của các thuật ngữ trong truy vấn tìm kiếm nhận được, đồng nghĩa đã được bắt nguồn từ dịch máy thống kê của thuật ngữ này , và mở rộng tiếp nhận truy vấn tìm kiếm với các từ đồng nghĩa và cách sử dụng các truy vấn tìm kiếm mở rộng để tìm kiếm một bộ sưu tập các tài liệu .

Ngoài ra , phương pháp khác bao gồm nhận được yêu cầu để tìm kiếm một ngữ liệu văn bản , yêu cầu chỉ định một truy vấn tìm kiếm , sử dụng dịch máy thống kê để dịch các truy vấn tìm kiếm chỉ định vào một truy vấn tìm kiếm mở rộng , truy vấn tìm kiếm và xác định các truy vấn tìm kiếm mở rộng đang trong ngôn ngữ tự nhiên, và để đáp ứng với yêu cầu, bằng cách sử dụng truy vấn tìm kiếm mở rộng để tìm kiếm một bộ sưu tập các tài liệu .

Sử dụng thống kê Máy dịch (SMT ) để tìm đồng nghĩa

Các ứng dụng bằng sáng chế đi vào một số lượng tốt của các chi tiết về cách Google có thể sử dụng dịch máy thống kê để dịch một chuỗi các từ từ một ngôn ngữ khác , phải học cách từ trong ngôn ngữ khác nhau có liên quan. Nếu bạn muốn có một phiên bản chi tiết về cách dịch máy thống kê hoạt động, nó có giá trị xem xét việc nộp bằng sáng chế cho mô tả của họ .

Blog nghiên cứu của Google, trong một bài đăng từ năm 2006 có tựa đề dịch máy thống kê trực tiếp, cung cấp một lời giải thích đơn giản hơn nhiều :

Một số hệ thống nghiên cứu , bao gồm cả chúng ta, một cách tiếp cận khác nhau : chúng ta ăn vào máy tính với hàng tỷ từ văn bản, cả hai văn bản đơn ngữ trong ngôn ngữ mục tiêu , và văn bản liên kết bao gồm các ví dụ về các bản dịch của con người giữa các ngôn ngữ . Sau đó chúng tôi áp dụng kỹ thuật thống kê để xây dựng một mô hình dịch.

Vì vậy , làm thế nào SMT giúp đỡ tìm từ đồng nghĩa ?

Từ ” tàu ” trong một bối cảnh cụ thể có thể được dịch sang ngôn ngữ khác cùng một cách mà từ ” vận tải” có thể được. Trong bối cảnh đó , từ ” tàu ” là đồng nghĩa với từ ” vận chuyển ” . Vì vậy, ví dụ trên của một truy vấn như “làm thế nào để vận chuyển một hộp ” có thể có bản dịch giống như “làm thế nào để vận chuyển một hộp . ”

Các tìm kiếm có thể được mở rộng để bao gồm cả các truy vấn – ” . Làm thế nào để vận chuyển một hộp ” “làm thế nào để vận chuyển một hộp ” cũng như

Một hệ thống máy dịch thuật cũng có thể thu thập thông tin về các từ trong cùng một ngôn ngữ , tìm hiểu về cách những từ có thể liên quan .

Cách tiếp cận để đào tạo một thống kê máy dịch mẫu

Bước đầu tiên là thu thập một tập huấn luyện chữ , có thể từ một số nguồn khác nhau , chẳng hạn như sau:

1) Nhìn vào câu hỏi – trả lời cặp

Hãy tưởng tượng nhìn vào nhiều trang thường gặp câu hỏi càng tốt , và so sánh như thế nào cùng một câu hỏi được trả lời khác nhau (hoặc tương tự ) . Tham gia những câu hỏi và trả lời theo cặp, và sử dụng chúng như một cơ quan đào tạo cho học máy thống kê có thể hữu ích .

2) Nhìn vào truy vấn và một số câu liên cặp

Nhìn vào kết quả tìm kiếm cho một truy vấn trong một công cụ tìm kiếm, và các đoạn của những kết quả . Có lẽ trông sâu hơn về các kết quả đã được lựa chọn và xem thường xuyên hơn và / hoặc lâu hơn bởi những người tìm kiếm bằng cách sử dụng những thuật ngữ truy vấn (có thể chỉ ra rằng những đoạn có liên quan nhiều hơn cho các thuật ngữ truy vấn tìm kiếm với ) .

Những truy vấn và đoạn cặp cũng có thể được sử dụng như một cơ quan đào tạo cho học máy thống kê. Văn bản từ các tài liệu bản thân, từ neo văn bản trong các liên kết trỏ đến các tài liệu và thông tin khác về các từ xuất hiện trong các kết quả như liệu họ đã được sử dụng trong tiêu đề trang , hoặc nếu họ là một phần của một chuỗi văn bản có liên quan đến truy vấn sử dụng cũng có thể được xem xét.

3) Nhìn vào cụm từ và diễn giải cặp

Như ví dụ của chúng tôi ở trên “làm thế nào để vận chuyển một chiếc hộp” và “làm thế nào để vận chuyển một chiếc hộp” những cụm từ có thể được dịch sang cùng kỳ hạn trong một ngôn ngữ khác , và thời hạn có thể được dịch hợp lý trở lại vào một trong hai cụm từ .

Cụm từ và diễn giải cũng có thể được cung cấp bằng tay được các chuyên gia ngôn ngữ . Một cơ thể của các từ đồng nghĩa và cụm từ tương tự có thể được thu thập từ cách tiếp cận đó.

Một câu truy vấn như “làm thế nào để trở thành một thợ ” có thể mang lại một truy vấn tìm kiếm dịch “như thế nào là một thợ nề ” sử dụng phương pháp này.

Sử dụng bối cảnh bản đồ với Nghĩa

Từ đồng nghĩa có thể được tìm thấy trong quá trình tìm kiếm, hoặc họ có thể được chuẩn bị trước và được sử dụng với một bản đồ bối cảnh đó quan tâm đến những lời mà có thể xuất hiện bên trái và bên phải của một trong các từ trong một cụm từ truy vấn. Bản đồ bối cảnh có thể được chuẩn bị trước khi tìm kiếm được thực hiện bao giờ .

Ví dụ, với các truy vấn “làm thế nào để buộc một cây cung, ” bối cảnh trái và bên phải của từ ` tie ` trong truy vấn mà là “làm thế nào để ” và ” một cây cung . ”

Trong bối cảnh bản đồ , cà vạt từ có thể được liên kết với hai từ đồng nghĩa, ` bằng ` và ` hôn ` . Từ ” hôn ” có thể được lựa chọn như một từ đồng nghĩa với ” buộc ” vì nó cũng phù hợp tốt trong bối cảnh tìm thấy trong các bản đồ bối cảnh “làm thế nào để ” và ” một cây cung . ” Các truy vấn có thể được mở rộng đến một cái gì đó như [ như thế nào để ( tie hoặc nút ) một cây cung ] .

kết luận

Khi một lỗi chính tả được nhập vào Google như là một phần của một truy vấn tìm kiếm, công cụ tìm kiếm đôi khi sẽ thấy một thông báo ở đầu các kết quả yêu cầu nếu bạn có nghĩa là đúng chính tả . Lần khác của Google sẽ chỉ hiển thị một kết hợp của kết quả cho các phiên bản sai chính tả và phiên bản sửa chữa, mở rộng truy vấn. Và đôi khi , Google sẽ chỉ hiển thị kết quả từ các phiên bản sửa chữa của từ .

Chúng tôi không biết chắc chắn nếu Google đang sử dụng xuất phát cho việc mở rộng truy vấn, hoặc nếu họ đang sử dụng từ đồng nghĩa để mở rộng truy vấn. Nhưng đây là những khả năng rất thực tế. Nếu bạn tìm kiếm một truy vấn bao gồm từ ” ô tô ” và từ “xe hơi ” cho kết quả rất có liên quan là tốt, sau đó là loại mở rộng truy vấn là rất hợp lý.

Nếu bạn quan tâm đến như thế nào một công cụ tìm kiếm có thể mở rộng từ được sử dụng trong một tìm kiếm , và làm thế nào họ có thể quyết định về những gì từ ngữ để sử dụng trong việc mở rộng truy vấn, nó có giá trị chi tiêu một số thời gian đi qua ứng dụng bằng sáng chế này để tìm hiểu làm thế nào mà loại mở rộng có thể được thực hiện. công ty seo

Thêm vào : 01 tháng 1 năm 2009 –

Google không nói với chúng tôi rằng họ sử dụng xuất phát trên trang web của họ Tìm kiếm Trợ giúp :

Biến thể của từ ( xuất phát )

Google hiện nay sử dụng công nghệ bắt nguồn . Vì vậy, khi thích hợp, nó sẽ tìm kiếm không chỉ với các điều kiện tìm kiếm của bạn , mà còn cho các từ tương tự với một số hoặc tất cả các điều khoản. Nếu bạn tìm kiếm cho nhu cầu ăn uống của loài vượn cáo , Google cũng sẽ tìm kiếm các loài vượn cáo nhu cầu chế độ ăn uống , và các biến thể khác có liên quan của các điều khoản của bạn. Bất kỳ biến thể của điều khoản của bạn đã được tìm kiếm sẽ được đánh dấu trong các đoạn văn bản kèm theo mỗi kết quả .công ty seo uy tín