Xử phạt trang trong kết quả tìm kiếm dựa trên NGÔN NGỮ (TRỪ TIẾNG ANH)

Biết điều gì đó về ngôn ngữ được sử dụng trong một truy vấn có thể giúp một công cụ tìm kiếm quyết định trang để hiển thị một tìm kiếm. Một công cụ tìm kiếm muốn dẫn dắt người sử dụng để họ có thể đọc các trang . Một ứng dụng bằng sáng chế của Microsoft gần đây khám phá làm thế nào các loại ngôn ngữ có thể được sử dụng trong các trang xếp hạng trong kết quả tìm kiếm .

Loại ngôn ngữ có thể được xem như một biện pháp liên quan bởi vì họ có thể giúp tìm các trang có liên quan để tìm kiếm. Họ được coi là một biện pháp “truy vấn phụ thuộc vào ” sự liên quan, bởi vì trong khi các loại ngôn ngữ cho một trang có thể được xác định trước khi bất cứ ai thực hiện một tìm kiếm mà có thể bao gồm các trang , ngôn ngữ được sử dụng trong những ảnh hưởng truy vấn mà kết quả được hiển thị.

Các biện pháp truy vấn độc lập , hoặc các thuộc tính , là khác nhau. Tôi đã viết trước đây về một vài ứng dụng bằng sáng chế khác của Microsoft mà điều này một ghi chú có liên quan, trong một bài viết có tựa đề Xếp hạng Kết quả tìm kiếm theo loại tập tin bằng cách Click vào .

Hai biện pháp được coi là ” truy vấn độc lập”, bởi vì bất cứ điều gì từ được sử dụng trong truy vấn có thể trả lại những trang không liên quan đến các phương pháp xếp hạng.
Nếu một tài liệu html được ưa thích vào một tập tin pdf, nó không quan trọng những gì các thuật ngữ tìm kiếm được. Nếu một trang là một cú nhấp chuột từ trang chủ , như trái ngược với năm cú nhấp chuột , các cụm từ tìm kiếm được sử dụng để tìm thấy nó có thể là bất cứ điều gì và điều đó sẽ không ảnh hưởng đến yếu tố xếp hạng ban cho các trang dựa trên khoảng cách click .

Các thuộc tính độc lập truy vấn phụ thuộc và truy vấn có thể được kết hợp để xác định đơn đặt hàng kết quả tìm kiếm . Một cái gì đó giống như PageRank là truy vấn độc lập. Thêm vào đó việc phân tích các văn bản neo được sử dụng để trỏ đến trang, một thuộc tính phụ thuộc truy vấn, và bạn có thể thấy hai có thể làm việc cùng nhau .

Một ví dụ khác của một chức năng xếp hạng truy vấn phụ thuộc vào sẽ đếm số lần một thuật ngữ tìm kiếm xuất hiện trong một tài liệu .

Ngoài việc là về xếp hạng trang bằng các loại ngôn ngữ , ứng dụng bằng sáng chế này là một trong số đó nhìn vào các yếu tố khác nhau xếp hạng , cả hai truy vấn phụ thuộc , và truy vấn độc lập.

Loại ngôn ngữ ứng dụng bằng sáng chế xếp hạng công ty seo website.

Xếp hạng kết quả tìm kiếm sử dụng các loại ngôn ngữ

Được phát minh bởi Dmitriy Meyerzon và Hugo Zaragoza

Giao cho Microsoft
Ứng dụng bằng sáng chế Mỹ 20060294100
Công bố ngày 28 Tháng 12 2006
Nộp : ngày 26 tháng 4 năm 2006

trừu tượng

Kết quả tìm kiếm của một truy vấn tìm kiếm trên mạng được xếp hạng theo một chức năng xếp hạng bổ sung cho xác suất trước của sự liên quan của một tài liệu dựa trên tài sản tài liệu . Chức năng xếp hạng có thể được điều chỉnh dựa trên sự so sánh của ngôn ngữ là một tài liệu được viết bằng ngôn ngữ và được liên kết với một truy vấn tìm kiếm . Cả hai giá trị truy vấn độc lập và giá trị truy vấn phụ thuộc có thể được sử dụng để xếp hạng các tài liệu .

Tóm tắt các quá trình công ty seo.

Đây là một cách xếp hạng kết quả tìm kiếm theo ngôn ngữ . Nó nhằm mục đích trừng phạt tài liệu không phù hợp với ngôn ngữ của các truy vấn , một cách độc lập với các tính năng xếp hạng khác .

1. Ngôn ngữ của một tài liệu được xác định bởi một phân tích thống kê phân phối nhân vật của trang , và bằng cách so sánh nó với ngôn ngữ phân phối nhân vật được đào tạo.

2 . Lý do tại sao ngôn ngữ được phát hiện chứ không phải lấy từ siêu dữ liệu ( chẳng hạn như thẻ ngôn ngữ html) là vì ” phát hiện ngôn ngữ là một thủ tục tương đối đơn giản với độ chính xác cao ” , và vì ” siêu dữ liệu thường là mơ hồ hoặc sai , hoặc mất tích. ”

3 . Nhận biết ngôn ngữ thường được thực hiện trong thời gian lập chỉ mục (chứ không phải bò hoặc phục vụ kết quả tìm kiếm ) .

4 . Một ngôn ngữ truy vấn được thực hiện hoặc từ tiêu đề yêu cầu trình duyệt hoặc từ các ứng dụng của khách hàng ( tuỳ chọn ngôn ngữ cài đặt trong trình duyệt, ví dụ).

5 . Các ngôn ngữ từ các truy vấn được so sánh với ngôn ngữ được phát hiện từ các tài liệu .

6 . Quả các trận đấu của ngôn ngữ xảy ra khi tài liệu và truy vấn chia sẻ một ngôn ngữ chính (lưu ý rằng một truy vấn Đức-Thụy Sĩ sẽ thường được coi là phù hợp với một tài liệu của Đức -Đức ), hoặc nếu ngôn ngữ chính của tài liệu là tiếng Anh.

7 . Vì vậy , các trang viết bằng ngôn ngữ người dùng không thể đọc được bị phạt, trừ các tài liệu tiếng Anh ( vì giả định rằng hầu hết mọi người sử dụng Internet có thể đọc tiếng Anh hoặc hiểu hương vị khác nhau của tiếng Anh).

8 . Tổng chức năng xếp hạng được sửa đổi bởi tính năng này loại anguage , có thể điều chỉnh việc xếp hạng các tài liệu dựa trên ngôn ngữ phù hợp giữa các tập tin và truy vấn , mà nên cải thiện độ chính xác tổng thể của công cụ tìm kiếm .

9 . Tài Phản hồi từ các truy vấn trước đó có thể được sử dụng như các đánh giá liên quan để lấy được một trọng lượng thích hợp kết hợp với mỗi loại ngôn ngữ so sánh.

10 . Trọng lượng đó có thể được coi là một tham số chức năng xếp hạng , và hành vi của các biện pháp thực hiện trên các giá trị khác nhau của trọng lượng có thể được quan sát .

11. Khi một loại ngôn ngữ so sánh được thực hiện trên một trang, các loại tập tin được đưa vào số điểm cho trang.

12. Tỉ số trang , kết hợp với các loại ngôn ngữ so sánh, xác định thứ hạng của trang giữa các trang khác trong kết quả tìm kiếm .

13. Thuộc tính tài liệu khác có thể ảnh hưởng đến sự liên quan của một tài liệu độc lập của các truy vấn ( chẳng hạn như loại tập tin và kích thước của tập tin).

14. Thay vào đó các loại ngôn ngữ cá nhân , các lớp học của ngôn ngữ có thể được sử dụng , do đó, một tài liệu được không bị phạt khi tài liệu có một ngôn ngữ mà là trong lớp như là ngôn ngữ truy vấn. Vì vậy, nếu các ngôn ngữ trên một trang được xác định là Hà Lan , loại ngôn ngữ được lưu trữ trong chỉ mục cho trang có thể được Hà Lan hoặc có thể Đức , bởi vì nó có thể được giả định rằng độc giả Đức có thể đọc Hà Lan .

kết luận

Tôi bắt đầu tự hỏi, nếu chúng ta sẽ thấy một ứng dụng bằng sáng chế riêng biệt trong tương lai của Microsoft trên mỗi yếu tố xếp hạng mà họ quyết định sử dụng để xếp hạng các trang web. Tôi không nghĩ rằng đó là một ý tưởng tồi , nhưng nó có khả năng cung cấp rất nhiều cái nhìn sâu sắc vào cách thức chúng được xếp hạng các trang web.

Tôi không biết làm thế nào an toàn giả định đó là nhiều người người sử dụng internet hiểu một trong những hương vị khác nhau của tiếng Anh.

Thú vị mà quá trình này dựa vào phân tích của riêng mình của các loại ngôn ngữ của trang chứ không phải là dựa vào một thuộc tính ngôn ngữ hoặc thẻ meta .