GOOGLE XÁC ĐỊNH TRANG TÌM KIẾM QUYỀN VÀ QUYỀN LIÊN QUAN tuyên truyền TRANG

Google đã công bố một cách tiếp cận để xác định các trang thẩm quyền thuật ngữ truy vấn và địa điểm kinh doanh và chuyên mục trên một trang web , và làm cho các trang khác trên cùng một trang web phù hợp hơn cho thông tin đó, ngay cả khi nó không được đề cập trên các trang khác .

Có trang thẩm quyền trên trang web cho một số thuật ngữ tìm kiếm hay địa điểm kinh doanh hoặc loại ?

Nó có thể hữu ích cho các nội dung và chuyên mục của một số trang trên một trang web để được quy cho các trang khác của trang web đó , để những trang xếp hạng cao trong kết quả tìm kiếm ?
Làm thế nào trang thẩm quyền này sẽ được xác định , và khi nào và như thế nào thông tin đó sẽ được truyền đến các trang khác của trang web?

Tìm kiếm địa phương trình được nhập khẩu để tìm kiếm Web?

Một trong những ứng dụng tìm kiếm bằng sáng chế tại địa phương của Google bao gồm một quá trình tương tự – nhận dạng tài liệu có thẩm quyền . Tôi đã viết về nó cuối tháng bảy trong một bài có tiêu đề tài liệu Thẩm quyền của Google tìm kiếm địa phương .

Tài liệu mô tả một cách để tìm các tài liệu liên quan đến thẩm quyền với một vị trí , nhìn vào tín hiệu kết hợp với những tài liệu, và xác định cửa quyền của họ cho vị trí dựa trên một số tín hiệu .

Bằng sáng chế ứng dụng quan của Google

Một ứng dụng bằng sáng chế mới từ Google khám phá những ý tưởng của việc xác định thẩm quyền trang cho các cụm từ truy vấn cụ thể cũng như các địa điểm kinh doanh và chủng loại, và làm cho các trang có liên quan trên cùng một trang web cũng được tìm thấy phù hợp hơn với những cụm từ hoặc các địa điểm hoặc loại, thậm chí nếu đó thông tin không xuất hiện trên các trang liên quan .

Tuyên truyền thông tin hữu ích giữa các trang web có liên quan , chẳng hạn như các trang web của một trang web
Được phát minh bởi Daniel Egnor , Paul Haahr , Kevin Lacker , John Lamping , Amitabh K. Singhal , và Ke Yang
Ứng dụng bằng sáng chế Mỹ 20070233808
Công bố ngày 04 Tháng 10 2007
Nộp : 31 tháng 3 năm 2006

trừu tượng

Các trang web của một Website có thể được xử lý để cải thiện kết quả tìm kiếm. Ví dụ, thông tin có thể liên quan đến nhiều hơn chỉ là trang Web đó là trực tiếp liên quan có thể được xác định. Một hoặc nhiều khác , có liên quan , các trang web có thông tin như vậy có thể liên quan đến cũng được xác định. Các thông tin xác định có liên quan đến các trang Web khác được xác định (s) và hiệp hội này được lưu trong một cách để ảnh hưởng đến một số kết quả tìm kiếm của trang web (s) .

quyền Trang

Một số bằng chứng cho thấy một công cụ tìm kiếm có thể có thể xem xét khi xác định một thuật ngữ mà các trang Website / web có thể được coi là có thẩm quyền :

Sử dụng các thuật ngữ trong một hoặc nhiều tài liệu tham khảo cho trang web, chẳng hạn như liên kết đến các trang.
Sử dụng các thuật ngữ , chẳng hạn như tên doanh nghiệp, trong các thư mục như mục Yellow Pages trong đó cho thấy trang web như trang web cho doanh nghiệp.
Sử dụng thuật ngữ trong tên miền .
Thuật ngữ này là một nhãn hiệu đăng ký và đăng ký nhãn hiệu có liên quan đến trang chủ của trang web.
Xác suất mà thuật ngữ truy vấn tìm kiếm sẽ cung cấp kết quả tìm kiếm tốt mà người dùng click vào và nơi những người sử dụng có thể ở lại trong một thời gian trước khi trở lại với các kết quả tìm kiếm để nhấp vào một kết quả khác nhau . Xác suất này có thể được sử dụng trong việc xác định sức mạnh của bằng chứng .
Các nguồn khác cho thấy một Website là độc quyền cho một thuật ngữ .
Như ñoùng bằng chứng , cho dù thuật ngữ có liên quan đến các trang web khác của một hoặc nhiều trang web khác .
Sức mạnh của mỗi mảnh bằng chứng , và toàn bộ các bằng chứng , có thể được sử dụng để xác định cách mạnh mẽ sự liên kết giữa nhiệm kỳ và trang đích. Nếu đủ mạnh , thời gian và trang có thể được liên kết . Quyết định sau khi một trang có thẩm quyền có thể phụ thuộc vào khả năng như thế nào tốt kết quả là nó được so sánh với hoặc là tất cả các kết quả khác , hoặc một số lượng nhất định của họ .

Nếu thời hạn là một cụm từ, toàn bộ cụm từ ( hoặc ít nhất là tất cả các từ của cụm từ ) có thể được yêu cầu để xảy ra trong truy vấn. Vì vậy, cho một truy vấn như ” đầu tư thế kỷ mỹ “, một trang web có thể được coi là độc quyền cho truy vấn ” đầu tư thế kỷ mỹ ” toàn bộ , nó có thể không có thẩm quyền cho các từ thành phần ” mỹ “, ” thế kỷ ” và ” đầu tư ” của truy vấn.

Thông tin vị trí có thẩm quyền

Google Nội -Website Tuyên truyền

Địa điểm liên kết với một trang web có thể được xác định bằng cách nhìn vào các nguồn dữ liệu khác nhau :

Địa chỉ đầy đủ trên trang web ,
Những lần xuất hiện của tên địa điểm trên trang Web ,
Dữ liệu trang vàng (ví dụ , với các trang nhà và / hoặc số điện thoại ) cho một địa chỉ hoặc địa điểm cho các trang Web ,
Thông tin meta từ đăng ký tên miền,
Mã quốc gia của tên miền ,
Cơ sở dữ liệu bao gồm các điều khoản có nơi,
Tên địa điểm xảy ra trên các trang khác gần liên kết đến trang ,
vv
Tên địa điểm từ các nguồn khác nhau có thể được liên kết với các trang web, và loại và số lượng nguồn cung cấp cho mỗi mẩu thông tin có thể được theo dõi và được sử dụng để ghi thông tin vị trí được xác định.

Một vài năm trở lại, Google đã cho ra đời một ứng dụng bằng sáng chế trên Phân công địa điểm địa lý vào trang web . Tôi đã viết một số bài viết chi tiết về nó ở Cre8asite dấu . Mà nộp hồ sơ bằng sáng chế mô tả cách Google có thể xác định một vị trí cho một trang , và làm cho các trang khác trên cùng một trang web ” về mặt địa lý có liên quan ” với địa điểm đó . Nó nhắc nhở tôi một số quá trình nộp hồ sơ trong bằng sáng chế này của ” nhân giống ” phù hợp cho các trang có liên quan.

Chúng tôi đang nói rằng một hệ thống học máy có thể được sử dụng để quyết định làm thế nào để cân nhắc những loại khác nhau của ” sự tự tin vị trí ” bằng chứng , và chỉ về phía một vài bằng sáng chế của Google cấp khác :

Tài liệu xếp hạng dựa trên dữ liệu lớn
Hệ thống học máy quy mô lớn và phương pháp
Liên kết một trang web với một vị trí

Nộp bằng sáng chế cung cấp một số chi tiết về cách vị trí bằng chứng có thể được sử dụng để xác định vị trí có thẩm quyền cho một trang web , nhưng những gì tôi thấy thú vị là làm thế nào các trang web có rất nhiều địa chỉ liên kết với chúng có thể được điều trị. Nếu một trang web có quá nhiều vị trí được coi là có liên quan, các địa điểm có thể không được tuyên truyền đến trang chủ của trang web.

Một điểm tìm kiếm thông tin có thẩm quyền trên một trang của một trang web là làm như vậy làm cho nó có thể kết hợp vị trí đó tại trang chủ của trang web, ngay cả khi nó có thông tin vị trí không xuất hiện trên trang chủ .

Một thương hiệu như McDonald có quá nhiều vị trí liên kết với nó cho quá trình này sẽ được sử dụng một cách hợp lý .

Tuyên truyền Vị trí và Thông tin khác

Thông tin khác hơn là chỉ thông tin vị trí có thể được xác định và tuyên truyền lên và xuống trang web .

Điều phổ biến – như tần số cao ngược tài liệu (IDF) điều khoản, có thể được truyền đến trang chủ hay gốc.
Loại trang – từ danh sách được xác định trước hoặc loại thẳng đứng, từ khái niệm, từ chủ đề, từ thể loại, vv, có thể được truyền đến trang chủ hay gốc ..

Dưới đây là một chút về cách mà sẽ làm việc trong bối cảnh thông tin vị trí :

Địa điểm được đề cập trên mỗi trang của trang web có thể được thu thập.
Điểm dựa trên các yếu tố như nguồn thông tin vị trí , và tần số của những địa điểm , sẽ được thu thập từ các trang này.
Một giá trị niềm tin cho mỗi địa điểm sẽ được xác định dựa trên những điểm số tích lũy hoặc điểm số yếu tố .
Tỉ số sự tự tin có thể được thực hiện cho mỗi trang web , nơi mà số điểm sự tự tin là một chức năng của thông tin trên các trang web dưới đây trang web cụ thể trong cấu trúc liên kết trang web.
Thông tin vị trí có thể được nhân giống lên chỉ nhà hoặc gốc trang của trang web.
Khi xử lý một truy vấn, các trang web có thể cung cấp tín dụng cho có tất cả những lời của các vị trí , cung cấp có những từ quan trọng khác trong truy vấn , bên cạnh vị trí . ( Nó có thể được mong muốn để không cung cấp tín dụng vị trí bổ sung vào các trang web nếu truy vấn chỉ là về một địa chỉ . )
Nếu có ý nghĩa , không phải vị trí , nói cách khác trong truy vấn, nó có thể là mong muốn cung cấp cho mỗi từ vị trí nhiều như tín dụng là có cho có ý nghĩa không từ vị trí mạnh nhất của truy vấn.
Nếu có rất nhiều địa điểm liên kết với một trang web, nó có thể được mong muốn để làm giảm lượng tín dụng nhất định.
Hiệp hội các thông tin nội bộ Trang web

Thông tin trang web (ví dụ , trang web, nội dung trang web , trang web thông tin dữ liệu , các trang vàng dữ liệu, dữ liệu đăng ký tên miền, vv được thu thập và trích xuất.
Thông tin đó là có khả năng liên quan đến các trang của các trang web khác hơn là từ trang nó được tìm thấy sau khi được xác định.
Trang khác có liên quan là thông tin được xác định là có khả năng liên quan đến được xác định.
Đó là thông tin được xác định có liên quan đến các trang web được xác định.
Website sửa đổi và / hoặc trang web (s) (ví dụ , các trang web với các thông tin liên quan mới ) thông tin được lưu để trang sửa đổi sẽ có một số điểm tìm kiếm cao hơn cho một truy vấn tìm kiếm bao gồm các thông tin xác định so với các trang ban đầu sẽ đã có
Truy vấn thông tin đôi khi xác định có thể không được truyền xuống các trang nhất định của một trang web :

PageRank thấp – trang với một PageRank thấp có thể không nhận được các thông tin được xác định liên quan đến họ .
Độ từ Trang chủ – Giới hạn có thể được dựa trên một số định trước (ví dụ 2) cấp độ khác nhau (ví dụ , số gạch chéo ngược từ trang Web nguồn ) của nguồn (ví dụ , nhà hoặc root) trang web và các trang web đích trong trang web.
Các loại trang – thông cáo báo chí , bảng tin , diễn đàn , các trang tiếng nước ngoài ( trong một ngôn ngữ khác hơn so với các trang nguồn ) có thể được loại trừ.
Tương tác với nội dung trùng lặp

Phương pháp này tuyên truyền thông tin từ một trang nguồn vào một trang điểm đến, nơi các thông tin không xuất hiện, có thể có ảnh hưởng đến các trang được nếu không giống nhau, nhưng trên trang web khác nhau, và có thể làm cho chúng có điểm khác nhau.

Ví dụ

Một trang web của Cincinnati Ramada trên Website của www.ramada.com có thể có một điểm số cao hơn so với các trang web giống hệt nhau trên trang web của www.hotels.com (ít nhất là cho các truy vấn tìm kiếm bao gồm cả thuật ngữ ” ramada ” ) .

Đây là một mục tiêu của việc nộp bằng sáng chế, và rất hữu ích bởi vì hầu hết người dùng tìm kiếm các khách sạn Ramada ở Cincinnati có khả năng sẽ thích trang web từ trang web có thẩm quyền khi truy vấn tìm kiếm bao gồm cụm từ ” ramada ” .

Tuyên truyền thông tin mô tả cao

Một số từ cao mô tả và các thông tin khác trên một trang web thường không nằm trên trang chủ của một Website . Nó có thể hữu ích để xác định rằng loại thông tin và liên kết nó với nhà hoặc gốc trang của một trang web .

Đây là cách thông tin rất mô tả như vậy có thể được nhân giống một cấu trúc liên kết trang web trong một trang web:

Thông tin Website được thu thập và trích xuất.
Địa điểm hoặc một số thông tin rất mô tả nào khác liên kết với một trang khác với nhà hoặc gốc trang của một trang web , được xác định.
Các thông tin xác định có thể được ghi trên mỗi trang web .
Các thông tin xác định là tuyên truyền (ví dụ , các cấu trúc liên kết trang web ) cho một hoặc nhiều trang web đích.
Một sự tự tin trong sự vừa vặn của vị trí xác định hoặc thông tin khác cho một trang web đích được xác định .
Nếu điểm tự tin là không đủ cao, các thông tin không được liên kết với trang đích.
Nếu điểm tự tin là đủ cao , vị trí xác định hoặc các thông tin khác có liên quan đến trang web đích và lưu lại.
Tuyên truyền có thẩm quyền Thông tin Xuống công ty seo.

Giả sử rằng trang chủ của Website Ramada đã được xác định là có thẩm quyền trong thời hạn “Ramada ” . Một bằng chứng sử dụng để làm determiniation đó là phần lớn các liên kết bao gồm các văn bản “Ramada ” điểm vào các trang web trên trang web Ramada.com .

Phần khác của chứng cứ có thể được thu thập để xác nhận rằng khi mọi người tìm kiếm “Ramada ” họ có thể muốn trang web Ramada .

Cơ hội được rằng tất cả các trang khác trên trang web là “liên quan đến ” trang chủ và có liên quan đến thuật ngữ truy vấn , ngoại trừ một số trang mục đích trái ra ngoài, chẳng hạn như thông cáo báo chí .

Đã xác định thông tin “Ramada ” – có thể được liên kết với các trang Web không được miễn và hậu duệ của nó , Trang Web và hậu duệ của nó , và các trang web khác và con cháu của nó trên Website của Ramada liên quan đến trang chủ. Một hiệp hội như vậy có thể được thực hiện bằng cách chú thích một bản sao của mỗi trang web không loại trừ trong ramada.com , hoặc thông tin thu được từ các trang web như vậy được sử dụng cho IR , như là chuyên đề cho thuật ngữ ” ramada ” .

Làm thế nào mà có thể được thực hiện?

Khi xử lý một truy vấn, nếu truy vấn có chứa toàn bộ thời hạn , mỗi trang web được chú thích , có thể được coi là có một số lượng nhất định (ví dụ , sáu) của các trang Web khác trỏ đến nó , bằng cách sử dụng cụm từ như neo văn bản, qua đó thúc đẩy một trang số thứ hạng của trang khi các kỹ thuật tìm kiếm Google được sử dụng.

Tuyên truyền cao mô tả Thông tin ký

Có một trang web cho một nhà hàng Việt Nam mang tên ” Sài Gòn II ” .

Giả định rằng nhà hoặc gốc trang của trang web không bao gồm địa chỉ của nhà hàng, nhưng một trang web dưới của trang web không bao gồm địa chỉ 123 Main Street, kỳ thị trấn nào , CA .

Nếu bạn giả định thêm rằng ” 123 Main Street, kỳ thị trấn nào , CA” có thể được coi là một địa chỉ hoặc vị trí với mức độ mong muốn của sự tự tin (ví dụ như do các thuật ngữ ” đường phố” , tên viết tắt của nhà nước ” CA” , cú pháp của địa chỉ , vv), sau đó trang chủ cho trang web có thể được cung cấp tín dụng cho các vị trí “123 Main Street, kỳ thị trấn nào , CA, ” với mục đích tìm kiếm mặc dù tên của vị trí không xuất hiện trên trang chủ.

Thông tin vị trí có thể không phải là thông tin duy nhất trên trang web này có thể được nhân giống từ trang này sang trang khác. Hãy tưởng tượng rằng một trang của trang web bao gồm các mục trình đơn cho các nhà hàng, trong đó có ” phở “, mà là một món bún bò .

Giả sử rằng ” phở ” được coi là một thuật ngữ mô tả đánh giá cao bởi vì nó không phải là thường xuyên được sử dụng trong một bộ sưu tập rộng của trang web .

Thuật ngữ này ” phở ” có thể được xác định và tuyên truyền đến trang chủ của trang web là tốt, và được đối xử như thể từ đó xuất hiện trên trang chủ , mặc dù nó thực sự không.

Bây giờ giả sử rằng một người nào đó từ hoặc gần Anytown , CA tìm kiếm ” nhà hàng phở ” trang chủ có thể hiển thị như là một trận đấu có liên quan, mặc dù cả hai thuật ngữ ” phở ” cũng không phải là vị trí thực sự xuất hiện trên trang chủ của trang web. khác.

Tuyên truyền cao mô tả mục Thông tin ký công ty seo website.

Mang theo trang web cho nhà bán lẻ điện tử Best Buy . Trang chủ liên kết đến các trang tương ứng với các loại sản phẩm khác nhau. Các trang liên kết đến trang sản phẩm cụ thể.

Các loại sản phẩm có thể được coi là cao mô tả. Những loại sản phẩm có thể được xác định trong các trang Web và tuyên truyền đến trang chủ của trang web.

Vì vậy , trang chủ Best Buy có thể được cho tín dụng cho (ví dụ như , coi như bao gồm cả ) các điều khoản ” TV “, ” máy tính “, ” trò chơi điện tử “, ” DVD “, ” CD “, ” máy ảnh ” và ” máy quay video, ” nhằm mục đích tìm kiếm, ngay cả khi những điều khoản không xuất hiện trên trang chủ.

Trên một tìm kiếm cho ” TV và trò chơi video, ” trang chủ cho Best Buy sẽ là phù hợp hơn với một truy vấn như vậy với các loại hình tuyên truyền hơn nó đã khác.

Tuyên truyền quan trang web Off

Một trang web từ một trang web có thể bao gồm một địa chỉ, và một tham chiếu như một liên kết gần địa chỉ , đến một trang web trên một trang web thứ hai . Điều đó có thể gợi ý rằng các địa chỉ tìm thấy trên trang web đầu tiên của trang web đầu tiên có thể liên quan đến các trang web thứ hai của trang web thứ hai .

Địa chỉ có thể được lưu trong hiệp hội với các trang trên trang web thứ hai để các trang sẽ có một số điểm tìm kiếm cao hơn cho một truy vấn tìm kiếm bao gồm địa chỉ, hoặc có lẽ một phần của địa chỉ, so với nếu không sẽ có .

Nguồn gốc của thông tin ban đầu không cần phải là một trang web, và mối quan hệ không cần phải là một liên kết . Loại giấy tờ khác có thể là những thứ như một nộp hồ sơ SEC , một hồ sơ cấp giấy phép kinh doanh , vv, mà có thể bao gồm tên doanh nghiệp và địa chỉ của doanh nghiệp.

Nếu một trang web được đăng ký kinh doanh , hoặc có một URL bao gồm tên doanh nghiệp , hoặc nổi bật hiển thị tên doanh nghiệp, nhưng không có thông tin địa chỉ, thông tin địa chỉ có thể được lấy từ các tài liệu như việc nộp SEC hoặc danh sách doanh nghiệp , và xếp hạng trong tìm kiếm cho một truy vấn liên quan đến vị trí .

Loại tuyên truyền của chính quyền có thể bị giới hạn đến các lớp học nhất định hoặc các loại thông tin , chẳng hạn như địa chỉ, số điện thoại, loại hình kinh doanh , thể loại trang, vv

Mối quan hệ giữa Điều khoản

Thay vì các tài liệu , các mối quan hệ giữa các điều khoản có thể tận dụng lợi thế của quá trình được mô tả trong ứng dụng bằng sáng chế này . Mối quan hệ sẽ có được một mạnh mẽ . Một ví dụ sẽ là một trang web bao gồm cả thuật ngữ ” Cleveland” , các thông tin có thể là ” Ohio” .

Một trang web với một số điện thoại mà có một mã vùng Chicago, . nhưng không sử dụng thuật ngữ ” Chicago, ” có thể xếp hạng cao hơn một chút cho một truy vấn bao gồm ” Chicago” bên trong nó.