Phần nào của trang web của bạn có thể tìm kiếm động cơ bỏ qua?

Là một quản trị trang web , khi bạn đưa một trang trên web , có thể có các bộ phận của trang đó mà bạn có thể không muốn có lập chỉ mục của công cụ tìm kiếm .

Nhiều trang web chứa thông tin đó không phải là duy nhất cho mỗi trang , chẳng hạn như điều hướng cho một trang web , thông báo bản quyền , quảng cáo, các liên kết đến các trang web khác như blog cuộn , và các bộ phận khác có thể không chứa thông tin về các chủ đề chính của trang riêng của mình .

Các lớp học Robot – Noindex Yahoo công ty seo

Vào tháng năm 2007, Yahoo đã thực hiện một bài viết trên Yahoo Search Blog về cách quản trị web có thể cho phép các công cụ tìm kiếm biết rằng nội dung trong phần nhất định của các trang không nên được trả lại trong kết quả tìm kiếm để tìm kiếm , tiêu đề giới thiệu robots-nocontent cho mục Trang .
Các trang Trợ giúp Yahoo Search cung cấp chi tiết về cách chỉ định một lớp học của ” robot – noindex ” để các phần tử HTML , để các nội dung bên trong của những yếu tố không được nhắc lại bởi các công cụ tìm kiếm để đáp ứng với một tìm kiếm, ” Làm thế nào để đánh dấu nội dung trang web đó là không liên quan đến nội dung độc đáo chính trên trang web? “(No longer có sẵn )

Yahoo Sáng trên mục No- Recall

Một ứng dụng bằng sáng chế của Yahoo đã được công bố tuần trước trông sâu hơn vào cách công cụ tìm kiếm sẽ làm theo hướng dẫn không nhắc lại các phần của trang theo “robots- nonindex ” thẻ .

Nó cũng mô tả làm thế nào công cụ tìm kiếm có thể quyết định riêng của mình mà một số phần của trang web không nên được trả lại cho các tìm kiếm bất kể chúng ta sử dụng “robots- noindex ” hay không, sau khi họ phá vỡ một trang thành các phần , và phân tích nội dung của các phần.

Yahoo nộp đơn cung cấp một cách cho nó để đánh giá các phần khác nhau của một trang chống lại một chủ đề chính cho một trang , và chỉ định một số đoạn như không có phần thu hồi , điều đó sẽ không được trả lại trong một tìm kiếm cho các nội dung mà chúng chứa.

Phương pháp để nâng cao chất lượng kết quả tìm kiếm bằng cách tránh các phần lập chỉ mục các trang
Được phát minh bởi Priyank S. Garg , Amit J. Basu , Timothy M. Converse
Ứng dụng bằng sáng chế Mỹ 20080168053
Công bố ngày 10 Tháng 7 2008
Nộp ngày 10 tháng 1 năm 2007

trừu tượng công ty seo uy tín

Một phương pháp và thiết bị để cải thiện kết quả tìm kiếm được cung cấp . Phương pháp này hoạt động bằng cách phân định các phần của một tài liệu không liên quan đến nội dung chính. Nội dung tài liệu được để phân tích xếp hạng toàn bộ . Để đáp ứng với một kết quả truy vấn được nhớ lại bỏ qua các điều khoản bao gồm trong các phần không thu hồi .

Điều khoản trong các phần không thu hồi không được sử dụng trong tiêu đề và tóm tắt các kết quả. Kết quả được sắp xếp ít nhất một phần của bảng xếp hạng do các phần không thu hồi được xác định.

Tổng quan về Không – Nhớ lại quá trình cắt Cắt

Một số phương pháp liên quan đến việc nộp đơn sáng chế :

1) Khi một chương trình tìm kiếm thu thập dữ liệu truy cập vào một trang web , nó có thể chú ý đến cấu trúc của trang , phá vỡ nó xuống thành phần.

2 ) Chương trình thu thập dữ liệu có thể xác định các phần để bỏ qua , và không chỉ trong công cụ tìm kiếm và hiện tại ( recall) để tìm kiếm.

3) Mục để được bỏ qua có thể được gọi là ” không thu hồi ” phần , và các phần của trang được lập chỉ mục có thể được gọi là ” thu hồi ” phần.

4 ) Chương trình công cụ tìm kiếm thu thập dữ liệu có thể bỏ qua các phần của trang đã được đánh dấu bởi người quản trị web đã sử dụng một “robots-nocontent ” lớp học trong một thẻ HTML xung quanh mà phần , chẳng hạn như một ” div ” hoặc một ” khoảng ” hoặc các loại khác của các phần tử HTML có mở và đóng thẻ , chẳng hạn như đoạn văn và các phần khác .

5 ) Chương trình thu thập dữ liệu công cụ tìm kiếm cũng có thể bỏ qua các phần của trang có thể đã được xác định bằng cách phân tích nội dung phần chứ không phải là “robots-nocontent ” lớp học .

6) Điều khoản trong những phần không thu hồi không góp phần vào việc tính tần số hạn tài liệu chỉ số công cụ tìm kiếm , vì vậy từ trong những phần không thu hồi không được coi là khi xác định từ một trang có thể liên quan cho trong bảng xếp hạng một trang cho các truy vấn tìm kiếm.

Nội dung trong những phần không thu hồi được cũng không được sử dụng cho thu hồi các trang để đáp ứng với truy vấn tìm kiếm động cơ.

7) Trong khi các thông tin trong các phần không thu hồi được bỏ qua trong kết quả tìm kiếm , nó được bao gồm như là đầu vào cho các phân tích của các trang mà có thể ảnh hưởng đến những thứ như bảng xếp hạng của trang.

8) Liên kết trong phần không thể thu hồi được theo sau bởi các chương trình tìm kiếm thu thập dữ liệu để khám phá nội dung mới.

9) Một trang cũng có thể được phân tích với số tiền quảng cáo hoặc các tính năng khác mà nó chứa , mặc dù những người có thể đã được đặt trong các phần không thu hồi bằng cách sử dụng ” robots-nocontent” phần bởi một quản trị trang web .

10) Lý do tại sao Yahoo có thể khám phá những gì được chứa trong những phần không thu hồi là để giữ cho mọi người bao gồm cả công cụ tìm kiếm thư rác trong vùng đó. Ví dụ, một trang có chứa một số lượng rất lớn các quảng cáo hoặc liên kết chất lượng thấp, thậm chí trong các phần không thu hồi , có thể được xác định và ” xếp hạng cho phù hợp. ”

Ví dụ về việc sử dụng một Tag Không có – Nhớ lại

Một quản trị trang web sử dụng một thẻ <div class=”robots-noindex”> xung quanh một trang thông báo bản quyền , phần cửa sổ chuyển hướng , liên kết đến các blog liên quan , và một phần quảng cáo.

Trong phần quảng cáo , cụm từ “giày ” xuất hiện , và nó không hiển thị bất cứ nơi nào khác trên trang . Trang sẽ không được nhắc lại bởi các công cụ tìm kiếm trên một truy vấn tìm kiếm cho từ ” giày ” .

Nếu từ “giày” được bao gồm trong các phần khác của trang đó, sau đó trang web sẽ được thu hồi cho truy vấn.

Trong khi nội dung trong một phần được đánh dấu bằng một class = “robots- noindex ” trong một phần tử HTML được không lập chỉ mục của một số công cụ tìm kiếm , khi trang được nhắc lại bởi một công cụ tìm kiếm cho một truy vấn tìm kiếm, các yếu tố được coi là spam và liên quan phân tích , với các thuộc tính trong tất cả các phần của trang web, chẳng hạn như ” liên kết ” , tần số từ ngữ , màu sắc, phông chữ, vv

Khi Yahoo Xác định Không – Nhớ lại mục Tự bản thân

Quản trị web có thể đánh dấu các phần của trang để nội dung trong những phần không được trả lại cho các tìm kiếm nội dung chứa trong các phần không thu hồi . Công cụ tìm kiếm có thể quyết định chỉ định một số phần của trang như phần không thu hồi ngày của riêng mình .

Dưới đây là các bước liên quan trong quá trình này :

1) Công cụ tìm kiếm phân tích thông qua mã HTML của một trang để xác định phần hợp lý khác nhau.

2) Các nội dung trong mỗi phần được phân tích , bằng cách tạo ra một tài liệu mô hình trừu tượng sử dụng một số phương pháp có thể. Thuộc tính được xem xét trong phân tích , chẳng hạn như ‘ số lượng, tần số và thứ tự xuất hiện từ ngữ , phông chữ, và màu sắc. “Ngoài ra, các liên kết đi trong các phần khác nhau cũng phân tích , xem xét những thứ như ” nơi các liên kết dẫn , liên kết văn bản và số lượng liên kết và chất lượng . ”

3) Các phần của một trang được đánh giá dựa trên liên quan của chúng có thể là chủ đề chính của trang web, sử dụng một số phương pháp có thể .

4) Một số phương pháp khác có thể được sử dụng để xác định một phần không thu hồi , chẳng hạn như tần số thay đổi nội dung của một phần , so với nội dung của các phần còn lại của trang. Ví dụ, một phần dành cho quảng cáo có thể thay đổi trên tất cả các chuyến thăm đến một trang , trong khi phần còn lại của các phần không thay đổi ở tất cả . Một số bộ phận có thể là giống nhau trên mỗi trang của một trang web , chẳng hạn như các phần bản quyền và tiêu đề.

5) Mục với xếp hạng mà chỉ họ là phần không thu hồi được chỉ định bởi các công cụ tìm kiếm, cũng như các phần đánh dấu bằng một ” robot – noindex ” tag bởi quản trị web .

kết luận

Tôi đã viết trước đó về cách Yahoo có thể phá vỡ một trang thành các phần , và cố gắng để tìm thấy những ” phần quan trọng nhất ” của trang đó trong Tầm quan trọng của Giao diện trang trong SEO. Ứng dụng bằng sáng chế mới này cho chúng ta thấy làm thế nào một công cụ tìm kiếm có thể mất một phân tích như vậy, và sử dụng nó để bỏ qua một số phần của trang .

Khi bạn đặt trang của bạn lại với nhau, hãy nhớ rằng một công cụ tìm kiếm chỉ có thể được lập chỉ mục một số phần của trang web của bạn , bất kể bạn sử dụng một cái gì đó giống như một ” robot – noindex ” tag xung quanh một số những phần hay không.