TẦM QUAN TRỌNG CỦA TRANG bố trí trong SEO

Nếu một công cụ tìm kiếm có thể hiểu được cách bố trí của một trang web và xác định các phần quan trọng nhất của một trang web , nó có thể chú ý hơn đến phần đó của trang khi lập chỉ mục nội dung từ trang.

Nó có thể cung cấp cho các liên kết được tìm thấy trong đó phần của trang trọng hơn các liên kết được tìm thấy trong các phần khác của trang, và nó có thể xem xét thông tin trong khu vực mà trọng lượng hơn khi xác định những gì trang là về .

Chúng tôi đã nhìn thấy những ý tưởng phá vỡ các trang thành phần từ một vài công cụ tìm kiếm thương mại lớn :

Microsoft VIPS và phân tích liên kết cấp khối (pdf)
Google – Văn bản phân khúc dựa trên Visual khoảng trống

Một ứng dụng bằng sáng chế từ Yahoo tìm hiểu làm thế nào để gần đúng cách bố trí của một trang web, mà không thực sự hiển thị các trang như là một trang web theo cách mà một chương trình trình duyệt nào .

Không thực sự vẽ một trang giống như một sức mạnh trình duyệt làm cho quá trình nhanh hơn, mà quan trọng là khi một công cụ tìm kiếm đã tìm rất nhiều trang web.

Nộp bằng sáng chế cũng khám phá cách để xác định những phần quan trọng nhất của một trang có thể là từ phiên bản xấp xỉ của một bố trí . Nộp bằng sáng chế là :

Kỹ thuật cho xấp xỉ bố trí hình ảnh của một trang web và xác định các phần của trang chứa nội dung quan trọng
Được phát minh bởi Anandsudhakar Kesari
Ứng dụng bằng sáng chế Mỹ 20080033996
Công bố ngày 07 Tháng Hai 2008
Nộp ngày 03 tháng 8 2006

Dưới đây là tóm tắt từ các ứng dụng bằng sáng chế :

Để gần đúng một cách bố trí hình ảnh của một trang web mà không cần dựng trang web, một cây đối tượng đại diện cho các thành phần trong trang được đệ quy đi qua để xác định giới hạn cho độ rộng của các yếu tố , dẫn đến cận dưới gây ra cho các nút lá không do yếu tố bên trong các nút và cận trên gây ra bởi tổ tiên và anh chị em của các nút .

Cho mỗi yếu tố , chiều rộng tối thiểu cần thiết ( giảm ràng buộc ) , chiều rộng mong muốn không có khó khăn, và tối đa có sẵn chiều rộng (giới hạn trên ) dựa trên các ràng buộc của cha mẹ được tính toán, và có chiều rộng xấp xỉ được phát sinh từ đó .

Một quá trình định vị vị trí mỗi phần tử trong container phụ huynh tương ứng của mình bằng cách thúc đẩy một con trỏ theo chiều rộng xấp xỉ của các yếu tố và hạn chế thích hợp.

Các yếu tố có chứa nội dung có ý nghĩa nhất được xác định dựa trên số lượng nội dung trọng của các yếu tố và vị trí của họ trong trang.

Hệ thống thông tin Khai thác và Cấu trúc dữ liệu công ty seo website

Những cách mà thông tin có thể được trình bày trên các trang web thường có thể được mô tả như cấu trúc, bán cấu trúc , hoặc cấu trúc.

Cấu trúc có nghĩa là các trang được tạo ra bằng cách sử dụng bố trí chung hoặc mẫu , và chứa các trường thông tin tương tự từ trang này sang trang khác.

Các trang web bán cấu trúc có thể sử dụng các mẫu có một số biến thể cho họ. Ví dụ, một trang có thể bao gồm thông tin và các lĩnh vực mà các trang khác không có, hoặc một số trang có thể hiển thị một phạm vi rộng hơn thông tin và giá trị. .

Một số trang web có thể sử dụng một định dạng cấu trúc có thể bao gồm các trang web việc làm, hoặc các trang web du lịch, hoặc các trang thương mại điện tử sản phẩm .

Phần lớn các trang trên một trong những trang web có thể hiển thị tất cả các lĩnh vực thông tin tương tự từ trang này sang trang khác, và nếu không có thông tin để điền vào một lĩnh vực , lĩnh vực này được thể hiện dù sao, nhưng có thể thấy rằng không có thông tin cho rằng lĩnh vực . Một hiệu sách trực tuyến có thể được thiết lập theo cách đó, quá .

Một định dạng bán cấu trúc chỉ có thể không hiển thị trường đó là trống rỗng, hoặc có thể hiển thị một số lĩnh vực mới nếu có thông tin duy nhất để hiển thị .

Khai thác thông tin (IE) hệ thống được sử dụng để thu thập và xử lý thông tin phi cấu trúc và bán cấu trúc trên web và cơ sở dữ liệu phụ trợ cư với các hồ sơ có cấu trúc.

Một trong những thách thức phải đối mặt bởi một hệ thống khai thác thông tin nhanh chóng và chính xác các thông tin từ các trang HTML .

Vì vậy , làm thế nào một hệ thống khai thác thông tin tìm thấy những thứ tốt trên một trang đầy đủ của mã HTML, và bỏ qua nội dung vô dụng?

Nó có thể tìm một số tín hiệu từ HTML , chẳng hạn như công ty seo 

(a ) Phong cách của nội dung, như màu sắc, nhấn mạnh , kích thước, vv;

(b) bố trí hình học của các yếu tố trang của trang, như vị trí tuyệt đối và tương đối của các yếu tố ; và ,

(c) Một trực quan khu vực quan trọng trên trang đó có chứa nội dung chính.

Nhìn vào HTML để có được tín hiệu về bố trí và có phần có thể chứa nội dung chính của một trang có thể khó khăn , mà không sử dụng một cái gì đó giống như một trình duyệt để hiển thị một trang cách mà mọi người thực sự nhìn thấy nó.

Nhưng chi phí tìm kiếm một trang theo cách đó có thể được tính toán đắt tiền, và nếu một xấp xỉ tốt có thể được thực hiện mà không liên quan đến loại chi phí , sau đó nó có thể là lý tưởng cho việc khai thác thông tin .

Xác định các phần tử quan trọng nhất của một trang công ty seo website

Một công cụ tìm kiếm không thực sự muốn trả quá nhiều sự chú ý đến các phần của một trang mà nó có thể xem xét ồn ào , chẳng hạn như các thanh menu , hoặc biểu ngữ hay quảng cáo nhắm mục tiêu khi lấy thông tin từ một trang.

Nó có lẽ không muốn tập trung vào một phần chân của một trang, với các thông tin như thông báo bản quyền , hoặc tiêu đề của một trang mà có thể chứa một biểu tượng trang web lặp đi lặp lại từ trang này sang trang khác trên trang web.

Các yếu tố quan trọng nhất của trang web sẽ được ước tính bằng quá trình thiết kế trực quan này , bằng cách cố gắng tìm các phần tử có chứa hầu hết các nội dung có ý nghĩa trên trang.

Rằng yếu tố quan trọng nhất của trang sẽ được dựa trên số lượng nội dung trọng của các yếu tố và vị trí của các yếu tố bên trong các trang như là xấp xỉ bằng quá trình thiết kế trực quan .

kết luận

Các ứng dụng bằng sáng chế đi vào rất nhiều chi tiết trên một phương pháp để ước tính bố trí của một trang , và để hiểu được vị trí của các yếu tố trong một trang , cũng như xác định các yếu tố quan trọng nhất của trang .

Nếu bạn xây dựng trang web , và bạn muốn một ý tưởng làm thế nào một công cụ tìm kiếm có thể được xem xét và cân nhắc các nội dung của các trang của bạn , bạn có thể muốn dành thời gian với nộp hồ sơ bằng sáng chế này .

Xem xét rằng Google và Microsoft cũng đã phát triển các phương pháp để phân đoạn nội dung của các trang web, Nó không phải là một ý tưởng tồi để có được một cảm giác như thế nào tất cả họ đều có thể bị phá vỡ trang thành nhiều phần .