Công sáng chế NỘP ĐƠN VỀ BLOG SPAM

Có một ứng dụng bằng sáng chế mới từ Technorati trên blog của thư rác. Trước khi nhảy vào đó, tôi muốn xem một số bài đăng trên blog gần đây về Công và tìm kiếm blog của Google.

Robert Scoble đã viết một , gương gương trên tường, mà blog tìm kiếm là tốt nhất của tất cả? – Yêu cầu độc giả của mình mà viết blog tìm kiếm là tốt nhất.

Lisa Barone được Dave Sifry của Nhà nước của Live Web và cung cấp một số phân tích chu đáo của số liệu thống kê từ báo cáo.

Maki , trên tại Search Engine Journal, khám phá sự khác biệt giữa Google Blog Search và Công sâu hơn , yêu cầu nào là tốt hơn ? Cô bàn về một số khác biệt giữa mỗi cho thấy giá trị của cả hai.
Đã chất lượng kết quả Công tăng lên gần đây , như Robert Scoble đã nói trong chuyến đi gần đây của ông tới khu vực South Park ở San Francisco ? Thành thật mà nói , khi tôi đang thực hiện tìm kiếm trên các blog, tôi sẽ thường xuyên thực hiện các tìm kiếm tương tự trên Technorati, Google Blog Search , và Bloglines . Kết quả thường khác nhau , nhưng tôi thấy giá trị trong cả ba.

Công Sáng trên Blog Spam

Hoạt động liên kết và các trang web thư rác tín hiệu có thể được xem xét với nhau để xác định thư rác trong blog? Một ứng dụng bằng sáng chế Công bố sáng nay nhìn vào các loại đồ vật mà chỉ ra thư rác, và mô tả cách các ID liên kết có thể được sử dụng với những chỉ số để xác định các trang thư rác và ngăn chặn lập chỉ mục chúng .

Trang web thư rác và spam kỹ thuật có thể phát sinh trong một loạt các hình thức , tất cả đều là lôi cuốn và lừa đảo , thực hiện chỉ duy nhất cho mục đích ảnh hưởng đến thứ hạng của trang hoặc phân loại trên một công cụ tìm kiếm :

Tần số cao công bố trang web.
Một số sai lầm liên kết trong nước ( nuôi liên kết ) , hoặc trích dẫn công bố trên các trang web khác.
Nhồi nhét từ khóa .
Tự động xuất bản nội dung của bên thứ ba .
Loại thông tin này được xem xét cùng với sự hiện diện của thông tin nhận dạng liên kết.

Để xác định thư rác, các phương án của sáng chế kiểm tra cấu trúc của một tài liệu mạng cho dấu hiệu liên kết với tiền thưởng trả tiền mạng nhấp chuột thương mại. Thống kê về chu kỳ khoảng thời gian xuất bản và phát tán trên các ấn phẩm của thẻ nhận dạng liên kết có thể được sử dụng để các trang web cờ là thư rác.

Xác định và phân loại tài liệu mạng là thư rác

Đây là một tổng quan đơn giản hóa quá trình được mô tả trong các ứng dụng bằng sáng chế :

1) Một tài liệu được thu thập thông tin hoặc lập chỉ mục để đáp ứng với một ping .

2) Trường hợp của nội dung trùng lặp từ các nhà xuất bản khác được xác định. Khi nội dung đã được sao chép từ các nhà xuất bản khác , nó cho thấy rằng tài liệu đó là ngày có thể là thư rác. Một số có thể được duy trì phần sao chép văn bản hoặc nội dung khác, và / hoặc số lượng các nhà xuất bản khác mà từ đó nội dung đã được sao chép .

3) repetitiveness nội dung trong một tài liệu được xem xét . Các nhiều lần một số từ đã được sao chép và lặp đi lặp lại trong một tài liệu , nhiều khả năng các tài liệu là thư rác.

4) Liên kết trong một tài liệu được xem xét để xem họ đã được xác định trước đây như được liên kết với các trang web spam.

5) Khi từ khóa nhất định xuất hiện nhiều hơn một số lần nhất định , điều này cho thấy rằng các tài liệu là thư rác.

6) trọng lượng được gán cho mỗi bên trên , và các yếu tố khác có thể được xem xét thêm .

7) Nếu các trang ứng cử viên được xác định như là thư rác, một lá cờ có thể được áp dụng cho một liên kết ID kết hợp với tài liệu đó.

8) các trang khác liên kết với liên kết ID có thể không được xử lý và lập chỉ mục.

Thông tin thêm về các ứng dụng bằng sáng chế : công ty seo website.

Phương pháp và thiết bị để xác định và phân loại tài liệu mạng là thư rác
Được phát minh bởi Ian Kallen
Giao cho Công , Inc
Ứng dụng bằng sáng chế Mỹ 20070078939
Công bố ngày 05 Tháng tư 2007
Nộp : 25 Tháng Chín năm 2006

trừu tượng công ty seo.

Tiết lộ những phương pháp và thiết bị , bao gồm cả các sản phẩm chương trình máy tính , thực hiện và sử dụng kỹ thuật cho các phương pháp và thiết bị , bao gồm cả các sản phẩm chương trình máy tính , thực hiện và sử dụng kỹ thuật để xác định và phân loại một tài liệu mạng như là một ứng cử viên thư rác. Trong một khía cạnh của sáng chế, một tài liệu mạng được lấy ra. Thông tin nhận dạng liên kết được xác định trong tài liệu mạng. Một hoặc nhiều ấn phẩm có liên quan đến các thông tin nhận dạng liên kết được xác định. Dữ liệu công bố cho các tài liệu mạng được xác định theo các thông tin nhận dạng liên kết được xác định và xác định một hoặc nhiều ấn phẩm . Khi nó được xác định rằng các dữ liệu công bố đáp ứng một điều kiện chỉ định của thư rác, tài liệu mạng được phân loại là một ứng cử viên thư rác.