LÀM THẾ NÀO GOOGLE từ chối QUẢNG CÁO gây phiền nhiễu và TRANG

Làm thế nào có thể một công cụ tìm kiếm chấp nhận hoặc từ chối quảng cáo tự động , mà không xem xét con người, trên cơ sở đó các quảng cáo gây phiền nhiễu hoặc phật lòng một cách nào đó ?

Mà không xem xét khối lượng rất lớn các quảng cáo được trình bày cho Google mỗi ngày, bạn có thể nghĩ rằng họ sẽ tự xem xét tất cả các quảng cáo mà các nhà quảng cáo hiện tại cho công bố , trong đó sẽ có rất nhiều người dân . Trong khi quảng cáo nên thu hút một số sự chú ý, họ không nên gây phiền nhiễu hoặc gây khó chịu . Có một số tiêu chuẩn thiết lập từ Google cho quảng cáo hình ảnh , quảng cáo video , và cho quảng cáo văn bản  công ty seo website.

Một ứng dụng bằng sáng chế từ Google đi vào một số lượng tốt về chiều sâu về cách nó có thể mất một cách tiếp cận chương trình để xác định các quảng cáo , và các trang web là ” gây phiền nhiễu. ”

Nộp bằng sáng chế mô tả một số phương pháp được sử dụng khi xem lại hình ảnh và văn bản và âm thanh, với các công cụ như Nhận dạng ký tự và mô hình kết hợp với cơ sở dữ liệu lớn các hình ảnh và âm thanh. Nó cũng mô tả chi tiết Flash và hình ảnh hoạt hình có thể được xem xét , nhưng không đề cập đến những gì nó đang nhìn vào khi nó đề cập đến những thứ như một ” Điểm tin cậy. ”
Phát hiện và từ chối các tài liệu gây phiền nhiễu
Được phát minh bởi Deepak Jindal và Anurag Agarwal
Giao cho Google.
Ứng dụng bằng sáng chế Mỹ 20070133034
Công bố 14 Tháng Sáu 2007
Nộp ngày 14 tháng 12 năm 2005

trừu tượng

Một hệ thống và phương pháp để đánh giá các văn bản phê duyệt hoặc từ chối và / hoặc đánh giá. Phương pháp này bao gồm so sánh các tài liệu với một hoặc nhiều tiêu chí xác định các tài liệu có chứa một yếu tố đó là giống hệt nhau đáng kể cho một hoặc nhiều hơn một yếu tố hình ảnh , một yếu tố âm thanh hoặc một yếu tố văn bản được xác định là trái ý.

Quảng cáo trên Internet có thể chứa ngôn ngữ xúc phạm hoặc hành động gây phiền nhiễu như nhấp nháy hoặc strobing hoặc có chất lượng hình ảnh kém . Xem lại thủ công của một quảng cáo là một trong những cách có thể để lọc quảng cáo như vậy , nhưng xem xét quảng cáo có thể đòi hỏi rất nhiều thời gian và chi phí.

Khối lượng tuyệt đối của quảng cáo có thể làm hướng xem xét thực tế không thể . Xử lý quảng cáo sử dụng một quá trình máy tính thực hiện và / hoặc không có đầu vào người hoặc can thiệp sẽ là một biện pháp lý tưởng .

Phương pháp trong ứng dụng bằng sáng chế này sẽ đi qua một bộ xử lý tài liệu đó sẽ xem xét hình ảnh, tập tin âm thanh , và các dữ liệu khác để xác định văn bản , hình ảnh (cũng như lời nói và các dữ liệu khác ) , và hành động trong quảng cáo. Nhận dạng ký tự quang học (OCR ) công nghệ sẽ được sử dụng để xem xét văn bản trong các quảng cáo , và để đánh giá và xem xét lại .

Có thể là hệ thống này có thể được sử dụng để đánh giá các trang khác trên Web khác hơn là chỉ quảng cáo , chẳng hạn như nội dung trang web.

Các loại thông tin có thể được xem xét bao gồm:

Tài liệu thông tin ,
Thông tin hiệu suất tài liệu ,
Đặc điểm tài liệu đánh giá thông tin ,
Đánh giá thông tin nhạy cảm ,
Thông tin tiêu chuẩn phù hợp ,
Thông tin điểm tin tưởng,
Thông tin nhà cung cấp ,
Liên kết thông tin , và ;
Các thông tin khác .
Thông tin tài liệu có thể bao gồm :

Các tài liệu riêng của mình,
Bất kỳ ngôn ngữ được sử dụng trong các tài liệu ,
Thông tin chiều dài ,
Thông tin về các loại tập tin trong tài liệu (ví dụ , html , doc, zip , vv),
Loại tài liệu ( quảng cáo, tài liệu giáo dục ) ,
Thông tin tóm tắt ,
Nội dung âm thanh (ví dụ , lời bài hát ) ,
Hình ảnh nội dung (ví dụ , hình ảnh của khuôn mặt ) ,
Nội dung khiêu dâm ,
Nội dung xuùc phaïm khác (ví dụ , sử dụng các từ có khả năng tấn công ) ,
Lập trình mã,
Chất lượng hình ảnh ,
Hành động kết hợp với các tài liệu ,
Nội dung liên quan đến tuổi ,
Danh tính của chủ sở hữu tài liệu và / hoặc tác giả tài liệu ,
Thông tin về đối tượng của tài liệu dự định (ví dụ như khu vực địa lý , độ tuổi , giới tính , chủng tộc, nguồn gốc quốc gia , tôn giáo, thông tin cá nhân khác ) , và ;
Các thông tin khác liên quan đến một tài liệu hoặc các nguồn máy chủ, nhà cung cấp , hoặc tài liệu.
Một cơ sở dữ liệu đặc điểm có thể xác định các tài liệu của một loại nhất định, dựa trên tính năng nhất định , chẳng hạn như :

Đối tượng,
Đánh giá đặc điểm ,
Tổng hợp các đặc điểm đánh giá,
Điểm nhạy cảm ,
Đặc gõ ,
ngôn ngữ ,
Nguồn gốc địa lý (ví dụ , đất nước , thành phố có nguồn gốc ) ,
Khu vực địa lý của đối tượng mục tiêu ,
Nguồn tài liệu ,
Chủ sở hữu của nội dung,
Người sáng tạo nội dung,
Nhắm mục tiêu nhân khẩu học,
Hành động ( chẳng hạn như hình ảnh nhấp nháy ) ,
Phong trào hình ảnh,
Phần cứng có thể sử dụng các tài liệu ( chẳng hạn như một con chuột , bộ điều khiển trò chơi , máy ảnh, hoặc microphone ) ,
Cho dù tương tác người dùng được cung cấp bởi các tài liệu ( có thể chỉ ra một trò chơi ) ,
Cho dù chương trình của tài liệu liên quan đến hệ số ngẫu nhiên , hoặc ;
Các tiêu chuẩn khác .
Các tài liệu có thể được xác định theo :

Xuùc phaïm của họ / đặc điểm phù hợp,
Từ khóa liên quan ,
Trang web có liên quan (ví dụ , một trang web rõ ràng hoặc ngầm liên kết từ các tài liệu ) ,
Tình trạng của trang web liên quan (ví dụ , cho dù một liên kết trong một tài liệu được chia và / hoặc chỉ đến một URL không hợp lệ) ,
Thịt nội dung (ví dụ , nhà nước của cởi quần áo của hình ảnh con người ) ,
Khiêu dâm hoặc nội dung dâm ô khác ,
Nội dung người lớn ,
Thuốc hoặc nội dung liên quan đến rượu ,
Nội dung của trẻ em.
Các tài liệu cũng có thể chứa các hành động gây phiền nhiễu như:

nhấp nháy ,
nhấp nháy ,
Phong trào lặp đi lặp lại ,
Vô vòng lặp hình ảnh động,
Sử dụng streaming video và / hoặc âm thanh,
Kết nối mạng mở,
Liên quan đến việc chơi game ,
Chất lượng hình ảnh kém , hoặc ;
Các hành động khác mà các nhà cung cấp có thể muốn sử dụng cho tiêu chí phê duyệt hay từ chối một tài liệu .
Các bằng sáng chế đi vào chi tiết tuyệt vời về cách các tài liệu Flash có thể được xem xét , sử dụng khai thác văn bản , kiểm tra các hành động không được phép như luồng âm thanh hoặc video hoặc kết nối mạng mở , tìm kiếm trò chơi , xem xét việc sử dụng các âm thanh và video, và lập chính sách cho vòng lặp vô hạn hình ảnh động.

GIF hoạt hình sẽ được kiểm tra nhấp nháy , nhấp nháy và động vào hình ảnh.

Hình ảnh tĩnh có thể được kiểm tra về chất lượng và bố trí người nghèo vấn đề .

Hình ảnh được dự định để lừa người sử dụng, bằng cách làm một cái gì đó như có chứa các hộp văn bản , thăng trầm thả , và các nút mà không phải là chức năng, nhưng thay vì chỉ cần hiện tại là hình ảnh sẽ được kiểm tra bằng cách sử dụng các kỹ thuật phát hiện cạnh / góc .