ASK.COM SỬ DỤNG CÁC VƯỚNG MẮC để phát hiện và lọc NGƯỜI LỚN NỘI DUNG?

Ok, nội dung để người lớn có thể không tách trà của bạn, và bạn có thể không thực sự quan tâm. Chịu với tôi ở đây. Nó không thực sự quá nhiều nội dung người lớn lọc mà tôi quan tâm đến một trong hai, nhưng thay vì làm thế nào một thuật toán công cụ tìm kiếm có thể sử dụng các truy vấn và hành vi người dùng để quyết định có hay không để lọc một cái gì đó.

Sau đây mô tả một ứng dụng bằng sáng chế có thể có hoặc có thể không được sử dụng bởi Ask.com. Tôi nghĩ rằng điều quan trọng cũng cần lưu ý rằng trong khi các phương pháp ở đây mô tả cách công cụ tìm kiếm có thể phân loại và hình ảnh bộ lọc dành cho người lớn, sử dụng của nó có thể được mở rộng dung và các thể loại khác. Nó cung cấp một cái nhìn tốt đẹp như thế nào phiên truy vấn và hoạt động người dùng có thể được sử dụng để giúp công cụ tìm kiếm quyết định những gì các trang và hình ảnh về căn cứ khi nhìn thấy cách mọi người tương tác với các công cụ tìm kiếm.

Bạn sẽ nghĩ rằng một thuật toán mà cố gắng để lọc hình ảnh người lớn từ quan điểm của trẻ em và những người không muốn nhìn thấy hình ảnh như vậy sẽ có một thành phần trực quan để nó – nó sẽ cố gắng để hiểu được những hình ảnh trong câu hỏi. Các ứng dụng bằng sáng chế sau đây, phát minh bởi hai nhân viên Ask.com không có khía cạnh hình ảnh như vậy, nhưng thay vì dựa trên hành vi người dùng để đánh giá có hay không một hình ảnh có chứa tài liệu dành cho người lớn.

Có một khả năng khá thông tin nội dung người lớn có thể được trả lại để đáp ứng với một truy vấn ngay cả khi thuật ngữ tìm kiếm được sử dụng không có điều kiện rõ ràng rằng có một ý định yêu cầu thông tin như vậy. Bằng sáng chế này là nhằm mục đích giành quyền kiểm soát nhiều hơn những gì hình ảnh có thể được trả lại trong thời gian tìm kiếm, và dù có hoặc không phù hợp với khán giả xem những kết quả.
Tại thời điểm này, bạn có thể tự hỏi nếu bạn thực sự quan tâm đến một nội dung dành cho người lớn phát hiện thuật toán. Hãy ghi nhớ rằng điều này có thể chỉ là một cách dễ dàng là một nội dung Pháp Luân Công phát hiện Algorithm, hay Paris Hilton Nội dung Phát hiện thuật toán. Trên thực tế, nó sẽ không được tốt đẹp nếu bạn nói với các công cụ tìm kiếm những điều mà bạn không muốn nhìn thấy hình ảnh của? Thật không may là sáng chế không làm điều đó. Điều này thậm chí có thể có một số tác động đối với các tìm kiếm không ảnh

Các nhà phát minh lưu ý rằng rất khó để xác định xem một hình ảnh khiêu dâm hay không mà không làm phân tích hình ảnh, và một phân tích như vậy có thể rất tốn thời gian. Thuật toán này sẽ cố gắng để phát hiện hình ảnh khiêu dâm bằng cách theo dõi các hiệp hội truy vấn mà không phân tích hình ảnh.

Phương pháp và bộ máy để xác định hình ảnh trưởng thành của hiệp hội truy vấn
Nhà sáng chế: Kaushal Kurapati và Rahul Lahiri
Ứng dụng bằng sáng chế Mỹ 20060184577
Công bố ngày 17 tháng 8 2006
Nộp: 18 tháng năm 2005

trừu tượng

Phương pháp khác nhau và các bộ phận được mô tả cho việc thực hiện phát hiện nội dung người lớn. Trong một phương án, một phương pháp phát hiện hình ảnh nội dung người lớn của hiệp hội truy vấn theo dõi để truy vấn của người dùng cho một tìm kiếm hình ảnh. Tập hợp các hình ảnh trở lại để đáp ứng với truy vấn của người dùng trên một công cụ tìm kiếm dựa vào việc một hoặc nhiều hình ảnh trong tập được phân loại như một hình ảnh nội dung người lớn.

Làm thế nào nó hoạt động

Ai đó tìm kiếm hình ảnh, và các công cụ tìm kiếm cố gắng để trình bày hình ảnh trong khi phát hiện hình ảnh nội dung người lớn, mà nó xác định bằng cách nhìn vào các hiệp hội truy vấn theo dõi phù hợp với truy vấn của người tìm kiếm. Các thuật toán phát hiện nội dung người lớn có thể gây ra một số hình ảnh không xuất hiện trong các kết quả dựa trên những hiệp hội.

Một cửa hàng cơ sở dữ liệu thông tin liên quan đến nội dung người lớn tiềm năng một hoặc nhiều hình ảnh có khả năng trong một tập hợp các hình ảnh trở lại để đáp ứng với truy vấn của người dùng, và có thể theo dõi thống kê các thông tin có liên quan từ tất cả các phiên sử dụng trong quá khứ và hiện tại. Nó cũng cửa hàng và thống kê theo dõi các hiệp hội truy vấn dựa vào hành vi người dùng qua cũng như đặc điểm theo dõi về nguồn gốc của hình ảnh và các thông tin khác về bản chất nội dung người lớn của những hình ảnh này.

Hiệp hội truy vấn

Các bằng sáng chế xác định những hiệp hội truy vấn theo dõi như sau:

mối tương quan truy vấn đến lựa chọn,
mối tương quan pick-to-lựa chọn,
mối tương quan truy vấn để truy vấn,
mối tương quan pick-to-truy vấn,
Tương tự theo dõi thống kê tương quan hành vi người dùng khác.
Một “lựa chọn” là một lựa chọn một hình ảnh từ những trình bày của các công cụ tìm kiếm trong kết quả tìm kiếm. Nó cũng quan trọng là các hành vi được xem xét là các phiên họp người dùng thay vì truy vấn chỉ cá nhân.

Một truy vấn chọn (Q2P) tương quan có thể xem xét để xem nếu có bất kỳ điều khoản trong truy vấn để chỉ ra rằng các truy vấn không phải là một “sạch” thiên nhiên, và cũng có những hình ảnh từ những trở lại truy vấn của người dùng khiêu dâm tiềm năng đã được chọn trong rằng phiên người dùng.

Một lựa chọn để lựa chọn (P2P) tương quan có thể kết hợp tất cả các chọn (lựa chọn ảnh) được thực hiện trong một phiên người dùng với tất cả các chọn khác phát hành trong phiên họp đó. Giả thiết là một người sử dụng nghĩ rằng tất cả các hình ảnh nhìn là có liên quan đến truy vấn của người dùng và một mối tương quan được thiết lập giữa tất cả các hình ảnh được chọn chọn trong phiên họp đó.

Đây là một số ngôn ngữ vụng về để xác định mối quan hệ giữa các loại khác nhau của hành vi người dùng. Tôi đã bị cám dỗ để thử và dịch một cái gì đó như “truy vấn để chọn tương quan” vào một cái gì đó dễ dàng hơn để hiểu và nhớ, nhưng quyết định rằng việc sử dụng kỹ thuật của ngôn ngữ có thể được chính xác hơn và dễ nhớ hơn một cái gì đó như “tìm kiếm hạn để hình ảnh mối quan hệ lựa chọn. “” Truy vấn để Pick “là snappier, quá.

Loại bỏ hình ảnh dành cho người lớn từ kiếm Chứa Không khiêu dâm Điều kiện tìm kiếm

Kiểm tra các truy vấn để xem nếu nó là “sạch”

Quá trình này bắt đầu khi một tìm kiếm vào thuật ngữ tìm kiếm vào công cụ tìm kiếm hình ảnh.

Kiểm tra nội dung người lớn thuật toán phát hiện thấy nếu truy vấn là một trong những liên quan đến hình ảnh người lớn bằng cách nhìn vào các từ tìm kiếm. Theo mặc định, nó cho rằng một truy vấn là một trong những hình ảnh không khiêu dâm. Nó có thể có một danh sách các thuật ngữ khi phân loại hiện một truy vấn như khiêu dâm.

Nếu nó không xuất hiện rằng các truy vấn đang tìm kiếm hình ảnh nội dung người lớn, sau đó theo mặc định các truy vấn được xem xét được phân loại bởi hệ thống là một truy vấn tìm kiếm hình ảnh sạch sẽ không khiêu dâm.

Trong trường hợp đó, các thuật toán sau đó sẽ lấy kết quả hình ảnh cho truy vấn sạch.

Ví dụ:

Nếu các từ tìm kiếm trong truy vấn của người dùng là tên của một người, công cụ tìm kiếm sẽ hiển thị một danh sách các hình ảnh liên quan đến tên của người đó.

Xem xét các hình ảnh được trả lại

Các thuật toán phát hiện nội dung người lớn trông để xem bất kỳ hình ảnh tiềm năng trong các kết quả tìm kiếm đã được đánh dấu / đánh dấu như là nội dung người lớn trong tự nhiên. Nó làm điều này bằng cách so sánh những hình ảnh quay trở lại để đáp ứng với truy vấn của người dùng để thông tin liên quan đến bản chất nội dung người lớn của những hình ảnh được lưu trữ trong cơ sở dữ liệu.

Thông tin có thể được xác định bằng cách nhìn vào thông tin liên kết truy vấn theo dõi thống kê cũng như phân tích hình ảnh không khác theo dõi thông tin.

Một hoặc nhiều hình ảnh nội dung người lớn có thể được loại bỏ khỏi tập hợp các hình ảnh trở lại để đáp ứng với truy vấn của người dùng thông qua so sánh đó.

Các thuật toán cũng có thể so sánh kết quả hình ảnh cho truy vấn sạch sẽ được xem xét và theo dõi thông tin được lưu trữ trong cơ sở dữ liệu về bất kỳ hình ảnh trở về trước từ các truy vấn khiêu dâm nổi tiếng.

Nếu bất kỳ hình ảnh từ những so sánh này là điểm chung, sau đó những hình ảnh thường được coi là tự nhiên khiêu dâm nội dung / người lớn và họ không nên được hiển thị để đáp ứng với truy vấn của người dùng. Tính phổ biến của hình ảnh có thể được thiết lập bằng cách nhìn vào ID hình ảnh, và / hoặc hình ảnh Universal Resource Locator (URL) địa chỉ.

Kết quả sẽ được sửa đổi để loại bỏ hình ảnh phân loại là hình ảnh nội dung người lớn, và hình ảnh đang quay trở lại tìm kiếm.

Xác định nếu truy vấn là khiêu dâm trong tự nhiên

Các thuật toán có thể xác định nếu truy vấn là khiêu dâm trong tự nhiên vì nó có chứa thuật ngữ tìm kiếm mà phân loại các truy vấn như các truy vấn khiêu dâm, tìm kiếm thông qua một danh sách các điều kiện để làm như vậy. Nó sẽ lấy hình ảnh để đáp ứng với một truy vấn có chứa thuật ngữ tìm kiếm phân loại là nội dung người lớn đó sẽ là có lẽ hầu hết tất cả các nội dung được người lớn / khiêu dâm trong tự nhiên.

Các thuật toán phát hiện nội dung người lớn thẻ một số hoặc tất cả các kết quả hình ảnh trở lại để đáp ứng với các truy vấn nội dung người lớn hình ảnh nội dung như người lớn có khả năng. Nói cách khác, nó có thể thực hiện một truy vấn tương quan đến lựa chọn bằng cách gắn thẻ một hoặc nhiều tập hợp các hình ảnh như nội dung người lớn / khiêu dâm trong tự nhiên.

Vì vậy, hình ảnh chọn bởi người sử dụng để đáp ứng với truy vấn của người dùng có chứa thuật ngữ tìm kiếm nội dung người lớn là nội dung người lớn rất có thể trong tự nhiên, và có thể được khả năng gắn thẻ như là nội dung người lớn.

Tất nhiên, các thuật toán có thể chờ đợi, và theo dõi theo thời gian, gắn thẻ chỉ những hình ảnh thường xuyên nhất được lựa chọn như là người lớn. Một số lượng ngưỡng của sự xuất hiện lựa chọn có thể xảy ra trước khi hình ảnh được gắn thẻ như người lớn.

Các thuật toán cũng có thể thực hiện một sự tương quan pick-to-pick để chồn ra những hình ảnh thường được chọn kết hợp với hình ảnh nội dung người lớn được biết đến. Một số lượng ngưỡng của các lựa chọn có thể áp dụng vào đó, quá.

Theo dõi truy vấn thông tin Hiệp hội

Các nội dung người lớn cửa hàng thuật toán phát hiện trong cơ sở dữ liệu thông tin liên kết truy vấn theo dõi thống kê bao gồm:

Gắn thẻ thông tin,
Truy vấn-to-pick tương quan,
Chọn để nhận các mối tương quan,
Truy vấn để truy vấn tương quan,
Đón để truy vấn tương quan,
Cũng như theo dõi thống kê tương quan hành vi người dùng khác tương tự.
Công cụ tìm kiếm có thể lưu trữ thêm thông tin về người sử dụng và hình ảnh trong cơ sở dữ liệu là tốt.

Truy vấn theo dõi người dùng và hành vi

Phát triển Sử dụng truy vấn của người dùng

Các thông tin được lưu trữ nêu trên được sử dụng cùng với các truy vấn người sử dụng hiện tại và trước ảnh hưởng đến truy vấn của người dùng hiện tại dựa trên mối tương quan của hoạt động người dùng và / hoặc thông tin người sử dụng thu được trong một phiên tìm kiếm các thông tin tương tự từ những người dùng khác. Điều này có nghĩa rằng có một hiệp hội phát triển giữa các truy vấn và các tổ chức và trình bày các văn bản.

Các hoạt động người sử dụng thống kê đáng kể ‘

Công cụ tìm kiếm xem xét các hoạt động của người sử dụng trên toàn bộ các buổi tìm kiếm, làm cho nó có thể liên quan một số loại khác nhau của hoạt động người dùng và thông tin người dùng. Điều này có lợi thế hơn chỉ lọc trên cơ sở các từ khóa liên quan đến hình ảnh. Phản hồi từ nhiều người sử dụng là cần thiết để các kết quả và các hiệp hội thực hiện được ý nghĩa thống kê.

Tương ứng, tổng hợp các truy vấn và các hoạt động

Có một mối tương quan của các truy vấn của người dùng hiện tại để sử dụng công cụ tìm kiếm hiện tại và quá khứ hoặc (Sử Dụng) hoạt động và / hoặc thông tin người sử dụng thu được trong một phiên tìm kiếm các thông tin tương tự như thu thập từ người dùng khác.

Sử dụng thông tin hoạt động và / hoặc thông tin người dùng, trong một buổi tìm kiếm, được ghi lại trong nhiều người sử dụng độc lập, và có thể bao gồm:

Việc ban hành các truy vấn,
Cách nhấp liên kết trên các trang tìm kiếm hàng đầu để dữ liệu nội bộ hay bên ngoài,
Cách nhấp các liên kết trên các trang nội bộ tiếp theo dẫn đến dữ liệu nội bộ hay bên ngoài,
Một sự trở về trang tìm kiếm hoặc bất kỳ trang nội bộ tiếp theo để cách nhấn vào một liên kết nội bộ hay bên ngoài, và;
Thông tin tương tự khác.
Một phiên giao dịch nơi hoạt động SỬ DỤNG được đo có thể liên tục hoặc xảy ra trong một khoảng thời gian quy định cho biết việc chấm dứt của một phiên tìm kiếm công ty seo website

Một hiệp hội có ý nghĩa thống kê là có thể không do ngẫu nhiên xảy ra. Các hiệp hội có thể là bất kỳ kết nối của các truy vấn, điều khoản, khái niệm, vật phẩm, dữ liệu web khác, hoặc sự kết hợp của chúng, thực hiện rõ ràng hoặc ngầm bởi một người dùng trong một phiên tìm kiếm.

Từ “tương quan” được sử dụng rất nhiều trong sáng chế này, và nó có nghĩa là có một hiệp hội ý nghĩa thống kê được thực hiện bởi hai hoặc nhiều người sử dụng dường như độc lập.

“Người sử dụng độc lập” ngôn ngữ này là từ các ứng dụng bằng sáng chế, và có vẻ là một cách để giữ người gửi thư rác từ hệ thống để cố gắng thao tác kết quả

Sử dụng lưu trữ hoạt động và thông tin tài

Hệ thống sẽ có một cơ sở dữ liệu có thể lưu trữ và duy trì các tập tin dữ liệu cho tất cả các thông tin sử dụng hoạt động và thông tin người dùng trong một bảng. Bảng này sẽ chứa một số yếu tố dữ liệu ghi lại các truy vấn đối với một số người sử dụng tại thời điểm khác nhau và URL (chọn) đã được lựa chọn (nhấp) tiếp theo mỗi truy vấn tương ứng cho mỗi người dùng tương ứng.

Nó cũng có thể bao gồm các thông tin khác, chẳng hạn như công ty seo

Thứ hạng hiển thị kết quả lựa chọn,
Thứ tự kết quả được nhấp bởi người sử dụng trong phiên,
Địa chỉ IP của người dùng,
Vị trí địa lý của địa chỉ IP,
Cho dù hình ảnh trước đây đã được gắn thẻ như là người lớn trong tự nhiên,
Số lượng các buổi hình ảnh này đã được lựa chọn với những hình ảnh khác được biết đến gắn thẻ như là người lớn trong tự nhiên, vv
các yếu tố khác

Bằng sáng chế là khá chi tiết, và nó đi vào để mô tả các yếu tố khác nhau sẽ tương quan các nội dung của một truy vấn với theo dõi các truy vấn hoặc lựa chọn hình ảnh mà có thể đã được xác định là khiêu dâm trong quá khứ với việc lựa chọn các hình ảnh khác.

Nó nhìn vào những thứ trong các buổi như:

Thời gian giữa truy vấn và lựa chọn,
Thời gian giữa chọn,
Thời gian giữa các truy vấn,
Có hoặc không có kết quả truy vấn được tạo ra chọn,
Số can thiệp truy vấn và / hoặc chọn,
Thứ tự của các truy vấn liên quan đến chọn với,
Đánh giá của các lựa chọn trong danh sách kết quả tại thời điểm hiệp hội,
Thời gian chọn (khoảng cho đến khi hành động người dùng tiếp theo được biết đến),
Tuổi hoặc thứ tự của các hiệp hội (liên quan đến các hiệp hội cũ hoặc mới hơn),
Tuổi của các ví dụ được biết đến đầu tiên của hiệp hội,
Thứ tự cặp-khôn ngoan của chọn liên quan,
Thứ tự cặp-khôn ngoan của các truy vấn liên quan,
Nguồn gốc của những hình ảnh,
Không hình ảnh thuộc tính của hình ảnh, và;
các yếu tố khác
Các thuật toán cũng có thể xác định ngôn ngữ của một từ Universal Resource và so sánh các ngôn ngữ với ngôn ngữ của các truy vấn để xác định xem một nội dung người lớn nên được trả lại cho các truy vấn. Nó có thể nhìn vào văn bản xung quanh một hình ảnh để xác định xem các hình ảnh nên được phân loại như nội dung người lớn trong tự nhiên.

kết luận

Như tôi đã nói ở trên, nó có thể cho một thuật toán như thế này sẽ được sử dụng để lọc hình ảnh liên quan đến các chủ đề khác. Tôi nghĩ rằng nó làm một công việc tuyệt vời thể hiện những phác thảo về một phương pháp để sử dụng các truy vấn người dùng và thông tin hoạt động người dùng để hiển thị như thế nào kết quả có thể được lọc trong một công cụ tìm kiếm. Nó không phải là quá khó khăn để xem làm thế nào điều này có thể được áp dụng để thay cho lớn hơn hoặc người cho thuê điểm phù hợp cho kết quả, quá.