NÊN công cụ tìm kiếm Giúp đỡ tìm kiếm TRÁNH trang web độc hại?

Làm thế nào an toàn là công cụ tìm kiếm? Một câu trả lời gần đây có thể làm bạn ngạc nhiên.

Hồi tháng Năm, Ben Edelman đã viết về Tìm kiếm An toàn động cơ. Một phần, ông đã viết về cách công cụ tìm kiếm trả tiền quảng cáo cho một số sản phẩm, như bảo vệ màn hình, có thể dẫn đến các trang web mà có thể đặt phần mềm gián điệp trên máy tính của khách truy cập tải về bảo vệ màn hình. Ông viết thêm về thực hành trong một bài đăng tháng một tên đẩy phần mềm gián điệp thông qua Tìm kiếm

Ông cũng đã được công bố một nghiên cứu ông đã làm việc trên với McAfee, về An toàn Internet Công cụ tìm kiếm. Nếu bạn bị mất báo cáo này vào tháng, nó có giá trị một lần. Nó thảo luận về sự an toàn của kết quả hữu cơ thông qua công cụ tìm kiếm, cũng như kết quả thanh toán.

Một công cụ tìm kiếm để làm gì?
Virus không phải là bất cứ điều gì mới, và nhiều người biết chữ internet hiện nay nhận ra một số trong những cách tiềm năng mà virus có thể lây lan, và biết nguy cơ của việc mở email không mong muốn, mở file đính kèm không rõ nguồn gốc, và ghé thăm các trang web được liệt kê trong những email.

Nhưng hầu hết mọi người không nghĩ hai lần về sau một liên kết từ một công cụ tìm kiếm để kết quả được liệt kê. Như nghiên cứu về an toàn trên công cụ tìm kiếm mô tả, có lẽ họ nên được. có liên quan.

Nên công cụ tìm kiếm khám phá cách để tránh những người dẫn đến các trang web chứa đầy những đoạn mã độc và virus? Họ có trách nhiệm trong việc giữ mọi người tránh xa từ các trang web như vậy? Liệu nó có giúp họ duy trì một mức độ tin tưởng với người dùng của họ làm như vậy?

Một cách tiếp cận từ Microsoft

Một ứng dụng bằng sáng chế mới của Microsoft tìm hiểu an toàn công cụ tìm kiếm trong bối cảnh kết quả hữu cơ.

Hệ thống và phương pháp sử dụng một công cụ tìm kiếm để ngăn chặn ô nhiễm
Được phát minh bởi nghệ thuật Shelest và Eytan D. Seidman
Giao cho Microsoft
Ứng dụng bằng sáng chế Mỹ 20060136374
Công bố ngày 22 Tháng Sáu 2006
Nộp: 17 tháng 12 năm 2004

trừu tượng

Một hệ thống và phương pháp được kết hợp trong một công cụ tìm kiếm để ngăn chặn sự gia tăng của nội dung tìm kiếm độc hại. Hệ thống bao gồm một cơ chế phát hiện để phát hiện nội dung tìm kiếm độc hại trong nội dung tìm kiếm đi qua bởi một trình thu thập web. Hệ thống cũng bao gồm một cơ chế trình bày để xử lý các phát hiện nội dung tìm kiếm độc hại theo quyết định rằng nội dung tìm kiếm độc hại được bao gồm trong kết quả tìm kiếm được cung cấp bởi các công cụ tìm kiếm. Cơ chế trình bày phát hiện xử lý các nội dung tìm kiếm độc hại để ngăn chặn sự gia tăng của nội dung tìm kiếm độc hại đến người nhận các kết quả tìm kiếm.

Làm thế nào một công cụ tìm kiếm sẽ đi về cố gắng để xác định các trang nguy hiểm, và giữ người tìm kiếm không bị tổn hại bởi các trang? Có một vài phương pháp tiếp cận tiềm năng khác nhau, mà thậm chí có thể được kết hợp.

Một cách có thể để tìm kiếm các trang độc hại trong quá trình thu thập dữ liệu của các trang web. Một cơ chế phát hiện sẽ tìm kiếm các trang có hại, và nhận dạng chúng. Hoặc nó có thể nhận thấy các trang độc hại trong thời gian thực trong khi sự trở lại của một truy vấn tìm kiếm. Tại thời điểm trình bày kết quả, các công cụ tìm kiếm có thể hiển thị một liên kết một số cách để cố gắng giữ một người tìm kiếm từ bị tổn hại. Một số trong những phương pháp tiếp cận thậm chí có thể giữ một từ tìm kiếm quay trở lại một liên kết đến một trang.

Một mô-đun trình bày, như là một phần của quá trình được mô tả trong bằng sáng chế, có thể:

Sử dụng một mã số đặc biệt để cho trình duyệt web để bảo vệ mình – ví dụ, bởi trước chờ một dấu chấm than vào liên kết độc hại. Vì vậy, “www.example.com” sẽ được phục vụ như “! Http://www.example.com” và chỉ có thể để cho trình duyệt biết để thực hiện hành động, chẳng hạn như vô hiệu hóa các macro chọn.
Sửa đổi các liên kết nguy hiểm để trỏ đến một proxy để che chắn máy tính của người tìm kiếm từ hoạt động nguy hiểm.
Thay đổi liên kết để trỏ đến một bản sao khử trùng lưu trữ của các trang web, lưu trữ hoặc đại diện của các công cụ tìm kiếm, mà sẽ tham khảo các bản sao lưu trữ khử trùng lưu tại thời điểm thu thập dữ liệu.
Trình bày một liên kết sửa đổi trỏ đến một bản sao không được lưu trữ tự động khử trùng, khử trùng nơi xảy ra khi người sử dụng chọn liên kết sửa đổi.
Tạo ra một cảnh báo sẽ được hiển thị cho người sử dụng, mà sẽ chỉ ra rằng nội dung vào liên kết có thể được độc hại, nếu truy cập.
Ẩn liên kết nguy hiểm hoặc không hiển thị các liên kết đến các tìm kiếm.
Một cơ chế phát hiện đăng nhập

Cơ chế phát hiện có thể bao gồm các công cụ phân tích tĩnh và cũng thực hiện phân tích năng động. Các công cụ phân tích tĩnh sẽ kiểm tra trang được truy cập và các trang web cho các mã được biết đến, và tìm kiếm những thứ như các lĩnh vực không cần thiết HTML dài.

Các công cụ phân tích năng động hoạt động hơi khác nhau, và sẽ xem xét cho hành vi nguy hiểm đã biết và mô hình giao thông. Vì vậy, các công cụ phân tích năng động có thể nhìn thấy một trang web bắt đầu một kết nối trở lại với một máy tính khách hàng trên một cổng thường gắn liền với các lỗ hổng. Hoặc các trang web truy cập có thể cố gắng để hack trở lại vào công cụ tìm kiếm.

Theo các ứng dụng bằng sáng chế:

Công cụ tìm kiếm cần phải được bảo vệ và cần được cấu hình để xuất hiện như là một máy tính người dùng thông thường * cho các trang web truy cập.

* Nhấn mạnh của tôi.

Một phương pháp phát hiện sự có mặt (Phương pháp tiếp cận Virtual Machine)

Thay vì sử dụng một cách tiếp cận bò bình thường, phương pháp khác có thể được sử dụng một máy dùng một lần, chẳng hạn như một máy ảo và một cơ chế kiểm tra máy một lần hay ảo. Nó sẽ hành xử tương tự như một chương trình Virtual PC cho phép các cửa sổ để chạy bên trong của cửa sổ.

Sắp xếp của một sandbox, nó sẽ hoạt động trong một cách độc lập của các cửa sổ bên ngoài hoặc máy chính, do đó bất cứ điều gì sẽ xảy ra cho các cửa sổ bên trong không có một tác động bất lợi khi máy chính. Do đó các máy ảo bao gồm một trình thu thập mà thăm mỗi trang web.

Sau mỗi lần, một cơ chế kiểm tra máy ảo sẽ kiểm tra thu thập bên trong bên trong máy ảo cho nhiễm trùng hoặc tác động có hại. Cơ chế kiểm tra máy ảo sẽ cho các kết quả của mỗi lần để xác định xem các tập tin hoặc hành vi của các máy ảo đã thay đổi, thay vì tìm kiếm hành vi trên trang web truy cập

Nếu các máy ảo bị nhiễm hoặc bị tổn hại, sau đó các trang web đã truy cập hoặc trang web được giả định là độc hại.

Nó sẽ có thể cho máy dùng một lần được sử dụng để bao gồm một máy tính cá nhân về thể chất, nhưng bằng cách sử dụng một máy ảo có một lợi thế của phục hồi nhanh chóng từ trạng thái bị nhiễm bệnh.

Hoạt động và sự có mặt Phương pháp tiếp cận kết hợp

Phương pháp tiếp cận tích cực ngăn chặn hành vi này xảy ra và phương pháp tiếp cận hiện diện cho phép hành vi xảy ra trên các máy ảo và sau đó biết chắc liệu các trang web truy cập là độc hại. Những phương pháp này có thể được kết hợp như vậy mà một số trang web truy cập có vẻ như bị ảnh hưởng có thể được lưu trữ và phân tích sau khi quá trình thu thập dữ liệu.

Phạm vi phủ sóng công ty seo website 

Các trình thu thập web được thiết lập để phát hiện hành vi nguy hiểm trên một trang bằng cách trang hoặc trang web theo từng trang web, hoặc nó có thể nhìn vào đối tượng cá nhân web (ví dụ như tập tin hình ảnh nhúng), tên miền, địa chỉ IP hoặc phương pháp nhóm khác của các đơn vị của bò.

Ví dụ, nó được sử dụng phổ biến mà dưới một tên miền duy nhất, một số trang web chia sẻ sử dụng một dấu ngã để tách các phần của một trang web vào các khu vực thuộc sở hữu của người dùng cá nhân. Vì vậy, http://www.example.com/users/ ~ tom / demo / hack.htm được giả định là thuộc về người sử dụng Barney, trong khi http://www.example.com/users/ ~ adam / index.htm là giả định thuộc về người sử dụng Adam. Nếu một cái gì đó trên các trang của Barney đã được xác định là độc hại, không ảnh hưởng đến khu vực hoạt động của Adam.

Phát hiện trong thời gian thực

Trong khi các cơ chế phát hiện và trình bày có thể tìm kiếm hoạt động nguy hiểm trong quá trình thu thập dữ liệu và lập chỉ mục, hoạt động nguy hiểm cũng có thể được phát hiện trong thời gian thực. Đó có thể là không phải là một ý tưởng tồi xem xét rằng các trang web có thể thay đổi kể từ lần họ đã được lập chỉ mục.

Một cách tiếp cận thời gian thực sẽ có cơ chế trình bày trình bày kết chuyển hướng người dùng đến một proxy tự động sẽ phát hiện và khử trùng nội dung web độc hại. Điều này trước lập chỉ mục, và lập chỉ mục theo thời gian thực có thể được kết hợp.

kết luận công ty seo

Tìm kiếm phần mềm độc hại trên các trang được lập chỉ mục âm thanh như nó có thể là một quá trình chuyên sâu các nguồn tài nguyên. Tuy nhiên, nghiên cứu của McAfee làm cho nó âm thanh như một mà có thể có giá trị theo đuổi.

Có trách nhiệm công cụ tìm kiếm “để bảo vệ chúng ta khỏi các trang nguy hiểm tiềm tàng, hoặc các nhà sản xuất trình duyệt, hoặc các nhà sản xuất phần mềm chống virus?

Có một nguy cơ tiềm ẩn cho chủ sở hữu trang web nếu công cụ tìm kiếm thông qua các phương pháp như thế này? Làm thế nào có thể là dương tính giả?

Chính xác những gì có nghĩa là nội dung “độc hại”? Nộp bằng sáng chế không hoàn toàn xác định đó là sử dụng từ độc hại. Điều này có nghĩa virus, hoặc có thể nó cũng bao gồm phần mềm gián điệp?

Sẽ kết quả tìm kiếm trả tiền cũng được bao gồm trong một quá trình như thế này? Các ứng dụng bằng sáng chế là im lặng về chủ đề đó.

Nếu một công cụ tìm kiếm có về trách nhiệm của bộ lọc hoặc hạn chế truy cập vào các trang web, họ cũng sau đó chịu trách nhiệm thông báo cho các chủ sở hữu của trang web mà họ đã xác định được như lưu trữ nội dung độc hại?