MUA yên tĩnh GOOGLE CỦA TRANSFORMIC, INC

Cập nhật (2008/04/13) – Đó là tốt đẹp khi một bài cũ được chỉ ra vì những thay đổi gần đây và phát triển. Google Webmaster Blog Trung ương chính thức có một bài mới được viết bởi Jayant Madhavan và Alon Halevy về công nghệ mà họ đã “gần đây đã được thử nghiệm với”, trong Crawling thông qua các hình thức HTML. Có vẻ như lời hứa của công nghệ Transformic được sống tại Google.

Anand Rajaraman, một người bạn và đồng tác giả và cựu thực tập sinh để Alon Halevy, cung cấp thêm chi tiết về sự phát triển này từ Google trong bài Datawocky của mình, Câu chuyện đằng sau nâng cấp trình thu thập của Google. Hệ điều hành Google cho biết thêm một vài suy nghĩ thêm trong Google Bắt đầu để Index Invisible Web …

*****
Đọc một bài báo Washington Post, Google Goes to thị trường, tôi nhận thấy một tên công ty trong danh sách các vụ mua lại của Google được thực hiện mà tôi đã không nhận ra, và đã không có trong danh sách các Mua lại Google.

Công ty này là Transformic, Inc, chạy Everyclassified.com. Mục đích của Transformic là xây dựng công cụ tìm kiếm cho các trang web sâu – một phần của trang web mà công cụ tìm kiếm có vấn đề thu thập dữ liệu và lập chỉ mục. Everyclassified.com là một ví dụ về khả năng của Transformic để thu thập thông tin từ các trang web khác mà công cụ tìm kiếm gặp khó khăn với, cung cấp quyền truy cập vào hàng trăm trang web phân loại được tìm thấy trên các trang web.

Một bài viết trên blog từ tháng Giêng năm 2006, Google Base để rao vặt, từ RantSpot của tôi, thảo luận về việc mua lại. Blog dường như được viết bởi một học sinh có thể lấy một lớp học với người đàn ông phía sau Transformic – Tiến sĩ Alon Halevy.

Tiến sĩ Halevy có một lịch sử lâu dài làm việc với cơ sở dữ liệu và các trang web, bao gồm cả phát triển một số bằng sáng chế khi ông làm việc tại AT & T Bell Laboratories, và sau đó tại AT & T phòng thí nghiệm, và một số lượng rất lớn các tài liệu nghiên cứu (Một vài trong số họ ở đây. ). Ông bắt đầu giảng dạy tại Đại học Washington vào năm 1998, nơi ông đã phát triển một công ty tên là Nimble Công nghệ, mà ông bán cho Actuate trong tháng Tám, năm 2003. Năm 2004, ông bắt đầu Transformic, Inc

Tiếp thu

Washington Post ghi ngày mua lại như 15 Tháng Chín năm 2006 – nhưng đó có thể là một lỗi đánh máy, và năm 2005 có nhiều khả năng Có vẻ như Tiến sĩ Halevy đã làm việc cho Google từ trước tháng Chín, năm 2006, bao gồm cả làm việc trên một số. giấy tờ và trình bày cho họ:

Trả lời câu hỏi có cấu trúc dữ liệu phi cấu trúc trên (pdf)
Webdb ’06, Tháng sáu, 2006, Chicago, Illinois Hoa Kỳ

Nguyên tắc của hệ thống Dataspace (pdf)
PODS’06, ngày 26-ngày 28 Tháng Sáu, 2006, Chicago, Illinois, Hoa Kỳ.

Tích hợp dữ liệu: The Teenage năm
VLDB `06, Tháng Chín, năm 2006, Seoul, Hàn Quốc.

Khi dữ liệu bán cấu trúc đáp ứng các web (ppt không còn nữa)

Dataspaces: Co-Sự tồn tại với tính không đồng nhất (ppt)

Bạn có thể nhận được một cảm giác lý do tại sao các folks tại Google có thể đã quan tâm đến làm việc với Tiến sĩ Halevy từ bài báo của mình trong ACM Queue, Tại sao dữ liệu của bạn sẽ không Trộn, được công bố vào tháng Mười, năm 2005:

Sự cần thiết cho các hệ thống chia sẻ dữ liệu linh hoạt, bên trong và giữa các doanh nghiệp, chỉ trong giai đoạn trứng nước. Các công cụ chúng ta có ngày hôm nay tụt hậu xa nhu cầu khách hàng. Vấn đề là chỉ làm trầm trọng thêm bởi thực tế là nhiều hơn nữa của các dữ liệu chúng ta cần quản lý là bán cấu trúc và thường là kết quả của cố gắng để trích xuất dữ liệu từ cấu trúc phi cấu trúc. Do đó, chúng ta cần phải quản lý dữ liệu, nơi các giá trị, các thuộc tính tên, và ngữ nghĩa thường không chắc chắn.

Đi về phía trước, có hai khu vực thách thức lớn: đối phó với các lược đồ mạnh lớn hơn và đối phó với môi trường chia sẻ dữ liệu cực kỳ phức tạp. Trong cả hai lĩnh vực này, chúng tôi có thể phải thay đổi cách chúng ta nghĩ.

Từ lưu trữ trang Công ty Transformic Nhiệm vụ:

Nhiệm vụ của Transformic là dẫn đầu thị trường quản lý dữ liệu tự nhiên bước tiếp theo: chia sẻ dữ liệu dễ dàng và có quy mô lớn và hội nhập. Transformic cung cấp các công nghệ cần thiết để sản xuất keo ngữ nghĩa giữa các nguồn dữ liệu. Công cụ Transformic có thể được nhúng vào trong bất kỳ chia sẻ dữ liệu và tích hợp nội dung, bao gồm nhưng không giới hạn Thông tin Doanh nghiệp hội nhập, bán lẻ trực tuyến, nhắn tin XML, và các doanh nghiệp quản lý siêu dữ liệu.

Thật khó để nói những gì vai trò Transformic và Tiến sĩ Halevy đã có trong sự phát triển của Google, và các hệ thống như Google Base và Google Coop, nhưng có vẻ như khả năng là họ đã đóng góp một phần.

Đồng bằng sáng chế phát minh bởi tiến sĩ Halevy

Alon Halevy được liệt kê là một trong những nhà phát minh trên các bằng sáng chế sau đây. Tôi là bao gồm cả chúng ở đây để cung cấp một cái nhìn thoáng qua về kiến ​​thức và chuyên môn của Alon Halevy. Google đã không có được các bằng sáng chế với việc mua Transformic, và việc thuê Tiến sĩ Halevy, nhưng nó là một loạt ấn tượng của học bổng trên công nghệ cơ sở dữ liệu hiển thị trong các bằng sáng chế.

Phương pháp và thiết bị để tối ưu hóa các truy vấn cơ sở dữ liệu liên quan đến các vị tập hợp (6.088.524)
Cấp 11 tháng 7 2000 công ty seo website
Giao cho Lucent Technologies, Inc

Thông tin đa dạng để xử lý truy vấn (5.995.961)
Cấp ngày 30 tháng 11 1999
Giao cho Lucent Technologies Inc

Hệ thống và phương pháp để có được câu trả lời đầy đủ và chính xác từ cơ sở dữ liệu không đầy đủ và / hoặc không chính xác (5.987.450)
Cấp ngày 16 Tháng Mười Một 1999
Giao cho AT & T

Phương pháp và thiết bị để quản lý trang web (5.956.720)
Cấp ngày 21 tháng 9 1999
Giao cho AT & T Corp công ty seo

Phương pháp và hệ thống để sử dụng xem được vật chất để đánh giá các truy vấn liên quan đến tập hợp (5.897.632)
Cấp 27 tháng 4 năm 1999
Giao cho AT & T Corp

Hội nhập của một lược đồ cơ sở dữ liệu máy chủ thông tin bằng cách tạo ra một bản đồ dịch từ các tập tin mẫu mực (5.778.373)
Cấp 07 tháng 7 năm 1998
Giao cho AT & T Corp

Giao diện người dùng cho hệ thống thông tin (5.768.578)
Cấp ngày 16 tháng 6 1998
Giao cho Lucent Technologies Inc

Tối ưu hóa truy vấn của vị di chuyển xung quanh (5.659.725)
Cấp ngày 19 Tháng Tám 1997
Giao cho Lucent Technologies Inc

Bộ máy và phương pháp để lấy thông tin (5.655.116)
Cấp ngày 5 tháng 8 năm 1997
Giao cho Lucent Technologies Inc

Bộ máy và phương pháp để lấy thông tin bằng cách sửa đổi kế hoạch truy vấn dựa trên mô tả của các nguồn thông tin (5.600.831)
Cấp ngày 04 tháng 2 năm 1997
Giao cho Lucent Technologies Inc