GOOGLE HỌC BÀI PHÁT BIỂU CÔNG NHẬN CHO VOICE TÌM KIẾM TỪ MTV?

Làm thế nào có thể một công cụ tìm kiếm bằng giọng nói học từ mới đã được giới thiệu trong bài phát biểu nổi tiếng , chẳng hạn như “da shiznet , ” và học hỏi và hiểu phát âm khác nhau của từ, ví dụ có thể được tìm thấy trong ngôn ngữ nói dựa trên sự khác biệt trong khu vực ?

Một nộp đơn sáng chế vừa được công bố từ Google cung cấp một số gợi ý .

Tháng Tư năm ngoái , Google đã được cấp bằng sáng chế trên một giao diện thoại cho một công cụ tìm kiếm. Tôi đã viết về nó trong Google bằng sáng chế tìm kiếm bằng giọng nói đã được cấp.

Mà nộp hồ sơ bằng sáng chế trước đó giới thiệu một số chủ đề xung quanh nhận dạng giọng nói , và cho chúng ta biết về những thứ như một mô hình ngôn ngữ , có thể học từ mới và pronuciations khác nhau.

Kể từ đó, chúng tôi đã thực sự nhìn thấy một tìm kiếm bằng giọng nói từ Google giới thiệu tại Goog 411
Các ứng dụng bằng sáng chế mới cung cấp một cái nhìn chi tiết hơn như thế nào một mô hình ngôn ngữ cho tìm kiếm bằng giọng nói có thể làm việc :

Cập nhật mô hình ngôn ngữ tự động
Được phát minh bởi Michael H. Cohen, Shumeet Baluja , và Pedro J. Moreno
Ứng dụng bằng sáng chế Mỹ 20070233487
Công bố ngày 04 Tháng 10 2007
Nộp : 03 tháng 4 năm 2006

trừu tượng công ty seo 

Một phương pháp để tạo ra một mô hình nhận dạng giọng nói bao gồm truy cập vào một mô hình nhận dạng giọng nói ban đầu, thu thập thông tin liên quan đến việc sử dụng ngôn ngữ gần đây từ các truy vấn tìm kiếm, và sửa đổi các mô hình nhận dạng giọng nói để điều chỉnh xác suất của một phần của một sự xuất hiện âm thanh dựa trên thông tin . Phần của một âm thanh có thể bao gồm một từ .

Ngoài ra, một phương pháp để tạo ra một mô hình nhận dạng giọng nói , bao gồm nhận tại một công cụ tìm kiếm từ một thiết bị điều khiển từ xa một âm thanh ghi âm và một bảng điểm đại diện đáng kể ít nhất là một phần của âm thanh ghi âm , đồng bộ hóa bảng điểm với ghi âm thanh, trích xuất một hoặc chữ nhiều hơn từ các bảng điểm và giải nén phát âm kết hợp của một hoặc nhiều thư từ các âm thanh ghi âm , và tạo ra một mục từ điển trong từ điển phát âm  công ty seo website

Các bằng sáng chế không cung cấp nhiều chi tiết về làm thế nào một mô hình ngôn ngữ có thể được xây dựng và đào tạo . Phần thú vị nhất của nó , với tôi, là làm thế nào nó có thể tìm kiếm các nguồn như chương trình tin tức truyền hình và bảng điểm từ họ, để học từ mới , xác định làm thế nào những lời nói âm thanh , và hiểu văn bản liên quan đến những từ đó.

Nó cũng thảo luận tìm kiếm âm thanh tiên đoán, như tìm kiếm tiên đoán mà bạn nhìn thấy trên thanh công cụ của Google trong một thả xuống , đề nghị đó cho các truy vấn dựa trên các chữ cái và các ký hiệu và không gian gõ vào hộp tìm kiếm trên thanh công cụ , ngoại trừ này nghe phần âm thanh .

Các ứng dụng bằng sáng chế thực sự sử dụng thuật ngữ ” Đà Shiznet ” (sic) là một ví dụ :

Hệ thống nhận dạng giọng nói hiện tại, tuy nhiên , không chuyển những lời nói với độ chính xác hoàn toàn. Đôi khi các hệ thống sẽ dịch một lời nói thành văn bản mà không tương ứng với ngôn ngữ nói. Vấn đề này đặc biệt rõ ràng khi lời nói là một từ mà không phải là trong một mô hình ngôn ngữ truy cập bởi các hệ thống nhận dạng giọng nói .

Hệ thống nhận được lời nói mới , nhưng không chính xác dịch từ vì lời nói mới không có một định nghĩa văn bản tương ứng trong mô hình ngôn ngữ . Ví dụ, từ ” da shiznet ” thể hiện một cách phổ biến , trong ngôn ngữ hiện tại , để mô tả cái gì đó là “tốt nhất . ”

Mô hình ngôn ngữ , tuy nhiên , không có thể bao gồm cụm từ này , và hệ thống có thể cố gắng để dịch các cụm từ dựa trên các từ hiện tại trong mô hình ngôn ngữ . Điều này dẫn đến dịch không chính xác của cụm từ ” da shiznet ” vào Nói cách khác, chẳng hạn như ” dấu gạch ngang ròng . ”

Bây giờ, tôi không thể nhớ Anchorman địa phương của tôi sử dụng những thuật ngữ như “da shiznit ” một cách thường xuyên . Nếu Google được học từ mới và cách phát âm bằng cách lắng nghe truyền hình và sau cùng với việc phát sóng bằng cách nhìn vào bảng điểm từ những chương trình , tôi tự hỏi nếu MTV là đúng tiến độ xem hàng ngày của họ