A+ R A-

Nhận diện giọng nói của Microsoft đạt độ chính xác kỷ lục

Nhận diện giọng nói của Microsoft đã lên tầm cao mới khi hãng công bố nghiên cứu cho thấy độ chính xác của AI này đạt ngang bằng với những nhà sao chép chuyên nghiệp.

 

Người khổng lồ phần mềm ngày hôm nay đã công bố hệ thống nhận diện giọng nói của mình đã đạt mức sai sót chỉ 5,1% - mức thấp nhất hiện tại. Độ chính xác mới của Microsoft vượt qua mức 5,9% vào năm ngoái của một nhóm nhà nghiên cứu tới từ Microsoft Artificial Intelligence and Research và ngang bằng với độ chính xác của những nhân viên biên chép là người thật - vốn dĩ có lợi thế hơn vì họ có thể nghe lại một đoạn hội thoại nhiều lần.

Cả hai nghiên cứu đã thực hiện chép lại những đoạn hội thoại từ tập sao lục Switchboard, một bộ sưu tập gồm khoảng 2.400 đoạn hội thoại qua điện thoại đã được các nhà nghiên cứu dùng để kiểm tra độ chính xác của các nền tảng nhận diện giọng nói từ đầu những năm 1990. Nghiên cứu mới này được triển khai bởi một nhóm nhà nghiên cứu tại Microsoft AI and Research với mục tiêu đạt độ chính xác ít nhất là ngang bằng một nhóm nhà sao chép chuyên nghiệp - những người có lợi thế hơn nhờ được nghe đoạn hội thoại nhiều lần, truy cập vào ngữ cảnh đoạn hội thoại cũng như làm việc nhóm với các nhà sao chép khác.

Nhìn chung, các nhà nghiên cứu đã giảm tỉ lệ sai sót khoảng 12% so với năm ngoái nhờ cải thiện được mạng lưới thần kinh âm thanh cơ sở cũng như mẫu ngôn ngữ của hệ thống nhận diện từ Microsoft. Đáng chú ý ở đây, họ còn tập cho hệ thống sử dụng cả đoạn hội thoại, từ đó cho phép AI hiểu và nhanh chóng thích ứng với từng ngữ cảnh khác nhau, cùng với đó là dự đoán những từ hoặc cụm từ tiếp theo sẽ được nói - vốn dĩ là cách não bộ hoạt động khi con người nói chuyện với nhau.

Hệ thống nhận diện giọng nói của Microsoft được dùng trên những dịch vụ AI như Cortana, Presentation Translator và Microsoft Cognitive Services.

Xin chào, tôi là Cortana. Hãy hỏi tôi bất cứ điều gì bạn muốn!

 

Theo Tech Crunch.

Phân phối chính thức