AI trong Nhận dạng giọng nói

Giải pháp nhận dạng giọng nói cho thị trường Việt Nam



Nhận dạng giọng nói - một công nghệ có thể xác định các từ được nói và chuyển thành dạng văn bản - hiện đang được sử dụng rộng rãi bởi một số công ty công nghệ lớn nhất trên thế giới. Tuy nhiên, trong khi tính năng nhận dạng giọng nói cho một số ngôn ngữ như tiếng Anh đã được phát triển từ lâu và đạt tỷ lệ nhận dạng chính xác lên tới 99%, tính năng nhận dạng giọng nói cho tiếng Việt vẫn còn sơ khai, với chỉ một số công ty cung cấp dịch vụ này.

Để thúc đẩy việc sử dụng công nghệ nhận dạng giọng nói cho tiếng Việt, ADAI Lab đã và đang nghiên cứu và phát triển giải pháp nhận dạng giọng nói của riêng mình. Được xây dựng dựa trên API chuyển giọng nói thành văn bản được hỗ trợ bởi công nghệ AI của Google, chúng tôi hy vọng sẽ tạo ra một phần mềm không chỉ có thể nhận dạng chính xác giọng nói tiếng Việt mà còn nhận biết các sắc thái phức tạp trong cao độ, thanh điệu và giọng đặc trưng vùng miền.

Chúng tôi mong muốn cung cấp phần mềm này cho cả mục đích quân sự và dân sự, bao gồm:

  • Ghi lại nội dung các cuộc họp chiến lược một cách bảo mật, song song với thực tế;
  • Sử dụng nhận dạng giọng nói kết hợp với các ứng dụng kinh doanh khác (loa thông minh, ứng dụng di động, v.v.).