音声認識におけるAI



音声認識(話し言葉を識別してテキストに変換するテクノロジー)は、現在、世界中の大手テクノロジー企業のいくつかで広く使用されています。 英語など一部の言語の音声認識は古くから開発されており、99%もの精度に達していますが、ベトナム語の音声認識はまだ始まったばかりで、そのようなサービスを提供している企業はごく限られています。

ベトナム語の音声認識技術の活用を促進するために、ADAI研究所は独自の音声認識ソリューションを研究開発してきました。 GoogleのAIテクノロジーを搭載したSpeech-to-textAPIに基づいて、ベトナム語会話を正確に転写できるだけでなく、ピッチ、トーンや地域のアクセントの複雑さを認識できるソフトウェアを作成していきます。

私たちは、このソフトウェアを軍用と民間用の両方に提供することを目指しています。

  • 戦略会議のリアルタイムで安全な転記
  • 音声認識を他のビジネスアプリケーション(スマートスピーカー、モバイルアプリなど)と組み合わせての使用