innavi net画像とITの医療情報ポータルサイト

ホーム

アドバンスト・メディア,AmiVoice® 音声認識APIに双方向型のディープラーニング技術「Bi-LSTM」を実装領域特化型エンジンの認識率が大幅向上

2020-9-17

(株)アドバンスト・メディアは,音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデートし,双方向型のディープラーニング技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を音声認識エンジンに実装した。これによりエラー改善率が最大で25%(同社調べ)と,自然発話を中心とした認識率が大幅に向上した。
https://acp.amivoice.com/main/

Bi-LSTMは,ディープラーニングの発展技術の一つ。従来の音声認識エンジンAmiVoiceに実装していた,リカレントニューラルネットワーク技術の「LSTM(Long Short-Term Memory)」は,過去の情報を加味しながら処理を行うが,「Bi-LSTM」は未来の情報を予測し加える事で,双方向の時間軸から処理を行う。その為,更に高い認識率を実現する事が可能になった。

Bi-LSTM

 

今回「AmiVoice Cloud Platform」で提供している,全ての領域特化型の音声認識エンジンに「Bi-LSTM」を実装した。「LSTM」を実装したこれまでの音声認識エンジンと比較し,リアルタイム認識で最大20%,バッチ認識で最大25%のエラー改善率となり,認識率が大幅に向上した。

【Bi-LSTMを搭載した音声認識API】
汎用向け:汎用エンジン ※4月1日に「Bi-LSTM」を実装済み
医療向け:医療_汎用エンジン,医療_介護エンジン,医療_電子カルテエンジン,医療_調剤エンジン
会議向け:会議_議事録エンジン
業務報告向け:業務報告_金融エンジン,業務報告_製薬エンジン,業務報告_保険エンジン

AmiVoice Cloud Platform

 

AmiVoice Cloud Platform
WEB:https://acp.amivoice.com/main/
概要:
クライアントアプリケーションに特別なライブラリを組み込む事なく,音声認識機能を実装できる音声認識API。音声文字化や音声対話,音声制御,音声翻訳等,アプリケーション,Webサイト等の各種サービスに使用できる。汎用エンジンに加え,医療向け・会議向け・業務報告向けの領域特化型エンジンを提供。汎用エンジンは,毎月60分無料で使用ができる。また,各エンジンは体験デモ(https://acp.amivoice.com/main/acp-demo/ )で試すことができる。

アドバンスト・メディアでは,「AmiVoice Cloud Platform」を軸とした音声認識のオープンプラットフォーム化を進めている。AmiVoice 音声認識APIを利用する事で,従来の音声認識開発に要する時間を大幅に短縮するとともに,高い認識精度の音声認識エンジンを簡単に組み込む事が可能になる。
今後も,様々な領域特化型の音声認識APIの公開や随時アップデートを継続していく。

 

●問い合わせ先
(株)アドバンスト・メディア
PF D&O部
TEL 03-5958-1034
FAX 03-5958-1033
https://www.advanced-media.co.jp/