-
Whisperとの連係と意義
「Whisper」は、「ChatGPT」でも有名なOpenAI社が提供する音声認識モデルです。多言語・多方言の教師付データを学習し、背景ノイズなど様々な音声状況下でも対応可能な「Whisper」は、日本語音声についても高い精度でテキスト化できるツールとして評価されています。
昨今のコールセンターでは会話そのものを情報として利活用することが注目されており、そのために求められる音声認識機能の重要性は高まりつつあります。『CT-e1/SaaS』では、今後コールセンターで求められる中核機能としての音声認識について、最新のテクノロジーと柔軟に連係し、ユーザーに多様な選択肢を提供することを目指して「Whisper」との連係開発をすすめました。
しかし、「Whisper」は、コールセンターでの利用を前提として作成されたツールではなく、汎用的な音声認識ツールです。またリアルタイムでの通話音声を連係する方法の提供がなく、お客様とコミュニケーターが会話するコールセンターでの電話音声をテキスト化するツールとして利用するには、工夫が必要でした。
-
高度な音声加工技術による連係
コールセンターの音源としては、お客様とコミュニケーターの会話を別チャンネルで保存するステレオ録音が一般的です。しかし「Whisper」はステレオ音源を受け付けません。そのため、1つのチャンネルに流れる2者の会話音声を、話者で分離する必要があります。そのため、細かく通話を区切り、話者ごとに分離した音声データを連係することが求められます。さらに、テキスト化のリアルタイム性を確保するのであれば、技術的にも難しいものとなります。
『CT-e1/SaaS』では、会話の中の無音を検知し、センテンスごとの音声データを「Whisper」と連係する「センテンス認識」という独自の音声データ処理を開発。また、話者分離により「Whisper」を利用しながらも、リアルタイム性の高い音声認識機能の利用が可能となっています。
これにより「CT-e1/SaaS」を利用していれば、手軽にOpenAI社の「Whisper」が利用できるようになりました。
-
「CT-e1/SaaS」について
「CT-e1/SaaS」は、コムデザインが提供するクラウド型CTIサービスです。低コスト・専用設備不要といったクラウド型サービスのメリットに加えて、機能の網羅性の高さや、導入企業ごとの柔軟なカスタマイズが可能という特長もあり、累計1,550テナント31,000席以上の企業に採用されています。詳細は以下URLをご参照ください。
-
コムデザインについて
コムデザインは、2000年に創業。2008年からクラウド型CTIサービス「CT-e1/SaaS」の提供を開始。高い拡張性を持つ自社開発のアーキテクチャと利用者のニーズにきめ細かく対応可能な独自のサービスモデルにより、小規模から大規模まで業種を問わずコールセンターに支持されています。近年はCCP※として、”会話”そのものをデータ化して扱う、音声認識や会話解析などのコールセンターDXソリューションとの連係を促進し、コールセンターの新たな価値創造をサポートしております。
※CCP(Converged Communication Platform)とは
「CCP」とはカスタマーとコミュニケーターの“会話”を利用するコールセンターDXソリューションの仕様にあわせて、「音声データ」または「テキストデータ」を柔軟且つ手軽に連係することが可能なコールセンタープラットフォームコンセプトです。
-
お問い合わせ先
株式会社コムデザイン
担当:寺尾 望
住所:102-0093 東京都千代田区平河町2-7-5 砂防会館本館3階
電話:050-5808-5500
E-Mail:sales@comdesign.co.jp