概要

本機能は、SkyWayを使った音声通話を文字起こしする機能です。専用のライブラリを利用してリアルタイムに文字起こし結果を取得することができます。

オープンベータ版について

本機能は現在オープンベータ版として提供しています。ご利用をご希望の方は、申し込みフォームよりご連絡ください。

主な特徴

  • リアルタイム:無音判定により音声が細かく区切られ、低遅延で文字起こし結果を取得することができます
  • 発言者の識別:文字起こし結果には発言者の情報が紐付けられるため、誰の発言かを識別できます
  • 翻訳機能:翻訳モードをONにすると、英語と日本語の両方の文字起こし結果を取得できます

例えば以下のようなシーンでご活用いただけます

  • 会議の議事録:発言者を識別して議事録を記録・表示
  • 遠隔接客:外国人との接客で互いの発言を翻訳

対応SDK

  • JavaScript SDK

他SDKは順次対応予定

なお、他のSDKを利用して文字起こし中のroomで発言した内容は文字起こしの対象になります。

利用方法

本機能のシステム構成は以下の通りです。

  • お客様サーバーをご用意いただき、文字起こし開始などの処理でREST APIを操作する必要があります。
  • クライアント(フロントエンド)アプリにてJavaScript SDKおよびSTT-Clientライブラリ(後述)のインストールが必要です。

概要図

文字起こしを行う際には、エンドユーザーへの説明および同意取得が必要です。詳しくは規約をご確認ください。

STT(Speach-To-Text)-Clientライブラリ

GitHub skyway-stt-client-js