話者識別機能(話者分離機能)

  • :

このヘルプ記事では、torunoで提供する「話者識別機能」について説明します。

機能の概要・特徴について

  • 会議前の事前準備は不要で、文字起こししながら自動で発話者を識別します。
  • 識別結果はSpeaker1、Speaker2、Speaker3・・・のように表示されます。
  • 実際の利用シーンでは、この表示を実際の発話名に変更してお使いください。変更は、個々の発言ごとや一括でおこなえます。
  • 記録アプリでのリアルタイム文字起こし、ファイルアップロードでの文字起こし、どちらでも利用できます。

利用可能なユーザーについて

話者識別機能は、tournoで文字起こしされる全てのユーザーがご利用いただけます。

無料トライアルだから利用できないといったことや、toruno パーソナル / toruno ビジネス どちらかだけでしか使えないといった制約はございません。

識別精度向上のコツ

後述の利用上の注意点に記載の通り、誤った識別をする場合があります。識別精度向上のコツは以下3点となります。

  • 同時発話を避ける
  • マイクを使いできるだけ近い位置で発言する
  • 残響(壁や天井などからの反射音)が入らないようにする

これらは文字起こし精度でも同様です。

マイクについては、マイク付きイヤホンやヘッドセット、マイク付きスピーカーなどのご利用をお願いします。

参考

利用方法

1. 文字起こしをおこなう

話者識別のために、事前準備をおこなう必要はありません。

記録アプリでは「記録開始」ボタンをクリック、ファイルアップロードで文字起こしをする場合はtorunoWebサイトからアップロードをしてください。

2. 話者アイコンに話者名をセット

記録アプリやWeb画面の文字起こし結果に、図のようなアイコンが表示されます。このアイコンをクリックしてください。

img_icon_mouse_over.png

すると、以下の図のような画面が立ち上がります。

img_inputbox_name.png

図示した順序で操作いただくことで、話者名をセットすることができます。

img_inputbox_name_discription.png

上図の「この発言のみ変更」「同じ名前の発言を一括変更」の違いについて

選択肢によって、下記の挙動となります。

選択肢 挙動
この発言のみ変更 選択した吹き出しの発言だけが変更されます。
同じ名前の発言を一括変更 選択した吹き出しにセットされている話者名と同じ話者名の発言が、全て変更されます。

img_diarization_detail_usage.png

その他

利用上の注意点

  • 様々な要因(声質が似ている、同時に発話がかぶる、発話時間が短い発言で学習や評価するなど)により誤った識別をおこなう場合がございます。ご了承の上、ご利用ください。
  • リアルタイム文字起こしにおいて「記録の一時停止」をおこなうと、話者識別機能も停止します。再開以降は、再度speakerX、speakerY、speakerZ・・・とIDで振られる状態となります。(X、Y、Zは数字で、一次停止前までの採番された番号に続く番号となります。)
    音声認識エンジンの仕様のため、お手数おかけしますが、再度話者名を入力してください。
     

仕様・制約について

質問

何名まで識別できますか?

質問終了

回答

リアルタイム文字起こしとファイルアップロードの文字起こしで異なります。

利用スタイル 音源 識別可能人数
リアルタイム文字起こし マイクから入力される音声 20名
内部音源(スピーカーやイヤホンから出力されてくる音声) 20名
ファイルアップロードの文字起こし アップロードした音声ファイル 1~20名

リアルタイム文字起こしの音源について
リアルタイム文字起こしでは、文字起こしする音源が2つあります。
マイク入力の音声と内部音源(スピーカーやイヤホンから出力されてくる音声)です。
各音源ごとに20名ずつ認識が可能となっております。

ファイルアップロードの文字起こしの識別可能人数について
ファイルアップロードの文字起こしでは、話者の人数を1~20名まで指定することができます。
指定がない場合は識別可能人数は10名となります。

回答終了

質問

識別可能人数を超えた発言者がいた場合、どうなりますか?

質問終了

回答

超えた後の発言は、既に識別された話者の中で類似度が近い声のユーザーに割り当てられ、誤認識されることが生じます。

回答終了

質問

会議ごとに話者名を設定するのが手間になります。 一度設定した情報を覚えて、それ以降、自動で話者を設定してもらえませんか?

質問終了

回答

できません。
発話者の名前は、記録した会議ごとにご入力・設定してください。
声紋の生体情報と個人(発話者名)の紐づけ情報はお預かりしないためです。

回答終了

質問

過去に文字起こした会議記録は話者識別されませんか?

質問終了

回答

されません。
機能をリリースした2023年10月3日以前の会議には、話者識別機能は提供されません。
なお、話者名を手動で入力する機能はご利用いただけます。

回答終了