裁判で使う!音声証拠の文字起こし(反訳)の手引き
反訳士協会ヘッダー

AI文字起こし反訳書の校正と課題は六何の原則

1. AI音声文字起こしの誤認識の要因

 近年、AI技術を使った音声データの文字起こしサービスが普及していますが、裁判の証拠としてそのまま裁判所に提出することは困難です。

 その理由は、AI音声認識技術だけでは、適切なつづり文字、大文字や小文字の区別、文章の末尾に打たれる句読点、話者の識別、音声以外の効果音、有形無形の力による誤認識や抜けなどが存在しているためです。

 AI技術を使った音声データの文字起こしにおいて、誤認識や脱落の要因はいくつかありますが、以下に代表的な要因を挙げます。

 

1-1 誤認識・抜けの要因

  • ノイズ:バックグラウンドノイズが多いと,AI音声認識が困難になります。
  • 録音品質:低品質のマイクや録音環境が不十分な場合,音声データが不明瞭になります。
  • 音声のクリアさ:話し手の発音が不明瞭だと,認識精度が低下します。
  • 環境: 騒音が多い場所での録音,電話の会話など,環境によっては音声データの質が低下し,誤認識や脱落が発生しやすくなります。

1-2 言語および方言

  • アクセントや方言:標準語とは異なるアクセントや方言は認識エンジンにとって難易度が高いです。
  • 言語モデルの限界:特定の言語や地域に特化したデータが少ない場合,誤認識が増えることがあります。

1-3 話者の特徴

  • 話す速度:早口だと認識精度が低下することがあります。
  • 声の質:声の高さや音質が変わると認識が難しくなる場合があります。
  • 複数話者:同時に複数の話者が話すと,どちらの音声も正確に認識されにくくなります。
  • 話者の声質: 早口で話す,訛がある,声のトーンが低いなど,話者の声質によっては,AIが認識しにくい場合があります。

1-4 文脈の理解

  • 言葉の曖昧さ:同音異義語や文脈に依存する言葉は誤認識されやすいです。
  • 専門用語:一般的でない専門用語やスラングは認識しづらいことがあります。

1-5. 技術的制限

  • 音声認識アルゴリズムの限界:現在の音声認識技術は完璧ではなく,一定の誤認識は避けられません。
  • 辞書やモデルのアップデート不足:最新の語彙や表現に対応していないと,誤認識が増える可能性があります


2. 裁判に於ける影響

 AI音声認識技術による誤認識や脱落は,裁判における証拠の真実性を損なってしまい誤った判断を招きかねません。
誤認識された内容は,事実と異なる情報として記録され,裁判に多大な影響を与える可能性があります。

 提出された証拠が実際にその証拠として主張されている事実や出来事が真実を反映しているかどうかを確認することを指す、証拠の真実性は、裁判の法的手続きにおいて非常に重要な概念であり、以下のような要素で確認されます。

2-1 証拠の出所

  • 作成者:証拠が誰によって作成されたのか、その作成者が信頼できる人物かどうか。

  • 取得方法:証拠がどのようにして取得されたのか、その方法が合法で適切なものであるかどうか。

2-2 証拠の一貫性

  • 内容の一致:他の証拠や既知の事実と内容が一致しているかどうか。

  • 改ざんの有無:証拠が改ざんや偽造されていないか、元の形を保っているかどうか。 

2-3 物理的および技術的検証

  • 物理的検証:文書の署名,印鑑などの確認。

  • 技術的検証:デジタル証拠の場合、メタデータやログファイル、暗号化技術などを用いて証拠の整合性や改ざんの有無を確認。

2-4 証人の証言

  • 直接証言:証拠の作成や取得に関わった人物の証言が、その証拠の真実性を裏付けるものであるかどうか。

  • 間接証言:証拠の間接的な信頼性を証明する第三者の証言であるか。 

2-5 連続性

  • 保管履歴:証拠が取得されてから法廷に提出されるまでの全ての段階で、適切に保管・管理されているかどうかを示す記録。

  • 取り扱いの記録:誰がいつ証拠にアクセスしたか、どのように取り扱われたかの記録が完全であること。

2-6 信頼性

  • 証拠の性質:証拠が信頼できるものであるか、その種類や形式に応じて判断する。例えば、目撃証言と物理的証拠では信頼性の基準が異なる。

  • 再現性:証拠の内容や結果が再現可能か。

 これらの要素を総合的に検討することで、証拠の真実性が判断されます。証拠が真実であると認められるためには、これらの基準を満たす必要があり、その基準に基づいて証拠の採否が決定されます。したがって、反訳書の作成段階では、AI音声認識だけに頼ることは適切ではありません。

 

3. 六何の原則で対策と校正

反訳書の校正では、複数の専門の反訳士が「六何の原則」を意識し作成します。以下、作成に関するポイントをお知らせします。

  • 誰が(Who): AIは特定の人物の発言を認識することが苦手です。特に、発言者の声質が似ていたり、会話が混み合っている状況では、AIが発言者を正確に識別することは困難です。
  • 何を(What): AIは専門用語や言い回し、方言などを正確に認識することが難しい場合があり、また、言葉の曖昧さやニュアンスを理解することも苦手です。
  • なぜ(Why): AIは文脈を理解することが難しく、誤った解釈をする可能性があります。特に、会話の流れや背景知識を必要とする場合は、AIの理解が不十分な場合もあります。
  • どこで(Where): 音声データの状態や録音環境によって、AIの認識精度が大きく左右されます。ノイズが多い場所や音声が不明瞭な場合には、AIが正確に文字起こしを行うことが困難です。
  • いつ(When): AIの学習データは常に更新されているため、最新の情報に対応できない場合があります。特に、新しい用語や表現が出現した場合には、AIが対応できない可能性があります。
  • どのように(How): AIの処理能力には限界があり、長時間の音声データや複雑な内容の文字起こしには時間を必要とします。また、AIの処理過程はブラックボックス化されており、人間がその判断根拠を確認することが難しい場合もあります。

3-1 精度の向上

AI音声認識技術は高い精度を持つ一方で、まだ完璧ではなく、誤認識や言葉の脱落が発生する可能性があります。複数の反訳士が関与することで、異なる視点からのチェックが行われ、誤りを発見しやすくなります。
 

3-2 文脈の理解

AIは文脈を理解する能力に限界があり、特に専門用語や複雑な表現において誤認識が生じやすいです。人間の反訳士は文脈を理解し、適切に修正することができます。
 

3-3 バイアスの排除

一人の反訳士の視点や理解に偏りがある場合、そのバイアスが反映された校正結果となる可能性があります。複数の反訳士による検証を通じて、バイアスを排除し、公正で正確な文書作成が可能になります。
 
3-4 信頼性の向上
重要な文書では、誤りが許されないことが多く、複数の反訳士による校正と検証を行うことで、最終的な文書の信頼性と精度を保証することができます。
 

3-5効率的なエラー検出

異なる反訳士が同じ文書を校正することで、各自の異なるエラー検出能力や知識を活かすことができ、より多くの誤りを効率的に見つけることができます。
 
以上の理由から、AI音声認識技術は大変に便利ですが、誤認識や脱落の問題を完全に排除することは難しいため、複数の反訳士による校正は重要です。AI音声認識で反訳された文字を誤り訂正、脱落を補完し、スタイルを修正することで、最終的な反訳書の品質と信頼性を高めることができます。これにより、AIと人間の協力によって、より正確で信頼性の高い文書を作成することが可能となります。

 

4. 第三者署名と押印

裁判において、第三者の署名と押印は、第三者の存在: 第三者が署名・押印することで、文書の作成に関与したことを示し、その内容の信憑性を高めます。その上、客観性: 当事者以外の第三者が関与することで、文書の作成過程における客観性を担保し、不正な作成や改ざんを抑止する効果が期待できます.させに、証拠力: 第三者の署名・押印は、裁判所において書証の証拠力を高める要素の一つとなり得ます。

以下の点で重要な役割を果たします。

4-1  書類の真正性を証明する

民事訴訟法では,「文書が他人に作成させた旨を署名又は記名押印して作成した時に限り,その作成者の作成した文書と推定する」とされています。

つまり,第三者が署名・押印することで,その文書が真正なものであることを証明することができます。

**真正(しんせい)**とは,**真実で正しいこと。偽りでないこと。ほんものであること。という意味。

4-2 意思表示を明確にする

証拠書類などの文書において,第三者が署名・押印することで,その文書の内容に同意し,法的拘束力のある意思表示をしたことを明確にします。
 

4-3 責任の所在を明確にする

文書において,第三者が署名し押印することで,その文書に基づく権利義務の主体が明確になります。
 

4-4 偽造防止効果

署名・押印には,文書の偽造を防止する効果もあります。
 

4-5 法律上の要式要件を満たす

一部の法律行為では,有効要件として署名・押印が要求されていて,裁判において,第三者署名・押印は,紛争の解決に重要な役割を果たす重要な証拠となります。

有形力無形力の音声証拠

人を不快にさせる表現や状況は無形の力に分類され,これらの表現や状況は,身体的な攻撃や傷害を伴わないため,直接的な身体的なダメージを与えるわけではありませんが,それでも心理的な影響を与える可能性があります。

一方,首輪をつかむ,殴る,蹴る,引っ張る,押す,水を投げる,唾を吐くなどの行動は,身体的な接触を伴うため,有形の力と見なされます。これらの行為は,直接的な身体的なダメージを与えるだけでなく,精神的な苦痛や不快感も引き起こす可能性があります。

無形の力と有形の力の両方が,人間関係や社会的な状況において重要な役割を果たすことがあります。どちらも,相手に対する尊重や配慮が欠けている場合,深刻な問題を引き起こすことがあります。

以下,参考例として,

身体的攻撃の状況
過大要求や過少要求の事実
精神的攻撃で,脅迫,侮辱,暴言,名誉棄損の事実
物や書類などを机や床,壁に叩きつけた威嚇が有ったか?
コツコツコツとペンやボールペン,物でテーブルを叩き続けたか?
胸ぐらをつかむ行為の状況
殴る蹴るの衝撃の有無
腕や衣服を引っ張る
耳元で大声で叫ぶ
拡声器を使い大音量で話しかける
狭い室内で連続的大音量で威嚇する
目に強い光を照射する
棒や刃物を振り回し周囲を叩く
身の回りの物を投げ,蹴とばす
着信音だけの無言電話を繰り返す
刺激の強い飲料水を無理強いする
車両の幅寄せ,進路妨害,停止車両を殴打や足蹴り行為
隣家居住者に騒音で精神的ストレスを加える
病菌(性病などを故意に感染させる)
臭気
音波

 

● 反訳書へ記入

公開が原則の裁判では,識別情報の取り扱いに注意することが非常に重要です。裁判所に提出する証拠は,個人情報の保護に関する法律などに基づき,厳格な規制が設けられています。

また,無断で証拠を収集することは,法的に問題がある場合があります。例えば,名誉毀損,プライバシーの侵害,商標権や著作権の侵害などの問題が発生する可能性があります。

これらの問題を回避するためには,事前に予防策を講じることが重要です。例えば,証拠の収集に当たっては,法律に従い,適切な許可や同意を得る必要があります。また,収集した証拠の保管や提出にあたっても,個人情報保護に関する法律や規則に従い,適切な処理を行う必要があります。

【証拠とは】
裁判においては,証拠を収集する際には,以下のような点に注意する必要があります。

  1. 証拠の収集方法や手段について,法律に違反しないように注意する。
  2. 証拠を収集する際には,秘密保持や個人情報保護など,関連する法律や規定を遵守する。
  3. 証拠の正確性や信頼性を確保するために,可能な限り複数の証人や資料から収集することが望ましい。
  4. 証拠を収集した場合には,証拠品を適切に管理し,偽造や改ざんの可能性がないように注意する。
  5. 証拠を提出する際には,反訳書や解説書など,証拠品を理解しやすくするための資料を提出することが望ましい。

以上のような点に留意し,正確で信頼性の高い証拠を収集・提出することが重要です。


※ 証拠の表記

他人が事実だと話した供述(述べた証拠)
人以外の物による物証(検証物・文書など,物の存在・形態・状況)
事実の存在があるのか,ないかの存否の直接証明(証明を必要とする)
他の物を間に置いて物事が行われた間接証拠(間接的に証明する)
裁判官や検察官の尋問に事実と答えた供述証拠(事実を述べる)
人が話した内容の非供述証拠

音声や動画記録データには,当事者らの言葉だけでなく,身ぶりや表情,語気や声のトーン,環境音,さらには有形の力に関わる音や動きなど,多くの情報が含まれています。これらの情報は,裁判において証拠として利用されることがあります。そのため,正確かつ詳細な記録が必要とされます。

 

※根拠
音声会話や動画記録情報に含まれる有形,無形の力情報を文字化する証拠資料(反訳書)の作成が増大しています。

それには録音環境の携帯端末,ドライブレコーダなどの電子機器の目覚ましい進歩が大きく貢献しています。
場所を選ばす,誰でも,いつでも,手軽に放送品質並みの音質で会話や動画情報が記録できる時代になったことです。


その証拠資料(反訳書)は,裁判終了後の人生を左右される裁定を受ける為の重要資料なのです。

従って,証拠を明確に指し示す根拠の情報が重要になるのです。

録音,録画の年月日
録音,録画スイッチ(ボタン)を押した時刻
録音,録画停止スイッチ(ボタン)を押した時刻
録音,録画の住所
録音,録画の場所
録音,録画に登場する話者(職名,立場)
録音,録画の会話,有形力,無形力情報の文字化(公用文,行政用語文書に準拠逐語反訳)

 

・証拠時刻の書き方
録音,録画情報の反訳では記録時間が約40分程度ですと約43,000の文字で,A4用紙で100ページを超える証拠資料(反訳書)になります。

さらに,会話や有形,無形の力情報は刻々と過ぎていく経過時刻を1秒単位の時間で反訳書に整えますとA4用紙の行数で約1,800行にもなるのです。
膨大な証拠情報には「00時,00分,00秒」の時刻と,話者,会話内容,行番号が表記されます。

 

※下の画像をクリックして拡大画像をご覧ください。

公用文書式反訳書

公用文書式の反訳書見本

※ 裁判で裁判所に提出する各書類に付いて平成13年1月1日から日本工業規格のA4判用紙を使用,様式/書式が以下

様式/書式
用紙は,A4版横書き片面。(A3判袋とじ不可)

文字のサイズは12ポイント固定。
一行の文字数は37字で,12.65pt
一頁の行数は26行で,25.25pt
余白の上端は35㎜
下端は27㎜
左側は30㎜
右端は15~20㎜
左端の30㎜綴じしろ2箇所をステープラーかホチキスで止める。
上端は印用(証拠号表示)の余白。と定められた。

※ 反訳士協会の反訳書フォーマットは以下

タイトル
前文
作成年月日
作成者記名,捺印
この記事
音声再生開始時刻の秒単位(0時0分0秒~)証拠時刻24時間で表記
会話者は,職名,肩書き,性別等を表記
連続行番号は音声再生経過時間に同期し表記
会話の内容は逐語表記
前回の記事
頁番号

反訳 裁判の証拠価値、専門家のアドバイス

PAGETOP
Copyright © 反訳士協会 All Rights Reserved.
Powered by WordPress & BizVektor Theme by Vektor,Inc. technology.