話すだけで文章入力ができる、「音声認識&入力ツール」

ドラゴンスピーチ11という、世界シェアNO.1ソフトの モニターキャンペーンに当選したことから、その使い勝手を レビューさせてもらっています。

今回は、以下3つの同様ツールを、比較実験してみました。

【1】iPhone付属の音声入力ツール「Siri
【2】iPhone用無料アプリ「Dragon Dictation」(日本語版)
【3】ドラゴンスピーチ11

ちなみに【2】は、ドラゴンスピーチの会社が、iPhone用に無料提供している、ドラゴンスピーチ簡易版のようなアプリです。

比較実験の方法

  • 同じ原稿(1076字のブログ記事。記事内容はこちら)を読み上げ、それぞれのツールに認識させる。
  • 読み方は、日常会話程度のスピードで、1文ずつ(文末最後の”。”まで)読み上げる。
  • 改行や句読点も、読み上げて指示する。≪ ”改行”(かいぎょう)、”。”(まる)、”、”(てん)、”「」”(かぎかっこ)等)
  • 認識した文章をWordにコピペし、文字化の認識精度を比較する。

なお、【1】Siriと【2】ドラゴンアプリは、メールを書く設定で、iPhoneに直接話す→自分のPC宛てに送信→Wordに文章を貼り付けて確認、という手順で行いました。

当初、iPhoneとドラゴンスピーチ11を連携使用しようと思っていて、iPhoneで読み上げた音声データを、PCのドラゴンスピーチの所に持っていって処理するにはどうしたら良いのか…と、ものすごく悩んで手こずっていました。でも、ブログ記事程度の文章量でしたら、データ変換などと難しいことはせず、【2】のアプリを使って、上のようにメールを介してPCに文字データを持っていった方が、一番手っ取り早くで面倒臭くないと思います。

さて、【1】Siri、【2】ドラゴンアプリ、【3】ドラゴンスピーチで比較したのは、以下の内容です。

  • 音声入力にかかった時間
  • 音声入力の反応、使い勝手
  • 文字化の認識率(誤変換、誤認識の割合)
  • 全体的な使用感、その他

比較実験の結果

  【1】Siri 【2】ドラゴンアプリ 【3】ドラゴンスピーチ
音声入力にかかった時間 7分14秒 7分4秒 5分52秒
音声入力の反応、使い勝手
誤認識、誤変換の割合
(誤変換の単語/1067単語中)
19か所
(誤変換率 1.78%)
13か所
(誤変換率 1.22% )
40か所
(誤変換率 3.75% )
全体的な使用感、その他 ・意外と優秀。
・簡単な文ならこれで十分?
・保存できない、
使い方が限定される
などの難はあるが、
外出先などPCのない所での
携帯利用なら、
Siriより優秀で使いやすい。
・PC利用、長い文章ならこちら。
・使えば使うほど、認識率も
使いやすさも育つ。育てるべきソフト。

3ツールの認識具合(文字化した時の誤変換の割合)

上の表に割合も書きましたが、視覚的にも比較しやすいように、ワードに文章を貼り付けてみました。誤変換だったものを、黄色いマーカーでなぞっています。

【1】iPhone付属のSiri  (誤変換率 1.78%)
iPhoneSiri

【2】ドラゴンアプリ (誤変換率 1.22%)
ドラゴンアプリ

【3】ドラゴンスピーチ11 (誤変換率 3.75%)

※補足というかフォローをすると、ドラゴンスピーチ11は、「感度が良すぎる」感じ。小さい声や早い声でも読み取ってくれる分、私がちょっと どもった声まで拾っていたようです。また、「改行」と指示したつもりが、私の発音が悪いのか、何度か「海峡」と認識されてしまいました…。(;_;)
ドラゴンスピーチには、認識精度を向上させるためのトレーニングプログラムがあるので、そちらを利用すると、より精度が上がるのだと思います。今回の実験では、インストールした時のお試しトレーニングしか、私はしていませんでした…。

ドラゴンWord2

 

各ツールごとの詳しい使用感コメントは、その2に続く。

▼ドラゴンスピーチはこちら

ジャストシステム ドラゴンスピーチ11J 通常版 ヘッドセットマイク付
ジャストシステム ドラゴンスピーチ11J 通常版 ヘッドセットマイク付
ジャストシステム 2012-10-19
売り上げランキング : 327

Amazonで詳しく見る

by G-Tools