2001年11月6日
声による文字入力やアプリケーション操作が可能な音声認識ソフト「ViaVoice for Windows」が、「同 V9」にバージョンアップした。Windows XPに対応し、認識エンジンの精度が向上、ユニークなおまけソフトも搭載している。
認識精度の向上と機能強化で
使いやすさが一段とアップ
 |
メイン画面のレイアウトは前バージョンとまったく変わらない。認識精度が強化され、画面の新聞原稿も一字の誤認識もなかった。 |
ViaVoice for Windows, V9 日本語版は、前バージョンの「V8」から大幅な改良はないものの、認識エンジンの強化とユーザーの利用傾向に合わせてユーザーインターフェイスを改良したことで、さらに使いやすい音声認識ソフトになっている。
Wordでの使い易さを一層強化
使いやすさの点では、同社で行ったアンケート結果からユーザーの6〜7割がWordやメールの音声入力に使用していることがわかり、Wordの使い勝手の向上に注力して2つの大きな改良が行われた。まずは「ワードで音声入力」の起動時間の短縮だ。従来はこの機能を実現するのにWordマクロを使っていたが、ActiveXコントロールを採用することで起動速度が4倍に高速化されたという。実際に手元の環境で計測してみると、V8が約10秒かかっていたのに対し、V9は約4秒へと大幅に短縮された。
もうひとつの強化点は「コマンド・キーの設定」だ。ViaVoiceはディクテーション(音声での文字入力)の際にも、「編集、すべて選択」のように間隔をあけてコマンドを発生すると文字入力モードからいちいち切り替えなくてもアプリを操作できるのが特徴だが、コマンドを発音する間隔が短すぎると文字として入力されてしまう場合がある。これを解消するため、設定したコマンド・キー(ScrollLockかNumLockのいずれか)を押している間だけは強制的に音声コマンドモードにする機能が新たに追加された。
認識エンジンの強化
エンジンの強化では、音声認識の基礎となる音響モデルや言語モデルなどは従来のままだが、雑音耐性を強化し、自動学習機能を改良している。雑音耐性は、ある判定基準値(音量や音程)よりも下の音を受け付けないようにして入力された音声信号から雑音を除去することで、音声認識エンジン全体の安定性を保っているという。
そこで、PentiumIII-800EBMHz、メモリ256MBという同じ環境で前バージョン(V8)との比較を行ってみた(表参照)。新聞原稿では、V8で簡易エンロール時に間違いが多かったが、V9では簡易エンロールとフルエンロールで結果がまったく変わらず、さらにV8のフルエンロールよりも認識精度が高い結果となった。音声認識ソフトが苦手とする「助詞の省略」が多い会話分では相変わらず誤認識があるものの、V8に比べて精度が上がっていることが確認できた。
一方、自動学習機能の改良では、標準搭載の専用エディタ「SpeakPad」で音声入力した結果を自動学習して、ある程度蓄積された頃に単語の使用頻度を解析して一気にエンロールを行える機能で、従来は解析に時間がかかっていたところを、短縮したという。
新聞原稿の認識精度比較
新聞原稿の元原稿
| 人間の全遺伝情報(ヒトゲノム)の解読を進めてきた米国のバイオ企業「セレラ・ジェノミクス」と、日米欧政府機関の出資による「国際ヒトゲノム計画」の研究成果が10日、同時公開された。遺伝子の数が従来の推定の約10万個をはるかに下回る3万〜4万個で、ショウジョウバエの2倍しかないことが分かるなど、ゲノムの全体像が初めて明らかにされた。解読データは無料で研究者に提供され、遺伝子と病気との関連の研究、新しい治療法や薬剤の開発に結びつくと期待される。(毎日新聞2月12日朝刊1面より抜粋) |
新聞原稿の認識精度比較表
| Version |
簡易エンロール |
フルエンロール |
|
V9
|
人間の全遺伝情報(人ゲノム)の解読を進めてきた米国のバイオ企業「セラ0ミックス」と、……国際人ゲノム計画の……はるかに下回る30,000−40,000戸で、……遺伝子と病気との関連の研究・新しい治療法や……。 |
人間の全遺伝情報(人ゲノム)の解読を進めてきた米国のバイオ企業「世羅時のみ楠」と、……国際人ゲノム計画の……はるかに下回る30,000−40,000戸で、……遺伝子と病気との関連の研究・新しい治療法や……。 |
|
V8
|
人間の全遺伝情報(1日の分)の解読を進めてきた英国の場よき業……「国際1日の無計画」の……40,000戸で、ショウジョウバエの……、下の者全体10日初めて明らかにされた。…… |
人間の全遺伝情報(1ゲノム)の……「国際一美の無計画」の……40,000戸で、……ゲノムの全体像が初めて明らかにされた。……。 |
会話文の認識精度比較
会話文の元原稿
| 「とうとうノートPC買っちゃった」「へー!なになに?どこの?」「ソニーのPCG‐C1VR/BP」「うわっ最新じゃん」「見せて見せて」「いいなぁ、小さいの」「チョーカッコいい」「CEマシンよりはバッテリ寿命短いよね?」「当たり前だってば」「だってねぇ、バッテリ残量気にしながら持ち歩くの嫌なんだもん」「おれ、そういうの気にしないからさ」「まぁいっか。あたしんじゃないし」「なあにいってんだか」「寝言いってんじゃねえよ」 |
会話文の認識精度比較表
| Version |
簡易エンロール |
フルエンロール |
|
V9
|
「とうとうノートPC語った」……「ソニーのPCBハイフン41分野ある/BP」「は最新山」……「PCいいマシンよりはバッテリ寿命身近米?」……「たってねえ、……」「俺そういう時にしない辛さ」「が入った。あった信者−」「何に円高」「で御大典じゃねーよ」 |
「とうとうノートPC(ちゃった」……「ソニーのPC辞意強い1 V r/BP」「は最新ジャン」……「しいいマシンよりはバッテリ寿命短い4年?」「当たり前だった」…「折れそういうの気にしないから3」「まあいっか。私いいんじゃないし」「なあに、高」「寝言いって演者名の」 |
|
V8
|
「とうとうノートPC下ちゃった」「変!……」「ソニーのBCGの強い1Vr/PP」「馬最信者」……「しいいマシンよりはバッテリ寿命身近米?」……「たってねえ、バッテリ残量気にしながら持ち歩くの家なんだもん」「をで、そういうの気にしないから3」「枚か。あたしの中−」「が2円高」「寝言意見邪念を」 |
>「とうとうノートPCカちゃった」「平!……」「ソニーのPC地の41 VR/BP」「は3深山」「を見せて見せて」……「Cマシンよりはバッテリいじめを身近米?」「当たり前だってば」「なってね、……家なんだもん」「を0・そう言うのが気にしないから3」「枚か。家臣で−」「なあに、高。」「寝言いってじゃ0」 |
お楽しみソフトなど付属のボーナスパックも充実
 |
「人工無脳ちかちゃん」は音声でインライン入力し、それに対して音声合成で返事をするちかちゃんと会話を楽しむソフト。たまにドキリとするようなまともな会話になることもある。 |
付属のボーナスパックには、人工知能型会話ソフト「人工無脳ちかちゃん」を新たに搭載。人工無脳ちかちゃんは、K.仲川氏が作成したWindows版のフリーソフトで、ユーザーが入力した文章中の単語について、あらかじめ知っていればその言葉の意味(ユーザーが教えた内容)を使って返答し、知らなければ問い合わせて学習することで、会話のキャッチボールが楽しめるソフトだ。V9収録版では、キーボード入力を音声入力に代えて、ちかちゃんに言葉をかける(「ダイレクトで音声入力」機能を使ってインライン入力する)と、ちかちゃんの返答が合成音声でPCのスピーカから聞こえてくるというもの。訳のわからない会話がほとんどだが、そもそもこのソフトはそれを楽しむものなので、音声入力や音声チャットの練習のつもりで気軽に楽しんでみてほしい。
なお、今回のレビューではPremium版に付属する手持ちのマイクを使用したが、いちいちヘッドセットマイクを装着するよりも面倒がなく、気軽に使えて便利だ。これから購入を考えている方には、ぜひ手持ちマイク付きのPremium版をお勧めする。
製品種別と対応OS一覧
| 製品種別 |
Premium版 |
Pro USB版 |
Standard版 |
| 価格 |
2万2800円 |
1万8000円 |
9800円 |
| CPU |
Pentium II-333MHz |
Pentium II-300MHz |
対応OS とメモリ |
Windows 98 SE/Me |
64MB以上 |
| Windows 2000 Professional |
96MB以上 |
非対応 |
| Windows XP Home |
256MB以上 |
| Windows XP Professional |
256MB以上 |
非対応 |
| HDD |
510MB以上 |
460MB以上 |
(遠藤)
|