NECでPDAの未来形を先取り。 高速プロセッサで、音声認識翻訳ソフトも動く

このページをDeliciousに追加 このページをはてなブックマークに追加 このページをYahoo!ブックマークに追加

2003年3月2日(日)版

NECでPDAの未来形を先取り。 高速プロセッサで、音声認識翻訳ソフトも動く

The Microsoft Windows Embedded Developers Conference 2003 Japan

←前へ↑↑記事一覧へ↑↑次へ→


■ はじめに

 少々時間が空いてしまったが、2003年2月18日-19日に開催されたマイクロソフトの組み込み開発者向けカンファレンス「The Microsoft Windows Embedded Developers Conference 2003 Japan」の模様について、まだ紹介し切れなったものを順に紹介していきたい。

 今回は、NECエレクトロニクスが展示していた、音声認識機能を持った英日・日英翻訳ソフトだ。音声認識のみならず、翻訳後の文章を音声で読み上げてくれることもできる。ソフト自体は昨年同社から発表されているが、今回、同社のVR5500プロセッサを利用することで、かなり高速な音声認識、翻訳が行われていたのが印象的だった。

■ NEC SOLUTIONGEAR II(VR5500) + WindowsCE.NET でここまでできる

 音声認識機能を持った英日・日英翻訳ソフトのデモ。おまけに結果を音声で読み上げれくれるとなれば、21世紀の夢の一つだ。Pentium4が3GHzを超える今でも、音声認識といえばまだまだ難しい印象があるが、「Embedded DevCon 2003」会場では、NECエレクトロニクスが、同社のプロセッサ等の評価用に販売している「SOLUTIONGEAR II」シリーズの上で、何の問題もなく動いていたぞ。

開発用の筐体のため愛嬌はない。
モニタの下側に移っている基板が
「SOLUTIONGEAR II」
コアはこの「VR5500」プロセッサ。
XScale PXA250の2倍の800MHzで動作。

 このソフトの使い方は簡単だ。

 マイクを片手に持って、マイクボタンを押して、日本語でも、英語でも翻訳したい内容をしゃべる。しゃべり終えて、1秒かからないくらいのうちに、聞き取られた内容が文章で表示され、即座に英日か日英の翻訳結果が表示される。と、同時に、その内容が音声で読み上げられるという仕組みだ。筆者のように、それほど英語が得意でない人間だと、相手にペラペラペラとしゃべられても、ほとんど聞き取ることが出来ないが、この音声対応の日英・英日翻訳ソフト「トランスピーチ」はきちんと聞き分けていた。筆者のしゃべる日本語はもちろんきちんと聞き取られていたし、説明してくださった方の流暢な英語も、あっという間に日本語になっていたぞ。(ちなみになんと言っているかはやはり私には聞き取れなかったが、「トランスピーチ」はきちんと聞き取ってくれたようだ!)

「駅はどこですか?」と話しかけたところ。
「Where is the station?」と瞬時に現れる。
「What time is it now?」と話しかけたところ。
今度は日本語に翻訳される。
英語を認識させるのはなかなか
しゃべるほうにも高等技術が要求されるそうだ。

■ すでに小型実装は完了

 音声対応の翻訳ソフトとは、なかなかすごいもんだが、上記の写真を見ると、その大きな筐体にがっかりする向きもあるだろう。これでは、PDAサイズはおろか、ミニノートパソコンサイズになるにも時間がかかりそうだ。しかし、その認識は間違いだ。このサイズなのは、あくまでも開発時の試験や部材の交換が容易になるようにと考えられている「SOLTIONGEAR II」上で動かされているからだ。

 現状の技術で、これをどこまで小さく出来ているかが、実はこれ。

左下の基板の端のようなパーツに、
右側とほぼ同じ機能を集積してある。
嘘のようなほんとらしい。
サイズは名刺入れの半分程度。小さい。

 手前の金色の石が乗っている小型のボードが、これをシュリンクしたボードだ。液晶パネルや、バッテリはないが、音声入力・音声出力ということだけ考えれば、これをケースに入れてバッテリをつなぐだけでも十分動かせるという。

 SOLUTIONGEAR II とのあまりのサイズの違いにぴんとこないかもしれないが、同じものをひっくり返して名刺入れと並べてみたのが右側の写真だ。標準的な名刺入れより薄く、サイズも名刺の半分だ。これをケースに入れて、液晶パネルをつけて、バッテリを載せれば、ちょうど今の Pocket PC サイズになる。今回展示されたのは、VR5500プロセッサ 400MHz を利用した「SOLUTIONGEAR II」だったが、ほぼ 800MHz の VR5500プロセッサでもほぼ同じサイズにできるらしい。

 NECでは、翻訳ソフトをいろいろなプラットフォーム上で動かしているが、同社によれば、従来のXScale ベースの Pocket PC 2002上では「翻訳して音声で読み上げるところまで」だったという。それが、こうしてVR5500プロセッサを利用することで「音声を瞬時に認識して、翻訳、音声再生」までできるようになったという。NECは、VR5500そのものの開発元なので多少割り引いて考えるにしても、実現されている性能をみた限りではやはり、同じ400MHzでも、VR5500プロセッサは強力だと言える。
 Pocket PC 2002 になって、CPU がARM系に限られてしまったため、コンシューマーPDAでなじみが薄くなってしまった VRプロセッサだが、いわゆるマルチメディアや、パワーの必要な業務用アプリケーションを動かしたい場合には、今すぐ使えて、今後もNECがサポートしてくれるプロセッサとして検討してみる価値がありそうだ。

■ 終わりに

 近頃では、PDA の電話帳機能や、スケジュール機能は言うに及ばず、メール機能なども携帯電話で可能になっているが、こうした音声認識・翻訳・音声再生といった強力なプロセッサが必要なアプリケーションを見ると、まだまだ、PDA というフォームファクターならではの可能性を感じることができた。

 それも、遠い未来の話ではなく、2003年後半から、2004年に登場するPDAは、企画次第では、どれも、今回のデモのような強力なアプリケーションを動作させることができるというわけだ。一本でも多く、強力さを活かした面白いソフトが登場することが望まれる。



Reported by けいたん


Last-modified: Sun, 24 May 2009 23:45:30 JST (3653d)