WinViewインフォメーション


<フォーラム報告>

◎ インテル インターナショナル・スピーチ・フォーラム

 去る4月27日に、スピーチ・テクノロジーを使用したコンテンツ開発に興味のある製品企画・開発担当者向けにインテル主催による「インテル インターナショナル・スピーチ・フォーラム」が帝国ホテルにおいて開催されました。フォーラムは10時から18時15分までの長丁場で、マーケティングセッションとして、インテル、NEC、日本IBM、マイクロソフト、ドラゴンシステムズ、テクニカルセッションとして日本IBM、NEC、ドラゴンシステムズ、アニモ、インテル各社の講師から計12セションについてお話がありました。また、スピーチ・テクノロジーを使用したソフトウエア製品およびデモ展示会も同時に開催され、アドバンスト・メディア、アニモ、オリンパス工業、ヴァル研究所、ジャストシステム、タム、ドラゴンシステムズ、日本IBM、NEC、ニフコ、ピーシーエー、マイクロソフト、メディア・ナビゲーションの各社から出展されていました。
 このフォーラムのセッションの中から、インテル株式会社取締役副社長ジョン・アントン氏による挨拶および米国インテルコーポレーション副社長兼デスクトップ・プロダクト事業部事業部長パット・ゲルシンガー氏による「Intel Architecture Power Speech」をご紹介いたします。
 なお、本コラムの文責は、Windowsコンソーシアム事務局にあります。

● インテル株式会社 取締役副社長 ジョン・アントン氏挨拶


 インテルは、世界中でインテル PentiumVプロセッサを発表しました。プロセッサの出荷は2ヶ月ほど前に始まっており、非常に順調な出荷状況を示しております。インテルといたしましては、メガヘルツレベルでの性能アップに加えましていくつもの新しいインストラクションをアーキテクチャに加えております。Pentium III プロセッサは、ダイナミック・エグゼキューション、マルチ・トランザクション・システムバス、インテル MMX テクノロジを含む、P6 マイクロアーキテクチャ・プロセッサの最もよい機能を統合しています。さらに、Pentium III プロセッサは、インターネット・ストリーミング SIMD 拡張命令、アドバンスト・イメージング、3D、滑らかなオーディオやビデオの再生、および音声認識アプリケーションを可能にする70の新しいインストラクションを提供します。
 特にインターネット・ストリーミング関係のインストラクションは直接インターネットの伸びに貢献するものであります。またPentiumVプロセッサの一貫としてインテルは、プロセッサのシリアルナンバーということで大企業、中小企業向けに使えるものを提供しました。特に3つの分野で機能拡張につながっています。一つは画像と3Dグラフイックスの分野、2番目としてはオーディオ、ビデオアプリケーションのストリーミングという分野、大幅なインターネットでの利用者が高まるということになります。3番目の分野としては、日本、アジア市場に向けて最も重要であると思われるのは音声認識および音声合成の分野での改善であります。ということで今日はこの第3の分野、音声認識Translation、そして音声合成といった分野について発表いただきます。弊社といたしましては、今日インテル社のみならず、NEC様、日本アイ・ビー・エム様、マイクロソフト様、レルナウト・アンド・ホスピー・ジャパン様、ドラゴンシステムズ様、アニモ様といった業界各社の方々から発表いただけるということで非常に喜びとしております。今日一日に渡りまして発表をお聞き頂くということになります。各社から発表がございます。各社とも日本での音声技術の発展のために多大な投資をしております。またツール類に関しましても皆様の製品により良い音声技術を取り込むためのツールを用意しております。ということで今日はセッションとして数多く用意しております。では、パット・ゲルシンガーからお話させていただきます。

● 米国インテルコーポレーション 副社長兼デスクトップ・プロダクト事業部事業部長パット・ゲルシンガー氏 「Intel Architecture Power Speech」


 インテルの第1回スピーチフォーラムを日本で開催できて非常にうれしく思っております。今日の話の中で、インテルの日本市場に向けての決意、特に新しいスピーチテクノロジー(音声技術)の分野でのアプリケーションに対する決意、さらにはアプリケーションプロバイダー、テクノロジープロバイダーの方々がこの技術を日本でまたアジア地域でどんどん拡大していくことに対する協力についての決意を示したいと思っています。

◎インテルのビジョン
 これは、十億台ものPCがネットワークされた世界の到来です。そして世界全体により多くのPCを提供することです。この数年を見てみますと非常に新たなチャンスがPCのネットワーク化という意味で見られています。十億台ものPCをネットワークすることが、私どものミッションであります。現在2億台のPCが接続されていますが、十億台になるまでには長い道程があります。それを達成するために大きな問題があります。これは特に日本やアジア地域の特有の問題であり、世界全体にこの問題があるわけではありません。それは、日本やアジア地域ではキーボードを使いこなせるかどうかという問題であり、音声対応技術がこの解決策になるのではないかと考えております。

◎今日のフォーラムの目的
3つの目的があります。
@ インテルのアーキテクチャによりインターネットの環境をより改善する。
A インテルPentiumVプロセッサ搭載プラットフォームは音声処理に最適化されている。
B 日本やアジア地域において、アプリケーション、Webサイトでの音声合成・音声認識技術の応用、そして開発を促進する。
 音声技術は、既に10年以上扱われてきています。この10年におきまして冗談のように聞こえますが、音声技術というのは、常に10年前も2年後だと言われていた、8年前も2年後だと言われていた、それに6年前も2年後に来ると言われていた、わけです。ただもう2年先ではなくなった、音声技術はもはや実現している、もう準備段階として大幅な展開を見せているということでユーザーのアプローチもずいぶん変わってきています。

◎日本のPC市場とコンシューマ向け製品の普及
 日本のPC業界は過去3年ほど停滞状況でありましたが、この数ヶ月を見ておりますとPC市場が回復してきております。売上、出荷の状況を見ましてもかなり回復をしてきており、向う数年間は日本の景気の回復をもとに、単にビジネスユースだけでなく個人ユースとして10%ほどの伸び率が見られるのではないかと思います。ただPCの浸透率は他の民生機器と比べますとかなり特異な状況になっております。日本の民生機器の使用率をアメリカと比べますと、非常に面白いデータが見えてまいります。日本ではCDプレーヤ、ビディオディスクプレーヤ、FAX、ビデオ・カメラ、ビデオ・ディスクといった機器が非常に急激に使われております。一般的な民生機器に関しては、日本はアメリカに比べて浸透率が高いといわれていますが、PCだけは別であります。インターネットやコマースに不可欠なPCのみが日本の使用浸透率がアメリカよりも低い状況になっております。これが日本での問題でもあり、チャンスでもあるということになります。

◎日本はキーボードに対する抵抗感が強い
 日本でのPCの普及率が低い問題の原因は、キーボードが重要な役割を果たしていると思います。これは我々にとっては重要な問題であり、日本のコンピュータ業界にとっても、また日本の経済にとりましても重要な問題であるわけです。この調査の結果を見ますと、キーボードに対する慣れがどの程度あるかということになります。PCに対する抵抗感がどの程度か、ということで「キーボードを見なくてもスムーズ」、「キーボードを見ればスムーズ」、それから「ゆっくりしか使えない」、「キーボードを全く使えない」というキーボード使用のレベルの表がありますますが、アメリカの方がずーっとキーボードをスムースに使いこなせる人の率が大きいことが分かります。“低いキーボード使用レベル”の表(日本が62%、アメリカが37%、韓国が45%、シンガポールが39%)は、キーボードを使っている人を100%としたときに、何%の人が「あまりスムースにはキーボードを使えない」ということを%で表したものです。キーボードを使える人の内「ゆっくりしか使えない」割合がアメリカ、それに韓国、シンガポールに比べても日本では大きいことになっています。日本での特にユニークな衝撃になっています。

◎生長する音声処理製品の市場
 音声認識が益々身がついております。最近IBMがViaVoiceを発表いたしました。日本での導入状況も極めて顕著であり、この6ヶ月に30万コピー以上が出荷されました。ジャストシステムが音声認識機能をワープロに取り込みました。ということで音声に対する市場の期待は日本で極めて高くなってきているという状況だと思います。
 最初に申し上げましたとおり、この10年の間、常に音声技術は2年先には出てくると言われ続けてきました。市場のデータ、この音声認識に対しても収益が非常に増えております。特に50%を超える成長率がこれからの5年間にかけて見込まれています。このような成長率ということになると、問題も出てくるわけですが、傾向だけは明らかだと思います。音声処理製品の市場が急速に拡大していくということです。近い将来、何十億ドルという規模の市場になると思われています。そこで何故我々が業界としてこの問題に取組むようになったのか、音声対応の技術をアジアおよび日本のユーザー向けに考えるようになったかといいますと、音声処理技術の応用分野について「強力なプラットフォーム」、「ユーザーインターフェイス」、「一連のアプリケーション」、そして根底にある「音声合成・認識技術」、この5つの分野が考えられるわけです。これがあって初めて強力なユーザーの利用環境が実現でき、さきほどご説明した問題に対して対応できるわけです。一つ一つ説明していきましょう。

◎音声処理技術のプラットフォーム
○ インテルPentiumVプロセッサの利点
 PentiumVのプロセッサが特に強みを持っている分野として、音声対応のアプリケーションが考えられます。これは演算集約的な問題でありますので、ととても強力なプラットフォームが必要になります。そうしないと音声対応のアプリケーションについてパフォーマンスの向上が望めません。そしてより高い対応処理速度の向上、エラー発生率の低下、遅延時間の短縮化、そして認識率の向上が必要です。音声処理技術を利用したアプリケーションの最適化は、インテルアーキテクチャプラットフォーム上でより快適に実現されます。

○ ハイパフォーマンスPCの発展
 この音声そのものがアプリケーションの一つの要素となってアプリケーションが拡大して複雑になれば、益々強力なプロセッサがアプリケーション向けに必要になりますし、また新しいユーザーインターフェイスも必要になってくるわけです。PentiumVのプロセッサは、特に音声対応のアプリケーションに関しては優れているということが明かです。高性能のPCはこれからもどんどん急速に進化していきます。PC業界におきましても益々強力なプラットフォームが提供されています。しかも一方で価格がどんどん下がっています。一年前と高性能なPCについて比べてみると、パフォーマンスは一年前と比べ飛躍的に46%ほども向上しております。一方同時に価格は43%も顕著に下がっています。これにより、より安い価格でより高いフォーマンス、強力なパワーが提供されているわけです。
 そこでこれを組み合せ、プラス音声対応技術ということになりますと、全く新しいアプリケーションの世界が開けてくるわけです。PentiumVプロセッサですが、これは特にパフォーマンスの面で大きな優秀性を誇っています。同じ周波数のPentiumUプロセッサとPentiumVプロセッサを3つの分野で比較してみますと、MPEG4でビデオエンコードのNetshow Encoderの例では21%の高速、イメージ処理のPhotoshop5.0の例では71%の高速、音声認識のNaturally Speaking v3.52の場合35%の高速となっています。また、ドラゴンシステムズの音声認識アプリケーションは、インテルPentiumUシステム上での動作と比較して、インテルPentiumVシステムでは37%高速に処理が行われると、Wall Street Journal(2/23/99)は述べています。
 同じ周波数であってもこのようにずーっと強力な製品が実現されるわけです。それによりましてこのような音声認識という重要なアプリケーションの機能拡張が期待できるわけです。

○ Easy PCイニシャティブ
 PCを更に進化させるためさまざまな活動を行っています。もっと使いやすく、しかも環境を改善し、コンシューマまた企業ユーザー向けに改善しようと努力しているわけですがもうPCも出現してから20年ほど経っています。この20年の歴史の間にPCは大変な進化を遂げてきました。最初のIBM互換性のあるPC以来、この20年間の歴史を振り返ってみますと、技術に関してはどんどん新しい技術が集積されはいるけれど、一方で技術がただ積み重なっているということで複雑化し、使い難くなっているという問題があります。その結果、PCの使い勝手の面で問題があるということから、「Easy PCイニシャティブ」を提唱するにいたりました。インテルとマイクロソフトによる共同イニシャティブです。ここで目的とするところは、技術を簡単にするという難しい課題であるわけですが、このイニシアティブにおいては、パソコンを“すぐ使えるように”、簡単に操作でき、簡単に買えて、簡単にセットアップができて、ずーっと信頼性も高く、しかも直ぐにネットと接続できてと、難しいことが簡単にできるようにすることです。1999年の目標は、「ハードウエアインプリメンテーションガイド FlexATX」としてまとめられ、Microsoft Windows 98 Second Editionにおいて一部実現されております。今年の目標に関しましても、ハードとソフトに関して確かに日本向けに関していろいろなことができるようにと考えております。その中でもやはり音声処理技術が、次世代のユーザーインターフェイスとしてはとても重要だと考えています。また形状、大きさ、フォームに関しても改善が見られています。
 ここで我々のPCにかかわる努力についてコンセプトしてみたいと思います。あるシステムをモデルとして作りました。とても強力なPentiumV 500メガヘルツのシステムです。128MBのメモリーを持ち、12GBのハードドライブ、というとてもエレガントなそして概念的にもとてもエキサイティングなプラットフォーム、しかも強力なもので例えば音声認識のような問題にも対応できるものです。また強力なプラットフォームを持つ別のモデルも作りました。これはむしろコンシューマ向け、或いは家庭ユーザー向けに最適化されています。PentiumV 500メガヘルツのプロセッサを持ったものです。しかしながら全ての家庭のコンシューマがこういった四角いPCに関して心地よいと考えているわけではありません。そこで新しい形状、新しい使い勝手のよさ、スタイルというものを提唱したいと考えているわけです。そこでこのような努力が業界でも広く受け入れられることとなりました。この結果、世界的にもPCの分野でリーダーとなっている企業であるDELL、COMPAC、富士通、HEWLETT PACKARD、NEC、IBM、GATEWAY2000、東芝、MICRONが我々と共にこのEasy PCイニシャティブに取り組んでくださることとなりました。Easy of Use(使い勝手の良さ)ということに関していろいろとユーザーインターフェイスを新しく変えて行く必要があるということから、音声認識というのがこのような日本向けおよびアジア諸国向けでは、この使い勝手の良さの重要な核心になっていると、考えています。

○ システムデザインガイド
 マイクロソフトとともに我々はシステムデザインガイドを作りました。PC9Xシリーズというもので、スペックに関しては基本的にどのような要件があるのか、また技術的にこのプラットフォームにどういうものを含めるべきかというPC99に関してリコメンテーションも入っています。「PC99」は昨年の7月に完成しました。今年半ばにもこれがテストされ、そして更にAC97、Audio Visualな部分、またAECなど、こういった面での改善を図っています。これにより音声での入出力に関して改善を図りました。これは音声認識にも重要だからです。「PC99a」は、今年の6月に完成予定で、「PC99」にFAQを追加したものです。また、「PC2001」のデザインガイドが今年の2月に、U.S.IDFでキックオフされました。2000年2月にRev1.0が発行されます。音声処理機能の実装が“必要項目”となる予定です。
 音声がこの「PC2001」のインプリメンテーションの中で重要な課題に立つと考えています。PCのデフニッション、このベースラインの定義を更に進める中でこの音声ということをいかに対応していくかが重要になっているからです。

○ 業界への期待
音声処理技術の発展のために、3つのことが期待されます。
@ 音声認識というのはとても複雑でかつ演算集約的なものである。何といってもプロセッサのパワーが必要になるからである。そこでPentiumを更に進化させていき、将来の要求に応えていきたい。
A オーディオのサブシステム(マイクをはじめとする入力技術の向上)も含め、ユーザーインターフェイスの改善。
B インフラストラクチャとしてOSの要件をマイクロソフトと協力してWindows OSを更に改善していき音声向けのより良いプラットフォームを実現する。Windows 98での強化、Windows 2000では更に強力にする。

◎音声処理技術の応用分野 <音声合成・認識技術>
○ ソリューションを提供する基盤
 音声技術に関して先ず技術そのものを前進させていき、音声認識のより良いエンジンにするという努力がなされました。そして、日本アイ・ビー・エム、日本電気、ドラゴンシステムズ、アドバンスド・メディア、レルナウト・アンド・ホスピー・ジャパン、マイクロソフトコーポレーション、といった企業が底流となる技術、音声認識のためのエンジンを出されております。またSDKに関してもアプリケーションベンダーから提供されており、それぞれのアプリケーションをこのプラットフォームで開発できるようになっています。ご覧のようにいろいろなソリューションが出されていますし、その上に音声対応のアプリケーションを構築していくことが可能になっています。

○ 音声処理技術を応用した航空券予約ソリューション
 例として、Web対応の旅行関連のアプリケーション「航空券予約ソリューション」を、ドラゴンシステムズのクリス・ライター氏にデモしてもらいます。これは、旅行関連のWebサイトで今このようなものが流行っていますが、既存のドラゴン技術“Dragon 2000 Naturally Speaking”を使い、またその他の既存のWeb対応技術を使って音声対応のWebサイトを作るものです。音声でもってナビゲーションができます。
 「ロビー手伝ってください」(“ロビー”というキャラクターが画面に現れて案内してくれる、以下デモが行われる)。
 この技術は日本語版でも出てきます。特に関心のある方はベータ版の日本語版のディクテーションシステムということでプロダクトショウケースの方で今日お見せしますのでご覧ください。ドラゴンシステムのWebアプリケーションをご覧いただきました。
 これで生産性が上がるということだけでなく、ユーザーの予約の経験がより楽しくなるというものです。

○ 業界への期待
 音声処理技術は非常に信頼性が高く、もう既に多くの利用実績があります。いろいろなアプリケーションに使えるということで、各社からアプリケーションデベロッパーキットが用意されており、皆さんの製品に取り込んでいただくことができます。それによって今からすぐにスピーチ技術を使って実際にアプリケーションを開発することが可能になっています。それでは、具体的なアプリケーションをもっと見ていきたいと思います。

◎音声処理技術の応用分野 <アプリケーション>
○ さまざまな分野
 音声技術を最初に取り入れたのは、教育分野であったと思います。エー・アイ・ソフト、マイクロソフト、ジョルダン、EHQ、そして日本ユニシスといった企業からいろいろな教育アプリケーションが日本語版で出ております。非常に積極的に音声技術を取り入れたのは教育分野でありまして、かなり広まっています。この教育分野では、音声を使っていなければもうリーダーからは遅れを取っているということになるわけです。
 ワードプロセッサの分野ですが日本語版としまして音声技術を使っているのはジャストシステムのものだけだと思います。英語版ですとLotus、Corelから出ています。中国語では、WPS98という中国語音声認識ソフトが98年に出ています。ワードプロセッサに音声認識を使うということのメリットは非常に大きいと思います。例えば、中国語ではタイピストでも1分に20文字くらいしか入れられませんが、音声認識を使いますと160文字を入れることができ、8倍になるわけですから生産性の大幅な向上が図れるということになります。
 次に電子メールですが、日本IBMがスピーチパッケージを提供しております。かなり新しい分野ですが、ポピュラーになっています。WebをEメール用に使うということで、音声認識にViaVoice技術を使って行っております。同じようにNECも「しゃべっていいメール」というパッケージを提供しておりますが、かなり成功をおさめております。現在Eメールで音声認識技術を使ったものは日本IBMとNECの2社からしか出ていません。
 それから、スピーチシステムということで更にアプリケーションを拡張してPCの利用勝手を高めたものが出ています。Eメールをタイピングするというのは運転中あるいは歩行中ですと難しいわけです。ですからこのようなアプリケーションがあればディクテーションマシンを使ってPCに接続すればメールを簡単に送れる、或いはドキュメントを歩きながら、或いは電車にいながら音声で送れるということができるわけです。オリンパス工業から「Voice TRECK」、ジョルダンから「乗換案内 時刻表対応版」、ドラゴンシステムズから「Naturally Speaking Mobile」が出ています。
 もう一つアプリケーション分野としましては、話者認識というのがあります。これは、ID識別ということで指紋ではなくログインやパスワードの代わりに声紋認識ができるわけであります。つまり声紋によりまして本人確認を行うということになります。例えばインターネットバンキングですとか、常にパスワードをアップデートする必要がなく声紋により本人確認ができるということで信頼性が高まります。これはアクセスコントロールをPCアプリケーションにもたらす良い方法ではないかと思います。アニモの「VoiceGate & VoicSync」(音声による話者照合、音声検索、本人確認)、「VoiceClinic」(音声による健康状態確認、性格・相性診断)とユニークなシステムが出ております。
 いくつかのアプリケーション分野をご紹介いたしました。

○ 有望な応用分野
 可能性は非常に大きいと思いますし、また、追加でアプリケーション分野を考えることができると思います。音声認識を使った有望な応用分野ということで、電子商取引、ビジネス、その他の分野を考えてみたいと思います。
 電子商取引では、音声によるWebブラウザー操作、Webサイトでの音声入力応答、銀行業務、販売、電子メール、チャットといった分野に、ビジネスでは、会計、宣伝・広告、データ・マイニング、法務、医療、情報システム、出版といった分野におきましていろいろ検討されておりますが、このような分野において音声技術によってもたらす生産性の向上というのは非常に大きな期待ができます。また、ゲーム、GUI、教育、トレーニングといったものも音声技術によって大幅な進展がみられると期待される分野であります。音声認識を日本語でやれば自動的にテキストに英語に、あるいは他の言語に、あるいは音声に翻訳できるということになります。生産性も大幅に上がり、機能も格段に向上することになります。音声技術によって言語の壁を超えて、あるいはキーボードの障壁を超えて展開できる新しいビジネスチャンスが出てくる、ということになります。

○ 日本のWeb利用者
 インターネットは爆発的に世界中で伸びているわけであり、それによって全てのやり方が変わってきています。人々の小売の仕方、ショッピングの仕方、ビジネスのやり方が変わってきているわけですが、日本でも例外ではありません。
 日本では、1995年にはわずか50万人だったWeb利用者が、96年250万人、97年500万人、98年750万人と急激に増加しておりなり、また99年1100万人、2000年1300万人、2001年1700万人、2002年2200万人と予想されています(IDC1998)。
 このような予測数字を見ましても日本のWebの利用者数は爆発的に伸びているわけであります。ますます今後伸びてくるということが予測されていますが、ここでインターネットスピーチ対応アプリケーションのデモをご覧いただきたいと思います。

○ 音声処理技術を利用したインターネットでの検索
 IBMの石橋さんにViaVoiceアプリケーションのデモをしていただきたいと思います。これはインターネット用に最適化されたものです。石橋さん、インターネットベースのスピーチアプリケーションをご紹介ください。
 IBMの石橋さんによるデモが行われる。「音声対応のデスクトップキャラクター、ビアボイオスアトムを紹介いたします。このアトム君は話しかけると音声対応をしてアニメーション処理をします。このように遊ぶだけでなくアプリケーションの起動もすることができます。声で簡単インターネットというアプリケーションにより、ネットサーフインとEメールの作成をご覧いただき、またAOLを起動して英文メールの作成をご覧いただく。簡単に全てを音声で英文メールなどもできるようになっております。」

 どうもありがとうございました。プラットフォームは何ですか。このパフォーマンというのは、どの程度このアプリケーションで重要なのですか。
 IBMの石橋さん「通常はPentiumUの333メガヘルツのものを使っているのですか、今回はPentiumVのマシンを使うことによって何時もの2倍の早さで入力や認識ができるようになりました。本日はアプリケーションが4つ以上立ち上がっていますが、それでもこのスピードを保てるわけですのでPentiumVの登場によって更に音声認識が身近になってくるのではないかと思います。」
 どうもありがとうございました。

○ 業界への期待
 ところでアプリケーションプロバイダーとしての課題は、いかにこの新しい音声技術を展開していくかということです。音声が重要なユーザーインターフェイス技術となって行きます。これは日本およびアジア地域について言えることです。そして、PCが普及していく上でまだまだいろいろな壁があるわけですが、インターネット時代に向けて日本市場においては阻害要因になっていたものを無くして行く上で音声というのはとても重要です。これこそが強力でかつ有益な技術です。そこで皆さんのようなアプリケーションプロバイダーとしては是非音声対応技術を皆さんのアプリケーション、インターネット、教育、生産性向上あるいはビジネスアプリケーションの中に取りこんでいってください。そうすることで皆さんはリーダーになれるわけです。そうでなければ他の企業に対して追随していかなければならず、競争不利になってしまいます。その結果この技術によりまして全く新しいユーザーの体験が実現できるわけであります。

◎音声処理技術の応用問題  <ユーザーの利用環境>
○ コンシューマにとっての利点
 ユーザーにとってのメリットはとても大きなものが考えられます。コンシューマにとってはPCはますます使いやすくなる、楽しいものになります。生産性も向上します。もっと自然なユーザーインターフェイスが実現されるからです。ユーザーはタスクの完了もずーっと短い時間でできるようになります。手書き認識、キーボードでのタイプ入力など、これらと比べますとこの音声入力は大きなメリットを持っています。それによりましていろいろな新しい利用形態が考えられます。その結果、ずーっと使いやすいプラットフォームが出てくるわけでインターネットにもつながり、そしてユーザーの体験ももっとより良いものになるでしょう。

○ ビジネス上での利点
 企業向けのメリットとしては、次のようなものが考えられます。多言語サポートが可能になります。長い時間をかけていろいろな翻訳をしたり、いろいろな言語の間でのやり取りがあったわけですがそれが改善される、生産性の向上も期待できます。ますますより多くの世界の市場に対してアクセスできるようになります。より効率的な業務が可能になります。ということは生産性が向上し、効率が高まるわけです。もう既に今日のデモでもご覧いただいたようなメリットがあります。そしてトレーニングにかかわるコストも軽減できます。そしてこれが今日および将来に向けて大きなメリットとなります。“時は金なり”といいますが、音声入力によりまして時間の削減が可能です。

○ 業界への期待
 業界への期待ですが、まずこれを使っていただきたい、そして展開してください。より多くの機能を提供していきたい、それが音声対応で可能になります。ソフトは使いやすくなります。企業にとってもコンシューマにとっても、またいわゆる電子商取引に関しても、またコンシューマ向けのアプリケーション、そして企業向けの生産性向上、こういった面でも改善が期待できますし、ユーザーとしてもより楽しく利用できるようになるわけです。ISVにとっても大きな競争優位になります。今日皆さんがリーダーであったとしても、もしこの音声技術の動きの中に参加しないとなれば、他に遅れてしまうということになるでしょう。

○ 本日のスピーチ・フォーラムの内容
 本日は、NEC、アニモ、ドラゴンシステムズ、ジャストシステム、IBM、マイクロソフト、レルナウト・アンド・オスピー・ジャパンといった会社様とともに、このフォーラムをやっています。このフォーラムに技術のリーダーあるいはアプリケーションプロバイダーのリーダーの皆さまにご参加いただいて、いろいろと話しをさせていただくわけです。ここではユーザー向けの体験についてお話をするわけですが、このような他の企業の方々が参加してくださることにより、今日のこの大変エキサイティングなフォーラムも可能になったわけです。

○ ビジネス・チャンス
 インテルアーキテクチャププラットフォームは音声処理に最適化されています。また音声処理技術は既に利用可能です。そして、広く実現し、普及させるためにはこういった要素が全て必要になるわけですがそのためには協力が必要です。全ての要素が協調しなければならない、インターフェイス、それからプラットフォームの移行、スピーチエンジン、そしてアプリケーション、それらの間での協調が必要です。そのためには業界各社が協力して、この新しいユーザー向けの体験を実現しなければなりません。そして、ハードの進歩、そしてこの音声対応技術の改善、これによって新しいビジネスチャンスが生まれます。
 これにより、より広範な形で音声対応アプリケーションの技術の展開をしていくことが可能です。日本のみならずアジア全体に向けていくことができます。我々が目標とするところは皆さんと協力することでこの動きに対応し、音声対応のソリューションを今から大いに市場に出していくことで前進を進めていきたいと思います。ご静聴ありがとうございました。


Contents         Windows Consortium ホームページ