ホーム > Global Perspective 2011 >
Global Perspective 2011
2011年10月28日掲載

「iPhone4S」の音声認識サービス「Siri」に”Foreign Policy”が聞いてみた国際問題

グローバル研究グループ 佐藤 仁
[tweet]

 2011年10月14日、世界各地でAppleの「iPhone4S」が販売されたのは周知の事実だ。日本でもソフトバンクの独占していたiPhone市場にKDDIからも販売されたことで大きな話題となっている。

日本版では対応していないが、今回の「iPhone4S」に目玉の新機能として音声ガイダンス機能「Siri」が搭載されている。音声によるコンシェルジェのようで、日本でも大きな話題となっている。現在は、英語、フランス語、ドイツ語のみ対応になっている。

 日本語には2012年から対応する予定とのことだ。「Siri」に関しては、既に多くの記事やレポートで利用体験記、日本人英語を聞き取れるかの結果などが出ているので、興味ある方々は既読のことであろう。YouTubeには「iPhone4Sの紹介の大阪弁バージョン」まで登場している。(「Siri」についての紹介もある。)また、米国版は女性で、フランス、イギリス版は男性の声であるとのことについても議論)になっている。「Siri」のサービス紹介や音声認識技術論や使い勝手についてはそちらに任せたい。

 本稿では、アメリカの外交雑誌「Foreign Policy」に掲載されていた「What Does Siri Know About the World?」という興味深いレポートを紹介したい。

 アメリカの外交雑誌が掲載する記事だけあって、「Siri」に音声で質問しているのは、現在の国際問題についてである。「Siri」は現在の国際情勢をどこまで回答するだろうか。非常に真面目な外交雑誌であるForeign Policyがこのような実験をして記事にするのは珍しいのではないだろうか。願わくは、もっと鋭く突っ込んだ質問があっても面白かったのではないか、と思う。

 以下にForeign Policyの音声での質問と「Siri」の回答を紹介したい。

表1:「Siri」での国際問題に関する質問と回答

"Foreing Policy"の質問 「Siri」の回答結果 補足・解説

Who is the president of Uzbekistan?
(ウズベキスタンの大統領は誰?)

Islam Karimov

正解。

Would you negotiate with terrorists?
(テロリストと交渉してくれませんか?)

 I don’t understand "Would you negotiate with terrorists".
(理解できません)

質問を理解不能。

Who is the leader of Libya?
(リビアの指導者は誰?)

Googleの検索結果が表示される。

現在、リビアに指導者はいないから正しいだろうと、Foreign Policyでは解説。

Does Pakistan support terrorism?
(パキスタンはテロリズムを支援している?)

I found a number of Pakistan restautrants in DC.
(DCでのパキスタンレストランをいくつか見つけたよ)

DCでのパキスタン料理店を表示。
実際には、インド料理店もかなり含まれているとのこと。

Can Greece leave the Eurozone?
(ギリシャはユーロ圏から離脱できる?)

I don’t know what you mean by "Can grease leave the euro zone".
(言っていることがよくわからないよ)

Greeceをgrease(油やポマード)と聞き違い、理解不能。

Where in Libya is the town of Sirte?  
(リビアのシルトという町はどこ?)

I don’t understand "Where in Libya is the town assert"
If you like, I can search the web for "Libya".
(わからない。もしよかったら、「リビア」で検索できますよ)

Sirteをassert と聞き違い理解不能。
もしよかったら、Libyaで検索しようか、と誘導。
(Sirteはカダフィ大佐の故郷)

Where is Tibet?
(チベットはどこ?)

Sorry, I can't provide maps and directions in China.
(中国の地図と方角は表示できないよ、ごめんなさい。)

Foreign Policyでは、この回答に対して、「Perhaps not wanting to threaten sales in China, Siri tows Beijing's line.」とコメントしている。

Where is East Jerusalem?
(東エルサレムはどこ?)

Sorry, I can't provide maps and directions in israel.
(イスラエルの地図と方角は表示できないよ、ごめんなさい。)

Foreign Policyでは、この回答に対して、「She also seems to be something of Zionist. 」とコメントしている。

(出典:Foreign Policyの記事を元に筆者作成)

 もちろん、音声認識機能であるから、話者の発音や聞き取りやすい単語、聞き取りにくい単語など様々であるから、一概にサービス、機能の良し悪しの判断はできない。これはどのようなジャンルの質問をしても同じだ。

 音声認識技術では、ウズベキスタンの大統領の名前は回答できても、ギリシャ問題やパキスタンのことなど、外交やリアルな国際政治に正確な予測を提示することは難しいだろう。

 「日本の首相は誰ですか?」「日本はこれからどうなりますか?」といった日本に関する質問がなかったのは、少々残念だ。「Siri」はちゃんと回答できただろうか。

 日本語版「Siri」の登場が待ち遠しい。一方でリアルな国際政治や外交は生身の人間が行っているのだから、正確な回答や予測は音声認識サービスに求めるのは難しいことは明白だ。

 どこまで技術が進歩しても、生身の人間にしか回答を出せないことが国際社会での日常生活においてはたくさんあることも忘れてはならない。

(参考)

*本情報は、2011年10月24日時点のものである。

▲このページのトップへ
InfoComニューズレター
Copyright© 情報通信総合研究所. 当サイト内に掲載されたすべての内容について、無断転載、複製、複写、盗用を禁じます。
InfoComニューズレターを書籍・雑誌等でご紹介いただく場合は、あらかじめ編集室へご連絡ください。