2021年7月28日掲載 ITトレンド全般 InfoCom T&S World Trend Report

ICT雑感:機械翻訳・自動通訳の進化から連想したAIと風情



(1)AI翻訳が日常となった職場-「藪大統領」は今や昔

いきなり私事で恐縮だが、筆者は長年、海外情報の分析の仕事をしており、ほぼ毎日、英語の文献に目を通している。しかし、今でも英語に対する苦手意識は払拭されていない。「読む、聞く、話す」のうち、圧倒的に「読む」の比率が高く、バランスが悪いのも一因だろう。それでは、「読む」は完璧なのか? 決してそうではない。今でも、まず翻訳してからでないと意味が十分に把握できた気がしない。昔は翻訳力向上のための「走り込み」と称して、朝から晩まで1つの文書の全訳に取り組んだこともあった。英文1ページの正確な翻訳には約1時間を要するため、10ページの文書であれば1日では終わらない。そもそも、休みなく翻訳ばかりしていると気力が減退してくるし、合間に様々な別の仕事が飛び込んでくるので、数日がかりになることが常であった。

しかし、ここ数年は、機械翻訳ソフトの性能が格段に向上しており、まずは文書全体を機械翻訳にかけた上で、日本語で読んでおかしいと思う部分を修正することにしている。首をかしげるような翻訳の比率はどんどん低下している。しかし、以前は爆笑するような訳も多かった。もう、15年くらい前のことだが、「President Bush」が「藪大統領」と翻訳されたことがあり、思わず同僚に笑い話として披露した。また、「他方で」と訳すべき「On the other hand」が「そのもう一本の手の上で」と直訳されたことなど、今では懐かしいエピソードが満載である。部分的な単語、イディオムの誤訳ならば文意はつかめるが、主語述語の関係が曖昧であるとか、関係代名詞や接続詞の対応関係が間違っていると、「これは日本語か?」と思うような翻訳となり、数行読み進んだところで気力が失せてしまう。そんな翻訳の修正を始めると、最初から自分で翻訳した方がずっと楽という気分になるものだった。そのような状態が大幅に改善された現在、機械翻訳が何よりも有難いと思うのは、日本語訳をざっと斜め読みして文意をつかみ、重要な部分をパラグラフ、センテンス単位で拾っていくことが可能になったことである。このような「斜め読み」の効率は、いつまでたっても母国語(日本語)に大きな分がある。また、単語、イディオムの翻訳精度が上がっているため、それらをワープロで打つ手間も大きく省くことができる。そうなればしめたもので、翻訳された文章の要点をコピーして箇条書きで並べたり、表や図として整理したりすることも容易である。

(2)名前を聞いたことのない言語も楽々翻訳

現在、無料で相当な精度の機械翻訳を提供するサイトやアプリが存在し、また、その一部はブラウザに実装されている。そのようなサービスは数多く、それぞれ一長一短があるが、ここでは一例として、「Google翻訳」の利用体験について書いてみたい。いつの頃か忘れたが、GoogleのChromeブラウザで海外サイトを検索して表示すると、「Google Translator」というポップアップが右上に現れ、「日本語」をクリックすると瞬時にサイト全画面がすべて日本語に翻訳して表示されることに気が付いて驚いた。Google翻訳自体は2006年の開始だが、翻訳の精度が向上し、ブラウザに拡張機能として追加されたことで、筆者は「仕事で使える」と認識し始めたような気がする。その時期は、2016年秋にGoogle翻訳が脳神経網に類似したニューラルネットワークモデルに基づくAI機能を搭載し、翻訳精度が飛躍的に向上したと話題になった時期と重なっていたと思う。

Google翻訳は108カ国語に対応しており(2020年2月以降)、随時、新しい言語が追加されている。その中には、オリヤ語、ショナ語など、筆者が初めて聞く言語が多数含まれている。前者は東インドのオリッサ州の公用語、後者はジンバブエやザンビア南部に住むショナ人の母語だそうである。これだけ多言語対応だと、ローカルフォント(字体)も多くて大丈夫かという気持ちが湧いてくるが、「5G in industrial campus networks」という英語をオリヤ語に翻訳すると「ଇଣ୍ଡଷ୍ଟ୍ରିଆଲ୍ କ୍ୟାମ୍ପସ୍ ନେଟୱାର୍କରେ 5G」と正しく表示されている(推測だが)。ちなみに、同じインドで最も多くの人が利用しているヒンディー語では「औद्योगिक परिसर नेटवर्क में 5G」であり、かなりフォントが異なっている。

(3)多言語で発信されるEU情報も怖くない

英独仏などのメジャー言語以外がサポートされていることは、仕事に大いに役立っている。筆者は職場で欧州連合(EU)の情報分析を担当しているが、EUは27加盟国から構成される文字通りの多言語共同体である。通常、大半の情報は英語で発信されるが、時に、英語以外の文書しか存在しないことがある。例えば、ある共通テーマに関して27カ国が自国の状況に関する報告書の提出を義務付けられることがあり、それらはオリジナル原語だけでアップされている場合も多い。例えば、ブルガリアが参照に値するユニークな施策を展開している場合には、その報告書を読む必要が出てくる。10年前であれば諦めるか、時間とお金をかけて外部の専門家に翻訳をお願いするしかなかった。しかし、今は数クリックであっという間に日本語に訳出可能である。

試しに、ブルガリア語の報告書の一部の翻訳結果を紹介すると表のとおりである。Google翻訳には、センテンス、パラグラフ単位に5,000文字までが指定できる「テキスト翻訳」と、ファイルを丸ごと指定する「ドキュメント翻訳」の2つのメニューがある。表の真ん中のテキスト翻訳結果はかなり精度が高い。しかし、ドキュメント翻訳では英語の「traffic」に相当する単語「трафика」が「人身売買」と誤訳されている。ブルガリアは同じ報告書を英文でも出しているので、試しにそのファイルをドキュメント翻訳すると、こちらは正しく「トラフィック」と訳されている。このように、ドキュメント翻訳には改善の余地があるが、テキスト翻訳の精度は相当なレベルである。同じ実験をする余裕はないが、108カ国語の精度はいずれも同じように高いと推察される。

表.EUサイトに掲載されたブルガリア語の報告書のGoogle翻訳結果

表.EUサイトに掲載されたブルガリア語の報告書のGoogle翻訳結果

(4)AIが変える翻訳・通訳の現場

Googleに代表される大手プラットフォーマーの機械翻訳がAI機能を搭載し、無料をベースに膨大な翻訳データを蓄積しながら進化していくと、人間による翻訳業、通訳業の未来はどうなっていくのだろう。ジャパンタイムズが運営する「通訳・翻訳キャリアガイド」というサイトに掲載された、日本翻訳連盟(JTF)の安達久博会長(2020年6月就任)のインタビュー記事(「翻訳業界の最新動向」)が、その点に明確に答えている。同会長によれば、通訳・翻訳業界はコロナショックの深刻な影響を受けているものの、それ以前は、インバウンドの拡大、企業によるYouTubeなどを利用した海外向けプロモーションの活発化、国際化に伴う決算文書類の英文開示の要請の高まりなどにより、翻訳・通訳需要は堅調であったという。しかし、コロナ終息後に以前の状態が戻っても、「ニューラルネットを活用した『機械翻訳』の精度向上がもたらす影響は無視できません」と同会長は述べている。その根拠は、機械翻訳してから持ち込まれた訳文をプロの翻訳者が修正していく「ポストエディット」の仕事が増えており、翻訳単価の低下が起きていることだという。「翻訳会社や個々の翻訳者が収入を維持あるいは拡大しようと思ったら、クオリティは落とさずに、翻訳のスピードを上げざるを得ません」という言葉には、翻訳に限らずAI時代を生き抜く社会人の在り方を示唆しているような気がする。

(5)AIと生きる世界の風情とは

これからもAI搭載の翻訳・通訳機能は加速度的に高度化していくだろう。そこに広がるのは、語学という壁が消えたバラ色の新世界だろうか。いや、そうなれば通訳さんの将来はどうなるのか、外国語学部は消滅するのか、語学の授業は意味がなくなるのかなど、とめどもない疑問が湧いてくる。しかし、そんな迷いは捨てて、今後は完璧な機械翻訳で入手した海外情報をもとに、相手国の政治経済、社会、文化を深く理解し、自国と比較する能力がますます高まっていくことに期待したい。

と、誰もが考え付く示唆を書いてみたものの、実務世界はともかく、個人の私的世界はまた事情が異なるような気がする。かつて、欧州を周遊するのは大変であった。1~2日ごとに国を移動するたびに、「明日からマルクではなくリラの世界だが、1円は何リラだったっけ?」などと大騒ぎしたものだ。ユーロへの通貨統合でその煩雑さは消えたが、国境をまたいで違う文化圏に入る風情が減少したと感じるのは筆者だけではないだろう。かつて、世界は共通言語エスペラントに夢をはせた。今、機械翻訳、自動通訳のソフトがエスペラント語の果たせなかった夢を実現しつつある(ちなみに、エスペラント語もGoogle翻訳の対象言語である)。しかし、ドイツやイタリアに行っても日本語が不自由なく使える旅行では、ますます味気ない思いが募るのではないか。独伊の人々も日本人と話している風情を少しは楽しみたいだろう。そこで一案だが、あえて自動翻訳・通訳機に品質を最高にしない「たまに誤訳」、「しばしば誤訳」のようなボタンを用意し、それを「日本訛りモード」と組み合わせて選択できれば、小さなトラブルで慌てた笑い話が双方の思い出として末永く残るかもしれない。旅、いや人生にかき捨ての恥も悪くないのである。

※この記事は会員サービス「InfoCom T&S」より一部無料で公開しているものです。

ITトレンド全般 年月別レポート一覧

2022 (26)
2021 (63)
2020 (61)
2019 (63)
2018 (78)
2017 (26)
2016 (25)
2015 (33)
2014 (1)
2013 (1)
2012 (1)
2010 (1)

InfoCom World Trend Report

会員限定レポートの閲覧や、InfoComニューズレターの最新のレポート等を受け取れます。

ICR|株式会社情報通信総合研究所 情報通信総合研究所は情報通信のシンクタンクです。
ページの先頭へ戻る
FOLLOW US
FacebookTwitterRSS