シェアする

保存する

Life Shift

2016.08.31

2020年、世界の「言語の壁」が消える?音声翻訳システムの今に迫る

世界の「言葉の壁」をなくす――。総務省が2014年に発表した「グローバルコミュニケーション計画(GC計画)」。ちょうど4年後に控えた、2020年東京オリンピック・パラリンピックをタイムリミットと定め、多言語音声翻訳システムの社会実装が急ピッチで進んでいる。しかし、そんな夢のようなことが本当に実現できるのか? そして、もし本当に言語の壁が消えたとすると、社会はどう変わるのだろうか? 日本、そして世界の音声翻訳技術を牽引する情報通信研究機構(NICT)の隅田英一郎氏に、夢までの距離を聞いた。

急速にグローバル化する日本が抱える大きな課題

2015年度の訪日外国人は過去最高の2,000万人を突破。政府は、「2020年に訪日外国人4,000万人」という目標を掲げ、“観光大国”を目指している。

中国、韓国、台湾……アジア圏を中心に世界各地から多くの外国人が訪れ、日本各地を巡る。“爆買い”で話題のインバウンド消費による経済活性化など、多くの恩恵があるが、外国人観光客増加にともない、とくに地方が「本当に困っている」と隅田氏は言う。

「全国の地方都市に、年に20回も、6,000人ぐらい乗る大きな船が海外から来ているんです。6,000人が船から降りてドドーっと街に出て、地元のおじいちゃんおばあちゃんのお店に行って、買い物をしたり、食事をしたりする。でも、言葉の問題に手が回っていないので、大パニックになっていて」

義務教育のなかで英語を学ぶ機会は設けられているが、自信を持って外国人とコミュニケーションが取れるという人は多くないだろう。そして、中国、韓国、タイ、ベトナム……など、多言語にすべて対応できる人はほとんど存在しない。2020年に向けて、より多くの地域で観光客が増えることが予想され、その言語の壁を言語教育でもってして越えることは不可能に等しい。

その解決策として、「音声翻訳」実用化への機運が高まっている。

SF作品にはたびたび「多言語音声翻訳機」が登場し、漫画『ドラえもん』では、言葉の壁をなくすひみつ道具「ほんやくコンニャク」が描かれた。我々は長年、異なる言語を使う相手と、話す言語を気にすることなく自由に会話することを夢見てきた。

隅田氏が所属する、国立研究開発法人情報通信研究機構(NICT)は、スマートフォンに音声を日本語で入力すると、即座に外国語に翻訳し、外国語の音声で出力するアプリ「VoiceTra(ボイストラ)」を開発。

世界中の研究機関と連携し、英語、中国語、韓国語といった日本で需要の高い言語のほか、ミャンマー語やハンガリー語など、31言語間の音声翻訳がひとつのアプリで可能となった。

手法のパラダイムシフトが研究を加速させた

音声翻訳の研究の歴史は今から30年前にさかのぼる。1986年、世界で初めて研究を始めたのが日本だった。小さな島国がトップランナーとして研究に取り組んだ背景には、語学が苦手でコンプレックスを感じやすかった「日本という国の事情も影響しているのでは」と、隅田氏は語る。

だが、先陣を切って走り出したものの、その道は険しかった。

「1986年に国のプロジェクトとして立ち上がり、6年間がんばって1992年に最初のプロトタイプができました。これを見ていただくと、笑っちゃうと思うんですけど……」

そう前置きし、見せてくれた歴史的なプロトタイプの映像は、残念ながら写真ではお見せできないのだが、たしかに我々が夢見るようなスムーズな自動翻訳にはほど遠かった。話者がゆっくりと丁寧な日本語で話す。そして、無音のなか待つこと1分。翻訳された英語の音声が流れる。しゃべる人が特定の人であること、文節で区切ってしゃべること、静かな室内で雑音がマイクに入らないことなど、制約も多く、2000年頃までは研究室のなかで実験を繰り返すだけの日々が続いた。

研究の流れを大きく変えたのは、手法のパラダイムシフトだ。当初は、文法に基づいて人間が規則を書く“ルールベース”の翻訳を行っていたが、これを“コーパスベース”の考え方にシフト。

「コーパスというのは、例えば日本語の文章をたくさん集めたものです。そのデータから、自動的にモデルを作って、それを使いながら音声を文字にしたり、日本語を英語にしたり、文字を音声に変換したりします」

翻訳に使われるデータは、「対訳コーパス」と呼ばれる。例えば、日英の翻訳の場合は、日本語と英語の同じ意味の文をたくさん集め、単語の対応関係を確率的で対訳辞書にする。

コーパスをベースとした手法に切り替えたことで、多言語化が容易になった。

「ルールベースの仕組みだと、ルールを書く人が必要だったんですね。例えば、ベトナム語と日本語の翻訳システムを作ろうと思ったら、ベトナム語の文法と日本語の文法をわかってる人を探してこなければいけなかった。でも、今の手法だと、日本語とベトナム語の対訳のデータを作る。あるいはすでに翻訳されたものをどこかから持ってくることで、コンピューターを使って自動的に対訳辞書が作れる」

隅田氏が語った「国立翻訳バンク」構想

コーパスシステムで、翻訳精度を左右するのはデータ量だ。

「ありとあらゆるデータをNICTに集めたいと思っているんです。それがあれば、さまざまな分野で高性能の自動翻訳システムができる。実は、日本は、翻訳に年間2,000億円ぐらいお金をかけてるんです。文の数にすると、5億文。それを1カ所に集めて自動翻訳システムを作ると、ものすごく高性能なものができると思うんです」

なんとも壮大な計画だが、「NICTは国の機関なので、みんなからデータを集め、高性能な自動翻訳システムとして世の中に出すことが可能」と、隅田氏は本気だ。すでに出版社や新聞社から着々とデータが集まってきている。

「データを集める国民運動みたいにできたらいいな、と思って、勝手に『国立翻訳バンク』って名前をつけています(笑)」

NICTの最先端の研究開発成果は、現在、日本で使われている多言語音声翻訳システムの9割近くにおいて使用され、各所で社会実装が進められている。

例えば、リクルートグループの2社(リクルートライフスタイル、リクルートコミュニケーションズ)とATR-Trek社は、多言語音声翻訳技術が備えるべき基本的なユーザーインターフェース技術に関する研究開発を共同で実施し、誰もが使いやすいシステムの実現を目指す。

ls_main02

隅田氏が、自動翻訳の研究に関わるようになったのは1982年。1986年に始まった音声翻訳の研究にも初期から携わり、「そのままズルズル逃げるタイミングを失った」と笑う日本の音声翻訳の歩みを熟知する男は、「自動翻訳の研究者にとって、今はすごく幸せな時代だ」と言う。

「最近は、みんな楽しくてしょうがないと思います。アルゴリズム性能がここ何年も上がり続けているので、すごくやりがいがある。また、研究所を飛び出して、実際に作ったシステムが世間で使われるようになった。『ぜんぜんダメ』と厳しいお言葉をいただくこともありますが、それが次の改善につながる」

音声翻訳の最新成績は「TOEIC600点レベル」

今、現在の翻訳の精度はどれくらいなのか。

「TOEICの点数がわかってる人と、翻訳システムが出した訳文を比べて、どっちがいいか○×をつけたんです。そうすると、ある点数の人とシステムを比べたときに、○×の数が同じぐらいになる。それをシステムの点として決めたら、600点でした」

すでにシステムに負けてしまっていると、ドキッとした人もいるのではないだろうか。英語翻訳だけでなく、ほかの言語に当てはめた場合も、同等レベルの精度が確保されている。

実際に、スマホアプリ「VoiceTra」の実演をしてもらった。

「タクシーを呼んでください」「和食のレストランを教えてください」「ビール2本とウイスキーをください」「食事の量が多いので少なくしてください」「この服はいいですね。大きなサイズはありますか?」「少し安くしてください」

矢継ぎ早に話した言葉が、瞬時に翻訳されスマホ画面に表示される。たしかにこれを使えば、旅先で会話に困ることがかなり減るだろう。

ls_main03

医療現場での実用化が急務

また、旅行会話だけでなく、「外国人が日本で生活する・仕事するところもターゲットに入れたい」と隅田氏は意気込む。

「音声翻訳を使って、日常の生活ができる、買い物ができる、電車に乗れる、病院に行っても大丈夫、という世界を作りたいんです」

今、力を入れて取り組んでいるのは、医療現場への実装だ。

「病院に山のように外国の患者さんが来ているんです。これって深刻で、症状が伝わらないわけです。痛みがあることはわかっても、しくしく痛いのか、ズキズキ痛いのか、痛みの種類も伝わらなければいけない。日本で病気になってしまって、言葉が通じれば治るはずなのに治らない。こんな悲劇的なことが起こりうるんですよね」

東京大学医学部附属病院国際診療部と共同研究し、病院用のシステムを作成。倫理審査を通して臨床試験を実施し、システムの改良を繰り返している。「2020年より前に、ちゃんと病院で動いているようにしたい」と未来を見据える、隅田氏に残された時間はあとわずかだ。

翻訳がむずかしい日英の長文対応など、課題はまだまだ山積。2020年までは、4年。言語の壁は本当になくせるのだろうか?

「昔は通訳の自動化なんて夢のまた夢だったんです。でも、作ったらボロボロだったけれど『おお、動くじゃん』となった。0と1の違いって大きいですよね。1になったらあとはどんどんよくなる。できないと思っていたことが実はできた。できたら欠点を直していけばいいんです」

アルゴリズムは進化を続け、コンピューターの処理速度も速くなる。「もっとデータが集まれば、演説みたいな長い文章でも翻訳できます。確実に性能が上がっていきます。4年も経ったらすごいです、と言うことは嘘にならない」

言語の壁が消えた、日本の未来は明るい

では、もし完全な自動翻訳システムが完成し、世界から言語の壁がなくなったとすると……。例えば、翻訳家や通訳という仕事は姿を消してしまうのだろうか? 外国語を学ぶ意味はなくなってしまうのだろうか? 隅田氏に聞いてみた。

「単純な仕事はなくなる可能性はあります。でも、単純じゃない翻訳もいっぱいあるんですね。小説の翻訳や心が込められた手紙とか、そういったものが新しい需要としてどんどん出てくると思うんです。だから、人間は単純じゃないクリエイティブなことにシフトしていく。仕事を奪われるというよりは、よりクリエイティブな仕事に移っていくんだと思います」

進んだ技術を「自分の道具」として使ってほしいと隅田氏は言う。

また、語学教育についても、「国際的なビジョンを作る手段として有効」とその価値を語る。

「日本にないものが世の中にはいっぱいある。それを学ぶことが、語学教育のもっとも重要な仕事だと思っていて、絶対に残ると思うんです。日本は、日本語だけで生きていける、すごく特殊な国です。こんな国はあまりないですよね。いろんな考え方の人がいるということを理解するから仲良くできる」

ただ、すべての言語を学ぶ必要はなく、「簡単な会話はツールでできるようになったので、道具に任せましょう」というのが隅田氏の結論だ。

「本当に外国人が山のように来る。そのときに、『日本でコミュニケーションができたよ』『日本は多言語化が進んでいる国だ』となると、4,000万人の目標が、6,000万人、8,000万人となることも夢じゃない。そうすると、日本経済がシュリンクしそうなところを、観光で立ち直らせることもできる」

観光客だけでなく、日本で働く人も増える。家族と共に来日したり、日本で結婚相手を見つけたり。「人口が減るとか言っていじけている場合じゃなくて、外国人をどんどん取り込んでいくことができれば、日本の未来は明るいと思うんですよね」

言葉の問題がなくなると、交流が盛んになることは間違いない。それは、日本にも外国にもメリットをもたらすことになる。

「やっぱり日本に住むと、日本を好きになりますよね。そうすると、日本と揉めごとをしようと思わなくなる。言葉が通じないことがひとつ、大きな争いの源になってる。言葉が通じないと『あいつなにを思ってるんだ?』と、だんだんそれが敵意になってくると思うんです。言葉が通じるようになれば、争いごとがあまり起こらなくなってくるかもしれないなと思うんですよね」

ls_main04


隅田英一郎

国立研究開発法人情報通信研究機構(NICT)/NICTフェロー/ASTREC研究開発推進センター副センター長/先進的翻訳技術研究室室長。1982年電気通信大学大学院修士課程修了。1999年京都大学博士(工学)。株式会社日本IBM、株式会社国際電気通信基礎技術研究所(ATR)を経て、現在、NICT。科学技術庁(当時)の自動翻訳の研究プロジェクトMuに参画、規則翻訳の研究に従事。その後、統計翻訳の技術をベースに音声認識と自動翻訳を組み合わせて、音声翻訳システムの実用化に貢献した。


PHOTO BY TOSHINORI KATAGIRI
TEXT BY MICHIKO KASHIMOTO