米グーグルが相次ぎ公開した、人工知能に関する二つの研究(図1、図2)。それが示すのは、人間が視覚で物体を認識する能力と、コトバを操る能力が、地続きの関係にあるということだ。この二つの研究について解説しながら、自然言語処理にニューラルネットワークを応用する研究の最新動向を紹介する。 図1●英語の文章をフランス語に機械翻訳するニューラルネットワーク。英文「A B C」(A~Cは英単語)をA、B、Cの順にニューラルネットワーク(長方形)に入力すると、その英文に対応したフランス文の「W X Y Z」がW、X、Y、Zの順に出力される(詳細は後述)
![[脳に挑む人工知能6]グーグルのAIにみる、コトバと視覚の接点とは](https://cdn-ak-scissors.b.st-hatena.com/image/square/bed39b5962a5d552c95b6d796db8f55e72d32943/height=288;version=1;width=512/https%3A%2F%2Fxtech.nikkei.com%2Fimages%2Fn%2Fxtech%2F2020%2Fogp_nikkeixtech_hexagon.jpg%3F20220512)