画像を解析して、人間が尋ねそうな質問に答えられるように機械を訓練できるシステムをMicrosoft Researchとカーネギーメロン大学(CMU)のチームが開発した。 人工知能(AI)ツール開発におけるMicrosoftの最新の取り組みは、「画像質問応答」と呼ばれる分野に焦点を合わせている。その狙いは、所定の画像の内容に関する自然言語の質問に自動的に応答することだ。 「自転車のかごの中に何が入っているか」という質問に答えるには、多段階の思考を経る必要がある、とCMUとMicrosoft Researchの研究者たちは述べた。 システムは、「まず質問の中で言及されている物体(例えば、かごや自転車)と概念(例えば、中に入っている)を認識し、その後、関係のない物体を徐々に除外していき、最後に最も可能性が高そうな部分を特定して答え(すなわち、この例では犬)を導き出す」と彼らは指摘した。 画像質問