写真1●NTTコミュニケーション科学基礎研究所公開の風景 音声認識,自然言語処理を駆使した展示に広いスペースがとられていた。写真は三つの音源からの同時入力を分離するデモの様子。異なる落語を3方向から流して分離する。 NTTはコミュニケーション科学基礎研究所の一般公開を2005年6月2,3日に実施した。この研究所では人の考え方や感じ方を研究している。人を理解するコンピュータを作るのが究極の目標だ。具体的には音声認識,自然言語処理,認知科学,学習理論などの分野に取り組む(写真1[拡大表示])。 人間の視覚特性を利用した圧縮技術 公開展示で特に目を引いたのが視覚,聴覚などの認知科学の分野だ。例えば人の視覚特性を考慮した新しい動画圧縮アルゴリズムの研究が展示されていた。 人間は輝度情報の変化から動きを認識しているというのがこれまでの解釈。実際,輝度情報の時間変化の情報から低速に変化する部分を間引く