国立情報学研究所(NII)とヤフーは2007年3月6日、ヤフーが運営するQ&A情報サイト「Yahoo!知恵袋」のデータに関する研究利用契約を締結したと発表した。ヤフーは、Yahoo!知恵袋に蓄積されたデータのうち約3割に当たる情報(質問約311万件、回答約1347万件)をNIIに無償で提供する。NIIは同研究所での研究活動にこのデータを活用するほか、情報検索などの研究者への無償提供も予定。情報検索、分析などを対象とした研究開発促進の一助になりそうだ。 ブログやQ&Aサイトなど、ユーザーによって発信されるデータは、研究対象としての重要性を急速に増している。「書き言葉と話し言葉の中間」(NIIの東倉洋一副所長)とも言える新しい種類の言語で書かれているため、既存の言語解析手法が通用しない。データ量も膨大で、「そこから新しい価値をくみ出すことが求められている」(東倉氏)。欲しい情報を探すための検索
![「Yahoo!知恵袋」のデータを研究用に無償提供、情報検索技術の研究を促進](https://cdn-ak-scissors.b.st-hatena.com/image/square/bed39b5962a5d552c95b6d796db8f55e72d32943/height=288;version=1;width=512/https%3A%2F%2Fxtech.nikkei.com%2Fimages%2Fn%2Fxtech%2F2020%2Fogp_nikkeixtech_hexagon.jpg%3F20220512)