国立情報学研究所(NII)とヤフーは2007年3月6日、ヤフーが運営するQ&A情報サイト「Yahoo!知恵袋」のデータに関する研究利用契約を締結したと発表した。ヤフーは、Yahoo!知恵袋に蓄積されたデータのうち約3割に当たる情報(質問約311万件、回答約1347万件)をNIIに無償で提供する。NIIは同研究所での研究活動にこのデータを活用するほか、情報検索などの研究者への無償提供も予定。情報検索、分析などを対象とした研究開発促進の一助になりそうだ。 ブログやQ&Aサイトなど、ユーザーによって発信されるデータは、研究対象としての重要性を急速に増している。「書き言葉と話し言葉の中間」(NIIの東倉洋一副所長)とも言える新しい種類の言語で書かれているため、既存の言語解析手法が通用しない。データ量も膨大で、「そこから新しい価値をくみ出すことが求められている」(東倉氏)。欲しい情報を探すための検索