研究機関むけに提供しているデータを使い、私たちの研究グループでも分析を実施した。対象は国立情報学研究所が提供しているYahoo!知恵袋の質問と回答のデータだ。(詳細はこちら: 国立情報学研究所のWeb)。私たちの研究グループでは回答の信頼性分析をしており、その結果を6/6の情報社会学会 2009年度年次研究発表大会で瀧寛文氏が発表した。本ブログのいつものソフトウェア開発に関するエントリとは少し異なるが、実際のデータを使った実証的(エンピリカル)な研究テーマとして紹介したい。 質問と回答のデータやブログのデータなど、一般には自然言語処理による解析や統計のために用いられることが多いと思うが(奈良先端科学技術大学院大学は自然言語処理でも有名だが)、私たちの研究グループ(瀧、大平、松本、森崎)では、自然言語解析を用いない方法でも回答の良しあしを評価することを目指した。 Yahoo!知恵袋は質問者が