西尾実 初代所長によるあいさつ (国立国語研究所創立10周年祝賀式、1959年3月6日、学士会館) コーパスで話し言葉を縦と横につなぐ 「会話コーパス」プロジェクト 国立国語研究所ではこれまで様々なコーパス(言葉のデータベース)を公開してきました。図1は、コーパス開発センターを中心に公開しているコーパスの一覧です。共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」(「会話コーパス」プロジェクト)が始まった当時、グレーで記したコーパスしかありませんでした。書き言葉のコーパス(上の段)は、小説や新聞、雑誌、行政白書など多様なジャンルのテキストをバランスよく収めた『現代日本語書き言葉均衡コーパス』(BCCWJ)や、奈良時代から大正時代までの書き言葉を対象とする『日本語歴史コーパス』(CHJ、構築中)など、とても充実していますが、話し言葉のコーパス(下の段)は、一人の人が話