日本語の新聞には、英語の新聞に比べて非常に多くの丸カッコ () が使われています。 かぎカッコ 「」 は英語におけるクォーテーションマーク “ ” と ほぼ同じように扱えるものの、丸カッコについてはじつにさまざまな構文があり、 意味的にもその扱いは多種多様です。しかしカッコの中にはときに情報抽出にとって 重要な情報 (年齢・日時など) が含まれているため、丸カッコを無視することはできません。 ここでは無作為に抽出した新聞記事の中から、かぎカッコと丸カッコについて それぞれその使用法を分類してみました。 英語と日本語の新聞にみる丸カッコの使用率の比較: 英語 (Wall Street Journal., PennTreeBank に含まれているものを使用): 1476文/49722文 = 3% 日本語 (毎日新聞、95年 1月分): 2955文/23055文 = 13% 注意: 以下の例は、