タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

コーパスに関するtakai_naotoのブックマーク (1)

  • ウェブ言語モデル

    音声認識用N-gram 作成中 仮名漢字変換N-gram 仮名漢字変換用のN-gramは上記の「仮名漢字変換用N-gram」からダウンロードできます。ファイルの中には、1-gramから7-gramまでが収納されています。各N-gramは頻度順にソートされています。現在の所、語彙のカットオフ、N-gramのカットオフは行っていません。 このN-gramの形式は次のようになっています。 22 私/わたし は/は トーマス/とーます か/か 22 私/わたし は/は 高校/こうこう 受験/じゅけん 22 私/わたし は/は 京進/きょうしん スクール/すくーる 19 BT 私/わたし は/は 京進/きょうしん 19 私/わたし は/は 今/いま 、/、 各行を構成するのは、あるN-gramに関する頻度とそのN-gramを構成するN個の単語と読みのペアです。頻度とペアの間、ペア同士の間は半角スペー

  • 1