エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
NDLラボ、振り仮名のデータセット「振り仮名注釈コーパス」(2種類)を公開
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
NDLラボ、振り仮名のデータセット「振り仮名注釈コーパス」(2種類)を公開
2021年9月21日、国立国会図書館(NDL)のNDLラボが、振り仮名のデータセット「振り仮名注釈コーパス」2... 2021年9月21日、国立国会図書館(NDL)のNDLラボが、振り仮名のデータセット「振り仮名注釈コーパス」2種類をGitHubで公開しました。 日本語のテキストを分かち書きにした上で、分割した箇所に振り仮名を付与したもので、青空文庫の公開作品のテキストデータに対し、視覚障害者情報総合ネットワーク「サピエ」が視覚障害者に提供している点字データに由来する振り仮名を付与して作成したものと、国立国会図書館が提供する書誌データを元に作成したものの2種類を公開したものです。 振り仮名注釈コーパスの公開について(NDLラボ, 2021/9/21) https://lab.ndl.go.jp/news/2021/2021-09-21/ 青空文庫及びサピエの点字データから作成した振り仮名のデータセット(GitHub) https://github.com/ndl-lab/huriganacorpus-ao