タグ

ブックマーク / qiita.com/shoku-pan (1)

  • textstatを使用したreadabilityの計算 - Qiita

    はじめに 先日、kaggleのCommonLit Readability Prizeというコンペに参加しました。 このコンペの目的は、 アメリカ教育現場における、3年生から12年生のクラスで使用する読み物の複雑さを評価するアルゴリズムを構築すること というものでした。 現状の課題は以下のように説明されていました(DescriptionをDeepLで翻訳)。 現在、ほとんどの教育用テキストは、伝統的な読みやすさの方法や市販の計算式を使って読者に合わせています。しかし、それぞれに問題があります。Flesch-Kincaid Grade Levelのようなツールは、テキストのデコーディング(単語あたりの文字数や音節数など)や構文の複雑さ(文章あたりの単語数など)の弱い指標に基づいています。そのため、構成要素や理論的妥当性に欠けています。また、Lexileのように市販されている計算式は、コストが

    textstatを使用したreadabilityの計算 - Qiita
    efcl
    efcl 2021/08/30
    textstatは、テキストから統計量を計算するのに便利なライブラリで、読みやすさや複雑さ、学年の判定に役立ちます。
  • 1