タグ

日本語に関するkoemuのブックマーク (2)

  • PyICU

    Verified details These details have been verified by PyPI Maintainers vajda Unverified details These details have not been verified by PyPI Project links Homepage View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery Meta License: OSI Approved (MIT) Author: Andi Vajda Classifiers Development Status 5 - Production/Stable Environment Console Intended Au

    PyICU
  • 単語親密度データベース|NTTコミュニケーション科学基礎研究所|NTT R&D Website

    単語親密度とは語のなじみ深さを被験者実験により評定したものです。単語親密度は、1から7の間の数値で表されており、大きな数値になるほどなじみ深い語であることを示しています。 NTTでは1995年から単語親密度の調査をはじめ、約8万語の調査結果をまとめたものが1999年にNTTデータベースシリーズ「日語の語彙特性」第1巻として三省堂から刊行されました。 また、2002年には、第1巻に含まれなかった約3万語の追加調査を実施し、同シリーズの第9巻として刊行されました(いずれも絶版。以下「平成版」と呼びます)。 これらは広く利用されてきましたが、初期の調査から時間が経ち、単語親密度の経年変化の可能性があること、 これまでのデータベースに含まれない語が多く出てきていることなどから、この度、第1巻、第9巻に含まれるすべての語の再調査と、新しい語の追加調査を、 合わせて16万語以上について行い、「令和版

    単語親密度データベース|NTTコミュニケーション科学基礎研究所|NTT R&D Website
    koemu
    koemu 2014/05/16
    日本語の語彙特性。語彙数推定テストはそれぞれ、50,700語、41,300語、51,900語だった。参考辞書が新明解なのだね。へへー
  • 1