タグ

研究とWikipediaに関するyifeのブックマーク (2)

  • tf-idf - Wikipedia

    情報検索の分野において、tf–idf (または、 TF*IDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量(数値)である[1]。また、tf-idfは情報検索や、テキストマイニング、ユーザーモデリング(英語版)における重み係数(英語版)にもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究

  • 語音転換 - Wikipedia

    この項目では、主に2つ以上の単語や熟語の文字列置換について説明しています。単語の文字列置換については「音位転換」をご覧ください。 語音転換(ごおんてんかん、または頭音転換 (とうおんてんかん)、英語:Spoonerism, スプーナリズム、フランス語:Contrepèterie, ドイツ語:Schüttelreim)とは、滑稽な効果を狙って、句の中のいくつかの音素、特定の音節を置換して新しい句を作る言葉遊び。あるいは同様の言い間違いのことである。いろいろな言語の中に語音転換の例を見つけることが可能である。 スプーナリズムという名称は、英国の神学者ウィリアム・アーチボルド・スプーナーの失敗談に由来し、1885年頃から教え子らの創作を含むものが普及していった[1]。フランスでは16世紀にフランソワ・ラブレーやエティエンヌ・タブロット(フランス語版)の使用例がある。 英語の例[編集] Mardo

  • 1