2013年11月30日のブックマーク (2件)

  • Mecab Pythonを使ったTF・IDFによるWikipediaの重要単語抽出 - Y's note

    入門 自然言語処理 作者: Steven Bird,Ewan Klein,Edward Loper,萩原正人,中山敬広,水野貴明出版社/メーカー: オライリージャパン発売日: 2010/11/11メディア: 大型購入: 20人 クリック: 639回この商品を含むブログ (44件) を見る TF・IDF計算 自然言語処理の勉強としてTF・IDFによる重要単語の抽出をwikipediaのデータに対して試してみます。TF・IDFを一言でまとめると、とある単語の重要度を出現頻度から計算する手法です。計算結果は重みを表します。TFは単語の出現数(Term Frequency)、IDFは総文書数 / 単語が出現する文書の総数の対数(Inverted Document Frequency)、TFIDFはその積になります。数式にすると以下のようになりますが、Webを検索してみると人によって計算の仕方が異

    Mecab Pythonを使ったTF・IDFによるWikipediaの重要単語抽出 - Y's note
    aonotas
    aonotas 2013/11/30
  • Mathematicaで任意画像の輪郭を数式に変換する - チューリング不完全

    330個の1000次方程式によるまどかマギカ  pic.twitter.com/QnuOhXQfiT— りんご (@aomoriringo) November 27, 2013 上記のような、任意の画像の輪郭を数式に変換するプログラムを紹介します。 発端 Wolfram|Alphaには「Person Curve」と呼ばれる類の検索結果が存在し、「Barack Obama Curve」「Hatsune Miku like curve」とか検索すると、その人物・キャラを表したパラメトリック方程式とそのプロット結果が表示されます。 これについては以下に示すようにたくさんの記事があり、存在自体は早くから知っていました。 数式が解明されてしまった初音ミク。その他キャラクターを色々試してみました | と杓子 http://nlab.itmedia.co.jp/nl/articles/1305/02/

    Mathematicaで任意画像の輪郭を数式に変換する - チューリング不完全
    aonotas
    aonotas 2013/11/30