サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
買ってよかったもの
tomobusan.seesaa.net
日本語を話すbotなら形態素解析したいよね!ということで、よくある「マルコフ連鎖」を使ったbotを作ってみました。 元データとして自分の今までのツイートのログを使い、形態素解析してマルコフ連鎖で文章を作るようにします。 形態素解析はMeCab+IPA辞書を使用しています。 気を付けたのは以下の点 ・あまり突飛な文章にならないようにする→3次のマルコフ連鎖にする ・他人の文章は使用しない→「RT 」「QT 」などで始まる引用文は削除する ・他ユーザ名(@~)やハッシュタグ「#~」、URLは削除する ・文章の始まり、終わりは日本語らしいものにする (「な人がいたので私の」みたいな明らかな断片にならないよう、主語~述語の形を取るようにする) 3次のマルコフ連鎖の作り方は、MeCabとPythonでマルコフ連鎖を書いてみる(改)を参考にして、リストを作る単語の数を3つにしてみた。 Twitterに
時々 "Gmail" + "popfile" というキーワードで検索して、このブログにたどり着く人がいる。 (Googleでは検索結果のトップに来るみたいだ) popfileの復活ついでにGmailの受信メールをpopfileに通してみたらうまくいったので、ここに書いておく。 「Gmailは強力なスパムフィルタがあるからわざわざpopfile通さなくてもいいじゃん」と 思う人もいるだろうけど、実はそうでもない。 popfileに「スパムじゃないけど、読む必要がないメール」を学習させることで メールチェックがより効果的になるんだ。(おっ、Life Hacksだ!) たとえば、時々”号外PR版”などの広告が混ざるメールマガジンとか、 一日 or 週に数回送られてくるメールニュースの、特定の号だけ読みたい場合など 内容でフィルタリングできるので、かなり便利だ。 ということで、設定方法は以下。 ・
このページを最初にブックマークしてみませんか?
『佐賀でエンジニアやってます』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く