タグ

2015年6月16日のブックマーク (3件)

  • 日本語のストップワードのリストを求めて - 武蔵野日記

    日は大学院入試の2日目で、博士後期課程の試験である。昨日の博士前期課程の入試で疲労困憊し、今日も一日中朝からいろいろあることが分かっていたし、娘は今日が産まれて満3ヶ月で2回目の予防接種に行く日なので、朝の散歩はスキップさせてもらう。(と書くと、スキップで散歩した、というようにも読めるが、当然そんなわけはない) 午前中は10時に研究室に行き、朝のミーティングをする。それぞれ自分で夏休みの過ごし方、研究の方向性などが決まってきて、いい感じ。じっくり考えることも研究には必要なのだが、そもそも最初のうちは「下手の考え休むに似たり」なので、手を動かせば数時間でできるようなことは、深く考えず手を動かした方がよい(繰り返していくうちに手が速くなるし、そもそも繰り返さなくてよいように自動化するプログラムを書いたりするようになる)。 そういうわけでなんだかんだとお仕事をする。口頭試問の10分前になっても

    日本語のストップワードのリストを求めて - 武蔵野日記
    sudo1101
    sudo1101 2015/06/16
    “最初のうちは「下手の考え休むに似たり」なので、手を動かせば数時間でできるようなことは、深く考えず手を動かした方がよい”
  • PythonでBag of WordsとSVMを使ったタイトルのカテゴリ分類 - stMind

    cc licensed ( BY ) flickr photo shared by Loco Steve 週末に試そうのコーナー。 ちょうど良いチュートリアルがあったので、データセットを用意してやってみました。 問題 How can I get a computer to tell me what an article is about (provided methods such as bribery and asking politely do not work)? ある記事が何について書かれているのか、コンピュータに理解させるにはどうすれば良いか? チュートリアルでは手動で作ったデータを使って犬もしくはサンドイッチの2クラス分類をしています。 ここでは、Google NewsでiPadのニュース、ソチ五輪のニュースとカテゴリ分けされている記事のタイトルを使って、 あるタイトルがiPa

    PythonでBag of WordsとSVMを使ったタイトルのカテゴリ分類 - stMind
  • Pythonを書き始める前に見るべきTips - Qiita

    Pythonを使ってこの方さまざまな点につまずいたが、ここではそんなトラップを回避して快適なPython Lifeを送っていただくべく、書き始める前に知っておけばよかったというTipsをまとめておく。 Python2系と3系について Pythonには2系と3系があり、3系では後方互換性に影響のある変更が入れられている。つまり、Python3のコードはPython2では動かないことがある(逆もしかり)。 Python3ではPython2における様々な点が改善されており、今から使うなら最新版のPython3で行うのが基だ(下記でも、Python3で改善されるものは明記するようにした)。何より、Python2は2020年1月1日をもってサポートが終了した。よって今からPython2を使う理由はない。未だにPython2を使う者は、小学生にもディスられる。 しかし、世の中にはまだPython3に

    Pythonを書き始める前に見るべきTips - Qiita