XMLをパースしてオブジェクト化する require "rexml/document" hoge = <<AAA <aaa> <bbb> <ccc>12345</ccc> <ddd>67890</ddd> </bbb> </aaa> AAA #Stringのxmlからオブジェクト化 xmldoc = REXML::Document.new(hoge) ▲ ▼
こんな風に使える。 puts "filename: #{__FILE__} 似たようなのに $0 がある。 しかし $0 と __FILE__ は似て非なるもの。 __FILE__ が実行中のプログラムのファイル名を表すのに対し、 $0 は実行するときに指定したプログラムのファイル名を表す。 > ruby hoge.rbのように実行するプログラムが1つの場合は、 __FILE__ と $0 の値は一致する。 しかし、別のプログラムから require したときは、 __FILE__ と $0 は一致しない。 この特徴を利用して、 __FILE__ と $0 はライブラリのサンプルコードによく利用される。 例えば以下のようにして書けば、 ライブラリとして利用されるとき(require されて使われるとき)は サンプルコードの部分は実行されない。 if __FILE__ == $0 # サンプ
もうすぐ5月です。 Twitterの投稿内容から鬱度を測定するRubyスクリプトを書いてみました。 これには東京工業大学の高村さんが公開している単語感情極性対応表というものを使っています。 http://www.lr.pi.titech.ac.jp/~takamura/pndic_ja.html これはある単語がどの程度の感情を表すかを数値化した表で、-1 ~ +1 までの値が特定の単語に割り当てられています。 その単語がネガティブな感情表現だとマイナスの値、ポジティブな感情表現だとプラスの値になっています。 なので、鬱度を測定といってもポジティブな投稿内容が多いときにはプラスの値を返します。 また日本語文の形態素解析にはYahoo!の日本語形態素解析APIを使っています。 http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html ア
現在大学1年生の人で3年後には NAIST に (というか松本研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は Perl → Python がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く