タグ

2011年2月7日のブックマーク (3件)

  • nkfを使った半角カナ⇒全角カナへの変換 - RX-7乗りの適当な日々

    今更ですが、nkfを使うと、半角カナが全角カナに変換されることを知った。 $ cat test.txt てすと テスト テスト testみたいなファイルがあったとして、nkfを実行してみると、、、 $ nkf -w test.txt てすと テスト テスト testこの通り、(↑では3行目の)半角カナの文字列が全角カナへと変換されて出力される。 nkf実行時に、半角カナのまま出力させたい場合 "-x"オプションを使う。 $ nkf -wx test.txt てすと テスト テスト testこの通り、半角カナの変換は行われずに出力される。 ちなみに、manには以下のように記載されています。 -x 通常おこなわれる、いわゆる半角カナ (JIS X 0201 片仮名) からいわゆる全角カナ (JIS X 0208 片仮名) への変換を行わず、半角カナを保存する。 入力は、Shift_JIS の

    nkfを使った半角カナ⇒全角カナへの変換 - RX-7乗りの適当な日々
  • 劣微分を使った最適化手法を紹介しました - 射撃しつつ前転 改

    新年明けましておめでとうございます、というのもはばかられるような時期になってしまいましたが、今年もこんな感じでのんびりとやっていきたいと思います。よろしくお願いします。 会社ブログの方で、劣微分を使った最適化手法として、FOBOSを紹介しました。線形識別器とは、というところから話を始めたら、実際の論文紹介にたどり着くまでに4回もかかってしまいましたが、何も知らないところからFOBOSでSVMが書けるというところまで、早足ですが一応一通り紹介したつもりなので、FOBOSに興味があるけどまだ論文読んでない、という人はぜひチェックしてもらえればと思います。使えるカーネルは線形カーネルか多項式カーネルぐらいに制限されてしまいますが、実用的なSVMが簡単に作れるというのは結構大きいですよ。ちなみに、FOBOSのところではSVMしか説明していませんが、第2回ではロジスティック回帰をSGDで最適化、とい

    劣微分を使った最適化手法を紹介しました - 射撃しつつ前転 改
  • Hidden CRFを用いた評判分析 - nokunoの日記

    Google社員の公開論文のRSSを購読しているのですが、そこで面白い論文を見かけたので流し読みしました。この論文自体はGoogleでインターンをした学生の研究のようですが、Hidden CRFを用いた評判分析というテーマでなかなか面白いと思いました。“Discovering fine-grained sentiment with latent variable structured prediction models”, Oscar Tackstrom, Ryan McDonald, European Conference on Information Retrieval, 2011.(pdf) 問題設定入力文書が複数の文で成り立つとき、「文書単位の評判」と「文単位の評判」を判別したい。ここで評判とはポジティブ/ネガティブ/中立の3値を取る。評判の対象の決定は手法に含まれない。与えられた