タグ

2015年11月8日のブックマーク (7件)

  • Semi-supervised Sentiment-aware LDA - skozawa's blog

    NAACL 2015の論文のLCCT: A Semi-supervised Model for Sentiment Classificationを読んだ。メモと気になった部分を軽く実装して試してみた。 感情分析で、コーパスベースのアプローチと辞書ベースのアプローチでco-trainingする話。 コーパスベースのアプローチだと、精度は高いが再現率が低い。逆に辞書ベースのアプローチだと再現率は高いが精度が低いのでこれを解決したいというもの。 ドメインに依存しない汎用的な素性をコーパスベースのアプローチで取得し、ドメインに依存するような素性は辞書ベースのアプローチでカバーする。 ドメイン依存の単語はSemi-supervised Sentiment-aware LDAというアプローチを使って獲得する。ポジティブ、ネガティブ、ニュートラルの3分類でそれぞれに対していくつかシードを与えてることでド

    Semi-supervised Sentiment-aware LDA - skozawa's blog
    chezou
    chezou 2015/11/08
  • TinySegmenter.jlをGoと比較して負けたと思ったら若者が最適化してくれた - once upon a time,

    先日、TinySegmenter.jlの話を書いたら各方面から反響を頂きました。 repeatedly.github.io http://woxtu.tumblr.com/post/132337169740/rust-tinysegmenterwoxtu.tumblr.com qiita.com そんな中で、ikawahaさんがGoでも同様の最適化を実装していました。 ikawaha.hateblo.jp それと比較するために、とりあえずJulia templateをPRして比較しました。 Ruby Perl Python Node.js C++ Go Julia Julia (hash optimized) 132.98 134 111.85 105.31 48 10.50 11.70 10.35 実はTinySegmenterMakerのshogo82148さんが一部のhashのkey

    TinySegmenter.jlをGoと比較して負けたと思ったら若者が最適化してくれた - once upon a time,
    chezou
    chezou 2015/11/08
    大江戸の裏でこっそり書いていた後日談です
  • xgboost4j より数千倍速く predict できる Pure Java な XGBoost 互換の予測器を作ってみた

    TL;DR XGBoost で構築した予測モデルを Java から利用したい、それも特徴ベクトルが一つ一つ、任意のタイミングで与えられるような オンライン環境下 で リアルタイムな予測 を実現するために利用したい、という目的を叶えるためのモジュールを作りました。 Github: komiya-atsushi/xgboost-predictor-java Bintray: xgboost-predictor (XGBoost の凄さとか XGBoost そのものの使い方とか GBDT/GBRT の解説はエントリにはありませんので、そのような情報を求めている方は他のブログエントリを読まれることをおすすめします。) xgboost4j という選択肢 Java から XGBoost を利用しようとすると、XGBoostをJavaのwrapperを使用して実行する - TASK NOTES にある

    xgboost4j より数千倍速く predict できる Pure Java な XGBoost 互換の予測器を作ってみた
    chezou
    chezou 2015/11/08
    cool!これのPython/Ruby版はないだろうか
  • Autogradという野郎が乗り込んできたのでガクブルな件 - Qiita

    Autogradという野郎が乗り込んできました。はい、そりゃもういきなり。複雑な確率モデルや損失関数だとしても、パラメータに関する勾配をこれでもかというぐらい簡単に計算できちゃうので、機械学習の世界に大きな影響を与えそうです。現時点では、PythonとTorchでの実装が公開されているようですが、これからJuliaなど他の言語でも実装されていきそうですね。 (補足:この記事を書いたすぐ後にGoogleがTensorFlowなるものを出してきまして、そちらでも自動微分がしっかり実装されてるみたいです〜。機械学習関連のフレームワークは移り変わりが激しいですねー ^^; ) ちなみに始まりはこんな感じでした。 ゆるいですね。 とりあえずチュートリアルやりながら、Python版チュートリアルの前半部分にテキトーな日語訳をつけたので、ここでシェアしておきます。英語が読める方は、僕のヘンテコな日

    Autogradという野郎が乗り込んできたのでガクブルな件 - Qiita
    chezou
    chezou 2015/11/08
    与えられたパラメータの値をもとに自動微分の逆をやって目的関数を推定するのだろうか。複雑な関数でどうなるかだな
  • 【重要追記あり】母語を奪うこと、セミリンガルにすることの残酷さ

    セミリンガル(ダブルリミテッド)の問題は基的には「移民(海外赴任や帰国子女も含む)の問題」です。多言語教育が即問題となるのではなく、言語環境が激変することで生じる母語の喪失と、そこに起因する文化・概念の喪失、そして思考・認知の不自由とアイデンティティの混乱こそが問題なのです。 ここにまとめたしろみくさんのツイートは、移住後に親の虐待によって母語喪失が加速した例です。親や教育機関が誤った指導や抑圧を行った時、あるいはクラスメイトが言語を対象にいじめを行ったなら、子どもどんな事が起きるのかが広く知られる事で、同じような喪失状態に陥る子が一人でも減る事を願っています。(2015年11月10日20:06、概要文を改定) ※まとめカテゴリは「生活・教育」としましたが、社会問題とも関連する分野のお話です。 続きを読む

    【重要追記あり】母語を奪うこと、セミリンガルにすることの残酷さ
    chezou
    chezou 2015/11/08
    親の酷さが出てるけど、ハーフリンガルの話はもっと根深いし難しい。両方の言語で深い思考が出来ないで大きくなる辛さは想像もできない
  • Computer, respond to this email.

    Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

    Computer, respond to this email.
    chezou
    chezou 2015/11/08
  • Ruby I/O 機構の改善 -stdio considered harmful-

    Ruby I/O — stdio considered harmful — akr@m17n.org Ruby (1.9) I/O stdio stdio C nonblocking I/O stdio stdio 1 C stdio (Standard Input / Output) Ruby[rub] stdio I/O Ruby 1.9 stdio 1 Ruby Ruby 1.8 Ruby 1.9.0 RubyRuby (1.8.3) stdio • Ruby (1.9.0) stdio 1 2 Ruby I/O 3 stdio 4 POSIX I/O 5 stdio 6 7 8 9 2 Ruby I/O Ruby I/O IO Unix Ruby 1 stdio stdio Ruby getc, ungetc, fwrite 12005–03 kernel stdio Rub

    chezou
    chezou 2015/11/08
    #oedo05