タグ

ブックマーク / www.yasuhisay.info (9)

  • Hacker Tackleで「はてなにおける機械学習の取り組み」について登壇しました - yasuhisa's blog

    LINE福岡で行なわれたHacker Tackleにて登壇してきました。 発表内容は(1)機械学習を使ったサービス開発の難しい点について整理し(2)その難しさを乗り越えていくためにはてながどのような取り組みを行なっているかについてでした。一口に機械学習を使ったサービス開発といっても、古典的な問題設定でどうやればいいか比較的クリアに見えているものと、R&D要素が強くどう取り組んでよいか分からないものではよい取り組み方も異なってきます。そこで、今回の発表では古典的な問題設定(テキスト分類)であるBrandSafe はてなのリニューアル、R&D要素の強いMackerelの異常検知、それぞれに対し技術的/組織的にどのような取り組みを行なったかについて話させてもらいました。 はてなにおける機械学習の取り組み from syou6162 登壇時間は30分で割と話すことも多かったので、当初話す予定だった

    Hacker Tackleで「はてなにおける機械学習の取り組み」について登壇しました - yasuhisa's blog
  • はてな社内の勉強会で構造学習について発表しました - yasuhisa's blog

    先週末、はてな社内の勉強会で構造学習、特に実装が簡単な構造化パーセプトロンについて発表しました。発表資料と説明用にサンプルで書いたPerlの品詞タグ付けのコードへのリンクを張っておきます。 今日からできる構造学習(主に構造化パーセプトロンについて) from syou6162 structured_perceptron/structured_perceptron.pl at master · syou6162/structured_perceptron 「えっ、Perlかよ」という人がいるといけないので、Clojureで構造化パーセプトロンを使った係り受け解析のサンプルコードへのリンクも張っておきます(2種類あります)。PerlもClojureもあれば8割くらいの人はカバーできそうなので、安心ですね。 syou6162/simple_shift_reduce_parsing syou616

    はてな社内の勉強会で構造学習について発表しました - yasuhisa's blog
  • openしたらcloseを忘れないようにしましょう - yasuhisa's blog

    Rubyだと File.open("hoge.txt", "w") {|file|...} のようにやっておけばcloseして片づけてくれます。後片付けがきちんとできない人間にも安心ですね。 ところで、clojureのjsonライブラリを使っていたのですが、書き出すときにハッシュの終わりが閉じていないという事例が発生。ライブラリ側とかを疑ってみたりしたけど、最終的にはFileWriterオブジェクトをcloseしていないというアホなことが原因でした。上のRubyのように終わったら後片付けしてくれるように書けばよいのですが、closeでも似たようなことができる。 (with-open [w (java.io.FileWriter. (str base-dir "/filtered_docs/all.json"))] (json/encode-to-writer result w)) File

    openしたらcloseを忘れないようにしましょう - yasuhisa's blog
    Itisango
    Itisango 2012/08/27
    openしたらcloseを忘れないようにしましょう
  • Flashcardsで同期 - yasuhisa's blog

    昔はRで画像生成してiPod touchで単語帳とかアホなことやってたんだけど*1、学習の履歴とか定着度合いとかそんな履歴は取っていて欲しいですし、iPadiPhoneで同期もして欲しいのでFlashcardsというアプリを使ってた。 Flashcards Deluxe 「単語とか手で書かねぇと覚えられねぇ」という感じのアナログな人間ですが、そういう機能もあったりしてなかなか便利。しかし、iPadiPhoneの画面で単語帳をちまちまいじっていては寿命が縮みそうなのでスプレッドシートでいじりたい(Google docsとかで)。一括エクスポートとか一括ダウンロードしかできないと思っていたので、統計情報とか消えてしまうのかなぁと思っていたらimportやexportのときに統計情報を保存してくれたり、importするときに新しい語があったらappendしてくれたりするようで、不安に思ってい

    Flashcardsで同期 - yasuhisa's blog
    Itisango
    Itisango 2011/07/05
    Flashcardsで同期
  • カーネル輪講で発表しました - yasuhisa's blog

    福水さんのカーネル法入門の3章、カーネルPCA、カーネルCCA、カーネルLDA(ベイズじゃないよ!!!)のところを担当しました。せっかくなので資料をアップロードしておきます。 Kernel20110619 View more presentations from syou6162 数理情報学講座(機械学習の研究室)で発表してきたので「せっかくだからNLPの面白い研究も紹介しよう」と欲張ってみたものの、紹介の仕方があまりよくなかったかもしれません、すみません。。。 紹介したのはいわゆるmatching CCA[1]で、確か持橋さんに最初紹介してもらったものでした。CCAよく分からんなぁと思ってしばらく放置気味になっていたのですが、カーネル法ので出てきたので読み直してなるほどーという感じ。こういう研究できるようになりたいもんです。pairになっていないとCCAは動かないですけど、pairにな

    カーネル輪講で発表しました - yasuhisa's blog
  • はてなインターン全日程終了しました - yasuhisa's blog

    8/2に京都に到着、8/3からインターンが開始されたはてなインターンですが無事全日程終了しました。後半に進めるのが決まったのが二週間前だとか信じられません。 というわけで興奮覚めないままの感覚で書いていこうと思います*1。 インターン後半戦 インターンの前半戦は毎日出される課題を倒していくという感じの日々でしたが、後半は実際にプロダクトの作成、改善、追加などを行ないました。チームも前半とは違って再配置となり、僕はid:mi_kattun、id:mroriiと一緒にid:onishiさん、id:antipopさん、id:ninjinkunさんの運用チームでやらせてもらいました。 このチームにて コメントスパム コメント日記 の撲滅を目指してスパムフィルタの作成をしました。以前は結構簡単なルールでフィルタリングしていたのですが、最近とにかく(当に!当に当に!!当に当に当に!!!)ス

    はてなインターン全日程終了しました - yasuhisa's blog
    Itisango
    Itisango 2009/08/31
  • Rによる最適化、パラメータ推定入門 - yasuhisa's blog

    パラメータの推定、でもその前に optimize関数について 補足 パラメータの推定 ベルヌーイ分布 定式化(尤度関数) 尤度関数の実装 尤度関数の最適化(パラメータ推定) 正規分布におけるパラメータ推定 まとめ パラメータの推定、でもその前に統計におけるパラメータの推定というのは大体最適化問題に帰着します。「なんとか関数を(最大|最小)にするようなパラーメータほにゃららを求めたい」とまあこんな感じで。というわけで、パラメータ推定は置いておいて、Rで最大化問題、最小化問題をどう解くかというところを最初にやってみようと思います。最適化問題は離散最適と連続のほうの最適に分けられますが、ここでは連続についての最適化問題について考えることにします。 optimize関数について Rにおける最適化をするための関数はoptim関数、optimize関数があります(他にもnlsなどありますが、とりあえず

    Rによる最適化、パラメータ推定入門 - yasuhisa's blog
    Itisango
    Itisango 2009/05/17
  • 確率論、統計学関連のWeb上の資料 - yasuhisa's blog

    確率論と統計学は俺がまとめるから、他の分野はお前らの仕事な。 確率論 Index of /HOME/higuchi/h18kogi 確率空間 生成されたσ-加法族 確率の基的性質 確率変数とその分布 分布の例 分布関数 期待値、分散、モーメント 期待値の性質 独立確率変数列の極限定理 大数の弱法則(Weak Law of Large Numbers) 確率1でおこること 大数の強法則 中心極限定理 特性関数 Higuchi's Page Brown運動 Brown運動のモーメントの計算 連続性 Brown運動の構成:Gauss系として Brown運動に関する確率積分 空間L^2の元の確率積分 伊藤の公式(Ito formula) 日女子大学理学部数物科学科の今野良彦先生のところにあった資料 最尤法とその計算アルゴリズム 収束のモード 大数の法則と中心極限定理 指数分布族モデルにおける最

    確率論、統計学関連のWeb上の資料 - yasuhisa's blog
    Itisango
    Itisango 2009/02/23
  • CでRの拡張したら速すぎて(40〜50倍)吹いたwww - yasuhisa's blog

    昨日Gibbs Sampler Algorithmをやってみたわけだが、Rの中でfor文を書いていて必要となるサンプル数が多くなると非常につらくなってくることは目に見えている。しかも、MCMCでは初期値依存となる期間のサンプルを捨てないといけない。そういうわけでじゃんじゃんサンプルを作っても大丈夫なような速度が必要。 Rで速度を上げようと思ったらapplyファミリーを使うとかベクトル単位での処理をするetcが常套手段*1。が、今回は質的にfor文が必要なケースである。 で、困るわけだがRにはC、C++、fortranを使って拡張する機能がある。詳しくはこの辺に載っている。そういうわけでCのポインタもアドレスも理解していないid:syou6162がRが好きすぎたためにCを書いてみたという感じの内容。 #include <R.h> #include <Rinternals.h> SEXP r

    CでRの拡張したら速すぎて(40〜50倍)吹いたwww - yasuhisa's blog
    Itisango
    Itisango 2009/01/17
    R便利そう
  • 1