タグ

2014年6月22日のブックマーク (3件)

  • プログラマのための文書推薦入門 (社内勉強会の発表資料) - y_uti のブログ

    勤務先の社内勉強会で、機械学習を用いた文書推薦*1に関する基的なことがらについて説明しました。その資料を公開します。 プログラマのための文書推薦入門 from y-uti 数学やコンピュータサイエンスを専門的に学んでいないエンジニアでも理解しやすいように、できるだけ数式を使わずに説明したつもりです。厳密性にはこだわっていないので、専門家からはあちこちツッコミを受ける内容かもしれません。 プログラマ向けということで、実際にコンピュータ上で動作を確認できるように、Wikipedia のデータを対象にして類似文書検索を行うスクリプトを作成しました。GitHub に置いてあります。 y-uti/document-recommendation · GitHub *1:推薦というより情報検索、類似文書検索という方が適切だったかもしれません。

    プログラマのための文書推薦入門 (社内勉強会の発表資料) - y_uti のブログ
    aidiary
    aidiary 2014/06/22
  • これが本当の神アプリ、手話を音声に変換するアイデア「Google Gesture」が素晴らしすぎる

    学生たちのアイデアが、巨大な言葉の壁を打ち壊すかもしれない。 この「Google Gesture」の仕組みはこうだ。 まず、手話を話す人の腕に、筋肉の動きと手・腕の位置を感知するバンドを装着する。 そして、手話をおこなう際の動きがスマートフォンに送信され、専用アプリがリアルタイムで音声に変換する。 「Google Gesture」は、手話をリアルタイムで音声に変換することで、健常者が手話を習得することなく手話を使用する人々とのコミュニケーションを可能とするアイデアで、いま実際に開発されているものではない。世界の学生を対象にしたアイデアコンペ「Future Lions 2014」でスウェーデンのBerghs School of Communicationの学生たちが受賞した。 旧約聖書によれば、人はバベルの塔を建設しようとしたために、神によって異なる言葉を使うようにさせられ混乱したという。そ

    これが本当の神アプリ、手話を音声に変換するアイデア「Google Gesture」が素晴らしすぎる
    aidiary
    aidiary 2014/06/22
  • 青空文庫のデータを使って、遅ればせながらword2vecと戯れてみた - 渋谷駅前で働くデータサイエンティストのブログ

    もう既に山ほど解説記事が出回っていて、あまつさえそれを利用したwebサービスまで出てきてしまっているword2vecですが、うちの現場でも流行っているのでせっかくなので僕もやってみようと思い立ったのでした。 word2vecそのものについては昨年来大量にブログやら何やらの記事が出回っているので、詳細な説明は割愛します。例えばPFIの海野さんのslideshare(Statistical Semantic入門 ~分布仮説からword2vecまで~)なんかは非常に分かりやすいかと思います。 要するにword2vecって何よ Recurrent Neural Network(再帰型ニューラルネットワーク)で、単語同士のつながり(というか共起関係)に基づいて単語同士の関係性をベクトル化(定量化)し、これを100次元とか200次元に圧縮して表現するもの。。。みたいです(汗)*1。 ※以下のようにご指

    青空文庫のデータを使って、遅ればせながらword2vecと戯れてみた - 渋谷駅前で働くデータサイエンティストのブログ