xiangzeのブックマーク / 2014年4月4日

論文紹介「ガウス過程に基づく連続空間トピックモデル」 - 西尾泰和のはてなダイアリー

Deep Learningで単語を連続なユークリッド空間に投影したらそれが意味を表現すると盛り上がっているけど、それをやるのに最適化の難しいニューラルネットを使わないで正規分布だと思って最適化したらいい、という論文。 word2vecには直接論文上は言及していない。制限ボルツマンマシン(RBM)は一般にLDA(Letent Dirichlet Allocation)を超えるって言われてて、更に多層にして"Deep Learning"したら更に性能が上がるよ、なんて報告されているけど、最適化が難しいし、何を学習してんのかわかんないし、他のモデルとの接続が難しい。だから研究の場ぐらいでしか使われてない。 RBMでは隠れ層への重みが意味をコードしていて、LDAではp(k|w)が意味をコードしていて、結局のところ「単語がd次元連続ベクトルに対応している」というコンセプトが重要。というわけで単語をd

xiangze 2014/04/04

リンク

Vanishing Component Analysisがダメそうという話 - 地球飽きた

要約: Vanishing Component Analysisは問題設定のレベルで壊れていると思うので誰かなんとかしてあげてほしい(4/12追記あり) http://d.hatena.ne.jp/m-a-o/20140323#p2 で、一時期話題になったVanishing Component Analysis([1], 以下VCA)への疑義が呈されていたので原論文を読んだ。感想はほぼ同じだったので上のエントリを読んでもらえればいいのだけど、ここでは自分なりに問題点をまとめなおしておく。まずは背景から。多項式環とそのイデアルについては省略。今、$\mathbb{R}^n$上に$m $個の点が与えられたとすると、それら全ての点で0になる多項式の集合はイデアルをなすことがすぐに分かる(零化イデアル)。以下、点集合を$S_m $、対応する零化イデアルを$I(S_m)$と書くことにする。$i$番

xiangze 2014/04/04

機械学習

リンク

VCAの出力はなぜ直感的に期待される多項式にならないのか - アドファイブ日記（ミラー版）

昨年NIPSベストペーパーで話題になったVCAの論文読みメモです。デンソーアイティラボラトリの塚原氏が試していた件を初めとして、幾人か実装してブログを書かれているが、なぜ単純な円にガウスノイズを乗せた程度のグラフで円の方程式がパッと出てこないのか、その理由が知りたいです。結論からいうと、論文読んでも良くわからなかったのですが、参考リンク http://lennmars.hatena blog.com/entry/2014/03/30/012008 http://d.hatena.ne.jp/m-a-o/20140323#p2 アブスト R^N上の集合に対してVanishingイデアルが定義できて、それは有限のイデアル生成系でコンパクトに表現できる。それを効率良く構成する方法を示す。我々のアプローチは数値的に安定、つまり誤差を許容する。教師あり学習に適用でき、実験ではカーネル法と同等の精度

xiangze 2014/04/04

リンク

音楽に感情を取り戻すために DAFT PUNKインタビュー | CINRA

今まさに、世界中がDAFT PUNKに夢中になっている。実に8年ぶりとなる4作目『Random Access Memories』からのリードトラック、THE NEPTUNES〜N*E*R*Dでの活動でも知られるファレル・ウィリアムスと、デヴィッド・ボウイやBlondieなどを手掛けた1980年代を代表するプロデューサーのナイル・ロジャースをゲストに迎えた“GET LUCKY”はすでにYouTubeでの再生回数が4,700万回を突破（この記事がアップされる頃には5,000万回に到達していることだろう）、5月に発売されたアルバムは、アメリカやイギリスをはじめとした世界中のチャートで1位を獲得し、ここ日本でもオリコンチャートの総合3位に食い込んでいる。常に時代の一歩先を行っていた二人の歩みが、遂に時代とがっちりかみ合ったのだ。トーマ・バンガルテルとギ＝マニュエル、二人の発言をもとに、この2013

xiangze 2014/04/04

音楽

リンク

http://tswww.ism.ac.jp/higuchi/index_e/papers/Bit00.pdf

xiangze 2014/04/04

リンク

BeautifulSoupでスクレイピングのまとめ – taichino.com

何度かBeautifulSoupについては書いているのですが、未だに使い方が覚えられずにイライラします。仕方が無いのでまとめて置く事にしました。BeautifulSoupはHTMLから情報を取得するだけ無く、HTMLの編集もできますが、ここではスクレイピング用途のみに絞っています。使用するのは以下のHTMLです。このHTMLを使って色々と情報を取得したのが以下です。覚えるべきはfindAllだけです。注意する必要があるのは、textを指定した場合にタグオブジェクトが取れずに、テキストオブジェクトが取れるので、一旦parentで親のタグ取りましょうという事と、正規表現で条件指定する場合は、re.compileで正規表現オブジェクトを渡すという事位ですか。 #!/usr/bin/python # -*- coding: utf-8 -*- import re import urllib f

xiangze 2014/04/04

python

リンク

Developer Information – World Bank Data Help Desk

UNDERSTANDING POVERTY Global data and statistics, research and publications, and topics in poverty and development With 189 member countries, staff from more than 170 countries, and offices in over 130 locations, the World Bank Group is a unique global partnership: five institutions working for sustainable solutions that reduce poverty and build shared prosperity in developing countries.

xiangze 2014/04/04

dataset

リンク

OpenCV/OpenGLによる映像処理

UFO　大垣慶介くん特徴点追跡アルゴリズムを利用することで，画像中の同一物体がどのように動いたのか(オプティカルフロー)を求めることができます。ノートPCにUSBカメラを固定し，事前に撮影した画像と比較することで，オプティカルフローを求めます。オプティカルフローからノートPCがどの程度傾いているのかを推定し，それに応じた処理を行うことで，傾きセンサと同様の機能を実現しています。 TAのコメント：ノートPCを傾けることで，画面に表示されるUFOの動きを制御するゲームです。傾きセンサを搭載しないノートPCで，カメラ入力だけを手掛かりに傾きを推定している点が評価されました。ハンバーガーイーター　森功くん OpenCVを用いてカメラからの画像を取り組み，Haar分類器でプレイヤの顔を特定して，口の位置を検出しています。そこに，OpenGLで作成したハンバーガーの3Dオブジェクトを用意し

xiangze 2014/04/04

リンク

pHomパッケージでドーナッツの穴を数えてみた - アドファイブ日記（ミラー版）

CRANに登録されているpersistent homologyを計算できるpHomパッケージで3次元トーラスの穴を数えてみました。ソースはこちら。データ生成まず与える人工データの生成ですが、極座標表示したときの回転パラメータ2つでそれぞれ20間隔にして20x20の400点作り、ドーナッツの直径が50に対して標準偏差1のガウスノイズを各点ごとに独立に乗っけてみました。下で呼ぶpHom関数はデフォルトでは1000以上の点がある場合は1000だけ適当にピックアップして動作するようです。なので400なら特に何も言わなくても全部を考慮してくれる。実行結果 pHomパッケージに与えるのはフィルトレーション（点たちを見るときの解像度）の最大値と、調べたいホモロジーの次元の最大値で、それぞれ5, 2としています。トーラスにおいては、0次元ホモロジー（点のあつまりを点とみなすときの点）、1次元ホモロ

xiangze 2014/04/04

R

リンク

O’REILLY COLLECTION | ちょゲつくオフィシャルサイト

対応OSAndroid OS 2.3.3 以上／ iOS 6.0 以上価　格無料（アプリ内課金あり）リリース日Google Play版：2014年4月／ iOS版：2014年4月ジャンルコレクション技術者の技術者による、技術者のためのアプリ登場！オライリー・ジャパンの技術書をコンプせよ！技術者の夢… オライリー・ジャパンのすべての技術書を本棚に並べること！その夢、叶えます！オライリー・ジャパンといえば、動物をあしらった表紙が特徴的な技術書の出版社です。背表紙の統一感もあって、エンジニアの方は思わず集めて本棚に並べたくなりますよね。そんなエンジニアの夢を叶えるのがこの「O’REILLY COLLECTION」！・エンジニアの仕事をするとメダルが貯まる！・たまったメダルを使ってガチャで書籍をGET！・書籍の概要なども確認できちゃう！欲しくなったらウェブサイトで購入

xiangze 2014/04/04

game
ネタ

リンク

22 Maps That Show How Americans Speak English Totally Differently From One Another

An icon in the shape of a person's head and shoulders. It often indicates a user profile.

xiangze 2014/04/04

リンク

はてなブックマーク

タグ

2014年4月4日のブックマーク (11件)

論文紹介「ガウス過程に基づく連続空間トピックモデル」 - 西尾泰和のはてなダイアリー

Vanishing Component Analysisがダメそうという話 - 地球飽きた

VCAの出力はなぜ直感的に期待される多項式にならないのか - アドファイブ日記（ミラー版）

音楽に感情を取り戻すために DAFT PUNKインタビュー | CINRA

http://tswww.ism.ac.jp/higuchi/index_e/papers/Bit00.pdf

BeautifulSoupでスクレイピングのまとめ – taichino.com

Developer Information – World Bank Data Help Desk

OpenCV/OpenGLによる映像処理

pHomパッケージでドーナッツの穴を数えてみた - アドファイブ日記（ミラー版）

O’REILLY COLLECTION | ちょゲつくオフィシャルサイト

22 Maps That Show How Americans Speak English Totally Differently From One Another

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス