タグ

2014年12月17日のブックマーク (13件)

  • テンソルって何?

    〜高校生のための微分幾何 第一部〜 有限次元テンソル積 ベクトルとベクトルを掛けたら何になるのか? この単純な疑問が、テンソルを理解するきっかけになる。 ベクトルとベクトルとベクトルを掛けたら何になるのか? この単純な疑問が、おそらくテンソルを生み出した。 章の構成を説明する。 まず、外積の説明を通じて、ベクトルの積とは何かを考察する。 そのあと、いわば体積要素を基底とするベクトル空間である、外積代数(グラスマン代数)について理解する。 それを足がかりとして、テンソル積とテンソルを順に区別して理解していこうと思う。 このコラムは、当初の予定に比べて大幅に量の多いものとなってしまった。しかし、これはテンソルを理解するためのミニマムであると思われる。この中に、テンソルを理解するうえで必要のないものはない はずだ。 長い道のりとなるが、どうか頑張って読破して頂けると、筆者としては喜

  • LibPaBOD: a LIBrary for PArt-Based Object Detection in C++

    The software released here implements a C++ library for object detection in images. The main algorithm is based on the detection method proposed by Felzenszwalb et al. [1]. The input of the detector is a single image, where the detection procedure is carried out. Depending on the target object class, a different object model is used. Such model is a computational description of an object class. It

  • Yahoo! Labs、Flickrで研究用のデータセットとして1億件の画像等をCCライセンスで公開

    2014年6月24日、Yahoo! LabsがFlickrで約9,930万件の画像、約70万件の動画をYahoo! Webscopeの研究用のデータセットとして、CCライセンスで公開したと発表しています。 データセットは約12GBで、写真、JPEG画像のURL、ビデオのURLやタイトル、説明、カメラの種類やタグなどのメタデータも含まれているとのことです。また、4,900万件の写真には、ジオタグ(緯度と経度についての情報)が付与されているとのことです。Amazonのウェブサービスのプラットフォームを利用して提供されており、アクセスには無料の登録が必要とのことです。 One Hundred Million Creative Commons Flickr Images for Research http://yahoolabs.tumblr.com/post/89783581601/one-hu

    Yahoo! Labs、Flickrで研究用のデータセットとして1億件の画像等をCCライセンスで公開
  • Pythonのcollectionsモジュールが地味に便利 - 唯物是真 @Scaled_Wurm

    PythonのcollectionsモジュールにはdefaultdictやCounterなどの便利なデータ構造があります。 いくつかメモ代わりに紹介しておきます defaultdict 辞書にキーが含まれない場合のデフォルト値を指定できます。 リストをデフォルトで持つ辞書などが作れます。 defaultdictへの引数としては初期値のものを返す関数を与えます from collections import defaultdict d = defaultdict(list) d['Hello'].append('World') 変わった使い方としては以前別の記事でも紹介しましたが単語にIDを割り振るのに便利です 単語などをIDにマッピングする - 唯物是真 @Scaled_Wurm 以下のようなコードを書くと未知の単語が辞書に与えられたら、その単語に新たなIDを振っていくことができます。 w

    Pythonのcollectionsモジュールが地味に便利 - 唯物是真 @Scaled_Wurm
  • Machine Learning Cheat Sheet (for scikit-learn)

    As you hopefully have heard, we at scikit-learn are doing a user survey (which is still open by the way). One of the requests there was to provide some sort of flow chart on how to do machine learning. As this is clearly impossible, I went to work straight away. This is the result: [edit2] clarification: With ensemble classifiers and ensemble regressors I mean random forests, extremely randomized

    Machine Learning Cheat Sheet (for scikit-learn)
  • Pythonディープラーニングライブラリのツートップ「Pylearn2」「Caffe」とは~PyData Tokyo Meetup #1イベントレポート

    PyData Tokyoは「Python+Dataを通じて、世界のPyDataエクスパートと繋がれるコミュニティーを作る」ことを目的として設立されました。その達成に向けた活動の一つとして、月1回のペースで勉強会を開催しています。勉強会はゲスト講師による講演+ディスカッションという構成です。2014年10月に開催された第1回勉強会「PyData Tokyo Meetup #1 - Deep Learning」では、非常に活発な議論が行われ、今後の発展が期待できる内容となりました。 連載では、勉強会を含む活動を通じてPyData Tokyoが得た「Python+Data」の可能性やナレッジを、読者の方にお届けしていきます。機械学習や大規模データ解析など、幅広いテーマを取り扱っていく予定です。 データ解析に関心を持つ人たちのコミュニティ 「PyData Tokyo」の設立 こんにちは。PyDa

    Pythonディープラーニングライブラリのツートップ「Pylearn2」「Caffe」とは~PyData Tokyo Meetup #1イベントレポート
  • On visual web, a photo is worth more than a 1000 words

    Posted on December 10, 2014June 19, 2016 | My Essays On visual web, a photo is worth more than a 1000 words Photos, photos and more photos! Photos are the atomic unit of social platforms. Photos and visuals are the common language of the Internet. It is hardly a surprise then, that we are going to upload nearly 900 billion photos to the Internet this year. Or that, Snapchat is worth tens-of-billio

    On visual web, a photo is worth more than a 1000 words
  • Pythonで画像の簡単なカテゴリ分け - Inside Closure - にへろぐ

    これはPython Advent Calendar 2014の16日目です。 実践 機械学習システムを読んでいて画像のパターン認識が面白そうだったので実装して遊んでみました。主に10章のコンピュータビジョンと3章のクラスタリングを参考にしました。ほとんど、NumPyやscikit-learn、Mahotasに丸投げです。 ざっくりとした流れ 今回は用意した複数のjpg画像を教師無しでカテゴライズしてみました。 まず、全ての画像を局所特徴量リストにしました。局所特徴量にはSURFを使用しました。SURFはMahotasのmahotas.features.surf.surfで簡単に取得できます。 そして、すべてのSURFをk-means法でグループ化して基特徴量(visual word)を求めます。k-means法の計算はsklearn.cluster.KMeans.fitを呼ぶだけでできま

    Pythonで画像の簡単なカテゴリ分け - Inside Closure - にへろぐ
    satojkovic
    satojkovic 2014/12/17
    表がすごい…
  • scikit-learnとgensimでニュース記事を分類する - Qiita

    こんにちは、初心者です。 適当なニュース記事があったとして、ニュースのカテゴリを推測するみたいな、よくあるやつをやってみました。Python3.3を使いました。 何をやるの? データセットはlivedoorニュースコーパスを使いました。 http://www.rondhuit.com/download.html#ldcc クリエイティブ・コモンズライセンスが適用されるニュース記事だけを集めてるそうです。 トピックニュース、Sports Watch、ITライフハック、家電チャンネル 、MOVIE ENTER、独女通信、エスマックス、livedoor HOMME、Peachy というクラスがあります。 データは、1記事1テキストファイルの形式で、クラス別のディレクトリにいっぱい入っています。 これを学習して、未知の文章に対して、お前は独女通信っぽい、お前は家電チャンネルっぽい、みたいに、分類が

    scikit-learnとgensimでニュース記事を分類する - Qiita
  • なるべく書かないawkの使い方 - ザリガニが見ていた...。

    awkという、古くからのスクリプト言語がある。(1977年生まれ。読み方は「オーク」である。エイ・ダブリュ・ケイではない)man awkをPDFに変換してみると、たったの3ページ強しかない。 $ man -t awk|pstopdf -i -o ~/Downloads/awk.pdf とてもシンプルな言語仕様ではあるが、awkには必要十分な表現力がある。特にテキストを処理する場面においては、最小限のシンプルな記述で、気の利いた処理を素早くこなす。無駄のないawkワンライナーを見ると、ある種の感動を覚える。awk以降に生まれたスクリプト言語は、少なからずawkの影響を受けていると思われる。 awkを知ることで、間違いなく幸福度は上がると思う。いつかきっと「知ってて良かった」と思える時が来るはず。もっともっと、awkを知りたくなってきた。 基動作 awkの基動作は、とってもシンプルである。

    なるべく書かないawkの使い方 - ザリガニが見ていた...。
  • Go言語の父と呼ばれるRob Pike氏による基調講演~Go Conference 2014 Autumn基調講演1人目 | gihyo.jp

    Go Conference 2014 Autumnレポート Go言語の父と呼ばれるRob Pike氏による基調講演~Go Conference 2014 Autumn基調講演1人目 2014年11月30日(日)に、楽天タワーにてGo Conference 2014 Autumnが開催されました。Go Conference(GoCon)は2013年に始まり、年に2回、春と秋に開催される日最大のGo言語のカンファレンスで、今回で4回目となります。今回は基調講演にGo言語の父と呼ばれるRob Pike氏と日Go言語の第一人者の鵜飼氏を招いていることもあり、今までで最も大きい規模となりました。 写真1 会場の様子 この記事では1人目のRob Pike氏の基調講演についてレポートを書きたいと思います。この基調講演では「Simplicity is Complicated」というタイトルで、Go

    Go言語の父と呼ばれるRob Pike氏による基調講演~Go Conference 2014 Autumn基調講演1人目 | gihyo.jp
  • Fun mosaic effect with Go

  • Golang パフォーマンスチューニング - Qiita

    この記事は Go Advent Calendar 2014 17 日目の記事です。 Go におけるパフォーマンスチューニングの話をします。 これらは Denco や Kocha などでのパフォーマンスチューニングの経験などから得た知見です。 処理系の話ではありませんのでご了承ください。 前提 プロファイリングを取った後、じゃあどうやって最適化するかというところの話です 「推測するな、計測せよ」 アルゴリズムやデータ構造は最適なものが選択されていると仮定します 小手先の最適化を行うよりアルゴリズム自体を変えたほうが圧倒的に良くなります。 この記事の各ベンチマークは Go 1.4 (go version go1.4 linux/amd64)で下記のコマンドにて取っています

    Golang パフォーマンスチューニング - Qiita