タグ

2017年8月1日のブックマーク (8件)

  • 高卒でもわかる機械学習 (1) 識別関数の前知識

    教師あり学習 大量のメールがあって、それぞれ人間の目でSPAMかどうかが判定済みであるとします。 それらのメールの何となくSPAMっぽい2単語「主人」「オオアリクイ」に注目し、各メールにそれらの単語が何回出てくるかを数えてグラフにプロットしたら下記のようになったとします。 (「主人」出現回数を、「オオアリクイ」出現回数をとおきます。) 何だか、グラフ中に直線を引けばSPAMとそうでないメールを分けられそうだと思いませんか。 そしてその直線を基準にすれば、未判定のメールがSPAMなのかどうかも判断できそうな気がしませんか。 これが識別関数による教師あり学習の基です。 教師あり学習では、教師データと呼ばれるデータをたくさん読み込ませて機械に学習させます。 教師データというのは「パラメータと正解ラベルの組」です。今回の例でいくとパラメータとは「主人」「オオアリクイ」という単語の数、正解ラベルと

    高卒でもわかる機械学習 (1) 識別関数の前知識
    hsato2011
    hsato2011 2017/08/01
    機械学習 高卒 入門
  • Robotic 3D Scan Repository

    This repository provides: 3D point clouds from robotic experiments log files of robot runs standard 3D data sets for the robotics community You may freely use this data for developing SLAM or interpretation algorithms, but you are required to name the people, who recorded the data set and their correponding institution. If you want to contribute a data set please contact: The following data sets a

    hsato2011
    hsato2011 2017/08/01
    温度画像と3D画像 デプス
  • ir:iricra2014 – ASL Datasets

    This dataset contains 4381 thermal infrared images containing humans, a cat, a horse and 2418 background images (no annotations). We provide manually annotated ground truth for all humans, cat and horse. The dataset is divided into 8 sequences and contains both 16bit (may appear black on most screens) images as well as the downsampled 8bit images. The uniform sampling rate allows the usage of trac

  • ScanNet

    ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes Angela Dai    Angel X. Chang    Manolis Savva    Maciej Halber Thomas Funkhouser    Matthias Nießner Stanford University            Princeton University            Technical University of Munich News 2018-06-11 : ScanNet v2 release. 2018-06-11 : ScanNet Benchmark Challenge available. 2018-02-11 : Browsing interface available. 2018-02-04

    hsato2011
    hsato2011 2017/08/01
    デプス RGB-Dデータセット
  • 大規模画像データセット - n_hidekeyの日記

    最近は画像認識・検索で用いられるデータセットも大規模化が進んでいます。 いくつか代表的なものや最近見つけたものをまとめてみます。 (ここでの目安は、教師つきデータは10万枚以上、教師なしデータは100万枚以上のもの) ImageNet http://www.image-net.org/ 自然言語処理の分野で有名なWordNetのオントロジーに従って、各単語(今のところ名詞のみ)に対応する画像を収集したものです。Amazon Mechanical Turk を利用し、質の高いデータセットを構築するように工夫されています。日々データは蓄積・更新されており、2012年1月現在、約1400万枚の画像データ(2万2千カテゴリ)が集まっているようです。 アノテーションは基的に1画像1カテゴリで、一部の画像には物体の位置を示すbounding boxもついています。カテゴリによっては十分な数の画像がな

    大規模画像データセット - n_hidekeyの日記
  • ChainerでYOLO - Qiita

    はじめに YOLOとはYou Only Look Onceの略とのことですがまあ当て字ですかね。速度に特化した画像検出・認識用ニューラルネットワークで、Cベースのdarknetというフレームワーク上に構築されています。元論文はこちらです。特徴は、全画像からいきなりクラス確率と物体のバウンディングボックス座標を推論する点です。R-CNNなどと違って複数の候補領域に対して何度も推論しないでよいので、Look Onceだから速い、というわけですね。 TensorFlowに変換した例はすでにあるようなので、今回はchainer化をしてみます。Cで組まれているものをわざわざスクリプト言語に変換するのは中身を理解するためです。今回の記事では学習済の係数を使った推論のみを行いますが、論文を読んだ感じだと学習手順が最大の特徴の一つに思われるので、そのうちトレースしたいです。 コードはこちらを参照してくださ

    ChainerでYOLO - Qiita
    hsato2011
    hsato2011 2017/08/01
    You Only Look Once[DNN][画像処理]
  • 第11回 辞書ソフトの定番「Personal Dictionary」 | The Professional Translator (ザ・プロフェッショナル・トランスレーター) - バベル・プレス

    小室 誠一  翻訳システムテクノロジスト (バイリンガルサービス事業 マネージャー、株式会社 バベル) この連載では、翻訳ソフトや翻訳メモリソフトに限らず、翻訳業務の効率化に役立つソフトウェアを取り上げて、その活用法を紹介します。 第11回は、辞書ソフトの定番ともいえる「Personal Dictionary」(シェアウェア、試用制限無し)を取り上げます。 翻訳作業効率化のポイントは、なんといっても用語管理でしょう。Excelなどを使わなくても、一括登録や追加削除などの編集機能がついた、PDIC(Personal Dictionary)があれば十分です。長年、翻訳者の間で愛用されてきたPDICのUnicode版もすっかり安定しています。 「Personal Dictionary」は以下のWEBページからダウンロードできます。 http://homepage3.nifty.com/TaN/

    hsato2011
    hsato2011 2017/08/01
  • Anki - powerful, intelligent flashcards

    Powerful, intelligent flash cards. Remembering things just became much easier. Download Remember Anything From images to scientific markup, Anki has got you covered. Remember Anywhere Review on Windows, Mac, Linux, iOS, Android, and any device with a web browser. About Anki Anki is a program which makes remembering things easy. Because it's a lot more efficient than traditional study methods, you

    hsato2011
    hsato2011 2017/08/01