2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
このサイトについて DERiVEはコンピュータビジョン、画像認識が専門のMasaki Hayashiがお送りしている、コンピュータビジョン(Computer Vision)を中心としたITエンジニア、研究向けのブログです。※「DERiVE メルマガ別館」は2015/9月で廃刊致しました、 以下のサイトに、「Image Classifier Demo 」と銘打った、Deep Learning ベースの画像認識器のデモアプリが公開されているので紹介します。 Image Classifier Demo このサイトはNYUのMattherw Zeiler氏により製作されたデモサイトです(※ NYUでDeep Learningと言うとYann Lecun先生を思い出すかもしれませんが、彼はRob Fergus研の方です)。彼はこのICCV2011の論文あたりで著名と言えます。 サイト中のAboutに
ある集団についてのデータがどのように分布しているかを表すものとして、その集団の代表値★(中心の値)を示す平均値及びそのばらつき具合を示す散布度がある。平均には算術平均が、散布度には標準偏差がよく用いられている。 1.度数分布表・ヒストグラム データがどのように分布しているかその実態を把握するには、データをその大きさによりいくつかの階級に区分し、その階級ごとの個数 (度数) をカウントして表にした度数分布表、あるいは、それを棒グラフにして表わしたヒストグラムが適している (表1、図1) 。 例えば、年齢別人口や従業者規模別事業所数など多くの統計表は度数分布表の形で作成され、また、年齢別人口をヒストグラムにした人口ピラミッドは人口構造の分析等によく用いられている。 2.平均値★ 一般に平均値には、単純平均 が多く使われている。平均値は通常μ(ミュー) と表示される。 3.標準偏差
9.4 多変量の場合 (1) 多変量正規分布とマハラノビスの汎距離 次に変数が2つ以上の時の群の判別について考えてみましょう。 変数が1つの時はデータが正規分布すると仮定して尤度を求めました。 それと同様に、変数が2つ以上の時もデータが正規分布すると仮定して尤度を求めることができます。 ただしその場合の正規分布は普通のものではなく、変数が2つ以上あり、しかもその変数間に相関があるということを考慮した拡張正規分布であり、多変量正規分布(multivariate normal distribution)と呼ばれています。 多変量正規分布の式は恐ろしく複雑で、見たとたんに頭が痛くなるので(注1)を見ていただくとして、例えば変数が2つの時の姿は図9.4.1のような感じになります。 (注1) 変数が1つの時にデータのバラツキ具合を表す指標は偏差(xi-m)でした。 偏差はバラツキの指標であると同時に
第 2 群のデータは,第 1 群のデータを (100, 50) だけ平行移動したものである。 第 1 群の平均値は (59, 64),第 2 群の平均値は (159, 114) である。 > data1 X1 X2 1 7 8 2 30 28 3 60 29 4 28 55 5 57 60 6 77 62 7 69 77 8 55 94 9 96 93 10 111 134 > ( m1 <- colMeans(data1) ) # 第 1 群の平均値 群 X1 X2 1 59 64 > data2 X1 X2 1 107 58 2 130 78 3 160 79 4 128 105 5 157 110 6 177 112 7 169 127 8 155 144 9 196 143 10 211 184 > ( m2 <- colMeans(data2) ) # 第 2 群の平均値 X1
2つのデータが似ている度合いを,類似度の大きさや距離の近さといった数値にしてあらわすことで,クラスタ分析や,k-近傍法,多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる. ここでは,よく知られている類似度や距離について述べる. 類似度という概念は,2つの集合の要素がまさにどれだけ似ているかを数量化したものであり,距離とは,要素同士の離れ具合,従って非類似度とちかい概念と考えてもよい. 参考までに数学における距離の概念の定義を示すと, 距離空間の定義 Sを1つの空でない集合とし,dをSで定義された2変数の実数値関数 d(SxS) → R が,以下の4条件(距離の公理) D1 : (非負性) 任意のx,y∈Sに対して d(x,y)≧0. D2 : (非退化性) x,y∈Sに対し d(x,y)=0 ⇔ x=y. D3 : (対称性) 任意のx,y∈Sに対して d(x
ネット上を検索しても、あまり情報が見つからなかったので簡単なまとめ。 ハウスドルフ距離とは、2点間の距離ではなく、2つの「集合」の間の距離を表すもの。 英語版Wikipediaでは次の式で表現されている。 sup, infを知らないとパッと見ただけでは分かりにくいけど、次のように表現されることもある。 こちらの方がわかりやすいかも。 http://www-cgrl.cs.mcgill.ca/~godfried/teaching/cg-projects/98/normand/main.html それでもわかりにくい場合のために、直観的な説明をしてみる。 「集合Aのどの点であっても、少なくとも距離dHだけ進めば集合Bのどれかの点に到達できる。」 同じく 「集合Bのどの点であっても、少なくとも距離dHだけ進めば集合Aのどれかの点に到達できる。」 このような距離dHをハウスドルフ距離と言う。 これ
情報処理学会の学会誌『情報処理』の2008年9月号(Vol.49, No.9)に「3日で作る高速特定物体認識システム」という特集記事があります。OpenCVを用いた面白そうなプロジェクトなのでレポートにまとめてみようと思います。3日でできるかはわからないけど。 残念ながらこの記事はPDFを無料でダウンロードすることができません(CiNiiでオープンアクセス可能になったみたいです)。なので会員以外で元記事が読みたい人は図書館でコピーする必要があるかも・・・また、2009年9月号の人工知能学会誌にも物体認識の解説「セマンティックギャップを超えて―画像・映像の内容理解に向けてー」があります。こちらも非常に参考になりますが同様にPDFが手に入りません・・・。他にもいくつかわかりやすい総説論文へのリンクを参考文献にあげておきます。 物体認識とは 物体認識(object recognition)は、画
必要。CDイメージ(760MByte)をダウンロードして自分でインストールCDを作成するか、もしくは、インストールCD付属の書籍を購入する。 このインストールCDは、Visual C++、Visual Basic、Visual C#、Visual Web Developer のフルセットになっている。 ! Visual C++ 2008 Express Edition では、オフラインインストールの場合には登録キーの取得は不要でしたが、 Visual C++ 2010 Express では、Webインストールとオフラインインストールともに、登録キーの取得が必要になったようです。 Webインストールによるセットアップ セットアッププログラムのダウンロード 1 ホームページを開く Visual Studio 2010 Express のホームページを開きます。 その中の「Visual C++
TortoiseSVN は Windows で動作する フリーのSubversion クライアントです。 TortoiseSVN はエクスプローラーの右クリックメニューで動作します。 エクスプローラー上ではアイコンオーバーレイ機能により、 ファイルやフォルダの状態が一目で分かるようになっています。 また、日本語化の完成度も高く、ポップアップの説明文まで丁寧に日本語化されており、 大変使いやすいです。 このページでは TortoiseSVNのインストールとリポジトリへの接続について解説しています。 TortoiseSVNの使用法については、「TortoiseSVNの使い方」で解説しています。 TortoiseSVNをインストールします。 TortoiseSVN のプロジェクトページからインストーラーをダウンロードします。 TortoiseSVNダウンロードページ インストーラーと、日本語化を
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く