Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

導入 まだ、私は機械学習を学び始めて2ヶ月ぐらいです。 最近Kaggleで学んだ知識を実践しようと取り組んでおり、どういった学習方法がいいのかなーって調べていたら 「KaggleのKenel読むといいよ!!」 ってあったので見てみたのですが 意味不明なコードで書かれたKernelばっかやん😡 そういうわけでなんとかして、初心者向けの簡単なコードで書かれたカーネルを見つけたので紹介していこうと思います。 ちなみにコンペはtkm2261さんのYoutube動画の影響を受けてPorto Seguro'sをやってます。 このコンペはデータが綺麗で、自然言語処理の知識とかも入らないのでtitanicやった後はこのコンペをやることをおすすめします! カーネルに関しては見つけ次第順次追加していく予定です。 もし、初心者におすすめのカーネルがあるよーって方はコメントしてくだされば追加するのでよろしくお願
はじめに 3月末に大学でデータ分析系の研究室に配属され、何か手頃なデータで遊んで見たいなぁ〜と思っていたところこんな素晴らしい記事を偶然発見。 Spotifyの76,000曲の属性データを分析した結果、J-RockはRockというよりむしろPunkだった **Spotify**は無料(!)で使えるApple Musicのような定額音楽ストリーミングサービスです。 ↑Spotify の Web Player 前々からSpotifyはかなり使っているのですが、APIの存在はこの記事で初めて知りました。取得できるオーディオ解析のデータの一つ一つもかなり面白そうだったので、これを使う手はない!ということで実際に触って見ました。 今回はSpotifyの曲の情報を取得するAPIを使い、データサイエンティスト一年生かつトラックメイカー四年生の観点から、色々頑張ってみようと思います。 目標 今回の目標は以
概要 What’s new in each version --v0.9.0 (July 2018) seabornがメジャーアップデートをして、バージョン0.9.0がリリースされました。 いくつかの変更点や新たな関数が追加されたようなので、いくつか試してみたいと思います。 特に、散布図のscatterplot()や、線グラフのlineplot()が良さげなので、それについて詳しく見ます。 コードだけ見たい方は、以下の文章は飛ばしてこちらからどうぞ。 注意! ベータ版なので、アップデート等は自己責任でお願いします。 主な変更点や追加関数 以下、公式ドキュメントの翻訳(意訳)の抜粋。だいぶ粗い訳なので、分かりにくい箇所はドキュメントを参照してください。 新しいグラフ関数が追加された。 relplot() scatterplot() lineplot() relplot()は FacetGri
def build_generator(self): model = Sequential() model.add(Dense(input_dim=(self.z_dim + CLASS_NUM), output_dim=1024)) # z=100, y=10 model.add(BatchNormalization(momentum=0.8)) model.add(LeakyReLU(0.2)) model.add(Dense(128*8*8)) model.add(BatchNormalization(momentum=0.8)) model.add(LeakyReLU(0.2)) model.add(Reshape((8,8,128))) model.add(UpSampling2D((2,2))) model.add(Convolution2D(128,5,5,border_mo
KerasのImageDataGeneratorはData Augmentation(水増し)にとても便利ですが、最近水増しの方法がいろいろ研究されてきて物足りないなと感じることがあります。KerasオリジナルのImageDataGeneratorを継承・拡張して、独自のImageDataGeneratorを作る方法を考えてみました。 クラス継承なのでオリジナルのImageDataGeneratorと全く同じ感覚で使えます。 参考 以下のサイトを参考にしました。 Kerasでデータ拡張(Data Augmentation)後の画像を表示する flow_from_dirctoryで流した画像をpyplotで表示させる方法について解説されています。 新たなdata augmentation手法mixupを試してみた Mix-upの原著論文やその実装について解説されています。 Extending
画像用のネットワークを調整する際、入力サイズを増やしたら、画像読込時にメモリに乗り切らなくなった問題を解消した際のメモです。 前提環境 Ubuntu 16.04 Keras 2.1.6 課題 学習に使う画像データの総容量が大きくなり、一度に読込できなくなった。 そのため、一定サイズ毎に区切りながらデータを読み込む必要が発生した。 概要 Model.fitの代わりに、Model.fit_generatorメソッドを使って学習する。 fit_generatorメソッドには、学習・検証データとして、Generatorオブジェクトを渡す。 Generatorオブジェクトは、バッチ単位にデータを提供する仕組みを実装する。 実装例 class MyGenerator(Sequence): """Custom generator""" def __init__(self, data_paths, dat
前編では、ヒートマップを使って異常個所を可視化しました。 後編では、従来手法と提案手法を数値的に比較してみます。 使うツールは、ROC曲線です。 ROC曲線 ROC曲線は、ラベル間のデータ数に差があるときに使われます。 ROC曲線について、詳しく知りたい方はこちら↓を参考にしてください。 http://www.randpy.tokyo/entry/roc_auc 今回は、ラベル間のデータ数に大きな差はありませんが、論文にならって ROC曲線を描画します。最終的に、AUCを算出して、これが大きい方が優れた 異常検知器といえます。 コードの解説 コードの一部を解説します。 異常スコアの算出 論文によると、異常判定の基準は以下のとおりです。 このパッチ全てに関して異常度を算出し、少なくとも1枚が閾値を 超えてる場合、テストデータは異常であると判断した. パッチというのは、前編でお伝えした小窓に相
「PyTorchは速いぞ」という記事がいろいろ出てて気になったので、何番煎じかわかりませんが、どのぐらい速いんだろうと思って実験してみました。実験するのはこの前作ったDenseNetです。 環境 Google Colab GPUはTesla K80、ハードウェアアクセラレータはON Kerasのバージョンは2.1.6、PyTorchのバージョンは0.4.1 条件 Dense Netの論文の条件を若干アレンジしたものです。Data Augmentationはシンプルにしました。 成長率K=16とし、DenseNet-121と同じ構成のDenseNetを作る CIFAR-10を分類する Data Augmentationは左右反転、ランダムクロップのみ。 L2正則化(Weight Decay)に2e-4(0.0002)。ドロップアウトはなし オプティマイザーはAdam、初期の学習率は0.001
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 顔の識別、検索をしたいがデータを集めて切り取りする作業があまりにも鬼畜な作業なので自動化したくて頑張ってみる。 open cv では傾いた顔を認識しない、顔じゃないものを顔と認識するなどなどイマイチ。 物体検出というものがあるらしい ここ https://github.com/pierluigiferrari/ssd_keras にあるコードが自分の環境(TensorFlow 1.x、Keras 2.x)で動きそうだったので試してみた。 ssd300_inference.ipynbかssd512_inference.ipynbに従ってポ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く