nabinnoのブックマーク - はてなブックマーク

Pythonで英文類似記事検索アルゴリズム : TF-IDF, Cosine類似度 - Qiita
概要急にリコメンドに興味を持ちまして、ニュースの類似記事検索アルゴリズムを試してみました。アルゴリズムは、自然言語分野ではよく使われているTF-IDFとCosine類似度を用いました。 TF-IDFとは文章をベクトル化するアルゴリズムの一つです。 TF : Term Frequency。単語の出現頻度。 IDF : Inverse Document Frequency。直訳すると「逆文書頻度」。珍しい文字が入ると値が大きくなる為、単語の「希少性」を表しているとも言えます。各文章の単語を抜き出し、全ての単語に対してTF(その文章が保持する単語数)とIDF(希少性)を掛け合わせたベクトルを作成します。このベクトルを用いることで、文章を用いた情報検索やクラスタリングが可能になります。詳しくはこちらの記事などが分かりやすいです。 Cosine類似度とは 2つのベクトルがどれくらい同じ向
nabinno 2018/08/14
scikit-learn

python

analytics
リンク
Keras / Tensorflowで始めるディープラーニング入門 - Qiita
2つのモデル記述方法 kerasでは、ネットワークの層（レイヤー）を記述する方法が2つあります。 Sequentialモデルネットワークを1列に積み重ねていく、シンプルな方法です。サンプルコード： from keras.models import Sequential from keras.layers import Dense, Activation # モデルの作成 model = Sequential() # モデルにレイヤーを積み上げていく model.add(Dense(units=64, input_dim=100)) model.add(Activation('relu')) model.add(Dense(units=10)) model.add(Activation('softmax')) # 訓練プロセスの定義 model.compile(loss='categor
nabinno 2018/01/14
qiita

keras

tensorflow

machine-learning

analytics

data-visualization

python
リンク
Keras / Tensorflowで転移学習を行う - Qiita
概要 Keras(Tensorflowバックエンド)で、画像認識の分野で有名なモデルVGG16を用いた転移学習を行いました。そもそもディープラーニングとは？Kerasって何？という方は、こちらの記事をご参照下さい。転移学習とファインチューニングの違い転移学習とファインチューニングは、どちらも既存のモデル(今回はVGG16)を応用したディープラーニングの学習方法です。その為この２つはよく混同されていますが、厳密には異なります。参考：Quora: What is the difference between transfer learning and fine tuning? ざっくりと説明すると、違いは以下になります。 - 転移学習：既存の学習済モデル（出力層以外の部分）を、重みデータは変更せずに特徴量抽出機として利用する。 - ファインチューニング：既存の学習済モデル（出力層以外の
nabinno 2018/01/07
qiita

keras

tensorflow

machine-learning

analytics

data-visualization

python
リンク
SSD(Keras / TensorFlow)でディープラーニングによる動画の物体検出を行う - Qiita
やったこと前回に引き続き、動画の物体検出を行いました。今回はアルゴリズムを変えて、SSDという物体検出アルゴリズムを使用しています。（動画はPIXELS VIDEOSよりCCライセンスの動画を使用しました。） SSD(Single Shot MultiBox Detector)とは論文はこちら(2016年)。前回使用したYOLO(You only look once)アルゴリズムと同じく、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いた物体検出アルゴリズムです。他のシングルステージ方式と比較して、入力画像サイズが小さくてもSSDの精度ははるかに優れています。 Compared to other single stage methods, SSD has much better accuracy, even with a
nabinno 2017/11/08
qiita

keras

tensorflow

machine-learning

analytics

data-visualization

python
リンク
YOLOv2(Keras / TensorFlow)でディープラーニングによる画像の物体検出を行う - Qiita
やったこと流行りのディープラーニングを使って、画像の物体検出を行いました。今回は、YOLOv2というアルゴリズムを使って物体検出を行なっています。 YOLO(You Only Look Once)とは畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いた物体検出アルゴリズムです。現時点ではv1とv2が存在します。 YOLO(YOLOv1) 論文はこちら(2015年)。従来とは異なり、画像をバウンディングボックスで分割してクラス分類を行なっている。 we frame object detection as a regression probl em to spatially separated bounding boxes and associated class probabilities. 結果として、45FPSの処理速度を実現し
nabinno 2017/09/03
qiita

tensorflow

machine-learning

analytics

data-visualization

python
リンク
1