With many products comes many reviews for training.In this article, we will be using fine food reviews from Amazon to build a model that can summarize text. Specifically, we will be using the description of a review as our input data, and the title of a review as our target data. To download the dataset, and learn more about it, you can find it on Kaggle. If you decide to build a model like mine,
seq2seqで利用可能な日本語対話データセットをダウンロードするツールの続きです。TensorFlowのseq2seqサンプルを、このデータで学習できるようにしてみました。 オリジナルのTensorFlowサンプルseq2seqは、WMTの配布する巨大な英仏翻訳のデータセットをダウンロード、展開して処理するコードが入っています。考えなしに動かせる点ではとてもお手軽で良いのですが、自分で用意したデータセットを与えるには向いていません。そこで、指定したディレクトリ上にあるinput.txt(encoder用データ)とoutput.txt(decoder用データ)を読みに行くよう修正したバージョンをgithubに置きました。オリジナルのコードに準じてApache 2.0ライセンスです。 knok/tf-seq2seq-mod: Modified seq2seq on TensorFlow これ
上の図の各ボックスは RNN のセルを表しています、より一般的には GRU セルまたは LSTM セルです (それらの説明については RNN チュートリアル を参照)。エンコーダとデコーダは重みを共有することができますがあるいは、より一般的に、異なるパラメータセットを使用することもできます。多層セルは sequence-to-sequence モデルでも成功的に使用されています。例えば翻訳のために Sutskever et al., 2014 (pdf)。 上に描かれた基本モデルでは、デコーダに渡される唯一のものとして、全ての入力は固定サイズの状態ベクタにエンコードされなければなりません、デコーダにより直接的な入力へのアクセスを可能にするため、attention メカニズムが Bahdanau et al., 2014 (pdf) で紹介されました。私たちは attention メカニズム
2. 2 2016/9/27 Singularity Copyright 2016 Singularity Inc. All rights reserved 自己紹介 新村拓也 - シーエイトラボ株式会社 代表取締役 - シンギュラリティ株式会社 取締役CTO - 機械学習のための数学塾 - RNN camp 3. 3 RNN campについて 2016/9/27 Singularity Copyright 2016 Singularity Inc. All rights reserved - 浅川伸一先生によるRNNに特化したハン ズオン形式の勉強会 - 現在第二回 - http://connpass.com/event/37205/ 4. 4 概要 何やら最近案件でRNNを使うことが、、 RNN campもあって、自分なりに色々とRNNのTensorFlow実装につ いて試
#!/usr/bin/env python # -*- coding: utf-8 -*- # Licensed under the Apache License, Version 2.0 (the "License"); # you may not use this file except in compliance with the License. # You may obtain a copy of the License at # # http://www.apache.org/licenses/LICENSE-2.0 from __future__ import absolute_import from __future__ import division from __future__ import print_function import math import os i
世の中ディープラーニングということで、対話システムに応用できる?とseq2seqをTensorFlowで実装してみます。英仏翻訳のチュートリアルがありますが、今回は日本語の対話でやりたかったので、下記を参考にとりあえずそのまま動かしてみることにします。 TensorFlowのseq2seqを自前のデータセットで試す http://qiita.com/knok/items/b24deb8cff3df48920ee 準備編 seq2seqのコード 対話させてみる おまけ 準備編 まずは日本語での対話データが必要です。これあんまりその辺にあるわけでもないし、ディープラーニングに流せる程度の量を自分一人で作るのは現実的ではないので、上のQiitaの記事のやり方で取得しておきます。 $ git clone https://github.com/knok/make-meidai-dialogue $
最近ずっと NN/CNN/RNN/LSTM などで遊んでいたのだけど Seq2Seq の encoder/decoder と word embeddings を理解したかったので Seq2Seq の chatbot を動かしてみた。Keras でフルスクラッチで書いていたのだけど上手く動かず。論文読んでもわからないところがあったので https://github.com/1228337123/tensorflow-seq2seq-chatbot を自分なりに読み解いてプロセスが別れてわかりやすいように書き換えた。同時に日本語に対応させて Twitter Bot として動くようにした。 会話例 seq2seq Google 翻訳などでも利用されている seq2seq というタイプの Neural Networks を利用しています。入力も出力も時系列データ。例えば会話とか翻訳とかに使えます。
ディープラーニングの大流行の中、様々なフレームワークが登場し、気軽にプログラミングができるようになりました。しかし、そんな中どのフレームワークを選べば良いかわからないという人も多いと思います。そんな人に少しでも参考になればと思い記事を書きます。 はじめに Chainer 特徴 柔軟な計算グラフの構築が可能 Pythonによる実装 直感的な計算グラフの構築が可能 メリット・デメリット メリット デメリット まとめ Keras 特徴 とんでもなく簡単に計算グラフを記述可能 高速計算ライブラリのディープラーニング用ラッパー もはやプログラミングの経験すら不要 メリット・デメリット メリット デメリット まとめ TensorFlow 特徴 圧倒的な利用者数 テンソル計算を行うライブラリ Define and Run 追加のライブラリが豊富 メリット・デメリット メリット デメリット まとめ PyT
TensorFlowとKerasによるディープラーニング・ニューラルネットワークの実践的入門書 本書はディープラーニング、ニューラルネットワークについての予備知識がなくても学習を進められるようゼロから丁寧に、理論とその実装について解説します。 実装にはPythonのディープラーニング向けのライブラリ、TensorFlow (1.0) およびKeras (2.0) を用います。 「ディープラーニングについて何となくわかってはいるけれど、もう少し理解を深めたい」「画像認識だけでなく、時系列データを分析するためのモデルについても学びたい」という方にとって、学びの役に立つのではないかと思います。 単純パーセプトロンにはじまり、多層パーセプトロン、ディープニューラルネットワーク、リカレントニューラルネットワークなど多くの手法について学びます。扱うデータの種類ごとに考えるべき課題も異なり、それに合わせ
FXシストレプログラムのディープラーニング版を作ろうとして、 偶然で最強のアルゴが誕生した(機械学習でFXシステムトレード) - Ryoの開発日記 に、 [TensorFlowで株価予想] 0 - Google のサンプルコードを動かしてみる - Qiita のTensorFlowコードを移植しようとしたけど、結構面倒で挫折したので、前に書いた 簡単なディープラーニングのサンプルコード (2入力1出力/2クラス分類) with Keras (Chainerは挫折) - Ryoの開発日記 のKerasによるDNNのコードをGoogleのやつに合わせて移植してみた。 3000 epoch回した感じだと、最終的に近い収益が得られたが、安定して上がっている感じにはならなかった(=頑強性が低い。最後の数か月でどかっと上がっている)。 ので、30000 epoch回した結果を見てみる。 学習時間は10
はじめに python tensorflowの初学者です。 QiitaにTitanicのデータにskitlearnを適用した記事に触発され、tensorflowを適用するとどうなるのかを試しましたので投稿します。 環境 OS : Windows10 Python : 3.5(Pandas,Numpyもインストール済み) tesorflow : 1.0 データの整理 データはKaggleからダウンロードしてください。(http://www.kaggle.com/c/titanic) 簡単にデータの仕様を説明します。 PassengerId : kaggleが割り振った個人に割り振ったID Survived : 生存・非生存(予測対象) Pclass : 客室のクラスを表すコード1は1等、2は2等、3は3等 Name : 名前 Sex : 性別 Age : 年齢 S
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く