Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
問題 mecab-ruby を本格的に使う必要が出てきたので mecab-ruby を触っていました. mecab-ruby は SWIG という一度書いたものをより高級な言語で使いまわせるようにするツールで実装されているので, インターフェイスが Ruby っぽくないです. あと各言語向けバインディングの Doc の MeCab::Node の振舞い で触れられているように MeCab::Node の振る舞いはすこし癖があります. 書いてみた というわけで, 不満があるならラッパーを書けばいいじゃない!ということで gem を書いてみました. https://github.com/taiki45/mecab-ext https://rubygems.org/gems/mecab-ext どこが便利なったのか・使い方 まずは Node インスタンスを作ります.
初めまして! BitStarでエンジニアのインターンをしている久根間です。 普段は、Railsで、社内システムや自社サービスの開発をしていますが、個人的に、機械学習に興味があるので、自作したデータセットを画像解析する方法をまとめてみようと思います。 はじめに この記事では、TensorflowのDeep MNIST for Expertsチュートリアルのコードを少し変えて、自作したデータセットを学習させていく方法を書いていきたいと思います。なので、今回は、データの扱いを中心にいきたいと思います。チュートリアルやCNNについては、深く突っ込まないので、ご了承ください。 具体的に、何を分類するかですが、BitStarでは、YouTubeのチャンネルを、ジャンルごとに分類したりしています。そこで、『YouTubeのサムネイルから、動画の内容を分類する』をやっていきたいと思います。〜やってみたの動
Keras動かせたから何かそこらにあるものを対象にできないかと、Raspberry Piの純正カメラモジュールを使って、定番の画像分類をやってみた。 RasPi OneでTensorflow/Kerasを動かす。で使ったKerasのClassify ImageNet classes with ResNet50にPicameraの出力を渡しているだけです。 カメラモジュール: PiNoIR Camera Module オリジナルのものです。今はVer.2になってます。 ## サンプルコード import io import time import picamera import picamera.array import cv2 from keras.applications.resnet50 import ResNet50 from keras.preprocessing.image im
目的 ゼロからKerasとTensorFlow(TF)を自由自在に動かせるようになる。 そのための、End to Endの作業ログ(備忘録)を残す。 ※環境はMacだが、他のOSでの汎用性を保つように意識。 ※アジャイルで執筆しており、精度を逐次高めていく予定。 環境 Mac: 10.12.3 Python: 3.6 TensorFlow: 1.0.1 Keras: 2.0.2 To Do Keras(Tensorflow)の環境構築 KerasでMINSTの学習と予測 KerasでTensorBoardの利用 <---いまココ Kerasで重みファイルの保存/読み込み Kerasで自前データの学習と予測 Kerasで転移学習 参考 流れ TensorBoardを表示されるためには、モデルを学習した時に出力されるlogファイルが必要になる。そのため、log用ディレクトリの作成とサンプルスク
先日行われたTensorFlow Dev Summit 2018の「Machine Learning in JavaScript」で、Webブラウザ上で実行可能な機械学習ライブラリとしてTensorFlow.jsが公開されました。 そこで、素振りがてらにこんなものを作ってみました。 これは、手書き数字識別のトレーニング済モデルをTensorFlow.jsで読み込むことで、Webブラウザ上で書いた数字が0~9のどれかを予測しています。 主なフロー TensorFlow or Kerasで学習済みモデルを作成 tensorflowjs_converterでTensorFlow.jsで読み込める形に変換 TensorFlow.jsで変換済モデルを読み込んで推論を実行 今回はKerasを使用した方法を紹介していますが、TensorFlowの場合も同様なフローになります。 具体的には、1で出力するフ
はじめに オブジェクト検出のアルゴリズムのSSDをkerasで実装したリポジトリがあります。 rykov8/ssd_keras こちらにはJupyter用のサンプルコードがありますが、ターミナルですぐ動かせるコードがなかったため、 Jupyter用のサンプルコード(SSD.ipynb)を参考に作成しました。 コード import cv2 import keras from keras.applications.imagenet_utils import preprocess_input from keras.backend.tensorflow_backend import set_session from keras.models import Model from keras.preprocessing import image import matplotlib.pyplot as
TD;LR mecab標準のフォーマットは少し扱いづらい 出力フォーマットを弄ろう! 表層系+品詞の組み合わせができるようになり幸せ mecabのデフォルトの出力形式は使いづらくないですか? 前回の投稿の複数の形態素解析を一度に見るコマンドを作った話に引き続き, 形態素解析器の利用に関するtipsです. 形態素解析と言えば, mecabを使われている方が非常に多いかと思います. 企業利用だと, 製品への組み込みやすさから kuromojiを使ってる方も多いでしょうか? kuromojiを使ったことはないですが mecabを使っていて思うことは, "標準の出力形式扱いづらくない?"ということです. よく利用するのは, 僕は単語分割(分かち書き)と品詞取得, 活用形の原形化ぐらいなものなのですが 標準の出力形式だと, どうしても後段の処理で扱いづらいです. ある問題に対する分析を行うため, と
概略 David Duvenaud et al, "Convolutional Networks on Graphs for Learning Molecular Fingerprints", NIPS 2016(https://arxiv.org/abs/1509.09292) をKerasを用いて実装しました ソースコード[https://github.com/mpozpnd/NeuralFingerprint-Keras] 化合物のベクトル化 機械学習を用いて、化合物のデータから化合物のなんらの物性を予測をしたいということがあります。 たとえば創薬において、ウェットな実験によって既に所望の薬剤としての性質の有無が分かっている化合物のデータによって学習モデルを構築し、新規の化合物について薬剤としての性質を持つかどうか予測をする、というタスクがあります。 なぜ学習ができるのかというと、「
はじめに TensorFlow はなかなかとっつきにくい部分があるかと思います。書き方が独特なので、慣れるまでに時間がかかるかと思います。公式の MNIST は一通りやったけど、自分で考えたディープニューラルネットワーク (DNN) をどう書いたらいいかわからない……なんてこともあるのではないでしょうか。 この記事では、シンプルな問題を題材にして、 TensorFlow をコピペに頼らず、自分の書きたい DNN を 低レベル API を使ってどのように書くかを最小構成で説明していきます(今さら感はありますが。。)。ベースは公式ドキュメントの Low Level APIs のあたり です。 内容としては: TensorFlow の最小構成要素 TensorFlow で線形関数のフィッティング TensorFlow で DNN を実装 のようになっています。また、以下のような方を対象としており
環境 ubuntu: 17.04 python: 3.6 keras: 2.0.8 tensorflow: 1.3.0 tensorflow-tensorboard: 0.1.5 実装 tensorboard用callbackの指定 model.fit()のcallbacks引数に、keras.callbacks.TensorBoard()を指定する また、histogram_freqを指定する場合はvalidation_data引数が必要になる 具体的には以下のようにする tb_cb = keras.callbacks.TensorBoard(log_dir=log_filepath, histogram_freq=1, write_graph=True, write_images=True) model.fit(x_train, y_train, epochs=20, batch_si
Solr 5.4 の環境構築で、ログ周りの設定が意外につまったので、整理としてのメモ。 ログの種類 おおむね、次の三つ gcログ solr本体 jetty(アクセスログ) アクセスログは標準では出力されないですし、大体の場合は不要でしょうが、solr 3.x 以前はtomcatにデプロイした形だとtomcatのアクセスログがあったので、それも残しておきたいケースもあるかと思い、あわせてとりあげます。 起動時の設定ファイル 公式サイトにあるように、インストールスクリプトでやったものとします。 https://cwiki.apache.org/confluence/display/solr/Taking+Solr+to+Production#TakingSolrtoProduction-Logsettings /etc/init.d/solr が起動スクリプトで、その中のSOLR_ENVに指定
はじめに オープンソースの日本語形態素解析器:MeCabの辞書を利用する方法を備忘録として記録します。 MeCabの辞書には、システム辞書とユーザ辞書があります。 システム辞書の方が処理が早いと言われており、ユーザ辞書を使用する機会は少ないと思われる。 また、MeCab用の新語辞書・固有表現に強いシステム辞書:mecab-ipadic-NEologdが公開されている。mecab-ipadic-NEologdは、毎週2回(月曜日と木曜日)に一般サイト(はてなキーワードや郵便番号データやSNS,ニュース記事など)から情報を収集して更新されている。 参考サイト: MeCab公式サイト MeCabの辞書をカスタマイズする mecab-ipadic-neologd - GitHub 環境 OS:Red Hat Enterprise Linux 7.2 MeCab:0.996 MeCabのシステム辞書
はじめに 自然言語処理を学ぼうと思い、PythonにMeCabをインストールしようと考える人は多くいると思う。 MacやLinux環境では比較的簡単に(HomeBrewやapt-getを使用して)インストールすることが可能だが、Windows環境では一筋縄ではいかない。(現に2,3日ハマった) 多くの先人達がブログの記事にしているが、個人によって環境は異なるので、私がインストールに成功した方法を記事にしたいと思う。 インストール(に試して成功した)環境 OS:Windows10, Windows7 Pythonの環境:Anaconda3系 先にダウンロードしておくべきもの https://www.visualstudio.com/vs/older-downloads/ VS2015 Community (私の手元ではVS2017だと失敗した) http://taku910.github.i
TensorFlow を試してみた まず、Get started を読んでみます。 Introduction | TensorFlow いきなりTensorFlow のサンプルコードがでてきますが、ここではサンプルデータを使って、どれだけシンプルにモデルを構築できるかを見せてくれているわけです。ここはそもそも機械学習の知識が皆無だと、逆に意味がわからないと思います。 いろいろなTensorFlow の記事を見ると「機械学習知識ゼロでもいける」というのもみかけますが、TensorFlow はあくまでもツールにすぎないので、最低限の知識はあったほうが今後のためにも良いと思います。 次に、伝統的なMNIST(手書き文字認識)に取り組むということでデータのダウンロードを勧められます。MNIST 未経験なら「青いクスリ」を、ある程度機械学習に慣れた方は「赤いクスリ」をと勧められますので、ここは迷わず
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く