サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
daily.ohkura.info
Google App Engineとか使ってみようと思って試しているうちに、ふとevalが使えるか試したところ使えたので、MapReduceをGAEでやってみました。完全におもちゃですが、何かできそうってことは伝わるかと。 デモサイトはこちら:http://gae-mr.appspot.com/ (無尽蔵に使われるとまずいので、GMailアカウントでログインするようにしてあります。ログインに本質的な意味はありません。) コードはこちら:http://github.com/ohkura/gae-mapreduce/ ※ gitとかgithubとか使ってみたいと思っていたので使えてよかった。
最近Luceneを使ってみている。Luceneを使って実験用のブログ検索エンジン(ぽいもの)を作っているが、とにかくインデクシングが遅い。Nutchでは、Luceneのインデックスをいくつものマシンに作成して、インデクシング/検索共に分散してやることが推奨されているようだが、残念ながら常時占有できるマシンがたくさんあったりはしない。 Luceneの本によれば、マルチスレッドでメモリ上にインデックスを作成して、あとでまとめて1つのインデックスをファイルシステム上に作るというのが、Luceneのインデクシングを高速化する常套手段らしい。しかし、それで高速化できるのは最大でも(インデックスのマージにかかる時間が0としても)1つのマシン上のCPU数だけで、大幅な高速化はできない。 そこで、複数のマシンでメモリ上にできるだけ大きな(メモリぎりぎりの)インデックスを作成し、それをファイルに書き出してネ
Wekaというものを使ってみた。存在は1年以上前から知っていたが、機械学習アルゴリズムのJavaによる「ライブラリ」だと思っていた。しばらくの間研究に必要なプログラムをC++またはRubyで書いていたので、Wekaに目を向けることはなかった。 いまBlog関連でやっている研究で、ある問題に文書分類アルゴリズムを使ってみようと思った。今回のテーマでは研究用プログラムをJavaで書いてみていて(書くの楽ちんだしね!)、C++のときに使っていたTinySVMや自作のNaiveBayes, AdaBoostライブラリの代わりになるものとして自然とWekaに目がいった。 Wekaをダウンロードして、ホームページに目を通すと、単なるライブラリではないことが分かる。たくさんの機械学習アルゴリズムが実装されており、それぞれのアルゴリズムは必要なパラメータを設定できるようになっている。さらに、たとえばスペー
Raspberry Piをいくつか運用していてよくSDCardが壊れるなと思ってより耐性の高いカードを買わないとと思っていたら、SDカードに書き込まずに運用するということが広く行われているということを発見してトライ。Docker対応する方法は簡単には見つからなかったので試行錯誤した。 以下作業メモ 普通にセットアップ(事前に/boot/ssh, /boot/wpa_supplicant.conf を作成) raspi-configでpassword, hostname, timezoneの設定 tmux, emacsをインストール watchdogの設定 (1) readonly modeにする基本設定 (2) 外部ディスクの追加 # /etc/fstab PARTUUID=abc-def /media/foobar ext4 defaults,auto,users,rw,nofail,x
このページを最初にブックマークしてみませんか?
『Daily Ohkura Info』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く