サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大谷翔平
shogo82148.hatenablog.com
「全ての部分文字列を考慮した文書分類」って論文の真似事をしてみようと、まずは極大部分文字列の抽出をやってみた。 極大部分文字列の作り方を調べていると、esaxxっていうライブラリが便利らしいとの情報を発見。(極大部分文字列 - アスペ日記) 早速やってみたわけだけど、サンプルでは文字型がcharなので、日本語を扱うことができない。僕は日本人だから日本語使うんだ!ってことで、C++とJavaのUnicodeライブラリ「ICU」で文字分割。ICUの名前は聞いたことあるけど、使うのは初めて。普通に ./configure make make all ってしたら使えるようになりました。 「ICU(C++)を使って Unicode 正規化 - やた@はてな日記」とか「ICUを使う | Netsphere Laboratories」を参考に、文字分割。その後esaxxに突っ込んでみた。 #includ
本文を読む前にこのページを開いておこう!(※大量のダウンロードが始まります。太い回線で試してみてください) http://shogo82148.github.com/igo-javascript/ JavaScriptで形態素解析を行うプログラムとしては、TinySegmentater(作者の工藤さんはMeCabの作者でもあるすごい方です)が有名ですね。TinySegmentaterは非常にコンパクトな設計で、わずか25kB程度の容量しかないも関わらず、95%の精度で分かち書きを行えるとのことです。コンパクトで便利なので、他の言語にも多数移植されています。 しかし、辞書を持っていないため、品詞や読みを推定することは出来ません。HTML5の登場によってJavaScriptでできることがかなり増えてきたし、JavaScriptの実行速度もかなり速くなったし、ネットワーク環境もよくなって動画みた
XMLを扱いたくなったのでメモメモ。 XMLを扱うためのAPIとして、DOM(Document Object Model)を構築する方法と、SAX(Simple API for XML)ってのを使う方法がある。 どちらもW3Cで標準化されているAPIだから、Pythonに限らず、いろんな言語で同じようにXMLを扱うことができる。 HTML上のJavaScriptなんかを触ってると、DOMはよく出てくるね。 DOMとSAXの違いは、DOMはメモリ上にXMLのデータを全部取り込んでから処理をするのに対して、SAXはデータを読み込んだら逐次処理していく点。 DOMは、XMLの構造をツリー構造として扱うことができるから、いろいろ高度なことができる。 ただ、メモリ上に全てのデータを展開するから、メモリを食うし、重い。 SAXは、XMLのタグの出現を「イベント」として扱うAPI。 読み込んだデータをメ
vagrantはコンソールから仮想マシンを操作するためのソフト。 Chefというソフトと連携して、仮想マシンに追加でソフトをインストールすることもできる。 これを使えば、同じ環境の仮想マシンをぽこぽこ作れるわけです。 で、これをWindowsに入れようと思ったわけですが、最新版を入れると仮想マシンの起動でエラーを吐いて上手く動かない。 C:/Ruby193/lib/ruby/gems/1.9.1/gems/virtualbox-0.9.2/lib/virtualbox/com/implemen ter/mscom.rb:61:in `method_missing': (in OLE method `ImportMachines': ) (WIN32OL ERuntimeError) OLE error code:0 in <Unknown> <No Description> HRESULT
昨日の書いた記事「磁力の引力と斥力で発電(?)する装置」を簡略・効率化してみたよで取り上げた沖縄高専:磁石の力で発電 エコエンジン研究へ(毎日新聞, 琉球新報の記事は削除されてしまったようです)という記事に対して、沖縄高専から公式にコメントが出ました。 平成23年11月26日付琉球新報掲載記事「磁石の力で発電 エコエンジン研究へ」に関する本校コメント 発表に至った経緯を要約すると あの機械は発電を意図したものではない 高専側は「発電」という言葉は使っていない 高専が記事の確認をしないまま、記事が公開されてしまった ということです。あの記事は記者の勝手な解釈によるもので本学は関係ない、とでもいいたいような書き方です。 まあ、沖縄高専が、勝手に記事にされた、と言いたくなるのもわかります。『平成23年11月25日(金)に開催された本校主催「沖縄高専フォーラム」内にて、本校教員がこの件に関して、琉
ここHatena Blogもシンタックスハイライトに対応しているらしいです。 http://blog.hatena.ne.jp/-/feedback/13208692334729889835 だけど、C++のソースコードをスーパーpre記法で載せたらシンタックスハイライトされなかった・・・orz 言語依存なのかな?と思い、他の言語ではどうなのかテストテスト。 C言語 #include <stdio.h> int main(void) { printf("Hello World!!\n"); return 0; } C++ #include <iostream> using namespace std; int main(void) { cout << "Hello World!!" << endl; return 0; } C# class HelloWorldApp { static v
SL4Aのリモートコントロール機能を使って、Androidをリモートコントロールするメモ。 SL4AのプロジェクトページにRemoteControlってページがあったので試してみた。 僕の英語能力では理解できなかったのでSL4A/ghome makotofも参考に。 Android側準備 SL4Aをインストール Python for Androidをインストール SL4Aを起動して、メニューを表示。「View」「Interpreters」を選択 インタープリター一覧が表示されたらもう一度メニューを表示。「Start Server」を選択 「Public」を選択 すると通知領域にSL4Aが現れるので、それをタッチ 起動しているスクリプト一覧が表示される。その中にServerという項目に表示されているIPアドレスとポート番号(ここでは192.168.0.100:4321と仮定)をメモしておく
このページを最初にブックマークしてみませんか?
『shogo82148's blog』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く