サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ドラクエ3
www.yohasebe.com
WP2TXT Version 0.3.0をリリースしました。 WP2TXT はWikipediaの圧縮データベース・ダンプ(英語版、日本語版、etc)を言語コーパス作成などのため、プレーンテキストに変換し、一定のサイズに分割するプログラムです。 ドキュメント ダウンロード 今回の主な修正点は次の通りです。 安定性と変換速度の向上 テキスト中の脚注部分や括弧書きをスキップする機能の追加 Mac(Leopard)用、Windows(XP/Vista)用のインストーラ・パッケージを用意 ところで、WPTXTの以前のバージョン(0.1.0)は、いくつかの研究で実際に使用されました(敬称略)。 田中和紀・管村昇 「Wikipediaを利用した音声認識用言語モデルの構築および評価」 氷野善寛 「言語研究対象としての中国語Wikipediaの可能性」 淺尾仁彦 「用法基盤モデルに基づいた複合語形成の生産
前回、Rubyでテキストを検索しKWIC形式で出力する関数を書きましたが、その際、日本語への対応は保留ということにしていました。早速、日本語のテキストも検索できるよう改良に取り掛かってみたのですが、その中である重要なことに気づきました。 KWIC (Keyword in Context) 形式では、出力されるすべての行において検索語が中心に来ていることが求められます。検索対象となるテキストの中で検索語がどんな文脈の中で使われているのかを視覚的に確認できるようにするのがKWICのそもそもの目的だからです。そしてそのためには、テキストを構成する文字の幅はすべて等しいのが理想です。 英語では通常、シングルバイトのいわゆる半角文字が用いられるので、この点についてあまり気にする必要がありません。しかし日本語ではテキストの中にマルチバイトの全角文字に加えて、半角の英数字・記号や半角カナが混じることがあ
先月末にリリースされたSnow LeopardをMacBook Pro にインストールした。何だか動作が軽くなったと喜んでいたのもつかの間、開発系を中心に、動かないプログラムがいくつも出てきた。どうもアーキテクチャがi386からx68_64になったことが原因らしい。 一番困ったのはRubyが上手く動かないことだ。ネイティブコンパイルされたgemのモジュール群を入れ直す必要がある。しかし、それらのモジュールが参照しているライブラリも影響を受けているので、MacPortsとそれで入れたライブラリを全部入れなおす。以下はいくつかのサイトを見ながら自分が行った手順だが、記憶違いもあるかもしれないのであくまで参考ということで。 最新版Xcodeのインストール まずはXcodeをSnow Leopardのインストールディスクに含まれる最新版にアップデートする。これをしないといろいろ上手くいかない。 M
久々のサーバー設定関連の備忘録。書いておかないと絶対また後で多大な時間を無駄にする自信がある。 以前作ったRailsアプリをRails 2.3.1で動かそうとしたところ、下のようなエラーが出た。 Mounting Rails at /myapp... /usr/lib/ruby/gems/1.8/gems/activesupport-2.3.2/lib/\ active_support/dependencies.rb:440:in `load_missing_constant': \ uninitialized constant ActionController::AbstractRequest (NameError) ひたすらググって原因を突き止めた。Railsの最新バージョンである2.3では、MongrelやThinを起動する際 --prefix オプションを使用するとこのようなエラ
公開日時 Yoichiro Hasebe Mon, 04 Sep 2006 14:47:00 GMT Apache + Rails という環境の中で PHP スクリプトを共存させるにはどうしたらいいのでしょうか。Google で検索をしても、参考になる情報があまり出てきません。気になっている人は多いと思うんですけどね。わかると簡単なことなので、取り上げるに値しないのかもしれません。個人的にはこれで結構悩んだので、メモを残しておきます。 RAILS_ROOT/public/ 以下に PHP スクリプトの入ったディレクトリを展開し、同じ public 直下の .htaccess に次のような設定を行います。 RewriteEngine On # 以下の php_directory0x の所を適当なディレクトリ名に置き換える RewriteCond %{REQUEST_URI} /php_dir
class Test puts "1. 基底クラス内、全てのメソッドの外側。" + "object ID は #{self.object_id}" def meth puts "9. 基底クラスのインスタンスメソッド内。" + "object ID は #{self.object_id}" end class << self puts "2. 基底クラスの特異クラス内。" + "object ID は #{self.object_id}" def meth2 puts "4. 基底クラスのクラスメソッド内。" + "object ID は #{self.object_id}" sing = class << self; self; end; puts "5. sing は特異メソッドを参照。" + "object ID は #{sing.object_id}" end end end cl
Rubyのメタプログラミングについて興味はあるけどまだきちんと理解していない人は、次の4つのメソッドをよく見てほしい。新たな発見があるかもしれない。 class Object # 特異クラスはどこにでも隠れてる。 def metaclass; class << self; self; end; end def meta_eval &blk; metaclass.instance_eval &blk; end # メタクラスにメソッドを追加 def meta_def name, &blk meta_eval { define_method name, &blk } end # クラスの中でインスタンスメソッドを定義 def class_def name, &blk class_eval { define_method name, &blk } end end 僕はこれらのメソッドを meta
公開日時 Yoichiro Hasebe Thu, 16 Mar 2006 11:07:00 GMT Ruby で日本語のテキスト処理をするときにはちょっと注意が必要です。String オブジェクトの length メソッドを呼び出すと文字の数ではなくバイト数を数えるので、日本語の文字列に対して知らずに使うとビックリするくらい大きい数が返ってきます。たとえば、
authored by Hal Fulton February 18, 2006 translated to Japanese by Yoichiro Hasebe April 26, 2006 Ruby は動的な言語である。それを知っており、また高く評価している者にとってこれは繰り返して述べるまでもないことだ。おそらくそのような人々は動的な言語が静的な言語より何らかの意味において優れていると信じている。 実際のところそれは何を意味しているのだろうか? どういう理由で、開発時でなく実行時に事をなさねばならないのか? いやそもそもそんなことを気にする必要がどこにあるのか? 1990年に初めて動的言語という概念に出会ったとき、私にもピンとこなかった。ある友人が Smalltalk という言語について興奮した口ぶりで、「クラスやメソッドを実行時に追加することができるのよ」などと教えてくれ
edit メタプログラミングに関する文書 公開日時 Yoichiro Hasebe Tue, 01 Jan 2008 11:21:00 GMT 以前 Ruby のメタプログラミングについて勉強しているときに翻訳した文書を公開します(いずれもオリジナルは CC ライセンス で公開されています)。もともと自分用のノートなので、訳は多少いいかげんですが、内容はとても参考になります。 Idiomatic Dynamic Ruby 日本語訳 Pete Lacey 氏による Ruby のクラス階層に関する解説文の抄訳です。入門書などではあまり触れられてない Ruby の本質的な部分について、うやむやにするのではなく、きちんと納得できるように書かれています。 Seeing Metaclasses Clearly 日本語訳 why the lucky stiff 氏による Ruby の特異クラスに関する解
Yoichiro Hasebe Professor The Faculty of Global Communications Doshisha University Projects Monadic Chat TED Corpus Search Engine RSyntaxTree jReadability.net Other Projects (Github) Academic Data Curriculum Vitae Publications Presentations Interests Cognitive Linguistics Natural/Artificial Language Design Corpus Linguistics Educational Technology Contact yohasebe@gmail.com Yoichiro HASEBE Faculty
このページを最初にブックマークしてみませんか?
『yohasebe.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く