タグ

ブックマーク / tkng.hatenablog.com (4)

  • 日本語入力を支える技術 振り返り、もしくは技術書を書きたい人へ - 射撃しつつ前転 改

    を書いてからこっち、年度末で忙しかったり、体調がずっと悪かったりしていますが、そろそろ気出します。正誤表も大幅にアップデートします。今書いてる。 今日は、を書いてみてどうだったか、ということをふり返る。たぶんこれでについて触れるのは最後かな。宣伝はたまにすると思いますが。 ※思いがけず大量にアクセスがあったから、最後に追記を書いたので、そっちも読んでね! を書いたきっかけ 会社の方でPFIセミナーという勉強会のようなものをやっており、なぜかそれがUStreamでインターネットに中継されているのだが、そこで日本語入力の話をしたら「書かない?」って話が来た。編集さんとは、その前年に会社に来たWEB+DB Pressの記事執筆依頼で記事を書いた際に知り合ったので、そういう意味では貪欲にチャンスを掴みに行った結果であると言えなくもない。 PFIセミナーがUSTで中継されるようになったの

    日本語入力を支える技術 振り返り、もしくは技術書を書きたい人へ - 射撃しつつ前転 改
    nilab
    nilab 2012/06/09
    日本語入力を支える技術 振り返り、もしくは技術書を書きたい人へ - 射撃しつつ前転
  • 言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改

    言語処理のための機械学習入門というが出版される、という話はtwitterで知っていたのだが、8月ぐらいに出るのだろうとばかり思っていたら、なんかもう発売されているらしい。Amazonでは早速売り切れていたので、某大学生協の書籍部まで行って購入してきた。おかげで、この週末は280円で過ごすハメになってしまった。 まだざっと眺めただけだが、 ラベルを人手でつけるのに隠れマルコフモデルと言うのは来はちょっとおかしいんだけどNLPの分野だとそう表現する事が多いよ 対数線形モデルと最大エントロピーモデルは同じものだよ 出力変数の間に依存関係がなければCRFではなく対数線形モデルとか最大エントロピーモデルと表現するべきだよ といった、これまでの教科書にはあまり載っていなかったような事が載っているのはとても良いと感じた。こういった情報は、これまではどこかの大学の研究室で学ぶか、もしくはウェブ上の資料

    言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改
    nilab
    nilab 2010/08/23
    言語処理のための機械学習入門を読んだ - 射撃しつつ前転
  • 正しいデバッグ用ログの吐き方 - 射撃しつつ前転 改

    普段何気なく出力しているデバッグ用のログであるが、 複数プロセスからどうやって同時に書き込むのか? rotationはどうやってやればいいのか? ということを考えると、実はこれまでライブラリ任せで、自分で書いたことがないという事実に気づいた。ので、調べてみた。 まず、複数プロセスからのログの書き込みについてだが、これは普通にアペンドモードで開くだけで良かった。 fp = fopen("app.log", "a"); openシステムコールにはO_APPENDというオプションがあり、これをつけると毎回の write(2) の前に lseek(2) を行ったかのように、ファイルポインタをファイルの最後に移動してくれる。fopenでファイルを開くときも、"a"で開くと内部でopenシステムコールを呼ぶ際にO_APPENDをオプションとしてつけてくれるのでこれでOK。ただ、仕様書での確認はまだして

    正しいデバッグ用ログの吐き方 - 射撃しつつ前転 改
    nilab
    nilab 2009/10/01
    正しいデバッグ用ログの吐き方:「複数プロセスからのログの書き込みについてだが、これは普通にアペンドモードで開くだけで良かった」「openシステムコールにはO_APPENDというオプションがあり、これをつけると毎回の writ
  • Googleのトップページを開くと毎秒100回JavaScriptが実行されるよ - 射撃しつつ前転 改

    FirefoxがCPUを常に15%ぐらいうのが気になっていたので調べてみたら、Googleのトップページを開くとものすごい勢いでJavaScriptが実行されることがわかった。具体的には、var k=t.value;k!=h&&X(0);h=k というコードが毎秒100回実行されている。このせいで、自分の使っているPCだと、Googleのトップページを開くだけでCPU使用率が2%ぐらい上がっているようだ。Firefox特有の問題というよりは、ウェブページ側の作り方に依るものみたいだ。たぶん他のブラウザでも問題は変わらないだろう。 Googleのトップページの場合、コードを調べてみた限りでは、原因はどうも検索候補の自動補完用のコードみたいだ。現在の入力文字列が過去の記録と違ったら補完の提示をやり直す、みたいなことをやっているように見える。 HTMLではテキストボックス内のテキストが変更され

    Googleのトップページを開くと毎秒100回JavaScriptが実行されるよ - 射撃しつつ前転 改
    nilab
    nilab 2009/10/01
    Googleのトップページを開くと毎秒100回JavaScriptが実行されるよ - 射撃しつつ前転:「原因はどうも検索候補の自動補完用のコードみたいだ。現在の入力文字列が過去の記録と違ったら補完の提示をやり直す、みたいな」
  • 1