タグ

2009年6月1日のブックマーク (3件)

  • 『なぜ2時から5時までは3時間で、2日から5日までは4日間なのか?』

    (補注:このアーティクルの論考は、『かけ算には順序があるのか』岩波科学ライブラリーの第3章で整理されました。) http://www.iwanami.co.jp/.BOOKS/02/2/0295800.html 子どものとき疑問だったこの問題は、塾で教えるようになってから、数教協の(特に遠山啓の)を読んで、分離量・連続量という考え方を知って、氷解しました。私にとっては、数教協で目からウロコシリーズのベストスリーに入るものでしょう。ところが、mixiで発言したところ、なかなか同意を得られなかった。それ自体が、私にとって、新たな目からウロコシリーズでもありました。 http://mixi.jp/view_bbs.pl?id=42139232&comment_count=306&comm_id=63370 233番発言以降。 さて、 A:「2時から5時までは3時間。」 B:「2日から5日まで

    『なぜ2時から5時までは3時間で、2日から5日までは4日間なのか?』
  • JavaScript正規表現メモ。 (JavaScriptでよく使う書き方。) - こせきの技術日記

    タイトル変えました。旧タイトル「JavaScriptでよく使う書き方」。よく使うけど毎回忘れる。 正規表現にマッチするかどうか。 RegExp#testを使う。 /abc/.test("abcdefg") // => true String#searchはマッチした位置を返す。マッチしない場合は-1。先頭にマッチすると0でfalseなので注意。真偽値が欲しい場合はString#searchを使わない。 "abcdefg".search(/xxx/) // => -1 "abcdefg".search(/def/) // => 3 "abcdefg".search(/abc/) == false // => true 正規表現の部分マッチを得る。 部分マッチを得るには、RegExp#execかString#matchを使う。execとmatchの速度は大して変わらない。 正規表現のベンチマー

    JavaScript正規表現メモ。 (JavaScriptでよく使う書き方。) - こせきの技術日記
  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点