タグ

2009年4月16日のブックマーク (6件)

  • はてなブックマークFirefox拡張, JavaScript で IS 法 による Suffix Array 構築 - naoyaのはてなダイアリー

    昨日、はてなブックマークFirefox拡張をリリースしました。おかげさまでベータ版からダウンロード数は累積で1万ダウンロードを突破し、アクティブユーザー数も伸びています。 はてなブックマークFirefox拡張で新しいインターネットを体験しよう http://b.hatena.ne.jp/guide/firefox_addon 開発者の id:secondlife が g:subtech:id:secondlife:20090415:1239804170 で技術的な側面からのちょっとした TIPS なども紹介していますので、興味のある方はご一読ください。 検索では思いのほか SQLite の like 検索が高速なのに驚いた。はてブ検索では、検索ワードから URL, Title, コメント にマッチしたものを表示していて、それ専用の search_data だかかんらかの検索用カラムがある。

    mamoruk
    mamoruk 2009/04/16
    この話の続き期待 age
  • 仮説ツリーを伸ばして剪定して盆栽にすると美しい - Ockham’s Razor for Engineers

    はてなブックマーク - Looks cute, Looks weird - 2009年4月15日失敗、というほど重い言葉で捉えてないんだよな個人的には。仮説バイナリツリーみたいな木の枝を最初に大量に生やして、いらん枝から切って盆栽にすると美しくて正しい、みたいな感じ。えーと、☆をたくさんいただいたので自分で言及します。実際は、実験の仮説を間違えたまま4時間ぶっ通しで実験しちゃったとか、装置が壊れた(壊した)とか、装置を他で使ってるから今使えないとか、見つけた数理モデル1個だけでは自分の研究には足りなかったとか、一個の論文では仮説を補強するには不十分だったとか、ライブラリにバグがあったとか、いろんな目にあうんですけれど。基的には、研究における仮説とその検証は、盆栽作りに似ていると思います。つまり、日々の研究のプロセスに対して、あんまり失敗とか重い言葉を与えたり、いちいち深刻に考えないで、ち

    mamoruk
    mamoruk 2009/04/16
    伸ばして刈るというのは研究ではよく出てきますよね。実験もそうですし、論文もそうですし。切るとき「もったいない」と思ってためらうと大体いいことがない、みたいな……
  • Perl, Python, Ruby の比較

    コードの書きやすさは3つともそれほど違わないように思えます。ただ、読みやすさはダントツで Python が 優れています。Ruby はまずまずで、Perl は書き手の技量による部分が大きいのですが、 一般的には "読めない" コードになりがちです。 現在の人気を無視して、言語そのもののよしあしを考えると、 PythonRuby はほぼ互角でしょう。しかし、今のところ Python の方が、 実行速度が速く、ライブラリが豊富なので、とりあえず Python を使うことにします。 また、Python には対話モードがあるのも Lisp に慣れた人間にとってはありがたいです。 Ruby は今後の健闘に期待します。 5. おわりに 以上 Perl, Python, Ruby の比較をつれづれと書きましたがご参考になりましたでしょうか? 結論は、 Python, RubyPerl に比べ

    mamoruk
    mamoruk 2009/04/16
  • Flash-Based DBMSの最前線

    フラッシュメモリーを使ったSolid State Drive (SSD)の容量が160GBに到達し、市場価格も下がってきたことにより、ハードディスクの代替品としてSSDを使う用途がいよいよ現実味を帯びてきました。低容量のものなら既にiPodやデジカメ用のメディアなど身の回りにも普及しており、市場ではすでに「破壊的イノベーション(「イノベーションのジレンマ―技術革新が巨大企業を滅ぼすとき」より)」が起こっているといえます。(HDD搭載のWalkmanとか既に滅んでいる例もあるし。。。)

    Flash-Based DBMSの最前線
    mamoruk
    mamoruk 2009/04/16
    SSD の利点欠点を冷静に比較。研究は進んでいるのだなー
  • Flash Based Database Systems - moratorium

    Flash Based Database Systems 2009-04-16 (Thu) 8:41 SSD Flash/SSD上のDatabase Systemsについての論文リストが有ったので、気になるものを読みました。2007, 2008年でどかっと来てますねえ。 http://www.cse.ust.hk/~yinanli/readinglist.html SSDのデバイス特性は語られる事がまだ少ないので、そのうちまとめてみようと思います。嬉しい事ばっかりじゃ無いんだよ、という事です。 特にSmall Writeが苦手だというのは知っておかないと、実際に使う上で危険な気がします (ログとか)。 Similar Posts: 上流工程? What Every Programmer Should Know About Memory FFTによる多倍長乗算 Older: WordPres

    mamoruk
    mamoruk 2009/04/16
    SSD の落とし穴は small write が苦手ということ
  • オンラインEMアルゴリズム - DO++

    EMアルゴリズム(Expectation Maximizationアルゴリズム、期待値最大化法、以下EMと呼ぶ)は、データに観測できない隠れ変数(潜在変数)がある場合のパラメータ推定を行う時に有用な手法である。 EMは何それという人のために簡単な説明を下の方に書いたので読んでみてください。 EMのきちんとした説明なら持橋さんによる解説「自然言語処理のための変分ベイズ法」や「計算統計 I―確率計算の新しい手法 統計科学のフロンティア 11」が丁寧でわかりやすい。 EMは教師無学習では中心的な手法であり、何か観測できない変数を含めた確率モデルを作ってその確率モデルの尤度を最大化するという枠組みで、観測できなかった変数はなんだったのかを推定する場合に用いられる。 例えば自然言語処理に限っていえば文書や単語クラスタリングから、文法推定、形態素解析、機械翻訳における単語アライメントなどで使われる。

    オンラインEMアルゴリズム - DO++
    mamoruk
    mamoruk 2009/04/16
    EM もオンラインにできるのか