タグ

2009年9月29日のブックマーク (3件)

  • 次元が高い場合に関してのsimhashの計算 - tsubosakaの日記

    最近simhashの実装を行っていて、データの次元が高いとsimhashを計算するのに必要なランダムなベクトルをメモリ上に乗らないという事態が生じたのでad hocな方法で回避していたけど、論文[1]をよく見直すとほぼ同じ方法でより計算コストが少ない方法が紹介してあったので少し解説を行ってみる。ちなみに以下の解説では低次元のビットベクトルに縮約した後にハミング距離が近いものをどうやって探索するかについては述べないです、それに関しては[1],[2]を参照してください。 ちなみに自分が実装したのは各ビットごとに次元に対するハッシュ関数を定義して計算する方法でした。この方法だと以下で開設する手法よりもf倍の回数ハッシュ関数を計算する必要があるので実行時間が割とかかる。 解説 simhash[3](文献によってはLSHと呼ぶこともある[2])は次元削減の手法の一つで、高次元のデータを低次元のビット

    次元が高い場合に関してのsimhashの計算 - tsubosakaの日記
    msk
    msk 2009/09/29
  • 日本に居ながら、ナマの英語に触れる工夫 | Chem-Station (ケムステ)

    一般的な話題 日に居ながら、ナマの英語に触れる工夫 2009/9/26 一般的な話題, 化学者のつぶやき, 化学英語・日常英語 Nature, Web2.0, ポッドキャスト, 英会話, 英語 コメント: 0 投稿者: cosine グローバル化の流れにある現在、化学の世界に限らず、英会話スキルは各方面で必要不可欠となりつつあります。しかし日英語教育はちょっとどころではなくアレで、読み書きは何とかできても、聴きとれないし喋れない人間が量産されている惨状です。 日英語教育が文法・英作文偏重になっているのが主要因です。聞くところでは、日の高校レベルの英文法とは、英語圏では大学でようやく矯正されるレベルのものなんだとか。 そんなレベルの文法をなぜムリして学習しているのか?――その背景にあるのは、先生側が点数・成績を付けやすい教育システム=「管理側・オトナがラクできる」モチベーションに

    日本に居ながら、ナマの英語に触れる工夫 | Chem-Station (ケムステ)
    msk
    msk 2009/09/29
  • 技術者が金儲けして何が悪い?-頭脳流出のススメ - My Life After MIT Sloan

    Tech-Onの記事「だから技術者は報われない」を読んだ。 日企業で「ものづくり」に関わる優秀なエンジニアが、安い給料で働かされ、しかも「好きなことやってるんだから、給料安くても仕方ない」と思わされてること。 この手の記事を読んでいると、私はいつも思う。 「技術者がお金を儲けて、何が悪い?」 別に金儲けを人生の目的にしろ、と言ってるんじゃない。 自分のスキルや仕事の成果に対して、相当の対価をもらうのはグローバルスタンダードだ。 それを、恥ずかしいことだなんて思わないでほしい。 だって日技術者はこんなに素晴らしい技術力を持ち、シリコンバレーのアメリカエンジニアなんかより、よっぽど真面目で、いつも遅くまで働いて・・・。 それなのに何でこんなに給料も安く、待遇も悪く、さらに皆それに甘んじているのか、と思うと、ものすごく腹が立つ。 私は、報われない日の優秀な技術者は、こんな国でイジイジし

    msk
    msk 2009/09/29