タグ

ブックマーク / leoclock.blogspot.com (8)

  • ぜひ押さえておきたいコンピューターサイエンスの教科書

    僕はバイオインフォマティクスという生物と情報の融合分野で研究を行っています。東大の理学部情報科学科にいた頃は同僚のマニアックな知識に驚かされたものですが、そのような計算機専門の世界から一歩外に出ると、それが非常に希有な環境だったことに気が付きました。外の世界では、メモリとディスクの違いから、オートマトン、計算量の概念など、コンピューターサイエンスの基礎知識はあまり知られていませんでした。コンピューターサイエンスを学び始めたばかりの生物系の人と話をしているうちに、僕が学部時代に受けた教育のうち、彼らに欠けている知識についても具体的にわかるようになってきました。 バイオインフォマティクスに限らず、今後コンピュータを専門としていない人がコンピューターサイエンスについて学ぶ機会はますます多くなると思われます。そこで、これからコンピューターサイエンスを学ぼうとする人の手助けとなるように、基礎となる参

    yuiseki
    yuiseki 2009/09/22
  • 民主党マニフェストのテストコード

    プログラミングの世界ではコードの動作を確認するために「テストコード」を書きます。仕様の変更などでコードを大幅に修正する機会は多いのですが、テストコードがあれば重要な機能が動かなくなった場合でも、すぐに確認できます。政治の世界でも、マニフェストの実現度合いを確認するための「テストコード」が必要ではないでしょうか。 テストコードを動かしてみると以下のようになります。今はマニフェストの実装(実現)段階なので、もちろん真っ赤(すべて動いていない状態)です。 テストをすべてパスすると、表示は緑になるはずです。 このようなテストコードがあると、政治の解釈、問題点がゆがめられていないかを、その都度確認していくことができます。一票を投じることも大切ですが、一般に分かりやすい部分しか報道しないマスコミに頼らず、各々が持つ専門的な知識(育児教育、研究、経済などなど)を活用して、自らの目で政治が行われる様を監

    民主党マニフェストのテストコード
    yuiseki
    yuiseki 2009/08/31
  • 研究者はどれくらい論文を読むのか?

    自宅にあった、ここ5年間に読んだ論文を集めたらこれくらいになりました。(ちなみに全部両面印刷。ラボにも、もう1山分?くらいあります) 今や論文のPDFファイルはネットで簡単に入手できる時代で(ただし英語に限る)、画面の大きなディスプレイなら、そのまま読んでも特に不自由がありません。(なぜ印刷するかというと、電車の中やカフェで読んだり、お風呂で読んでも安心だったり(え?)、読み終わったら子どもに落書きさせたり(ええ?)するためです)。とにもかくにも、印刷された論文は家に置いておくとスペースをとってしまうので、1ページ目だけ読んだ記録用に残し、後は廃棄するために、子どもがホチキスの針をはがしてくれました。いい子。

    研究者はどれくらい論文を読むのか?
    yuiseki
    yuiseki 2009/05/26
  • Top 5 Database Research Topics in 2008

    岡野原君が自然言語処理関連で2008年に読んだ論文のベスト5を紹介しています。それに倣って、僕も個人的にインパクトのあった2008年のデータベース研究のベスト5を集めてみました。 Michael J. Cahill, Uwe Röhm and Alan D. Fekete. Serializable Isolation for Snapshot Databases. SIGMOD 2008. (ACM DOI) 真っ先に思い浮かんできたのがこの論文。SIGMOD2008のベストペーパーでもあります。僕自身、トランザクション処理を長く研究していた経験から、Serializability(ディスクのread/writeの順番をあるプロトコルに従って入れ替えても、データベースの検索・更新結果に影響を与えない)を保障しつつ、一秒間あたりに処理できるトランザクションの数(つまりスループット)を上げる

    Top 5 Database Research Topics in 2008
    yuiseki
    yuiseki 2009/01/31
  • 正規表現に見切りをつけるとき

    Perl, Rubyなど手軽に使えるプログラミング言語に慣れてくると、あらゆるテキストデータの処理に正規表現(regular expression)を使ってしまいがちです。 けれど実は、正規表現の処理能力を超えるフォーマットというのが存在します。その典型的な例が、XMLやJSONのように、入れ子になったデータフォーマットです。

    yuiseki
    yuiseki 2009/01/31
  • これから研究をはじめる人へのアドバイス

    研究の世界 上の文章はもちろんネタですが、研究を続けていくと当にここに書かれたような、トップジャーナルに通ってなければ…、という世界が待っています。実際、僕自身もいつもこのような心づもりで研究しています。ただ、ひとつ気になったのは、自分自身の経験や、周りの様子を見る限り、Cell, Nature, Science (CNSと俗に言われます)などは、自分一人の実力だけで採録されるわけではありません。この人がいなかったらここまでの成果は出なかった、という貢献は確実にあるけれど、大抵は多くの人の長年の努力の積み重ねの結果acceptされています。 研究のインパクトの大きさ だから結果として、団体で金メダル!くらいには誇れますが、これを個人の功績と考えるのはあまりに決まりが悪いものです。僕が情報と生物の融合分野にいながら、情報系でかつ腕一でできる研究も続けているのは、この決まりの悪さを避けたい

    yuiseki
    yuiseki 2008/11/13
  • Google Street Viewが持ちえない情報

    Google Street View(ストリートビュー)が、写してはいけないものまで公開していることが多くのサイトで話題になっています。今日、「不適切画像の削除作業は小鳥並の知能で行われる」:高木浩光@自宅の日記のエントリをみて、根的な問題がようやく整理できました。 Google Street Viewが検索エンジンのロボットやウェブ上のブログなどと根的に違うのは、「人のフィルターを通さない情報をネットに晒している」ことに尽きます。 もちろんGoogle Street Viewのデータを収集するには、路上の写真を撮影する実際の作業員がいて、撮るべき場所の最低限の判断はしているのでしょう。(私道に入り込んでいたり、とそれすらも怪しいですが)。写ってしまった人の顔をぼかすなどの処理もしているようです。けれど、ネットに公開すべき情報とそうでない情報の判断を、98%の精度でスパムメールを弾くの

    yuiseki
    yuiseki 2008/09/12
  • [本郷でお散歩] PFIに行きました

    今週休みをとっていたので、この機会に、はてなの関連エントリー機能を実装するなど、いまを時めくPreferred Infrastructure(PFI) さんに遊びに行ってきました。忙しいところ快く応じてくれた社長の西川君、太田君に感謝。 以前、二人が会社を立ち上げたばかりのころに、データベースの話で盛り上がったことがあります。東大全体を見回しても、データベースシステムとその実装にまで興味がある人って意外と少なくて、Jim GrayのTransaction Processingを読んでいるなど、データベース屋さんの僕にとっては、貴重な話相手です。 ACM主催のプログラミングコンテストICPC東大内予選(と僕が勝手に呼んでいます。当は国内予選。ただ、各大学から3チームまでしか先に進めない)を勝ち抜けて、世界大会にまで出場するだけでもすごい人達なのですが。 今日は分散トランザクションについて

    [本郷でお散歩] PFIに行きました
    yuiseki
    yuiseki 2008/08/21
  • 1