タグ

ブックマーク / leoclock.blogspot.com (12)

  • ぜひ押さえておきたいコンピューターサイエンスの教科書

    僕はバイオインフォマティクスという生物と情報の融合分野で研究を行っています。東大の理学部情報科学科にいた頃は同僚のマニアックな知識に驚かされたものですが、そのような計算機専門の世界から一歩外に出ると、それが非常に希有な環境だったことに気が付きました。外の世界では、メモリとディスクの違いから、オートマトン、計算量の概念など、コンピューターサイエンスの基礎知識はあまり知られていませんでした。コンピューターサイエンスを学び始めたばかりの生物系の人と話をしているうちに、僕が学部時代に受けた教育のうち、彼らに欠けている知識についても具体的にわかるようになってきました。 バイオインフォマティクスに限らず、今後コンピュータを専門としていない人がコンピューターサイエンスについて学ぶ機会はますます多くなると思われます。そこで、これからコンピューターサイエンスを学ぼうとする人の手助けとなるように、基礎となる参

    Nagise
    Nagise 2009/09/24
    自分は勉強不足なのでこのうち2冊しか読んでない orz
  • 民主党マニフェストのテストコード

    プログラミングの世界ではコードの動作を確認するために「テストコード」を書きます。仕様の変更などでコードを大幅に修正する機会は多いのですが、テストコードがあれば重要な機能が動かなくなった場合でも、すぐに確認できます。政治の世界でも、マニフェストの実現度合いを確認するための「テストコード」が必要ではないでしょうか。 テストコードを動かしてみると以下のようになります。今はマニフェストの実装(実現)段階なので、もちろん真っ赤(すべて動いていない状態)です。 テストをすべてパスすると、表示は緑になるはずです。 このようなテストコードがあると、政治の解釈、問題点がゆがめられていないかを、その都度確認していくことができます。一票を投じることも大切ですが、一般に分かりやすい部分しか報道しないマスコミに頼らず、各々が持つ専門的な知識(育児教育、研究、経済などなど)を活用して、自らの目で政治が行われる様を監

    民主党マニフェストのテストコード
    Nagise
    Nagise 2009/08/31
    まてまて。自動テストならfake itでグリーンにしちゃうかもしれないだろ。ちゃんとリファクタリングされるってのか? ←fake itのスペルミスってた orz
  • SSD投入でDBMSのココが変わる! - WEB+DB PRESS vol. 52

    SSDを使うとDBMSはどう変わる?徹底検証した記事を書きました! WEB+DB PRESS Vol.52 予約受付中です。 実際に最新最速のSSD、Intel X25-Eを使ってDBMSのパフォーマンスを計測するなど、わくわくしながら記事を書くことができました。SSDの実力に驚きつつも、使い方を間違えるとHDDより遅くなる? など新しい発見もあり。 そして、SSDとHDDの違いがどのようにデータベースの性能に影響するのか?ディスク上のデータ構造(ヒープ、B+-treeなど)からバッファ管理など、データベースシステムの中身を解剖してわかりやすく解説しています。読みやすくなったのは丁寧に添削してくださった担当様のおかげです。感謝。 ディスクを活用したデータのソーティング(External merge sortなど)に加え、2009年6月にEdgar F. Codd Innovation Aw

  • 炭鉱のカナリア

    論文書きなどで論理を練る訓練をしていると、文章には、指す対象を「あいまい」にしたまま扱える「表現力の強さ」がある、と気付くようになりました。 論文ではあいまいな表現はすぐに潰しますが、ブログで書く文章では、対象を限定しすぎてしまわないように敢えて「あいまい」にしたり、意図的に、根拠などが「あいまい」な事柄をもとに「あいまい」なことを書いて、AでBになり、だからCという一直線のロジックだけではうまくとらえられないものを表現したりしています。 なので、曖昧かどうかの区別は、おそらく普通の人より随分とはっきりしていて、読み手がどの部分に「あいまいさ」を感じて、ひっかかるかは、把握しているつもりです。 それゆえ、はてブなどで、他の人にとっては「あいまい」な表現だと気づかずに、自分の世界の中だけしか意味の通じない文章を、敵意むき出しで投げかけられると悲しくなります。なぜなら、そのような言葉を投げかけ

    Nagise
    Nagise 2009/06/10
    論理的な思考をする能力が弱い人を利用して、論理的に難しい話題であるかどうかを計測するという炭鉱のカナリアメソッド。なるほど、いいえて妙だ。
  • イラストで知る研究の世界とその醍醐味

    例えば大学4年で卒業し就職してしまうと(法学部や経済学部に多い)全くといっていいほど研究の世界を知らないまま社会に出ることになります。日では、報道などのメディアに就職する方も学部卒ということが多いため、テレビ・新聞などで研究の世界について深く書かれた記事を目にする機会はほとんどありません。 NHKのサイエンス・ゼロなどの番組で、研究者の様子を垣間見ることもできます。しかし、番組は研究の世界の一側面を見せているだけであり(取材時間に比べてカットが多く、内容も製作者の主観に左右される)、研究の世界で活躍していて評判の高い人は、実はほとんどメディアにでてこない事情もあります(「21歳からのハローワーク(研究者編)」を参照)。そのような研究者は、論文という形で一生懸命アウトプットを出しているのですが、論文は学部教育や大学院、博士での研究トレーニングを経ないと読みこなせない(研究の内容だけでなく、

    イラストで知る研究の世界とその醍醐味
  • 正規表現に見切りをつけるとき

    Perl, Rubyなど手軽に使えるプログラミング言語に慣れてくると、あらゆるテキストデータの処理に正規表現(regular expression)を使ってしまいがちです。 けれど実は、正規表現の処理能力を超えるフォーマットというのが存在します。その典型的な例が、XMLやJSONのように、入れ子になったデータフォーマットです。

    Nagise
    Nagise 2009/01/27
    正規表現は再帰に無力。たしかに。
  • Leo's Chronicle: XML時代の終焉 ~ XMLから再びCoddへ

    先日、ACM SIGMODの日支部大会に招いていただいて、「Relational-Style XML Query (ACM Portal http://doi.acm.org/10.1145/1376616.1376650)」について講演をしてきました。Relational-Style XML Queryは、XMLという複雑な構造をもったデータに対して、SQLのようなテーブルデータへの検索に使われる言語で問い合わせする手法です。 この研究の肝は、木構造データといわれるXMLでも、実はそのほとんどがリレーション(Microsoft Excelのようなテーブル形式のデータ)の組み合わせと考えることができ、そのテーブル構造の情報(スキーマ)を使うと、検索が非常に簡単に書けるという点です。

  • 知性が失われて初めて言語が「亡びる」

    論文が読みやすいとしたら、それは良く練られているからだ。そもそも、わかりやすい表現が良いというのは、日語、英語の区別がない。文章を吟味することから「逃げ」て済むなら良いが、それでは投稿してもろくに読まれないから身を滅ぼす。安易にこのような考えに同調する人がいるのがとても心配だ。 日人が書いた日語論文であっても読みにくい例の枚挙には暇がない。口語の方がわかりやすい?口語中心のブログでも読みにくい文章はうんざりするほどある。(例えば、「日語が亡びるとき」の書評を批難したり、あるいは水村美苗人を攻撃するときに、読みやすく、かつ、知性をうかがわせる文章で応えた人はほとんど見受けられない) もし世界の標準が「日語」で、皆が日語で論文を書くようになったとしたらどうだろう。段落ごとに「てにをは」や「漢字」の間違いが出てくるような論文は、すぐに読む気がなくなってしまうのではないだろうか。 崩

    Nagise
    Nagise 2008/11/25
    これはちょっと主張を外している気がするなぁ。
  • たった一つの準備で勉強会は変わる

    について語るなら、まずを読む。輪講なら、自分が発表者でなくても、ざっとに目を通してわからない点をチェックしておくこと。 たったこれだけの準備で、グループでの議論は実りあるものになります。に書かれている以上の話ができるからです。その段階までいかなくても、わからなかった点を周りの人に確認し、の内容をより深く理解することができます。 準備をしてないとこうはいきません。まず、なぜこのを読んでいるかわからない参加者が出ます。さらに、の紹介者の話がわからなくなると、その段階で思考が停止する。あるいは明後日の方向の議論が始まってしまいます。輪講や勉強会のようにその場で内容を尋ねられるならまだ救いようがありますが、ブログのように対話的(interactive)な議論が難しいメディアでは、理解を深める術がありません。を読んでないから教えて、というのが通用するのは、その人が教えるに値する場合だ

    Nagise
    Nagise 2008/11/10
    件の発言、作った側の思いと使う側の思いの差はやむを得ないんだろうな。正しい議論とはどんなものなのかをもっと広めないといけない。サルのマウンティングみたいなことが議論だと思っちゃいけない
  • Leo's Chronicle: ブログのレベルを上げるポイント

    Nagise
    Nagise 2008/10/31
    かくしてマーケット至上主義のお笑い芸人は、誰にでもわかる幅の広い、つまらない話題や下ネタばかりを取り上げるようになるのだった。このあたりは悩ましい話題ではある。
  • Google Web Toolkitでcanvasを使って画像を描く方法

    Google Web Toolkit(GWT)は、Java言語からJavaScriptのコードを生成するものです。ブラウザ間のJavaScriptの動作の違いを吸収してくれるなど、ウェブアプリケーション開発の苦労をかなり軽減してくれます。GWTはもう十分実用的なのですが、まだまだ成長途中でgwt体のtrunkに正式に組み込まれる前の機能などは、Google Web Toolkit Incubatorというプロジェクトで開発されています。 gwt-incubatorの中で目玉なのが、GWTCanvasというライブラリ。これは、次期HTML5には標準搭載されるはずのcanvasタグの機能を使って、ブラウザ自身に画像を描画させるというものです。こちらのデモを見てもらえれば、意外と複雑な図が描けたり、アニメーションが作れるなど、そのすごさがよくわかると思います。Flashプラグインなどを使わない

    Google Web Toolkitでcanvasを使って画像を描く方法
  • プログラマとして生きるということ

    システムエンジニアプログラマーなどにおける過酷な労働条件を自嘲的に表現したもの。「土方」は差別用語及び放送禁止用語として扱われているため、使用の際には留意すること。 という意味だそうです。僕は研究者だけれど、プログラマでもあるので、プログラマが世間でこう呼ばれているのは非常に悲しいことです。プログラマというのは、当はとても魅力的な仕事です。土方で甘んじているのは、きっと「プログラマ」として生きていないのだとも思います。(例えば、矢野勉さんのエントリにも挙げられているような状況の人達です) プログラムをデザインする、ということ プログラムの場合、通常の土木工事と比べて顕著に違うのが、一度作ったコードを「一から作り直さないようにデザインできる」ということ。たとえば、コマンドライン引数を処理するプログラムを一度作ると、それをクラスの形に整理して(OptionParserクラスなどと名づけて)

  • 1