タグ

2009年9月25日のブックマーク (4件)

  • Microsoft Word 文書からテキストを抽出するモジュールを書いた - daily dayflower

    CPAN にはなさそげだったので書いてみました。 http://svn.coderepos.org/share/lang/perl/MSWord-ExtractContent/trunk/ 名前空間がどうよって気がするけど Word 文書に該当する名前空間が見当たらず,こんな感じにしてしまいました。まぁ coderepos の段階なので。なんかいい名前があったら教えてください。もし CPAN にあげるときにはそれにします。 図をおこしたほうがわかりやすくなるのですが,あんまりに面倒だったので図は描いてません。 Microsoft Word バイナリフォーマット Word バイナリフォーマット*1の仕様は Microsoft が公開しています。下記からダウンロードすることが可能です。 http://www.microsoft.com/interop/docs/officebinaryform

    Microsoft Word 文書からテキストを抽出するモジュールを書いた - daily dayflower
    gfx
    gfx 2009/09/25
  • ぜひ押さえておきたいコンピューターサイエンスの教科書

    僕はバイオインフォマティクスという生物と情報の融合分野で研究を行っています。東大の理学部情報科学科にいた頃は同僚のマニアックな知識に驚かされたものですが、そのような計算機専門の世界から一歩外に出ると、それが非常に希有な環境だったことに気が付きました。外の世界では、メモリとディスクの違いから、オートマトン、計算量の概念など、コンピューターサイエンスの基礎知識はあまり知られていませんでした。コンピューターサイエンスを学び始めたばかりの生物系の人と話をしているうちに、僕が学部時代に受けた教育のうち、彼らに欠けている知識についても具体的にわかるようになってきました。 バイオインフォマティクスに限らず、今後コンピュータを専門としていない人がコンピューターサイエンスについて学ぶ機会はますます多くなると思われます。そこで、これからコンピューターサイエンスを学ぼうとする人の手助けとなるように、基礎となる参

    gfx
    gfx 2009/09/25
  • 何を科学リテラシーとするか? - 発声練習

    科学リテラシーが何かはさておき、科学リテラシーが低いことで我々にとってどんな不利益があるかというと、専門家が正しいことをしようとしても我々自身がそれを阻んでしまうということが起こりえるというのが一番の不利益だと思う。世論のバックアップがなければ、専門家が科学的知見に基づいて正しいことをしようとしたとしてもそれを成し遂げることはできない。「自分が望んでいることなんだから、どんな不利益がでても良いじゃないか」という意見もあろうが、帰結を理解していて不利益をこうむるのと、利益があると誤解していて不利益をこうむるのでは話が違うと思うのが人情。 典型例が新型インフルエンザーへの対処、品偽装問題への反応、BSE問題での反応など。 一方で、何を持って科学リテラシーとするかといえば、社会の状況や生活環境においてどの科学的事実を「常識」として知っておいたほうが便利であるかというのは異なると思う。なので、考

    何を科学リテラシーとするか? - 発声練習
    gfx
    gfx 2009/09/25
  • PSGI/Plack勉強会 - Kentaro Kuribayashi's blog

    PSGI/Plack勉強会を開きました(ひとりで)。資料はGitHubにあげてあります。いろいろまとめ書き足りてないのですが、自分的には納得したので満足してしまいました。 http://github.com/kentaro/psgi-study 以下にもコピペ。 PSGI/Plackとは? PSGI = Perl Web Server Gateway Interface Specification WebサーバとWebアプリケーションとの間のインタフェイス仕様 Plack = PSGIのリファレンス実装 PSGI実装のひとつ(とはいえ、やたら気合いの入った感じになってるけど) PSGI != Yet Another WAF PSGI != Plack PSGI策定の背景 各Webアプリケーションフレームワークがバラバラに実装していた、WebサーバとWebアプリケーションとのインタフェイスを

    PSGI/Plack勉強会 - Kentaro Kuribayashi's blog