2010年1月11日のブックマーク (4件)

  • すべての漢字を取り出す正規表現 - totonのブログ

    http://www.unixuser.org/~euske/doc/python/sample.py.html # 日語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html [亜-煕]はJIS漢字を検出するときに使う正規表現になります。 文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので,すべての漢字を検出するには,[一-龠]を使用してください(龠は音読みで「ヤク」,訓読みで「ふえ」,Unicodeでは「9FA0」にあたります)。 追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。

    すべての漢字を取り出す正規表現 - totonのブログ
    shak
    shak 2010/01/11
  • 「もののけ姫」の基礎知識

    ※以下の文章は「キネマ旬報臨時増刊/宮崎駿と『もののけ姫』とスタジオジブリ」(97年9月2日/キネマ旬報社発行)に掲載されたものです。 映画『もののけ姫』には、莫大な量の情報が詰め込まれている。猛烈な速度で駆け抜ける画面には、その隅々に至るまで、新しい歴史観、新しい民俗学・考古学的視点、そして生命の倫理が貫かれている。また、物語は緻密かつ重層的に構築されており、画面には直接登場しない組織や人物たちによる文字通りの暗闘が背後にある。 稿は、その一端を明かにすることを目的とする。ただし誌面の制約上、各項ともあくまで概括的な言及に留まっていることを御容赦願いたい。(詳述は別の機会に行っているので、そちらを参照のこと。) �氈C『もののけ姫』の勢力地図 『もののけ姫』には、「人間の世界」として、一つの異民族と四つの政治勢力が描かれる。そして、四つの勢力と対立する「神々の世界」がある。各勢力の構成

    shak
    shak 2010/01/11
  • WhatTheFont : MyFonts

    To identify a font from an image, use a font finder or font identifier. These tools are great for finding the name of a font or similar alternatives. All you need to do is upload an image of the text by having it readily available on your device or taking a photo. Yes, WhatTheFont is a simple and easy font finder that can help you identify fonts. Just upload an image of the font you need identifie

    WhatTheFont : MyFonts
    shak
    shak 2010/01/11
  • PHPを使ったWebサイト構築 備忘録

    共用レンタルサーバ「さくらインターネット」にcakePHPを導入する場合で、サブドメインで運用する場合は下記の設定とする。 ■[cakePHP]さくらインターネットに導入する(cake体とwebrootを分ける)[サブドメインで運用] これをサブドメインではなく、既存ドメインの下階層で動作させる場合の設定は下記の通りとする。 続きを読む

    PHPを使ったWebサイト構築 備忘録
    shak
    shak 2010/01/11