bunhikoのブックマーク / 2006年3月21日

bunhiko id:bunhiko

2006年3月21日のブックマーク (8件)

すべての漢字を取り出す正規表現 - totonのブログ
http://www.unixuser.org/~euske/doc/python/sample.py.html # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html ［亜-煕］はJIS漢字を検出するときに使う正規表現になります。本文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので，すべての漢字を検出するには，[一-龠]を使用してください（龠は音読みで「ヤク」，訓読みで「ふえ」，Unicodeでは「9FA0」にあたります）。追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。
bunhiko 2006/03/21
正規表現

形態素解析

資料

UTF-8
リンク
単純な正規表現で実現する簡易形態素解析
bunhiko 2006/03/21
形態素解析

正規表現

Ruby
リンク
「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌
すべての漢字を取り出す正規表現を参考にPHPでトークンを切り出すサンプルを作成しました。 <?php // スクリプトはUTF-8で記述されています $str = <<<EOM ようこそphpspotへ！当サイトではフリーのwindows用php開発環境であるＰＨＰエディタ forWin や、フリーのＰＨＰスクリプト( PHP 掲示板,webshot,webimager,CMS 等 )、ＰＨＰツールバー、テレビバー、便利検索バー(Yahoo,Google,辞典検索)などを配布しています。その他、ＰＨＰ入門やＰＨＰ５ーＴＩＰＳ、ＰＨＰサンプル集、MySQL解説、ＰＨＰレンタルサーバー特集などのコーナーもあります。 EOM; mb_internal_encoding("UTF-8"); mb_regex_encoding("UTF-8"); $token = array(); // すべての
bunhiko 2006/03/21
形態素解析

正規表現
リンク
ほぼ日刊イトイ新聞 -マッチ箱の脳（WEB）篇
「マッチ箱の脳」という森川くんが書いた本は、その世界で、かなりの評判を呼んでいます。まだ、売り出されてまもないこの本を、森川君、WEB用に再編集して、「ほぼ日」に連載してくれることになりました。なんとふとっぱらで、骨惜しみしない男なのでしょう？！ ◆気前がいいだけじゃ生きられない。ただのケチでは生きている資格がない。謹んで、感謝の意をこめて、上記のことばを森川くんにささげさせていただきます。
bunhiko 2006/03/21
読物

資料
リンク
Site Cooler NZ | Points to Note When Shopping for a Washing Machine
Points to Note When Shopping for a Washing Machine There are different washing machines brands in New Zealand. When shopping, therefore, you need to ensure that first, you get a quality machine; a machine that will last through many years without breaking down. You check product warranties and reviews when shopping to ensure a machine is a good quality. The material of the drum can be enamel, plas
bunhiko 2006/03/21
JavaScript

学習
リンク
いやなブログ: 配列操作の比較表: Ruby, Python, JavaScript, Perl, C++
配列操作の比較表: Ruby, Python, JavaScript, Perl, C++ プログラムを書いていると、他のプログラミング言語の記憶とごっちゃになって、「配列の後ろに要素を追加するのは push だっけ、 append だっけ」などと混乱することがあります。特に Ruby, Python, JavaScript はコードの書き方が似ているので、この問題が起きがちです。そこで、備忘録として、 Ruby, Python, JavaScript, Perl, C++ の配列操作の比較表を作りました。一番慣れている Ruby を基準にしています。間違いなどがあったらご指摘いただけると助かります。他の言語のもあるといいなあ。 Ruby (Array) Python (list) JavaScript (Array) Perl (@) C++ (std::vector)
bunhiko 2006/03/21
JavaScript

Python

Perl

Ruby

まとめ
リンク
オブジェクト指向プログラム言語としてのJavaScript
このページでは、JavaScriptのオブジェクト指向言語としての側面を研究します。 JavaScriptは、HTMLの拡張という側面が注目されていますが、プログラム言語として見た場合にも、興味深い独自の特徴がたくさんあります。このページでは、これらJavaScriptの言語としての特性、特にオブジェクト指向言語としてJavaScript を見た場合の特徴について詳しく研究を試みます。 JavaScriptは、ほぼ完全なオブジェクト指向言語です。プログラマによるクラス定義、プロパティ定義、メソッド定義ができます。継承は、言語の基本機能としては用意されていませんが、基本機能の組み合わせにより実現できます。メソッドのバインディング(binding)はレイトバインディング（late binding）です。これは、JavaScriptが変数の型のない言語だからです。 JavaScriptに
bunhiko 2006/03/21
JavaScript

オブジェクト指向

学習
リンク
ここギコ！: 渡り歩く人工無脳
こども(てれび)さんとこの記事わあ。仕様がふらふらなので1週間で動かなくなりそう。こっちでちゃんとAPI作ります。うん、なんかそんな感じ。今日だけでも何度か取得したJSONオブジェクトの構造が変わってくの確認。まあ、できるだけ追っていくけど、APIもいずれ出るようですし、こういう方向性もあるよ（社内でも出ていたみたいですが）という問題提起のためだけの、徒花な感じのアレで。んで、このモジュールにせよ公式APIにせよ、外部から犬動かせたら、GPSによる自分の位置トラッキングとかの他にも、やりたかった事があったのを思い出した。なんかよく判らないが俺的に永らくテーマだった、「渡り歩く人工無脳」。ここギコのケータイ版やってた頃も、人工無脳のギコ猫エージェントを仮想空間で適当に移動させて、たまたま出会ったここギコユーザと人工無脳でアホ話、というコンテンツを作りたかったが、その頃は人
bunhiko 2006/03/21
人工無脳

開発
リンク
- 2006年3月22日
- 2006年3月21日
- 2006年3月20日