タグ

perlに関するn246のブックマーク (131)

  • [を] UTF-8 の文字にマッチする正規表現

    UTF-8 の文字にマッチする正規表現 2006-03-09-1 [Programming] UTF-8の文字にマッチする正規表現の素直版。 レガシーなのに対応するとき用にメモ。 [\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}|[\xF0-\xF7] [\x80-\xBF]{3}|[\xF8-\xFB][\x80-\xBF]{4}|[\xFC-\xFD][\x80-\xBF]{5} 1 2 3 4 5 60xxxxxxx 110xxxxx10xxxxxx 1110xxxx10xxxxxx10xxxxxx 11110xxx10xxxxxx10xxxxxx10xxxxxx 111110xx10xxxxxx10xxxxxx10xxxxxx10xxxxxx 1111110x10xxxxxx10xxxxxx10xxxxx

  • [鏡] 入門 JSON -- 戯れ言++

    ここではあまりプログラミングの話はしないのですが(私も今気がついた), たまにはいいでしょう。 今回は JSON というデータフォーマットのお話です。 めっさ長文です。 ご注意を。 (3/8 追記があります) 最近 JSON (JavaScript Object Notation)にハマってます。 JSON というのはごく軽量のデータフォーマットで, Javascript (というより ECMAScript と言うべきかもしれませんが)の言語仕様がベースになっています。 とはいえ, JSON 自体は Javascript からは独立していますので他の言語(C/C++, Java, C#, Perl, Ruby, Python など)でも問題なく扱うことができます。 JSON は以下の2種類のデータ構造の組み合わせでできています。 (JSON フォーマットの詳しい解説をご所望の方は「入門 J

    [鏡] 入門 JSON -- 戯れ言++
  • YappoLogs: WWW::2chを正式リリース

    WWW::2chを正式リリース 2ちゃんねるのスレッドを簡単に取り扱うWWW::2chをCPANにageました。 WWW-2ch-0.04 ・ローカルにあるdatをパースするメソッドの追加 ・キャッシュされているdatを取り出すメソッドの追加 ・各プラグインで利用するサイトのencodeの取得 ・Jbbsのサポート などが追加されています。他にも痒いとこに手が届きそうなものも追加してます。 上2つはサーバに接続をせずに手元のデータだけを使用しているので 一度取得したdat等を後でデータマイニングしたい場合に有効になります。 ただしhttp://www.2ch.net/ 2ちゃんねるのデータの利用に関して、原則的に自由ですが、 2ちゃんねるのデータ自体を利用して対価を取る行為はご遠慮下さいには注意してくださいです。 各種データをサーバから取ってくるときも極力余計な通信を発生させないように注意

  • 4-2. Perl の危険な関数

    Perlには他のプログラムを起動したり,文字列で与えられた式を実行時に解釈実行する機能を持つ関数が用意されている。こうした関数に与える引数は,十分に吟味しないと,悪用されて意図しないコマンドを実行させられる。 Perlには外部プログラムとの連携機能が複数組み込まれている。Perlは連携機能を実現するため内部的にUnixシェルを起動する(注1)。そのため連携機能をユーザ入力データなどの外部から与えられるデータと組み合わせて使用する場合,外部からシェルコマンドを混入され実行されてしまう可能性がある。次の関数はこのような問題につながる注意すべき関数や構文である。 open system, exec, ``(backticks) <>(fileglob),glob C言語などのコンパイル系言語と異なりPerlはスクリプト系言語である。Perlは実行時にプログラムを解釈して実行する。eval

  • Flickr の認証API - naoyaのはてなダイアリー

    認証API をどうするか、ということで数名のスタッフであれこれ話ながらやってます。 まず、はてなの認証APIを使って何ができるといいのかというところですが、はてなラボをオープンしたときにいただいた意見などを見ると、「はてなAPIで認証付きのをセキュアに利用するための API」というより「サードパーティのアプリケーションではてなIDでユーザーを識別できるためのAPI」の方が求められているという風に思いました。 具体的には、新規にユーザーを識別する必要のあるアプリケーション、例えば掲示板などを作るとして、その掲示板のユーザーを一意に識別する方法としてはてなIDを使いたい、そのIDが当にその人のものであるかどうかをはてなが保証する、その保証を問い合わせるための API ですね。その掲示板でログインして何かを書き込むと id:naoya、と表示されると。 この手の認証APIを提供しているサービ

    Flickr の認証API - naoyaのはてなダイアリー
  • [を] MeCabをPerlから使う

    MeCabをPerlから使う 2006-02-25-4 [Programming][NLP] NAISTの後輩のスーパーハカー taku-ku 氏作の形態素解析エンジン MeCab。 解析スピードは ChaSen より速いし、なにより今もメンテされてるのが 素晴らしい。20%ルール!? Perlモジュールもあって、しかも使い勝手も良いので Text::ChaSen [2006-02-24-3]は止めて、こっちを使っていこうかと。 MeCab: Yet Another Part-of-Speech and Morphological Analyzer <http://mecab.sourceforge.jp/> 以下を取ってきてすんなりインストール。何のバッドノウハウもなし。 - mecab-0.90rc9.tar.gz - mecab-ipadic-2.7.0-2005

  • [Perl] XML::FeedPP - RSS・RDF・Atomフィードの解析・生成・変換・結合

    Kawa.netxp [Perl] XML::FeedPP - RSS・RDF・Atomフィードの解析・生成・変換・結合 XML::FeedPP モジュールは、 RSS 2.0、RSS 1.0 (RDF)、Atom 0.3(および1.0)フィードの XML ファイルを解析・生成・変換・結合するための Perl モジュールです。 RSS ベースの1種類の共通 APIRSS・RDF・Atom の各フォーマットの処理に対応しているため、 手軽に扱えます。 フィードの読み出し・書き込みはもちろん、 RSSからRDFへ、RDFからAtomへといった各フォーマット間の相互変換も可能です。 他サイトからダウンロードした複数のファイルを結合して、 まとめて1つのファイルとして出力することもできます。 公開版アーカイブ: XML-FeedPP-0.43.tar.gz TARGZ CPAN ←通常パッケ

  • http://www.lanceweb.jp/indexj.html

  • イケてないプログラム(使えない成果物)に見られる3つの共通点

    クイックソートの話で書いたとおり、相変わらず Excel - VBA と格闘する日々が続いております・・・orz 「大企業にありがちな問題。委託開発の甘い罠・・・」でも書いたとおり、今まで外注して作ったソフトウェアってほぼ 100% の確率でイケていないものが完成してます。年末に納品されたソフトウェアのできも酷いの何のって・・・ さて、いままで見てきたイケてないプログラムのダメソースに共通して言えることが3点ありまして、 DRY ( Don’t Repeat Yourself ) でない。同じもしくは似たソースのコピペが至る所に散在する。 ロジックに無駄が多すぎ。行き当たりばったりで作った感、満点。 アルゴリズム知らなさすぎ。馬鹿ループ処理で時間かかりすぎ。 のいずれか、もしくは全部が当てはまります。大抵は全部ですね。こういったソースが納品されると、センス無いなぁ〜と思っちゃうわけ。こうい

  • dW : Linux : プログラミング改善への道: 第4回

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    dW : Linux : プログラミング改善への道: 第4回
  • Tcool.org

    Catalyst Advent Calendar目次 2005年度版 2005年末に公開されたCatalyst Advent Calendar。興味深い内容ではあったのですが、表紙にはカレンダーとSebastian Riedel氏の自画像があるばかりで目次らしいものが存在していませんので、目次がわりに各ページへのリンクを用意しました。いまのところ内容は特に訳していませんのでご注意をば。 Day 6 - Building PAR Packages PARを使えば簡単に持ち運びできますよ、と。 Day 7 - mod_perl Deployment mod_perlを使う長所と短所。セットアップの仕方。 Day 8 - Don't Repeat Yourself DefaultEndを使えば毎回sub end : Privateなんて書かなくてもよろし。 Day 9 - YAML, Y

  • SBP:結城浩の「Perlクイズ」

    自由課題は苦手です。 ポイントは "あえてHTTPクライアント" です。 欠点は、LWPモジュールがあるというのに...という点とヘッダもprintする点です。 use IO::Socket; $ARGV[0]=~m'http://([^:]+?)(:(\d+))?(/.*)'||die"usage: perl $0 http://.../...\n"; $s=IO::Socket::INET->new(PeerAddr=>$1.':'.($3||80)); $s->autoflush(1); print$s "GET ".$4." HTTP/1.0\n\n"; print$_ while(<$s>); 引数にURLを指定すると、そのページを表示するようです。 例えば、このファイルをhttp.plとすると、 perl http.pl http://www.yahoo.com/ で、Yaho

    n246
    n246 2006/01/12
  • http://www.multiburst.net/project-multiburst/archives/2006/01/06/2348.php

    http://www.multiburst.net/project-multiburst/archives/2006/01/06/2348.php
    n246
    n246 2006/01/12
  • Perlでブラウズ(HTTP)

    このページでは、インターネットでホームページなどをブラウジングするときに利用するHTTPプロトコルについて、Perlスクリプトを使って説明しています。 概要 HTTPプロトコルとは、Hypertext Transfer Protocolの略で、インターネットでホームページなどをブラウジングするときに利用しているプロトコルです。 HTTPプロトコルは、TCP/IP上のプロトコルで、通常80番ポートを使ってアクセスします。 詳細な定義は、以下のRFCで定義されています。 RFC-2068は、古くなっている(obsolated)ため、RFC-2616を参照しましょう。 RFC-1945 HTTP/1.0 RFC-2068 HTTP/1.1 (Obsolated) RFC-2616 HTTP/1.1 基的にHTTPプロトコルは、メッセージを要求(リクエスト)し、その応答結果(レスポンス)を表示す

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • 山口家の逆襲->perl-解説->クロージャ

    テーブルゲームで遊ぶなら人気No.1! ベラジョンカジノのオンラインテーブルがオススメです! 世界中のカジノは、運試しにゲームをし、人生を変えてしまうようなジャックポットを引き当てる様々なタイプの人間たちであふれている。カジノに来る人間のタイプは大方、予想可能で、いくつかのグループに分けられる。 タバコ好き TVシリーズ『Xファイル』に出てくる ” 煙草を吸う男” はミステリアスだが、カジノのスモーカーには謎めいたところなどない。彼らはただひたすらにタバコを吸い、ウエイトレスが灰皿をせっせと片付けなければならないだけだ。 タバコ好きたちは彼らの側を通りすぎる人たちとは違い、タバコの煙の刺激に慣れている。さらに、特に理由がなければ、誰も彼らの側にとどまりたくはないのだが、しょっちゅう咳をしては周りの注目を集めている。 酒飲み タバコと酒は切り離せない存在だ(もちろん、一概には言えない)。スロ

  • naoyaのはてなダイアリー - Perl のクロージャ

    いつもお世話になってるあの人とかあの人とかが山口家の逆襲->perl-解説->クロージャというクロージャの解説ページをブックマークしてるのをきっかけに、 Perl のクロージャについて自分もちゃんと理解できてるのかというのを考えてみましたが、どうも微妙です。 クロージャについて、何でいまいち理解しきれてない感じがあるのかというと、クロージャがどういうものであるかは知ってるけど、クロージャをどういう時に使うと良いのかが具体的にあれとこれという感じで思い付かないからなのではないかと思った。 なので、Perl でクロージャを使ってる実装とかを見て、どんなときに使われるものなのかをリストアップして理解を深めてみよう..のコーナーです。 クラスにデータを保持するためのクロージャ 僕がぱっと思いついたのは Class::DBI の中で使われている Ima::DBI におけるデータベースハンドラのキャッ

    naoyaのはてなダイアリー - Perl のクロージャ
  • [を] プログラミング関連メモ

    プログラミング関連メモ 2006-01-09-3 [Programming] 自分用リンク集。随時追加。 ■Perl - Perlクックブックソースコードリンク集 <http://www.sarinaga.com/progtoy/perlcookbooklink.html> Perlクックブックを持ってると相乗効果で便利。 - Perl Design Patterns at Perl Design Patterns Wiki <http://www.perldesignpatterns.com/?PerlDesignPatterns> - Perlモジュール作成に関するリンク[2006-02-03-3] - PerlとUTF8についての自分用メモ[2005-09-29-1] ■Ruby - プログラミングとその応用I <http://www.stdio.h.kyot

  • Perl5.8 の UNICODE 対応

    perl は 5.8 から Unicode(utf-8) がサポートされました.5.6 でも Unicode に対応はしていましたが,ぜんぜん使い物にならず,ようやく 5.8 でまともに使えるようになったということです.ただせっかく使えるにもかか わらず perldoc などを見てもイマイチ使い方がわからないので,独自にまと めてみたのがこのページです. 誤った書き方や勘違いをしてい ることもあるので,形式的ですがこのページの内容は無保証です. 内容 文字コード変換 perlIO jperlからの移行 UTF-8フラグ 文字コード自動判別 Unicode Standard Unicode 正規化 その他 参考資料 文字コード変換 とりあえず perl5.8 で新しく組み込まれた機能を見るために,euc-jp から shift_jis への変換スクリプトをいくつか載せます. openを利用し

  • ITmedia エンタープライズ:Perlは悪くない――CGIセキュリティホールの落とし穴 (1/2)

    比較的レガシーになってきた言語「Perl」に対し、旧サービスのメンテナンス不備が問題視されている。問題なく稼働中であっても、脆弱性が潜んでいる場合があるからだ。何に注意すればよいのか? 具体的に触れていこう。 先ごろ報じられた「Perlの脆弱性は氷山の一角か」は、一見するとPerl自体の問題? と思われるかもしれない。しかし、核心はPerl言語で作られたスクリプト(ソースコード)自体の問題だ。 PerlCGIと思われるほど広まっているこの言語は、フリーで配布されているものが多く、コンパイルする必要なくファイル属性にさえ注意すれば容易に動かすことが可能だ(仕組みの詳細は後述)。このため数多くのPerlスクリプトが公開されているが、十分にセキュリティ対策を行っていないものもある。見かけ上の動作に問題がなければ、セキュリティホールに気付かないことも多い。 「セキュリティプログラミング」とひと口

    ITmedia エンタープライズ:Perlは悪くない――CGIセキュリティホールの落とし穴 (1/2)