タグ

ブックマーク / chalow.net (4)

  • Perl の正規表現の「名前付き捕捉」がとても便利

    Perl の正規表現の「名前付き捕捉」がとても便利 2014-08-07-1 [Programming] Perlの正規表現で「名前付き捕捉」を使うと、マッチした部分に名前をつけておけるのであとから参照するときに便利。 「(?<name>...)」でマッチさせると、ハッシュ「%+」に保存されて、「$+{name}」でアクセスできるのです。同じ正規表現内では「\g{name}」など。 サンプルプログラムです。日付表現にマッチしたら、年、月、日をそれぞれ別途格納。そしてそれを正規化して出力。 サンプルプログラム: #!/usr/bin/env perl use strict; use warnings; while (<DATA>) { chomp; if (m{ (?<Y>[0-9]{4})\s?年\s? (?<m>[01]?[0-9])\s?月\s? (?<d>[0-3]?[0-9])\s

    Perl の正規表現の「名前付き捕捉」がとても便利
  • テキストから辞書にある文字列をすべて取り出す簡単なプログラム (Pure Perl)

    テキストから辞書にある文字列をすべて取り出す簡単なプログラム (Pure Perl) 2014-05-09-1 [Programming][NLP] 機械学習のデータ加工用のスクリプト。辞書によりテキストから素性を抽出する簡単なプログラムです。先日ちょっと需要がありまして、Pure Perl で動くものを作りました。 あらかじめ用意された辞書(文字列とIDのペア)があり、テキスト中にその辞書の文字列が存在したら対応するIDを出力する、というタスクです。 辞書マッチは最長一致のみではなく、一部重なりや内包含むすべて。最長一致のみならば辞書エントリを長い順にならべてORでつなげた正規表現を作れば一発なのですが、すべて欲しいというわけで(疑似)TRIEを採用。ハッシュで TRIE という懐かしい実装です(初期のJUMAN風)。 ■辞書の例 (fepp-dic.txt)。フォーマットは「^エントリ

    テキストから辞書にある文字列をすべて取り出す簡単なプログラム (Pure Perl)
  • Emacs 初心者のための最低限のコマンド表

    Emacs 初心者のための最低限のコマンド表 2007-01-11-1 [Tips] 最強のエディタである Emacs はその敷居の高さでも最強かも。 なんてったってコマンドが多すぎで初心者はブルーになりがち。 しかもまわりの Emacs ユーザに使い方なぞ聞いた日にゃ、 「入門段階ではそもそも使いこなせないようなすごい機能」 の説明を嬉々として始めたりしがちで手に負えない。(偏見) というわけで、初心者向けに 「最低限これだけ使えればとりあえず大丈夫」 と思うものをまとめてみた。私も普段からよく使うコマンドたちである。 主に「Emacs操作キー一覧」 (http://www.magic.mediawars.ne.jp/tips/emacs_key.html) から抜粋。 上下左右へ移動C-p, C-n, C-b, C-f行頭・行末へ移動C-a, C-e1画面進む・戻るC-v, M-vファ

    Emacs 初心者のための最低限のコマンド表
  • tumblr に自動投稿するプログラムの雛形

    tumblr に自動投稿するプログラムの雛形 2010-02-19-1 [Programming][WebAPI] 様々な「ログ」を蓄積する場所として tumblr を活用していこうと考えていて、まずは tumblr に投稿するプログラムの雛形を作った。言語は Perl。 #!/usr/bin/perl use strict; use warnings; use HTTP::Request::Common; use LWP::UserAgent; my $api_url = "http://www.tumblr.com/api/write"; my $email = 'yto@example.com'; my $password = 'PASSWORD'; my $group = "ytotumblrapitest.tumblr.com"; my $date = "2010-01-01";

    tumblr に自動投稿するプログラムの雛形
  • 1