wkbyshnbtkのブックマーク / 2009年1月2日

wkbyshnbtk id:wkbyshnbtk

2009年1月2日のブックマーク (19件)

http://qootas.org/blog/archives/2006/06/perl_regex_perf.html
wkbyshnbtk 2009/01/02
regexp

perl

coding
リンク
Perlでカタカナひらがな変換
Perlでカタカナひらがな変換 2006-08-07-5 [Programming] Perlでカタカナひらがな変換をやろうと思ったら、 Unicode::Japanese を使うのが手軽なのかな。 - 山科氷魚 / Unicode-Japanese - search.cpan.org http://search.cpan.org/dist/Unicode-Japanese/ とりあえず使うことにしてみた。以下、適当なサンプルプログラム。 #!/usr/bin/perl # 入力はEUC-JPのTSVで住所とその読み仮名（カタカナ）。 # 出力はUTF-8のTSVで住所とその読み仮名（カタカナ＋ひらがな）。 use strict; use warnings; use Unicode::Japanese; while(<>) { chomp; my @col = split("\t",
wkbyshnbtk 2009/01/02
perl

日本語処理
リンク
今日のCPANモジュール（跡地）目次
Redirecting… Click here if you are not redirected.
wkbyshnbtk 2009/01/02
module

perl

Web-Scraper
リンク
UserAction Extension でオレオレスクリプトのススメ (1)
ずいぶん寒くなりましたが、お元気ですか？元気があれば何でもできる。謎の人です。こんにちわ。机がないので立ち仕事ですよ！(嘘) みなさん、UserAction Extension、使ってますか？ Sleipnir の様々な機能を JScript/VBScript で開発することが可能になります。ユーザーが作成したスクリプトがアクションとして登録されるので、メニューやマウスジェスチャなどから呼び出すことができるようになります。私も、自分がちょこっと使うための「オレオレスクリプト」を日々作ってますよ。 Perl で。 Perl で ActiveScript な情報は意外に少ないので、以下、簡単に手順を。 ActivePerl をインストール resources/languages/default/english/ScriptEngine.ini に一行追記 pl=PerlScript p
wkbyshnbtk 2009/01/02
perl

sleipnir
リンク
HTML::Elementを返すようにした - download_takeshi’s diary
前々回のエントリで紹介した重要部分を抽出するperlモジュール「HTML::Feature」ですが、その後ジワジワと反響があって、意外なことにid:fubaさんから「HTML::Elementでデータを返してくれるといいなぁ」というリクエストまでいただくほどに。でようやく今週末に時間がとれたので、遅ればせながら対応してみました。 http://search.cpan.org/~miki/HTML-Feature-2.0.3/ 精度面でもわずかながらチューンアップを施しています。多分少しだけ精度が高くなっているはず。重要部分のHTML::Elementを取得する方法ですが、こんな感じでOKです。 use HTML::Feature; my $feature = HTML::Feature->new; my $result = $feature->parse("http://hogehog
wkbyshnbtk 2009/01/02
HTML-Feature

cpan

perl

module

HTML-Element
リンク
HTML::Feature - 重要部分を抽出するモジュール - - ダウンロードたけし（寅年）の日記
以前からCPANで公開していたモジュールがあるんですが、日本語での解説ドキュメントがなかったのと、最近大幅にブラッシュアップしたので、せっかくなので紹介記事を書きます。 HTML::Feature - Extract Feature Sentences From HTML Documents 「えいちてぃえむえる::ふぃーちゃー」と読みます。ブログやニュース記事など様々なHTML文書から「重要部分」を推測して抽出してくれる perl モジュールです。「重要部分」とはいわゆる「本文」のことですね。本文抽出とか焦点抽出とか色々な言い方があるかと思いますが、まぁ要するに特徴的な部分を推測して抽出するわけです。どういうものか。例えばブログ記事からヘッダーやフッター、その他のナビゲーションブロックを除いた「記事らしき部分」だけを切り取りたい、とします。ぱっと思いつくのは「特定のコメントタグ
wkbyshnbtk 2009/01/02
cpan

module

perl

HTML-Feature
リンク
技林ブログ: ピアノのコード表を出力するGD::Chord::Piano
This domain may be for sale!
wkbyshnbtk 2009/01/02
GD-Chord-Piano

perl

module
リンク
技林ブログ: DMMから情報を引っこ抜くPerlモジュール Net::DMM 作った
This domain may be for sale!
wkbyshnbtk 2009/01/02
Net-DMM

perl

module
リンク
bayashi.jp
This domain may be for sale!
wkbyshnbtk 2009/01/02
module

perl

test

Devel-Cover
リンク
BLOGOS サービス終了のお知らせ
平素は株式会社ライブドアのサービスをご利用いただきありがとうございます。提言型ニュースサイト「BLOGOS」は、 2022年5月31日をもちまして、サービスの提供を終了いたしました。一部のオリジナル記事につきましては、 livedoorニュース内の「BLOGOSの記事一覧」からご覧いただけます。長らくご利用いただき、ありがとうございました。サービス終了に関するお問い合わせは、下記までお願いいたします。お問い合わせ
wkbyshnbtk 2009/01/02
アンケート（世論調査）の「新聞、信頼している？」の信頼していないが8割以上ってのが、フレーミング効果かと。ヒューリスティクス

考え方

社会
リンク
IDEA * IDEA
ドットインストール代表のライフハックブログ
wkbyshnbtk 2009/01/02
まとめ

tool
リンク
IDEA * IDEA
ドットインストール代表のライフハックブログ
wkbyshnbtk 2009/01/02
git

github

まとめ
リンク
うるう秒のNTT時報
うるう秒のNTT時報です。左が普通の日の音、右がうるう秒の日の音です。音源はNTT DoCoMo、9時100秒前（8時58分20秒）から右側は0.01秒ずつ遅れます。
wkbyshnbtk 2009/01/02
うるう秒
リンク
2ch譲渡 : ひろゆき＠オープンSNS
ヽ | | | |／三す三　　　 /＼＿＿_／＼三ま三　　／　／　,、　＼ :: ＼三ぬ三. 　|　（●）,　、（●）、　| 　　ヽ | | | |／／| | | |ヽ .　|　 | |ノ(、_, )ヽ| |　:: | 　　　三す三 |　 | |〃-==‐ヽ| | .::::| 　　　三ま三＼ | | ｀ニニ´. | |::／　　　三ぬ三／｀ー‐--‐‐―´´＼　　　／| | | |ヽ(コメントを残す) タバスコ
wkbyshnbtk 2009/01/02
web

service
リンク
HTTP Response decoded_contentをちゃんと使ってみる - D-6 [相変わらず根無し]
HTTP Response decoded_contentをちゃんと使ってみる HTTP::Responseに格納された日本語ページをちゃんとデコードしてunicodeで持ちたかったので最初 my $body = $response->decoded_content(); ってやってたんだけど、これだとcp932 (!= Shift-JIS)でこけることが多くて、とりあえずヘッダーとMETAヘッダで見るかと思って以下のようにして、decoded_content() にcharsetが必要であれば渡されるようにした。 my %opts; if ( my $ct = $res->content_type ) { if ($ct =~ /charset=Shift_JIS/) { $opts{charset} = 'cp932'; } } if ( my $ref = $res->content
wkbyshnbtk 2009/01/02
HTTP-Response

perl

module
リンク
Perlメモ/IO::Fileモジュール - Walrus, Digit.
OOスタイルでファイルIOを行うためのIO::Fileモジュール。オブジェクト指向（OO）スタイルならファイルハンドルをがりがりいじってないでIO::File、ということの他に、IO::Fileオブジェクトであればサブルーチンやメソッドなどとの受け渡しがスマートなども良いところです。 IO::Fileモジュール自体はIO::HandleとIO::Seekableを継承していて、IO::Handleのread、write、getline、getlines、printなどの読み書きのためのメソッドや、IO::Seekableのseekなどのメソッドを使うことができます。ファイルを開くにはopenメソッドを、閉じるにはcloseメソッドを使います。 IO::Fileオブジェクトをnewメソッドで生成してから、openメソッドでファイルを開きます。 use IO::File; my $io =
wkbyshnbtk 2009/01/02
File関連のモジュールはいっぱいあるね。ただ、ファイルを行毎に処理するって感覚がなくなってきている。ConfigだとJSONとかYAMLもあるし。普通のデータはDB使ったり

IO-File

perl

module
リンク
Tie::Fileモジュールの使い方メモ - 備忘帳 - オレンジ工房
テキストファイルの各行に、perlの配列でアクセスできるモジュールなのです。変更は随時ファイルに反映されるので、用途によっては便利、用途によっては不便。個人的には、頻繁に使ってます。:-) ちょっとテキストファイルをどうにかしたいだけ、って時とか、使い捨てプログラムには、とりあえず早く書けていいです。ログファイルを部分的に取リ出して、処理してブラウザで見るとか（この用途に限ると`tail -n 20 ファイル名`;とかで済ますこともあるのですが）。 use Tie::File; tie my @array, 'Tie::File', "filename" or die; # 配列は0から始まるので、[0]が1行目。 $array[13] = 'blah'; # ファイルの14行目を'blah'に変更 print $array[42]; # ファイルの43行目をprint $n_recs
wkbyshnbtk 2009/01/02
ファイルを配列化

Tie-File

perl

module
リンク
うるう秒の瞬間を見てきた
日本標準時の維持・管理を行っている、NICT 独立行政法人情報通信研究機構の小金井本部にて、2009年1月1日に行われたうるう秒実施の様子を見てきました。NICT小金井本部の研究本館には、現在の日本標準時を示す電光掲示板があります。この掲示板を撮影し、うるう秒実施時の様子収めています。動画中でも言及していますが、今年は見学者の人数が多かったそうで。
wkbyshnbtk 2009/01/02
うるう秒
リンク
はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
はてなグループの終了日を2020年1月31日(金)に決定しました以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記はてなグループ日記のエクスポートデータは2020年2月28
wkbyshnbtk 2009/01/02
hatena

perl

module
リンク
- 2009年1月3日
- 2009年1月2日
- 2009年1月1日