タグ

Perlに関するsassanoのブックマーク (267)

  • Kansai.pm #11 Social SKK - Kentaro Kuribayashi's blog

    今回のKansai.pm #11は、アルゴリズム特集ということで、いつもに増して濃い話が満載で、特にPFIの吉田さんの発表が強烈でした。とても楽しかった。 そんな中、僕もSocial SKKと題してお話しをしてきました(アルゴリズム特集とは全然関係ない話題ですが……)。というか、最初はXSのはなしをするつもりだったのだけど、時間がなさそうだったのでネタを変更したのでした。XSのはなしもいつかしたいですね。 んで、そのSocial SKKとは、Social IMEをSKKからも使いたいってなもので、既にid:shunirrさんがRubyで実装されているものをPerlでもやってみて、あとちょっと機能を加えましたよ、というものです。詳しくは以下のスライドで。 あと、ここで話したApp::SocialSKKをCPANに上げておきました。 Social SKKView more presentati

    Kansai.pm #11 Social SKK - Kentaro Kuribayashi's blog
    sassano
    sassano 2009/03/24
  • 堀江貴文 エンジニアは誇り高くあれ|【Tech総研】

    東京大学文学部宗教学宗教史学専修課程中退。1996年に「有限会社オン・ザ・エッヂ」を設立。2002年に旧ライブドア社から営業権を取得し、2004年に社名を「株式会社ライブドア」に変更。2006年に証券取引法違反容疑で起訴されて一審、二審ともに有罪判決を受ける。現在上告中。1972年福岡県生まれ。 今、非正規雇用の増加やいわゆる「派遣切り」が社会問題になっていますけど、僕が前の会社(ライブドア)で社長をやっていたときは、技術者派遣やSI会社の常駐社員などは一切使わなかったし、逆に自社の社員を派遣することもしなかった。社内ではこうしたシステムを利用するようにかなり説得されたけど、ここだけは頑固に譲らなかった。 唯一、派遣会社を使ったのは受付の女の子たち。いろいろとあって押し切られてしまったのだけど、彼女たちが望めば正社員にしていたし、希望すれば総務や経理に異動もさせていた。ほかに社員でない人と

    sassano
    sassano 2009/03/24
  • 第11回 Kansai.pm / スペルミス修正プログラムを作ろう - naoyaのはてなダイアリー

    昨日は第11回 Kansai.pm でした。 今回は無理を言って自分がホストを担当させていただきましたが、面白い発表が多く開催した自分も非常に満足でした。 PFI の吉田さんによる Cell Challenge での計算機に合わせたアルゴリズムのチューニング手法の発表 (発表資料) は圧巻でした。伊奈さんの文抽出の話 (発表資料)、はこべさんのコルーチンの話 (発表資料)、いずれも難解になりがちなところを凄く分かりやすく解説されていて、さすがだなと思いました。各々ショートトークも、いずれも良かったです。 スペルミス修正プログラムを作ろう 自分も 20 分ほど時間をいただいて、スペルミス修正プログラムの作り方について発表しました。 スペルミス修正プログラムを作ろうView more presentations from Naoya Ito. スペルミス修正プログラムについてはずばり スペル

    第11回 Kansai.pm / スペルミス修正プログラムを作ろう - naoyaのはてなダイアリー
    sassano
    sassano 2009/03/23
  • ASIN入りアマゾン商品画像URLリダイレクトCGIの雛形

    ASIN入りアマゾン商品画像URLリダイレクトCGIの雛形 2009-03-18-1 [Programming] アマゾンの商品画像のURLについて。 昔はアマゾンの商品ページにある商品画像URLには下記のようにASINが入っていました。 例:http://ec2.images-amazon.com/images/P/4822245772.01.MZZZZZZZ.jpg しかし、最近(って、もう何年もだけど)はASINが入らなくなりました。そのうえ、このURLをコピーして使っているとときどき無効になってしまったりします。 例:http://ec2.images-amazon.com/images/I/311qdsd1JaL._AA140_.jpg そこで、このブログで使うためにASINを渡すと商品画像URLへリダイレクトするCGIつくりました。CGIの雛形(テンプレート)を載せておきます。

    ASIN入りアマゾン商品画像URLリダイレクトCGIの雛形
  • Locality Sensitive Hashing に挑んでみた - download_takeshi’s diary

    久々のエントリです。 Locality Sensitive Hashing を perl で使うためのモジュールを書いてみました。Algorithm::LSHと名付けました。 先ほどDeveloper ReleaseとしてCPANにあげましたが、反映されるまで時間かかるので、興味ある方はcodereposからみてください。 Algorithm::LSH CPAN: http://search.cpan.org/~miki/Algorithm-LSH/ coderepos: http://coderepos.org/share/browser/lang/perl/Algorithm-LSH 超アルファバージョンな状態ですが、そのうちgithubにもupする予定。 そうそう、そう言えば WEB+DB PRESS Vol.49 にレコメンドエンジンの特集があって、その中に偶然にもLocality

    Locality Sensitive Hashing に挑んでみた - download_takeshi’s diary
    sassano
    sassano 2009/03/20
  • 米国でRuby関連書籍の売り上げが減速か - @IT

    2009/02/27 出版社の米オライリー・メディアは2月25日、プログラミング言語関連書籍の2008年の売り上げデータから、各言語関連書籍の市場シェアを可視化したデータを公開した。データはオライリー1社のものではなく、書籍販売のPOSデータを管理・提供するニールセン・ブック・サービシズから得たものという。 データを可視化して分析を加えているのは、オライリー・メディアのOpen Tech eXchange部門で発行人を勤めるマイク・ヘンドリクソン(Mike Hendrickson)氏。2月25日付けのブログ投稿によれば、2008年のプログラミング言語関連書籍の売り上げ実績は174万部で、2007年の185万部から5.9%減少。ただし、コンピュータ関連書籍全体は8%減少しており、これと比べてプログラミング言語関連書籍の売れ行き自体は特に悪いわけではないという。 ヘンドリクソン氏が公開したグラ

    sassano
    sassano 2009/02/28
  • Yahoo! ウェブ検索 API で単語同士の近さを総当たりで調べる

    Yahoo! ウェブ検索 API で単語同士の近さを総当たりで調べる 2009-02-26-2 [Programming][YahooHacks] あらかじめ用意された単語セットがあり、それぞれの単語同士の近さを検索ヒット数とそれによるシンプソン係数で求める手順について。 使用している Web API の提供が終了となったため、現在動作しません。ご了承ください。 Yahoo!デベロッパーネットワーク (YDN) のウェブ検索 API を用いる。 - Yahoo!デベロッパーネットワーク http://developer.yahoo.co.jp/ - Yahoo!デベロッパーネットワーク - 検索 - ウェブ検索 http://developer.yahoo.co.jp/webapi/search/websearch/v1/websearch.html ロジック やってることは、下記で書かれ

    Yahoo! ウェブ検索 API で単語同士の近さを総当たりで調べる
  • Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法

    Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法 2009-02-26-1 [Programming][YahooHacks] Yahoo!デベロッパーネットワーク (YDN) のウェブ検索 API を用いて、入力キーのウェブ検索ヒット件数だけを取り出す簡単な方法について。 ウェブサービスを用いて自然言語処理っぽいことをやろうというときの基中の基。 使用している Web API の提供が終了となったため、現在動作しません。ご了承ください。 - Yahoo!デベロッパーネットワーク http://developer.yahoo.co.jp/ - Yahoo!デベロッパーネットワーク - 検索 - ウェブ検索 http://developer.yahoo.co.jp/webapi/search/websearch/v1/websearch.html Y!API に投げる

    Yahoo! ウェブ検索 API で検索ヒット数を取り出す簡単な方法
  • Perlはもう終り? | | プログラマ2.0日報 | あすなろBLOG

    というのはですね、私が使ってるサーバで事故があって、いろいろとサイトを再構築していたのですが、私のことですから、自分が Perl で書いた古い CGI が大量にあって.... というわけで、完全復旧なんてできないかも?ともなってます。で、古いCGIを復旧するためには、当然、CPAN からライブラリを取ってきて、入れなおすことが必要になります。結構盛んにCPANライブラリを使って書いてましたからね....で、です。そこで気がつくのですが、あれ....CPAN ライブラリのバージョン更新があまり進んでない.....ということなんですね。たとえば、用途から考えて、現役でちゃんとメンテされているに決まっている XML::RSS あたりを基準に考えると、  2009年:2、2008年:8、2007年:1、2006年:4というくらいの更新があります(要するについさっきも更新があった、くらいの頻度)。そ

    sassano
    sassano 2009/02/19
  • Perl/XSが得意なこと - Islands in the byte stream (legacy)

    最近ひたすらXSを書いていて思ったのが,XSはやっぱり速いということ。 ただ,いつでも無条件に速いというわけでもなく,何も考えずに書くとPurePerlのコードより遅くなることも珍しくない。実際,最近書いたShikaやMOPのXS版もいきなり高速だったわけではなく,一番最初のコードはPurePerlのほうが10%-30%ほど高速だった。 いろいろベンチマークをとった結果の感触として,XSの得手・不得手が分かってきたのでメモしておく。ちなみに下記で「注意を払う」というのは内部で呼ばれるmalloc()を極力減らすという意味で使っている。SVの生成自体はmalloc()を伴わないことが多い*1が,文字列の生成/連結や配列の生成/push/unshiftでは内部でmalloc()が呼ばれる可能性が高く,速度を落とす原因となる。 得手分野 ループ - XSのループが早いというより,Perlのループ

    Perl/XSが得意なこと - Islands in the byte stream (legacy)
    sassano
    sassano 2009/02/16
  • URIモジュールにutf8フラグつきの文字列を食わせたらquery_formのエンコードが化けたでござるの巻 - とあるモバイル系エンジニアの日々

    タイトル長い。っていうかそのまんまです。 #!/usr/bin/perl use strict; use warnings; use URI; my $s = 'http://example.com/?q=%82%e2%82%e9%95v%82%c5%8aw%82%d4'; utf8::upgrade($s); my $uri = URI->new($s); my %qf = $uri->query_form; $qf{flag} = 'ON'; $uri->query_form( %qf ); my $uri_str = $uri->as_string; これ、一見すると$uri_strは http://example.com/?q=%82%e2%82%e9%95v%82%c5%8aw%82%d4&flag=ONになりそうなんですが、実際には http://example.com/?q=

    URIモジュールにutf8フラグつきの文字列を食わせたらquery_formのエンコードが化けたでござるの巻 - とあるモバイル系エンジニアの日々
    sassano
    sassano 2009/02/11
  • use utf8 環境下で => オペレータの左辺が UTF8 flag on になってしまう - daily dayflower

    use strict; use warnings; sub Dump { @_ = map { sprintf "'%s'(%s)", $_, utf8::is_utf8($_) ? 'utf8' : 'bytes' } @_; print {*STDERR} join(q{, }, @_), "\n"; } no utf8; Dump( foo => 'bar' ); #=> 'foo'(bytes), 'bar'(bytes) no utf8; だもんで,両者とも bytes なのは,まぁあたりまえ。 ところが,これを use utf8; で動かすと…… use utf8; Dump( foo => 'bar' ); #=> 'foo'(utf8), 'bar'(bytes) foo の UTF8 flag が on になってる! use utf8 にしてたので,任意の文字列リテラルが

    use utf8 環境下で => オペレータの左辺が UTF8 flag on になってしまう - daily dayflower
    sassano
    sassano 2009/02/01
  • 2009-01-30 - metal-heartの研究日誌

    sassano
    sassano 2009/01/30
  • [O] Module::Refresh で、Perlデーモンを再起動しないでモジュールの変更を反映する

    « 魚真 乃木坂店 ばらちらし | トップページ | ちか八の鯛焼き » Module::Refresh で、Perlデーモンを再起動しないでモジュールの変更を反映する [日記] 最近作ったPerlのデーモンで読み込んでいるモジュールがあるのですが、 毎日そのモジュールのコードを書き足しているので、 書き足すたびにデーモンを再起動しなきゃいけない寂しい状況です。 でも、Perlって、こういう状況を嫌がる人が使ってるはず。 すかさずCPANで「refresh」というキーワードで検索したら、 以下のモジュールが見つかりました。 - Module::Refresh - Refresh %INC files when updated on disk - search.cpan.org -- http://search.cpan.org/~jesse/Module-Refresh-0.

    sassano
    sassano 2009/01/29
  • Revilist、13桁ISBN対応しました

    Revilist、13桁ISBN対応しました 2008-12-28-1 [Maintenance][Programming] 先日公開した、 アマゾンの商品のカスタマーレビューを一気に表示するサイト 「Revilist」ですが[2008-12-25-1]、 ASINだけでなく13桁のISBN(ISBN-13)も使えるようにしました。 - Revilist - アマゾンのレビューを一気読み ttp://revilist.net/ ISBN-13をASIN(ISBN-10)に変換してから、 既存の Revilist の枠組みに投げるようにしています。 ■変換ロジック (1) 13桁の数字文字列から、最初の3文字と最後の1文字を削除する。 9784774133416 → 978[477413341]6 → 477413341 (2) 各桁の数字をそれぞれ左から10倍、9倍、8倍、...、3倍、2

    Revilist、13桁ISBN対応しました
  • TTYtter: an interactive console-mode text based Twitter client and Perl platform

    TTYtter is dead. Long live Oysttyer (or Texapp, if you're on ADN). TTYtter had a long life, running regularly from 2007 to 2012, and was consistently the first thing people reached for when you wanted a "text Twitter." It maintains a tremendous user base even on platforms with other choices, and even now, almost three years later, people are still using it. That was during a time when I actually w

  • DJ_SATORUの研究日誌 » Blog Archive » コマンドの並列実行(part.3)

    Perlでマルチスレッドを使う場合、メモリに注意しなければならないようです。 というのも、Perlのthreadsモジュールはメモリをう代物らしくて、下手に作り過ぎるとメモリがオーバーフローして処理が中断されてしまうようです。 例えば、以下のプログラム。@textで任意の数のファイルを指定して、それをCaboChaで係り受け解析していきます。係り受け解析は、$pで指定した数だけ同時に並列実行させます。

    sassano
    sassano 2008/12/11
  • XSとPuerPerlの二つの実装を持つモジュールの書き方 - Islands in the byte stream (legacy)

    XSとPurePerl(PP)両方の実装を持つモジュールは少なくない。たとえば: Data::Dumper List::Util/Scalar::Util (List-Scalar-Utils) List::MoreUtils Class::MOP Params::Util (>=0.35) Params::Validate Data::Util DBI JSON/JSON::XS Text::CSV/Text::CSV::XS このように一般的に使われることなのだが、その書き方は多様で定説がない。 Data::Dumperは関数を別の名前で用意し、実装を切り替えるインターフェイスを持つ。 List-Scalar-UtilsはXSがデフォルトで、さらにXSでのみ提供している関数があり、そのような関数はインストールの状態によっては利用できない。なお、そのためにTask::Weakenという特

    XSとPuerPerlの二つの実装を持つモジュールの書き方 - Islands in the byte stream (legacy)
    sassano
    sassano 2008/11/29
  • URL を転送してリンク元 URL を分からなくする方法

    URL を転送してリンク元 URL を分からなくする方法 2008-11-27-1 [Tips][Programming] URL を転送してリファラーを分からなくする方法について。 (1) CGI でリダイレクトする方法。 perl の例。 r.cgi : #!/usr/bin/perl print "Content-type: text/html\nRefresh: 0; URL=" .substr($ENV{PATH_INFO}.(($q=$ENV{QUERY_STRING})?"?$q":""),1)."\n\n"; (サンプルなので、use strict とかそういうのはとりあえずなしで。) http://example.com/r.cgi/http://blog.example.com/?d=080101 ↓ http://blog.example.com/?d=080101

    URL を転送してリンク元 URL を分からなくする方法
    sassano
    sassano 2008/11/28
  • 「日本語テキストを分類するベイジアンフィルタ」を簡単につくるyo - download_takeshi’s diary

    数週間前の話になりますが、「はてブのリニューアル会見」の記事を読んでいたところ、はてブにも「自動カテゴライズによる記事分類」の機能が搭載されるとか。。。 同じようなタイミングで「似たようなモノ」というか「ほぼ同じようなモノ」を作っていたので、すごーくインスパイアされてしまいました。ジュワ〜。(アドレナリンの放出音) 数週間たってもいまだ興奮冷めやらぬ状態なので、今日はその件について書いてみようと思います。 Lingua::JA::Categorize - a Naive Bayes Classifier for Japanese document. http://search.cpan.org/~miki/Lingua-JA-Categorize-0.00001/ 「はてブのパクリ」ではありません。「ベイジアンによる日語テキスト分類器」を「簡単に作る」ことを目的としたモジュールです。 も

    「日本語テキストを分類するベイジアンフィルタ」を簡単につくるyo - download_takeshi’s diary
    sassano
    sassano 2008/11/26