タグ

ブックマーク / shidho.hatenablog.jp (10)

  • 「かなり使えるPHPの正規表現まとめ」にツッコんでみる。 - あそことは別のはらっぱ

    かなり使えるPHPの正規表現まとめに404 Blog Not Found:「PHP使いはもう正規表現をblogに書くな」と言わせないでくれがDisかまして、まあほどよく荒れているわけですが。 Idea*Ideaの中の人も既に突っ込まれているのに「個人的にまだ検証していないのであれですが」なんていいながら次のエントリを書いてますし、たぶん修正する気がないんだな、ということで、あの正規表現にツッコミをいれてみようと思います。 ちなみにはてなブックマークのほうでは、perlの正規表現とPHPの正規表現が違う(ゆえにperlでの例を見てもPHPの参考にならないのでは?)、と思っている人がいるみたいですが、今どきのPHPperlであれば、正規表現に差はほとんどないです。差があるとしても、間違ったマッチを書くよりは少ない差です。 あと、これはブクマコメントにも要旨として書いたのですが「正規表現がいく

    「かなり使えるPHPの正規表現まとめ」にツッコんでみる。 - あそことは別のはらっぱ
  • はてブお気に入られリスト2008年12月分 - あそことは別のはらっぱ

    えー、もともとこれは「お気に入られリスト」なので、各人自分のお気に入られが見られるようになった今、別に作る必要はなくなったものなのです。 ランキングとか別に作るつもりで作ってるやつじゃないのです。ということで前回で最終回にしようかと思っていたのですが、一応リニューアル後に取得するとどんな感じになるかな?というのは見ておいた方がいいかな、と思って、スクリプトを少し変更した上でリストを作成してみました。*1 しかし、時間がかかったなあ。followerページも取得するようにしたので、1人あたりの取得ページが2から3に変わっているのもあるでしょうけど、それにしても取得に29時間とかあり得ないというか。 これ、単純にHTML部分だけ取りに行くだけだから、faviconとか、Javascriptとか、はてなスターとか、取りに行かないんですよね。それでこの遅さ。頑張ってサーバ増強、なんてことになればい

    はてブお気に入られリスト2008年12月分 - あそことは別のはらっぱ
  • はてブお気にいられリスト2008年6月分。 - あそことは別のはらっぱ

    把握したブックマーカー: 9941 ブックマークの把握出来ないブックマーカー: 417 お気に入りを使ってなさそうなブックマーカー: 4605 のべお気に入り人数: 60564 ということで、こちらのほうにアップしておきました。 ちなみに、取得には7時間くらい。

    はてブお気にいられリスト2008年6月分。 - あそことは別のはらっぱ
  • はてダのはてブ内人気記事ベスト50を取ってくるperl script - あそことは別のはらっぱ

    http://d.hatena.ne.jp/tragedy/20080522/p1で作っているベスト50つうのは、人も言うとおり『d.hatena.ne.jp』 の人気エントリー - はてなブックマークを成形したものだそうで。 であれば、普通にスクレイピングしてくればいいのかな、ということで。 #!/usr/bin/perl use strict; use Web::Scraper; use URI; use utf8; # init my $entry_body = scraper { process '.entry-body > a.bookmark', 'url' => '@href'; process '.entry-body > a.bookmark', 'title' => 'TEXT'; process '.entry-body > a.domain' , 'writer'

    はてダのはてブ内人気記事ベスト50を取ってくるperl script - あそことは別のはらっぱ
    zonia
    zonia 2008/06/01
    お勉強のもとにしよう。
  • はてブお気にいられリスト2008年5月分 - あそことは別のはらっぱ

    把握したブックマーカー: 9725 たぶんはてブをもう公開してない人: 358 お気に入りを使ってない人: 4548 のべお気にいられ数: 59453 てなところです。ファイルはこちら。出力には約6時間。 昨日買った、先々月号のWeb+DB Pressを読んで、せっかくなのでJSON形式でも出力してみました。そうしたらファイルサイズが倍になりました。 一応、親サイトにはyaml→json変換スクリプトも載せておいてあるのですが、これ(JSONデータ)があるとなんか便利になったりするんでしょうか。はてブコメント等でご意見お聞かせ下さい。 あ、そうそう。 あまり関係ない(というか全く関係ない)ですが、先週「はてなアイデア」なんてアイデアを出してみました。

    はてブお気にいられリスト2008年5月分 - あそことは別のはらっぱ
  • はてブお気にいられリスト2008年3月分 - あそことは別のはらっぱ

    非常に忙しいことになりつつあります。 ということで、なんで遅れたのかとか、そう言う話は省略しまして、 把握したブックマーカー: 9326 引退したブックマーカー: 316 お気に入りを使っていないブックマーカー: 4381 のべお気に入り人数: 56961 データはこちらです。

    はてブお気にいられリスト2008年3月分 - あそことは別のはらっぱ
  • 被favとコメント数に関係はあるのか。 - あそことは別のはらっぱ

    さて、SBM論とかを読んでいると、「面白いコメントをつけてる人をお気に入りに」なんて話もあるので、被favの多い人がどのくらいコメントを付けているか見てみました。 被fav順位 id コメント数 被fav ave. 1 b:id:naoya 30 1038 2 b:id:umedamochio 2 703 3 b:id:jkondo 2 690 4 b:id:kanose 8 497 5 b:id:finalvent 3 426 6 b:id:miyagawa 2 335 7 b:id:laiso 0 315 8 b:id:otsune 4 314 9 b:id:Hamachiya2 15 225 10 b:id:lovelovedog 30 212 9.6 11 b:id:gotanda6 22 202 12 b:id:netafull 20 197 13 b:id:higepon 19

    被favとコメント数に関係はあるのか。 - あそことは別のはらっぱ
  • 被fav数を自動調査したいという思いはあるよね、ということで。 - あそことは別のはらっぱ

    例のはてなブックマーク被お気に入り登録数調査はてブWiki版だけど、やっぱりなんとか自動化したいなあ、と思っていて。 HTMLを読み込んで解析する、そこが面倒くさいなと思っていろいろ調べていたらHTML::TagParserというモジュールが結構簡単に使えそうだったのでちょいちょいとツールを作ってみた。(要YAML::Syck) 動作はこんな感じ。 タネとなるIDを初期ユーザーリストに指定してやる。*1 ユーザーリストからIDを取ってくる。 そのIDのお気に入り一覧をもらってくる。 お気に入り一覧が初めて見るユーザーなら追加。初めてでなければお気に入り数を1増やす。 ついでにそのIDの被fav数ももらってくる。 次のユーザーに進む。 昨日は試しに作って動かしては、うまく動かない*2ところを(間歇保存することで)おざなりに改善してみたりして。 2時くらいに自分をスタートにしたユーザー一覧が全

    被fav数を自動調査したいという思いはあるよね、ということで。 - あそことは別のはらっぱ
  • 2006-10-23

    さて、とりあえずfavりfavられやっている人の環が6000人弱で閉じてしまう件の対策としては、そこに含まれないbookmarkerを追加で探しに行くのがいいわけで。 publicなbookmarkerを探すには単純にブックマークページの一覧に書いてあるユーザーを見に行けばいい。ブクマページのソースを眺めつつ、HTML::TagParserでユーザー名を抽出できるようなスクリプトを作った。ここで出てきたユーザを追加ユーザーとして見に行けるようくだんのスクリプトをちょっとだけ改造。 ブックマークページの一覧で人がいっぱいいるところを探すなら、人気度ランキングで上位のページを見に行けばいい。確率的に1ページから取れる人数が多いから効率が高い。ところでサーバの負荷として考えると1ページの大きさが大きいページを取るのと、1ページの大きさが小さいページをいっぱい取るのではどっちが負荷が高いのかね。よ

    2006-10-23
  • あそことは別のはらっぱ。 - 2006-08-07

    テレビマンの独言:プロデューサーとの喧嘩というところの話。 僕が担当する、視聴者からの素朴な疑問を解決するコーナー。 「蚊の好きな血液型は何型か」というテーマについて、 専門家にお願いして番組で実験をし、よくさされるのはO型、 さされにくいのはA型と結論づけたのですが、放送直後にサブ(副調整室)で、 「根拠がはっきりしていない。シャレならシャレと言ってからVTRを流せ。 でなければ、こんな内容を放送してはいけない」 と言い出したのです。 ネタはデスクである僕がチョイスしました。 夏になれば必ずといっていいほど、多くの人が蚊に刺される。 さされやすい人とさされにくい人がいれば、 「血液型は影響するのか」という話にいくのは自然な流れです。 実際僕のまわりにも、毎年そんな話がわき起こるので、 当初があった瞬間に採用を決めました。 この後の記述で、喧嘩がよくある話であることは書かれているのですが、

    あそことは別のはらっぱ。 - 2006-08-07
  • 1