タグ

ブックマーク / fuba.hatenadiary.org (22)

  • パピョプパパピポポポパポMeCabポポピピペポンパプププ*1 - fubaはてな

    他消火が伊露露モナコMeCab55二時へホンがツクる ピャじゃなかった!なおした ニーズ "ヨッピーさんがしゃべってる言葉の変換系はまだできないんですか" "youpyさんのtwitterをフィードで読んでイラッとして自動翻訳書いてたけど10分ぐらいでアホかと思ってやめた" 実装 最新版のMeCabがピプピョプです。 % wget http://nchc.dl.sourceforge.net/sourceforge/mecab/mecab-ipadic-2.7.0-20070801.tar.gz % tar vxzf mecab-ipadic-2.7.0-20070801.tar.gz % cd mecab-ipadic-2.7.0-20070801 % wget http://fuba.moaningnerds.org/src/papyopu/conv.pl % perl conv.pl

    パピョプパパピポポポパポMeCabポポピピペポンパプププ*1 - fubaはてな
    youpy
    youpy 2008/09/08
    ピパプ
  • URLとXPathを渡すと値を返すツールをもっと極悪ぶっこ抜きができるツールに改造してる - fubaはてな

    jottitのほうに公式ページをつくりました。 値がとれるだけでは退屈、ページ辿りたいし、その先も辿りたいので機能追加。ずいぶんたくましくなりました。あとはキャッシュができればいいですねー。 追加したオプション n 次のページ(別に次じゃなくてもいいけど)のURLを返してくれるXPath、いっぱいマッチさせても最初の1つしかたどりません d ページを辿る回数、デフォルト1 s HTML::Elementがマッチしてる場合にHTMLソースを吐く f 処理しているURLも出力し、結果の値の前にはタブがついているフォーマット(いまひとつなのでなんとかしたい) URLのかわりに- 標準入力から改行区切りでURLをうけとる ためす twitterのfollowingリストを0回ページ継ぎ足しして、そこから抽出したユーザリストのfavoritesをさらに確認、彼らのfavってるユーザ名を集計する。 %

    URLとXPathを渡すと値を返すツールをもっと極悪ぶっこ抜きができるツールに改造してる - fubaはてな
    youpy
    youpy 2008/06/26
  • WedataにあるLDR Full Feedのsiteinfoを使ってフィードを全文入りにupgradeするPlagger::Plugin::Filter::EntryFullText::LDRFullFeed - fubaはてな

    lib/Plagger/Plugin/Filter/EntryFullText/LDRFullFeed.pm http://b.hatena.ne.jp/otsune/20080530#bookmark-8776502 SITEINFOはwedata版に書き換えたほうがよさそう とのことなので書き換えた。HTML::Featureを使ってもっと便利にしたかったのだけど、UAがうまく置き換えられない問題とかが残ってるのであいかわらずEntryFullTextを継承。なのでPPF::EFT::SiteInfoのEFTのyamlがうまく一緒に使えない問題が残ってます。あとPPF::EFT::SiteInfoも野良siteinfoがあればまだ使えるのでこっちは名前かえました。Webservice::WedataはkoyachiさんのところからとってきてくださいWebService::Wedataも

    WedataにあるLDR Full Feedのsiteinfoを使ってフィードを全文入りにupgradeするPlagger::Plugin::Filter::EntryFullText::LDRFullFeed - fubaはてな
    youpy
    youpy 2008/05/30
  • firefox.jpの転送先をしらべる - fubaはてな

    ランダムな転送という実装は、つまり十分な回数のアクセスを奨励している。とりあえず1001回の連続アクセスを試みる。 $ perl -MYAML::Syck -e 'my %urls;for my $i (0..1000) {if (`curl -l http://firefox.jp/`=~/src\=\"([^\"]+)\"/) {sleep 1; $urls{$1}++}} warn Dump(\%urls)' stderr http://archive.ncsa.uiuc.edu/mosaic.html: 60 http://browser.netscape.com/: 58 http://icab.de/: 65 http://java.sun.com/products/archive/hotjava/index.html: 50 http://jp.opera.com/: 53

    firefox.jpの転送先をしらべる - fubaはてな
    youpy
    youpy 2008/04/01
  • LDR Full Feedのsiteinfoを使ってフィードを全文入りにupgradeするPlagger::Plugin::Filter::EntryFullText::SiteInfo(2008/2/27仕様変更) - fubaはてな

    LDRでgを押せば全文出てくるべんりなLDR Full Feedだけど、個人的には自作の自動抽出のをつかってるのでいいなーと思いながら指をくわえてその進化を見つめています。ただXPathのsiteinfoはものすごく使えそうなので、とりあえず試しにPlaggerでただのりさせてもらうことにしました。siteinfoはキャッシュしてないのでちょっとまずいかもしれないけど、たぶんこのプラグインを使う人はほとんどいないので大丈夫でしょう。siteinfoの取得もPlagger::UAを使うようにしました。これでキャッシュできてる! と思う…。 lib/Plagger/Plugin/Filter/EntryFullText/SiteInfo.pm 元のEntryFullTextは継承して全機能がそのまま動くようになってるはずです。今つかってるconfig.yamlのmodule: Filter

    LDR Full Feedのsiteinfoを使ってフィードを全文入りにupgradeするPlagger::Plugin::Filter::EntryFullText::SiteInfo(2008/2/27仕様変更) - fubaはてな
    youpy
    youpy 2008/02/24
  • glitch20071121.pl - fubaはてな

    usage % perl glitch20071121.pl [filetype] [frequency param] [repeat] < [src] > [dist]% perl glitch20071121.pl image 1000000 10 < sakkaku.jpg > sakkaku_glitch.jpg % perl glitch20071121.pl text 13 2 < netrunner.txt > netrunner_glitch.txt jpeg image japanese text from http://mala.nowa.jp/entry/41ca6cdb15 インターネットはとても楽しい。インターネットを使っているのかをタダで聴くことができた。もっとである修正のかをを見ことができた。もっと機DVDを見プロテクトをはずす事ができた。P2Pでラジオを中継

    glitch20071121.pl - fubaはてな
    youpy
    youpy 2007/11/21
    グリッチ、テキスト、画像
  • glitch20071120.pl - fubaはてな

    第1引数は画像ファイル、第2引数の等倍が壊すbyte。 usage perl glitch20071120.pl ../Documents/icon/sakkaku.jpg 10000 > ./a.jpg code #!/usr/bin/perl my ($source, $param) = @ARGV; open my $image, '<', $source; my $string; while (<$image>) { $string .= $_; } close $image; my @array = split //, $string; my %bigram; for my $i (2..$#array) { $bigram{$array[$i-1]}->{$array[$i]}++; } my @newarray = ($array[0]); for my $i (1..$#a

    youpy
    youpy 2007/11/20
  • HTML::FeaturedImage - URLに含まれる画像のうち、重要そうなものを取り出すためのPerlモジュール - fubaはてな

    yuisekiが「エントリのメイン画像抽出があるといいかも」と言ってたときに、昼飯まで暇だったので作った。結果のサンプルはこちら。 仕組みはてきとう。まずURLをたくさん与え、その先にある画像の数を数える。たくさんのページにでてきたり、何度もおなじページに出てくる画像はどうでもいいものとして、消す。よくあるやり方だけど強力。 よく考えるとHTML::じゃない感じがしてきた。あとで直すかも。HTML::としてふさわしくするため、Web::Scraperにcontent渡せるようにした。 $content = "<html>..."; $hfi->add_page($url, $content);あと、リンク先が画像っぽいURLのときにはa hrefも取るようにした。閾値のキャッシュとかちょっとアルゴリズム変更とか、細かいところも変更。ちょっとノイズ入るようになったけど、たぶん欲しい物は確実に

    HTML::FeaturedImage - URLに含まれる画像のうち、重要そうなものを取り出すためのPerlモジュール - fubaはてな
    youpy
    youpy 2007/10/31
    何度もおなじページに出てくる画像はどうでもいいものとして、消す。
  • HTML::Feature::Engine::TsubuanLike - fubaはてな

    Tsubuanが死んでて困ってるところにHTML::Featureが来てこれで勝つる!とおもったけどHTML::Elementで返してくれるのがやっぱり欲しいので、TsubuanっぽいアルゴリズムでEngineを実装してみた。Tsubuanの基礎となるタグ/テキスト比をつかったアルゴリズムはブログの記事文を抽出するスクリプトをつくってみたを参照。Elementを結果として返したい都合上ちょっと違いますが、まあTsubuanとだいたい似たような結果になります。 使い方としては、$result->{element}でHTML::Elementがとれて、そのas_HTMLは$result->{html}にも入っています。ちなみにあのアルゴリズムは空文字列を返すこともあるんですが、このモジュールでは何もとれなかった場合はHTML::TreeBuilderのルートがかえってきます。ちなみにちょっと

    HTML::Feature::Engine::TsubuanLike - fubaはてな
    youpy
    youpy 2007/10/28
  • Livedoor Readerのピンをフィードに変換し、またLDRで読むためのシステム - fubaはてな

    LDRのピンを100以上刺し、Atomフィードを吐いて、/pin/clearコマンドで保存したり、LDRでゆっくり読み直したりするためのツールを書いたので、ソースを晒してみる。APIの乗っ取りにはPlaggerLDRで使用されているHack LDR APIというGM User Scriptをちょっとだけいじったものを使うので、たぶんPlaggerLDRで使うにはそのままじゃ無理です。というかそのままじゃどんな環境でもたぶん大抵動かないし、セキュリティやパフォーマンスもいっさい気にしていないので、こんなことをやってまで大量のピンを刺す変態もいるんだーという参考程度にごらんください。 ぐりもんをGM0.8+Fx3で動くバージョンにおきかえました。ほかはそのままです。 githubに置きました。 ソース http://github.com/fuba/ldr-enhanced-pin/tree/

    Livedoor Readerのピンをフィードに変換し、またLDRで読むためのシステム - fubaはてな
    youpy
    youpy 2007/10/20
  • マソソソマソソソのバリエーションを生成する - fubaはてな

    ワードサラダとマソリソマソリソが脳内で自然に融合したのできらレボ観ながら書いた。どうぞご利用ください。 例 [puma:~/masososomasososo] ec% perl maso.pl < masocorpus マンソリマリリソ [puma:~/masososomasososo] ec% perl maso.pl < masocorpus マソンソマソンソ maso.pl #!/usr/bin/perl use utf8; use encoding 'utf-8'; use strict; use constant { HEAD => 'マ', TOKEN_LEN => 4, }; my $maso = learn(*STDIN); print gen($maso).gen($maso)."\n"; sub learn { my $h = shift; my $model = {}

    マソソソマソソソのバリエーションを生成する - fubaはてな
    youpy
    youpy 2007/07/14
  • 紫色の何かを口に押し当てているジェネレータに関するまとめ - fubaはてな

    把握してたルート takesako (y0sh1) on Twitter: "紫色の何かを口に押し付けるオフを開催してみるのはどうか http://tinyurl.com/2z2wj9" http://blog.mizzy.org/articles/2007/06/14/something_purple メキシコ産 on Twitter: "OpenCVで紫色の何かを口に押し付けるジェネレーターつくりたい" takesako (y0sh1) on Twitter: "@fuba wktk 期待age" あーでもやっぱオリジナルを使うほうが悪質でいいかもと思ったら元画像がみあたらないのではてなセリフからギってくる。 Gimp入ってないのでGraphicConverterで切ったらジャギジャギ。 とりあえずMacBookOpenCVが入ってるのでOpenCVを使って画像の物体認識をするPer

    紫色の何かを口に押し当てているジェネレータに関するまとめ - fubaはてな
    youpy
    youpy 2007/06/15
  • Net::Tumblr - fubaはてな

    http://fuba.tumblr.com/post/2327086 こういう仕様なら作るまでもない気がしたけど画像Botのために作ってみたけど一瞬で容量制限溢れたので存在意義がなくなってとりあえず放出。コードはやっぱりはてダの方がいいな…。 usage.pl use Net::Tumblr; my $url = shift; my $t = Net::Tumblr->new( email => 'example@example.com', password => 'password' )->write( type => 'photo', source => $url, caption => "<a href=\"$url\">$url</a>", ); 詳しくはTumblr - API参照。 Net/Tumblr.pm package Net::Tumblr; use strict;

    Net::Tumblr - fubaはてな
    youpy
    youpy 2007/05/24
  • 素のOS Xに入ってるPerlでPlaggerが動かねー - fubaはてな

    10.4.9かららしい。こないだMacPortsのperl5.8.8に移行したので気付かなかった。StorableとかMIME::Base64が動かないね。 ec% perl -MStorable Storable object version 2.13 does not match $Storable::VERSION 2.15 at /System/Library/Perl/5.8.6/darwin-thread-multi-2level/DynaLoader.pm line 253. Compilation failed in require. BEGIN failed--compilation aborted.つーかバージョンダウンするにしてもStorableの2.13なんてCPANにすらねーよ! なので/System/Library/Perl/5.8.6/darwin-threa

    素のOS Xに入ってるPerlでPlaggerが動かねー - fubaはてな
    youpy
    youpy 2007/03/30
  • Plagger::Plugin::Subscription::DeliciousInbox - fubaはてな

    いらなくなりました!ヽ(´ー`)ノやったぜ! del.icio.usのinboxの更新があまりに遅いのでやっつけた。TT? 何それ? 当然del.icio.us側の更新が早くなればいらなくなります。Publish::Planetのdel.icio.us風skinは気が向いたら作ります。jが頭に付く人はPPP::HatenaBookmarkに流し込むと幸せになります。 酔っぱらいのコードなので明日にでも変数名とか見直そう…。多少見直した。あとdel.icio.us風というかコピペのskinもあるけど、PPP::Planetの日語対応ができてないっぽい+この数日で直りそうな予感なのでこっちは放置。PPP::Planetはサニタイズ放棄すれば通ります。 デモ http://fuba.s7.xrea.com/planet/ DeliciousInbox.pm package Plagger::P

    Plagger::Plugin::Subscription::DeliciousInbox - fubaはてな
    youpy
    youpy 2006/03/28
  • Plagger::Plugin::Publish::HatenaBookmark - fubaはてな

    なんでこれがないのかよ(;´Д`)と思ったけどみんなメインがはてブなのか。tracの使い方わかんないので野良で放置 家にコミットされたよ! これで安心 おっとパッチです。修正されました 30c30 < my $tag_string = @tags ? join(' ', map "[$_]", @tags) : ''; --- > my $tag_string = @tags ? join('', map "[$_]", @tags) : ''; config.yaml - module: Publish::HatenaBookmark config: username: fuba password: aybabtu interval: 2 post_body: 1 参考 del.icio.us と はてなブックマークに cross-post: blog.bulknews.net htt

    Plagger::Plugin::Publish::HatenaBookmark - fubaはてな
    youpy
    youpy 2006/03/01
  • Plagger::Plugin::Filter::MMFeedTags - fubaはてな

    ところでPlagger::Plugin::Publish::Deliciousはuri_escape(_utf8)?じゃなくてencodeじゃね? と思ったもう修正してくれた。はえー (5/20追記)名刺交換, [Plagger][MM/Memo][del.icio.us][Hatena]Plagger/MM/Memoをdel.icio.usとはてなブックマークに同期, [Plagger][SBM][HyperEstraier]Pl.. - HsbtDiary(2006-05-20)で取り上げられてて気付いたのだけど、そういやASINメモのタイトルの括弧がおかしくなるのを修正したのをエントリに反映させるの忘れてた。直しました。 package Plagger::Plugin::Filter::MMFeedTags; use strict; use utf8; use Encode; use

    Plagger::Plugin::Filter::MMFeedTags - fubaはてな
    youpy
    youpy 2006/02/28
  • Plaggerこんなもん欲しいぞの会 - fubaはてな

    そのうち作る/だれか作れリスト Plugin書かないといけないの Filter::MMMemo Filter::Deliciousをいじる Filter::MMFeedTagsで作った Publish::Clustering 俺GoogleNews use AI::Categorizer 種記事適当にえらぶ AI::Categorizer::Documentに文書をMecabで形態素解析+TF値のハッシュをuse_features => $feature_vectorと放り込む AI::Categorizer::KnowledgeSetを作る AI::Categorizer::Learner::SVMで分類 適当に出力 AI::CategorizerはめんどくさそうなのでKNNは勝手に作ってもいいか 公開したくないソースになりそう CustomFeed::Katoyuu CustomFee

    Plaggerこんなもん欲しいぞの会 - fubaはてな
    youpy
    youpy 2006/02/26
  • はてなカタンのためのAjax汎用ゲームテーブル草案 - fubaはてな

    http://d.hatena.ne.jp/jkondo/20051217/1134774642 でカタン話が出てたので、あんまり関係ないけど以前考えてたWebゲームテーブルシステムの草案をてきとうに載せてみる。 概要 フレームワークだけ提供して、コマやカードの画像はユーザが用意する(というたてまえ)。画面上に表示されたオブジェクトはすべてドラッグ&ドロップ可能(設定で固定可能)で、コミュニケーションはSkypeとかにまかせる。 とりあえずふつうのカタンを実現するためには プロパティ 角度 座標 裏表 z-index オブジェクト一覧 位置さえ変えればいい紙 マップ構成パーツ 陸 数字 回す必要のある紙 マップ構成パーツ 海 マップ構成パーツをある制約を満たすようなランダム配置にできるようにはしたい。 裏返す必要のある紙 資源カード チャンスカード 裏返す必要のある紙を安心して表にできるよ

    はてなカタンのためのAjax汎用ゲームテーブル草案 - fubaはてな
    youpy
    youpy 2005/12/17
  • fubaはてな 2000 - 日本のソーシャルブックマークサービス

    http://ameblo.jp/usami/entry-10006973491.html を参考にオチとか考えずに現在のイメージを羅列してみる。 MyClip ソーシャル性が無くて単にウザいが普及率は高い。 はてなブックマーク 210万部熊を誇る巨大掲示板だがここにいるとモテない。 MM/Memo たった800強の総ユーザ数で11万部熊を誇る中規模廃人集積場。 FC2BOOKMARK FC2自体が非ギーク系オタに強かったせいで、サムネイルの著作権についてギスギスしたSBS。webshot使用。 webshotブックマーク ツールとしてのhttp://phpspot.net/php/webshot/のデモみたいなものだが人がいない。 フロッグ メディア露出は多いが人はいない。 JoltMark せっかくTrackbackやコメントができるのに人がいない。 Livemark 出来はいいのに人

    fubaはてな 2000 - 日本のソーシャルブックマークサービス
    youpy
    youpy 2005/12/12