タグ

ブックマーク / chalow.net (51)

  • 全ツイート履歴「tweets.csv」を軽く集計してみる

    全ツイート履歴「tweets.csv」を軽く集計してみる 2013-03-22-4 [Programming] 全ツイート履歴が取得できるようになったので、取ってきて軽く分析(というほどでもないが)してみた。 (↑一番最初の発言は2007年3月24日) 「全ツイート履歴」の詳細は下記の記事を参照されたし: - 日の皆さんにも「全ツイート履歴」が使えるようになりました (Twitterブログ) http://blog.jp.twitter.com/2013/03/blog-post_22.html ダウンロードした中に含まれているファイル「tweets.csv」に全ツイートが入っている。 文字コードはUTF-8。 フォーマットはCSV: - 必ずダブルクォートで閉じられている律儀なCVS。 - ダブルクォート内に改行コードが入ってる。 ■各カラム: 0tweet_id1in_reply_t

    全ツイート履歴「tweets.csv」を軽く集計してみる
  • エスカレーターはどう見ても階段なのに止まってなければならないなんてアフォーダンスに反するよなあ

    エスカレーターはどう見ても階段なのに止まってなければならないなんてアフォーダンスに反するよなあ 2013-10-23-3 [Design] エスカレーターで歩いて(走って)追い越す人のために片側をあけておく習慣について。 「エスカレーターでは片側を開けず、並んで立つ」を少しずつ浸透させたい (頭ん中) http://www.msng.info/archives/2013/10/escalator.php 非常によく分かります。危ないですよね。啓蒙していきたいところです。とはいえ、苦難の道。 特に駅のエスカレーターは啓蒙では無理かと。あれだけアナウンスしても駆け込み乗車減らないし。 なので、デザインで解決ですね。やはり、一人幅のエスカレーターを増やしていくしかないかと。子供と並ぶ場面も考えて1.5人幅くらいがいいかな。さすがに追い越しできないだろうし。 まあ、そもそも階段なのに止まってなけれ

    エスカレーターはどう見ても階段なのに止まってなければならないなんてアフォーダンスに反するよなあ
    pmakino
    pmakino 2013/10/23
    まったくだ
  • 【ベイズ】Naive Bayes(単純ベイズ)による文書分類のサンプルプログラム【Perl】

    【ベイズ】Naive Bayes(単純ベイズ)による文書分類のサンプルプログラム【Perl】 2013-07-26-1 [Programming][Algorithm][NLP] かなり昔に作った Naive Bayes(単純ベイズ)による文書分類のサンプルプログラムを整理したので公開しておきます。Perl で書かれています。Pure Perl。 Naive Bayes についての詳細は下記のサイトをどうぞ。 - 単純ベイズ - 機械学習の「朱鷺の杜Wiki」 - Wikipedia:単純ベイズ分類器 さて、Naive Bayes で分類するときには下記の式を用いるわけです。 Pについての定義は下記: 実装を簡単にするために log をとって足し算にしています(argmax ですが実際はマイナスかけて argmin で実装)。 学習データ 分類したいカテゴリごとに1行。 各行はカテゴリのラ

    【ベイズ】Naive Bayes(単純ベイズ)による文書分類のサンプルプログラム【Perl】
  • リンク構造を用いてスコアを計算する HITS アルゴリズム

    リンク構造を用いてスコアを計算する HITS アルゴリズム 2011-11-10-1 [Algorithm][Programming] HITS とはハイパーリンク構造(リンクや被リンクなど)を用いてウェブページのスコアを計算する方法。Google で用いられている PageRank の仲間。 HITS は Authority score(以下、auth) と Hub score(以下、hub) の2種類のスコアを算出する。 アルゴリズム概要 各ページiの持つ auth を 、hub を とする。 をウェブグラフ全てのリンクの集合とし、 はページiからjへのリンクを表す(有無:1 or 0)とする。そして、以下の式(オリジナル論文での式)を繰り返し計算し最終的な auth と hub を得る。初期値は何らかの方法で与えられるとする。 実例で解説。下図のようなウェブグラフがあるとする。 初期

    リンク構造を用いてスコアを計算する HITS アルゴリズム
  • ブラウザのタブをサイドに配置する方法

    ブラウザのタブをサイドに配置する方法 2011-08-08-3 [Tips] 横幅が広くて縦幅が狭いディスプレイではブラウザのタブはサイドにあった方が便利。というわけでブラウザごとの設定方法を調査。 Google Chrome アドレス欄「about:flags」→サイドタブを有効→ブラウザ再起動→どこかのタブを右クリック→「サイドタブを使用する」 Firefox アドオンを入れることにより実現可能。いくつかのアドオンが出ている。「Tree Style Tab」や「Vertical Tab」など。 Safari プラグインを入れると実現可能。「SafariStand」でできる。ただし、Windows 未対応。Windows 版 Safari での方法は不明。 IE8 方法不明。

    ブラウザのタブをサイドに配置する方法
    pmakino
    pmakino 2011/08/09
    Chrome で「サイドタブを有効」が見つからないのは Mac だからなのか Stable だからなのか
  • 「Perl中級者への道」でステップアップ!

    Perl中級者への道」でステップアップ! 2011-05-24-3 [Programming] ラクダの翻訳などで知られる近藤嘉雪さんによるプレゼン資料。 初心者がつまづきがちなリファレンスの話が分かりやすいです。 必読。 - Perl中級者への道 (近藤 嘉雪, at PerlCasual #4) http://www.slideshare.net/KondoYoshiyuki/perl-perlcasual-4-2011428 一部メモ: - 必須 use strict; use warnings; - 推奨 open my $data, "<", "file"; - 推奨 print {$data} "this...\n"; - 異なる ${$a[2]} $$a[2] - 異なる $a[2][1] $a->[2][1] - 無名 無名配列、無名ハッシュ、無名サブルーチン - 便利

    「Perl中級者への道」でステップアップ!
  • 自然放射線量を考慮してない測定値で煽らないでほしい

    自然放射線量を考慮してない測定値で煽らないでほしい 2011-05-24-4 [News] 原発事故関連では煽り記事が非常に多く、あまり煽ると正しい情報が伝わらないと常々思っている私としては心配になります。 で、「現代ビジネス」の煽り記事。 - 実はこんなに高い あなたの町の「当」の放射線量 公式発表は「低く出る」よう細工をしていた http://gendai.ismedia.jp/articles/-/5688 東京・永田町の首相官邸のすぐ近くに、「溜池交差点」がある。この東京のど真ん中で、購入したばかりのガイガーカウンターを用い、放射線量を計測した人物がいる。国土交通省政務官の小泉俊明代議士だ。 真新しいガイガーカウンターが示した数値は、「0・128μSv/h(マイクロシーベルト毎時)」。この結果を見て、小泉氏は目を疑った。 「私の事務所には、小さなお子さんを持つ親御さんから放射線量

    自然放射線量を考慮してない測定値で煽らないでほしい
  • Perl で短縮 URL を戻すサンプルスクリプト

    Perl で短縮 URL を戻すサンプルスクリプト 2010-03-29-1 [Programming] tinyurl や bitly などの短縮URLを元のURLに戻すサンプルスクリプトを Perl で書いてみました。 HEADリクエストなげて返ってくるデータを見るだけ。 コード(getlongurl.pl): #!/usr/bin/perl use strict; use warnings; use LWP::UserAgent; my $url = shift @ARGV; my $ua = LWP::UserAgent->new(timeout => 5); my $res = $ua->head($url); my $lurl = $res->request->uri || ""; print "$lurl\n"; 実行例: % ./getlongurl.pl http://b

    Perl で短縮 URL を戻すサンプルスクリプト
    pmakino
    pmakino 2010/04/11
  • 官公庁グラフ検索を公開

    官公庁グラフ検索を公開 2010-02-23-1 [Release] YDNの画像検索APIを使って、官公庁のサイトにあるグラフを検索するサービスを公開しました。 使用している Web API の提供が終了となったため、現在動作しません。ご了承ください。 官公庁グラフ検索 http://gragoja.ta2o.net/ 検索例:人口ピラミッド, 出生率, 晩婚, 進学, 離婚率, 労働, メタボリック, ドナー, がん, O157, カフェイン, 献血, コレステロール, トマト, バナナ, 自給率, 酒類, 募金, 貯蓄, 金利, バブル, レアメタル, 国防, 交通事故, 高速道路, 騒音, オゾン, プランクトン, 海水温, ... どうぞご利用ください。 ref. - Yahoo!デベロッパーネットワーク - 検索 - 画像検索 http://developer.yahoo.co

    官公庁グラフ検索を公開
  • 幅優先探索で迷路の最短経路を探す

    幅優先探索で迷路の最短経路を探す 2010-01-14-4 [Algorithm][Programming] 迷路の最短経路を探すプログラムを作成するという問題について。 - 人材獲得作戦・4 試験問題ほか (人生を書き換える者すらいた。) http://okajima.air-nifty.com/b/2010/01/post-abc6.html これは単なる幅優先でOKですね。 足跡を記録していき、すでに別の子が通った道にぶつかるか(足跡の有無で判定)、行き止まりに到達したら枝狩り。 幅優先なんだからこれで見つかるのが最短経路。 後からの「最短性のチェック」は不要です。 「アルゴリズム知らないとできない」とか以前の問題で、正式にプログラミングの基礎を学んだ人ならできて当たり前の問題です。ピンと来ない人は、ポインタわからない、再帰わからない人と同列かなあ。 バリバリプログラミングからは一線

    幅優先探索で迷路の最短経路を探す
  • 「Google Analytics API を Perl から扱うスクリプト」の標準モジュール使用版

    Google Analytics APIPerl から扱うスクリプト」の標準モジュール使用版 2009-10-21-3 [Programming][WebTool] ゆーすけべ氏の「Google Analytics APIPerl から扱うスクリプト」が非常に素晴らしいのですが、標準Perlモジュールしか入ってない環境だといろいろとアレだったので改造しました。 - [ゆ]: Google Analytics APIPerl から扱うスクリプト http://yusukebe.com/archives/09/10/19/054257.html - Google Analytics Developer Docs - Google Analytics - Google Code http://code.google.com/intl/ja/apis/analytics/doc

    「Google Analytics API を Perl から扱うスクリプト」の標準モジュール使用版
  • まあ確かにパノラマ画像は作れるんだけどね、という iPhone アプリ「PanoLab」

    まあ確かにパノラマ画像は作れるんだけどね、という iPhone アプリ「PanoLab」 2009-09-29-1 [iPhone][Photo] 「PanoLab」は iPhone 用のパノラマ画像作成アプリです。 無料です。 複数の写真を選んでパノラマ画像を作るのですが、無料アプリなので自分で作らなければなりません。 つまり、写真と写真のつなぎ目を自分で拡大・縮小・角度変更しながらうまいことやるためのツールなのです。 さっそくやってみましょう。 使う写真はこの4枚。 マクドナルドで撮影しました。 すこしずつ横にずらしながら。 そしてこの4枚の写真のサイズや角度を調整しながら自分で並べます。 完成です! パノラマ!パノラマ!パノラマ! 適当にやったので若干つなぎ目がずれていますがご容赦を。 まあ「有料アプリでもいいから自動でやってほしい!」とも思いますが、「無料で済ませたい」という需要も

  • 銀座伊東屋の階段にある案内板がカッコイイと思う

    銀座伊東屋の階段にある案内板がカッコイイと思う 2009-09-17-3 [Design] 表題の通り。 銀座にある伊東屋という文房具店の階段の案内プレートがオシャレでカッコイイ! ……と思います。 伊東屋 銀座店 場所:東京都中央区銀座2-7-15

    銀座伊東屋の階段にある案内板がカッコイイと思う
  • Perl の utf8 まわりのおまじない

    Perl の utf8 まわりのおまじない 2009-09-12-4 [Programming] 自分用メモ。 最近良く使うおまじない、というかイディオム。 utf8::decode($text) unless utf8::is_utf8($text); (追記:より良いおまじない。詳細は後述。 $text = Encode::decode_utf8($text) unless utf8::is_utf8($text); ) PerlCGI モジュールでクエリから得られるデータの文字列のutf8フラグの有無が環境によって違うことがあってイライラ。 でもこのおまじないでなんとかなった。 こんな文脈で使う: use utf8; use CGI; ... my $text = $q->param('text') || ""; utf8::decode($text) unless utf8:

    Perl の utf8 まわりのおまじない
  • iPhoneで使える無料の画像フィルター7つ

    iPhoneで使える無料の画像フィルター7つ 2009-08-16-1 [iPhone][Software] iPhoneで使える無料の画像フィルター、加工アプリを7つご紹介。 Crop for Free : 写真の一部を切り取ることができます。それだけですがかなり便利なアプリです。 Free Photo Filter : Lomography, Polarizeing, Black & White, Retro Photo の4つのフィルター。スライダーで明るさ調整。フィルターなしでの明るさのみの調整も可能。 処理例。左がLomograph、右が明るさ調整。 (追記090820: 説明が間違っていたので修正。) SnapBox : 十数個のフィルターが用意されています。強さ調整はできません。 処理例。「Summer '69」というフィルター。左が処理前、右が処理後。 (追記090820:

    iPhoneで使える無料の画像フィルター7つ
  • どっちがどっちか分からなくなるブログ名とブログ記事タイトル

    どっちがどっちか分からなくなるブログ名とブログ記事タイトル 2009-08-04-1 [Blog] はてなブックマークの人気エントリ一覧を眺めているとブログ記事がたくさん登場しているのに気づくと思います(というかほとんどがブログ記事)。 ブログ記事のウェブページタイトル文字列は、ブログ名と記事タイトルが並んでいることが多いです。 順番は「ブログ名 記事タイトル」だったり「記事タイトル ブログ名」だったりと各ブログばらばらで一貫していません。 例えば、「壊れる前に…: 格差と健康」とあったときに、「壊れる前に…」と「格差と健康」のどっちがブログ名でどっちが記事タイトルか悩みます。 ぱっと見ただけだとどっちがブログ名でどっちが記事タイトルなのかが分からないものも結構あるのですよ。 バンド名と曲名(アルバム名)がどっちがどっちか混乱するのに似ていますね。 ハイファイ新書の相対性理論みたいに。 セ

    どっちがどっちか分からなくなるブログ名とブログ記事タイトル
  • [を] Perl による自分用 Amazon Product Advertising API proxy「PAPAXY」

    Perl による自分用 Amazon Product Advertising API proxy「PAPAXY」 2009-08-01-1 [Programming] Amazon API の大掛かりな仕様変更[2009-05-09-1]まであと半月。 みなさん準備はどうですか? 私は、アマゾンAPIを使っている個別サービスの数が多いので、まずは Perl で自分用 Amazon Product Advertising API proxy CGI を作って当面の対処をすることにしました。 名前は PAPAXY(パパクシィ)。 「Perl Amazon Product Advertising api proXY」の略です。 テキトー 今までの amazon api の URL、 http://webservices.amazon.co.jp/onca/xml?... のかわりに下記のように自

    [を] Perl による自分用 Amazon Product Advertising API proxy「PAPAXY」
  • 日付や時刻の十の位と一の位を別々に選ばせるフォームは劣悪

    日付や時刻の十の位と一の位を別々に選ばせるフォームは劣悪 2009-07-29-3 [Design] カレンダーの日付や時間を選ぶフォームで、 十の位と一の位を別々に選ぶタイプのやつは、 繰り上がるときにものすごく面倒。 例えば、29日になっているやつを30日にしたい場合、 2→3, 9→0 の二回の操作が必要になる。 前述のフォームは某乗り換え案内サービスのやつ。 下記のものはYahoo!の乗り換え案内のフォーム。 時刻は別々なのでダメダメだけど、日付はこっちの方がマシ。 願わくば、日付の後に「次の日」ボタンがあればいいかな(時刻のところには「▼(次)」と「▲(前)」がある)。 乗り換え案内だと次の日のことを調べる場合が多いので。

    日付や時刻の十の位と一の位を別々に選ばせるフォームは劣悪
  • このブログの記事の印刷用ページを作った

    このブログの記事の印刷用ページを作った 2009-07-15-3 [ThisSite][Programming] このブログの個別記事ページですが、ブラウザによってはきれいに印刷できないことがありました。 そこで、内容部分以外は削除したミニマムHTMLを生成するプログラムを書き、それによりこのブログの記事の印刷用ページを作りました。 記事URL「http://chalow.net/2009-07-15-1.html」に対し「http://chalow.net/p/2009-07-15-1.html」というURLが印刷用ページです。 各記事ページにリンクを貼りました。 ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ どうぞご利用ください。 よろしくお願いします。 § 印刷用ページの生成には「Webページを読み込んで何か処理して表示するラッパーCGIのテンプレート」[2008-11-04-2]

    このブログの記事の印刷用ページを作った
  • 学校が土曜日休みになったのっていつからだったっけ?

    学校が土曜日休みになったのっていつからだったっけ? 2009-07-14-1 [History] 学校が土曜日休み(週休二日制)になったのはいつからなのか、という疑問はけっこう話題になります。ちょっと調べてみたのでまとめておきます。 Wikipedia「学校週5日制」より、土曜休みのパターンとその開始時期。 休業日開始時期第2土曜日1992年(平成4年)9月12日第2第4土曜日1995年(平成7年)4月22日毎週土曜日2002年(平成14年)4月 「2chにある無駄な知識を集めるスレ66」に、生まれ年度別に導入時期がまとめてあったので表にしてみた。 生まれ年度と各学年での土用休みの有無の表。 生まれ年度小学校中学校高校1973以前無無無1974〜75無無無→第21976無無第21977-78無無→第2第2→第2,41979無第2第2,41980-81無→第2第2→第2,4第2,41982無

    学校が土曜日休みになったのっていつからだったっけ?