タグ

ブックマーク / chalow.net (25)

  • リンク構造を用いてスコアを計算する HITS アルゴリズム

    リンク構造を用いてスコアを計算する HITS アルゴリズム 2011-11-10-1 [Algorithm][Programming] HITS とはハイパーリンク構造(リンクや被リンクなど)を用いてウェブページのスコアを計算する方法。Google で用いられている PageRank の仲間。 HITS は Authority score(以下、auth) と Hub score(以下、hub) の2種類のスコアを算出する。 アルゴリズム概要 各ページiの持つ auth を 、hub を とする。 をウェブグラフ全てのリンクの集合とし、 はページiからjへのリンクを表す(有無:1 or 0)とする。そして、以下の式(オリジナル論文での式)を繰り返し計算し最終的な auth と hub を得る。初期値は何らかの方法で与えられるとする。 実例で解説。下図のようなウェブグラフがあるとする。 初期

    リンク構造を用いてスコアを計算する HITS アルゴリズム
    kshimo69
    kshimo69 2011/11/10
    これやったな。こんな難しい式書かんかったけどw
  • 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード候補が含まれるドキュメ

    形態素解析と検索APIとTF-IDFでキーワード抽出
    kshimo69
    kshimo69 2011/04/13
  • 無料で読めるデータマイニングの教科書「Mining of Massive Datasets」

    無料で読めるデータマイニングの教科書「Mining of Massive Datasets」 2011-03-31-3 [Algorithm] フリーで公開されてる Data Minig の教科書。PDF で入手可能。iPad で読んでいます。 - Anand Rajaraman and Jeff Ullman, "Mining of Massive Datasets" http://infolab.stanford.edu/~ullman/mmds.html Chapter 1 Data Mining Chapter 2 Large-Scale File Systems and Map-Reduce Chapter 3 Finding Similar Items Chapter 4 Mining Data Streams Chapter 5 Link Analysis Chapter 6

    無料で読めるデータマイニングの教科書「Mining of Massive Datasets」
  • Twitter API プログラミング

    Twitter API プログラミング 2010-04-21-2 [BookReview][Programming][WebAPI] @tsupo さんより献いただきました。 ありがとうございました。(ref. [2010-04-14-2]) ■辻村浩 / Twitter API プログラミング モバツイやBuzztter、ふぁぼったーなど、Twitterを使ったおもしろいサービスがたくさんあります。 これもTwitterが人気を集めている理由の1つでしょう。 Twitterは、その機能のほとんどをAPI経由で使うことができます。 書は、公式ドキュメントをもとにそれぞれのAPIの使い方をわかりやすくまとめたリファレンスです。 サンプルコードも紹介していますので、書があれば、すぐにアイデアを実現できます! Twitter API ドキュメントの日語訳でもおなじみの @tsupo さん

    Twitter API プログラミング
  • Twitter のストリーミング API を試す

    Twitter のストリーミング API を試す 2010-04-15-2 [WebAPI][Programming] 今日から始まった謎のツイッタードラマ(?)を横目に、ツイッターの Streaming API を試してみました。このを参考にしました。 ■辻村浩 / Twitter API プログラミング (ref. [2010-04-14-1]) ストリーミングAPIって何かというと、タイムラインがひたすらだらだらと流れ続けるAPIです。 以下紹介するのは契約無しで自由に使えるバージョンで、タイムラインから適当に間引いて全体の5%くらいが取得できるみたい。 噂では億単位のお金を払えばほぼ100%取れたりするみたいだけどよく分からない。 使い方を curl コマンドで説明。 JSONで欲しい場合はこう(U=アカウント名、P=パスワード): curl -uU:P http://strea

    Twitter のストリーミング API を試す
  • ScanSnap S1300 で初めてのスキャン!

    ScanSnap S1300 で初めてのスキャン! 2010-03-14-1 [Gadget][Video] ScanSnap レビューシリーズの第二回です(前回は[2010-02-14-1])。レビューのために頂いた ScanSnap S1300 の利用レポートをシリーズでお届けしています。 ■FUJITSU ScanSnap S1300 FI-S1300 ■FUJITSU ScanSnap S1300 楽2ライブラリパーソナルV5.0セットモデル FI-S1300-SR ちょっとしばらくばたばたしてたのですが、この週末、やっと ScanSnap S1300 を箱から取り出しました。うーん、これはかなり小さいです。 ScanSnap S1300 は、小型プリンタの給紙のように、紙を一枚一枚読み込んでスキャンするタイプのスキャナーです。 同胞されていたケーブル類です。 片方がUSBで片方が

    ScanSnap S1300 で初めてのスキャン!
  • プレインテキストをブラウザでコンパクトに印刷できる「Print Text JS」を公開

    プレインテキストをブラウザでコンパクトに印刷できる「Print Text JS」を公開 2010-03-03-2 [Release] テキストファイルを印刷するときには、ウェブブラウザに表示させてから印刷することが多いです。フォントサイズ変更などブラウザの方が慣れているというのが理由。なれないエディタから印刷しようとすると、プレビューとか設定の前にいきなりプリンタに行っちゃったりすることもあるからなー。 ということで、プレインテキストをコンパクトに印刷するためにブラウザで表示する処理を JavaScript で書きました。(ついでに Wiki っぽい記法にも対応しています。理由は明かせませんが Confluence になんとなく準拠しています。なぜでしょうね。まあともかく、時と場合によっては便利ですよ。) 手元にテキストファイルかテキストデータがあったら、下記のサイトへ行って、テキストエイ

    プレインテキストをブラウザでコンパクトに印刷できる「Print Text JS」を公開
  • abrAsus の「薄い財布」や「保存するメモ帳」がブレイク寸前!?

    abrAsus の「薄い財布」や「保存するメモ帳」がブレイク寸前!? 2010-02-15-6 [abrAsus][Stationery] 「abrAsus」ブランドの話題があったのでメモメモ。 まずは abrAsus のブランドロゴを担当した方による、店舗販売の噂。 - 小物ブランド『abrAsus』が話題になっている模様。 (YAMABLO [山風呂]) http://yamagra.jp/yamablo/2010/02/post-119.html フランスやニューヨークの店舗でも販売されていて、国内でも3〜4月頃から某百貨店にて取り扱いが始まる予定らしい。 おお! これは一気に(ネット以外の)一般層に浸透するかも。 反響が楽しみです。 伊東屋などの大手文具店でも扱われれば大ブレイクしそうだなあ。 あと、私が Flickr にアップした「薄い財布」の写真についてのコメント。 - Wal

    abrAsus の「薄い財布」や「保存するメモ帳」がブレイク寸前!?
  • ScanSnap 生活が始まります(予告編)

    ScanSnap 生活が始まります(予告編) 2010-02-14-1 [Gadget][Stationery][ONEDARI][abrAsus] A4の紙を折り畳んでメモ用紙として使うための文房具「保存するメモ帳」[2010-01-06-4]。ただいま絶賛活用中です。かなりヘビーに使っています。 この「保存するメモ帳」は元々はメモを取ったらスキャナーで保存するというコンセプトです。その縁でスキャナーのレビューもすることになりまして、「ScanSnap S1300」を送って頂きました。ありがとうございます。 ■FUJITSU ScanSnap S1300 FI-S1300 ■FUJITSU ScanSnap S1300 楽2ライブラリパーソナルV5.0セットモデル FI-S1300-SR (届いたのは「楽2ライブラリ」入りの方です。でも「楽2ライブラリ」はWindows専用ソフトだから使

    ScanSnap 生活が始まります(予告編)
  • 「ウェブサービスを使ったテキストマイニングとサービス適用」のURLリスト

    「ウェブサービスを使ったテキストマイニングとサービス適用」のURLリスト 2010-01-26-2 [NLP][WebAPI][YahooHacks][Programming] 「第一回集合知シンポジウム」でプレゼンしたのですが、そのときデモしたり言及したりしたURLのリストです。 第一部 ウェブサービス(Web API)の基礎知識 - [を] ウェブサービス(Web API)とは?[2009-12-24-1] - [を] ウェブサービス(Web API)をプログラムから使う[2009-12-26-2] - MECAPI - MeCab Web Service (MeCab API) ttp://mimitako.net/api/mecapi.cgi ttp://yapi.ta2o.net/apis/mecapi.cgi (追記180618: 負荷が厳しいため何年か前から停止中) (追記1

    「ウェブサービスを使ったテキストマイニングとサービス適用」のURLリスト
  • 幅優先探索で迷路の最短経路を探す

    幅優先探索で迷路の最短経路を探す 2010-01-14-4 [Algorithm][Programming] 迷路の最短経路を探すプログラムを作成するという問題について。 - 人材獲得作戦・4 試験問題ほか (人生を書き換える者すらいた。) http://okajima.air-nifty.com/b/2010/01/post-abc6.html これは単なる幅優先でOKですね。 足跡を記録していき、すでに別の子が通った道にぶつかるか(足跡の有無で判定)、行き止まりに到達したら枝狩り。 幅優先なんだからこれで見つかるのが最短経路。 後からの「最短性のチェック」は不要です。 「アルゴリズム知らないとできない」とか以前の問題で、正式にプログラミングの基礎を学んだ人ならできて当たり前の問題です。ピンと来ない人は、ポインタわからない、再帰わからない人と同列かなあ。 バリバリプログラミングからは一線

    幅優先探索で迷路の最短経路を探す
  • テープを切ってもベタつきにくいグルーレス刃のハサミ

    テープを切ってもベタつきにくいグルーレス刃のハサミ 2010-01-12-5 [Stationery] 先日知り合ったコクヨのNMさん[2009-12-13-2]に、文房具をいくつか送って頂きました。ありがとうございます。何回かに渡ってレビューしていきたいと思います。 まずは、KOKUYO のハサミ AIRO FIT。 型番は「ハサ-P210LM」(LMは色を表しているみたい)。 全長170mm、刃渡り70mm。 グルーレス刃 最大の特徴は刃。 粘着テープみたいにねばねばしたものを切っても、ベタベタが刃に付きにくいのが特徴です。 フッ素コートにより粘着しにくくしているハサミもありますが、それと比較してグルーレス刃の優れているところは刃の構造。 切る時に刃先部分だけが接触する構造なので、ハサミを閉じたときには中が空洞になります。 つまり、刃先で切れなかったテープがまきこまれて、刃の裏側にべっ

    テープを切ってもベタつきにくいグルーレス刃のハサミ
  • 「英辞郎 on the WEB」の検索ログから英語を学ぶ本「英辞郎 検索ランキング」

    「英辞郎 on the WEB」の検索ログから英語を学ぶ「英辞郎 検索ランキング」 2010-01-02-3 [English][Book] アルクさんより面白い企画のを献いただきました。ありがとうございます! 2冊セットでいただきました。 それぞれ英和と和英です。 ええと、辞書ではないです。 ■阿部一 / 英辞郎 検索ランキング 英和編 ■阿部一 / 英辞郎 検索ランキング 和英編 どういうものかというと: 語学学習サイト「SPACE ALC」提供の英和・和英対訳データベース検索サービス「英辞郎 on the WEB」は、月間200万人もの方々に利用されています。 日々メールを英語で読み書きしているビジネスパーソンから、海外の文献を読む研究者、翻訳・通訳者といった英語のプロまで、英語に携わるさまざまな方にご愛用いただいている「英辞郎 on the WEB」。10億の検索キーワードを

    「英辞郎 on the WEB」の検索ログから英語を学ぶ本「英辞郎 検索ランキング」
  • ウェブサービス(Web API)をプログラムから使う

    ウェブサービス(Web API)をプログラムから使う 2009-12-26-2 [WebAPI][Programming] 前回[2009-12-24-1]はウェブサービス(Web API)の基的事項と、よく採用されているプロトコルとデータ構造の概要を解説した。 プロトコルとデータ構造の組み合わせ、計4つのうち3つを取り上げて、実際にプログラムから Web API を使う方法を例を用いて説明する。 今回取り上げるサンプルプログラムで使った Web API と用いたプログラム言語を表に示す: プロトコル\データ構造XMLJSON, JSONPREST風MECAPI, Perlキーフレーズ抽出API, JavaScriptSOAP, XML-RPCはてブ件数取得API, Perl- REST風 + XML Web API をREST風プロトコルでアクセスしXMLデータを得る流れを perl

    ウェブサービス(Web API)をプログラムから使う
  • ウェブサービス(Web API)とは?

    ウェブサービス(Web API)とは? 2009-12-24-1 [WebAPI][Programming] Webサービス(Web API)とは、ユーザがウェブ経由で他の人・会社が持っているデータや処理をアクセスして使うための技術。 プログラムから呼び出して使うことが多く、それを前提としたプロトコル、データ構造となっている。 商品検索、ウェブ検索、ソーシャルブックマーク、写真サービス、ツイッター、カレンダー、番組表、天気予報情報、路線情報、漢字変換、キーワード抽出、ウェブページのサムネイル、位置情報、地図情報、認証などさまざまなサービスで Web API が提供されている。 このような Web API を組み合わせてサイトやアプリケーションを作ることをマッシュアップと呼ぶ。 プロトコル Web API で利用されるプロトコルは大まかに下記の二つに分けられる。 (1) REST風 (2)

    ウェブサービス(Web API)とは?
  • iPhone夫婦にはGoogleカレンダーが便利!

    iPhone夫婦にはGoogleカレンダーが便利! 2009-12-17-2 [iPhone][WebTool][LifeHacks] iPhoneGoogleカレンダーの連携にトライしました。 iPhone のデフォルトカレンダーアプリをGoogleカレンダーと同期させるのです。 SafariでGoogleカレンダーを見ればいいじゃん、という意見もあるとは思いますが、ブラウザ経由だと共有カレンダーのイベントがマンスリービューで表示されないのです。現在、Googleカレンダーで、の個人カレンダーと家庭行事カレンダーを共有しています。この二つがマンスリービューに表示されないんじゃ困ります。 カレンダーアプリとGoogleカレンダーとの同期だとこの問題も解決! これはすごく使いやすいです。 すばらしす! このページの通りにやりました。ありがとうございました。 - iPhoneGoog

    iPhone夫婦にはGoogleカレンダーが便利!
  • 某氏の iPhone 新規購入の際の心配事の対処方法メモ

    某氏の iPhone 新規購入の際の心配事の対処方法メモ 2009-10-31-1 [iPhone][Tips] 某氏、というか、iPhone を新規購入の際に心配してることとその対処方法をメモしておきます。同じような心配をしている人の参考になれば幸いです。 【Q.1】ソフトバンクじゃないケータイからアドレス帳を iPhone に移動する方法 【A.1】ソフトバンクから出ている専用ソフトがある。 - 電話帳かんたんコピー (SoftBank) http://mb.softbank.jp/mb/iphone/pdc/ - メモリの移行について (SoftBank) http://mb.softbank.jp/mb/iphone/sync_memory/ - 【iPhone 3GS】 docomo SH-04A からの電話帳の移行 http://twenty3.blog33.fc2.co

    某氏の iPhone 新規購入の際の心配事の対処方法メモ
  • 履いてるだけで掃除ができるスリッパ

    履いてるだけで掃除ができるスリッパ 2009-10-13-1 [Kawaii][Goods] 履いてるだけで掃除ができるスリッパです。 「マイクロファイバー(Micro Fiber)モップスリッパ」というものだそうです。 アトレ恵比寿で購入。 ハチさんですね。働きバチかな。 踏んづけられながらももくもくと掃除に励んでくれます。 けなげ!かわいい! は「びーー!びーー!」と言いながらすり足で歩いたりしています(蜂なだけにbee)。 素材の感触はこの前の傘袋[2009-10-10-4]と同じです。 ふわふわでニョロニョロです。 そうそう、ちょこっとネットショップで探してみたのですがハチは見つけられませんでした。 蜂が一番かわいいのになー。 他のはいろいろありました。

    履いてるだけで掃除ができるスリッパ
  • iPhone スタンドのペーパークラフト

    iPhone スタンドのペーパークラフト 2009-09-16-4 [Gadget][iPhone] 紙で作る iPhone 用スタンドが紹介されていました。 コードをつなげたままで iPhone を立てることができます。 - Iphone and Itouch paper stand / dock http://www.dessinemoiunobjet.com/iphone-and-itouch-paper-stand-dock/ (via http://blog.creamu.com/mt/2009/09/iphone_3.html) 紹介するだけじゃアレなので、実際に作ってみました。 DIY! DIY! (↑完成品) まずはA4の紙に前述のURLから入手できるPDFを印刷。 しかし印刷した紙がペラペラなのでどう考えてもスタンドには不向き。 そこで牛乳パックを開いたやつを使うことに。

    iPhone スタンドのペーパークラフト
  • Perl の utf8 まわりのおまじない

    Perl の utf8 まわりのおまじない 2009-09-12-4 [Programming] 自分用メモ。 最近良く使うおまじない、というかイディオム。 utf8::decode($text) unless utf8::is_utf8($text); (追記:より良いおまじない。詳細は後述。 $text = Encode::decode_utf8($text) unless utf8::is_utf8($text); ) PerlCGI モジュールでクエリから得られるデータの文字列のutf8フラグの有無が環境によって違うことがあってイライラ。 でもこのおまじないでなんとかなった。 こんな文脈で使う: use utf8; use CGI; ... my $text = $q->param('text') || ""; utf8::decode($text) unless utf8:

    Perl の utf8 まわりのおまじない