タグ

ブックマーク / chalow.net (15)

  • 転置インデックスの構成とブーリアン検索

    転置インデックスの構成とブーリアン検索 2008-01-18-1 [IIR][Algorithm] 「Introduction to Information Retrieval」[1]の第一章[2008-01-12-1] の転置インデックスまわりの用語と検索手順などの解説です。 ちょっと前に書いた 『ウェブ検索を「の索引」で説明する試み』[2007-06-17-6] という記事の続きでもあります。 「転置インデックスによる検索システムを作ってみよう!」 [2007-11-26-5]もご参考に。 § 転置インデックス (inverted index または inverted file) は、 dictionary と postings の二つの部分から構成されます。 dictionary は索引語 (term) の集合です。 term が登場する文書の ID を posting と呼びます

    転置インデックスの構成とブーリアン検索
    youpy
    youpy 2008/12/22
  • Pathtraq API が出たので「ウェブ検索パストラック順」を公開

    Pathtraq API が出たので「ウェブ検索パストラック順」を公開 2008-07-23-1 [Release] Pathtraq の API が公開されました。 - Pathtraq の API を公開しました (Kazuho@Cybozu Labs) http://labs.cybozu.co.jp/blog/kazuho/archives/2008/07/pathtraq_api_released.php - 開発者向け情報 - パストラック Pathtraq http://pathtraq.com/developer - サイボウズ・ラボ、Pathtraqの統計情報取得APIを公開 (ITmedia エンタープライズ) http://www.itmedia.co.jp/enterprise/articles/0807/23/news073.html - ステップ・バイ・ステップ

    Pathtraq API が出たので「ウェブ検索パストラック順」を公開
  • Google Chart API で QRコードも生成してくれるようになった

    Google Chart APIQRコードも生成してくれるようになった 2008-07-04-3 [WebTool] URL をなげるとグラフなどの図を画像として生成してくれる Google Chart API ですが、新たに QRコードを生成してくれるオプションができました。 QR codes (Developer's Guide - Google Chart API) 基となるパラメータは chs(サイズ指定)cht(QRコードなのでqrを指定)chl(エンコードしたテキストを指定) の3つです。 では実例。 このブログのトップページ「https://chalow.net/」のQRコードを作ります。 URLを組み立てるとこうなります: https://chart.apis.google.com/chart?chs=150&cht=qr&chl=https%3a//chalow.

    Google Chart API で QRコードも生成してくれるようになった
    youpy
    youpy 2008/07/06
  • [を] 転置インデックスによる検索システムを作ってみよう!

    転置インデックスによる検索システムを作ってみよう! 2007-11-26-5 [Algorithm][Programming] 転置インデックス[2007-06-17-6]による検索システムの実装は パフォーマンスを無視すれば意外と簡単です。 それを示すために Perl で簡単な検索システムを作ってみました。 検索方式は転置インデックス(Inverted Index)、 ランキングには TF-IDF[2005-10-12-1] を用いました。 検索対象ファイルは一行一記事で以下のフォーマットとします。 [記事ID][SPC][記事内容]\n 記事IDは数字、記事内容は UTF-8 の文字で構成されるものとします。 以下のようなサンプル test.txt を用意しました。 1 これはペンです 2 最近はどうですか? 3 ペンギン大好き 4 こんにちは。いかがおすごしですか? 5 ここ最近疲れ

    [を] 転置インデックスによる検索システムを作ってみよう!
    youpy
    youpy 2008/07/04
  • 転送量の 18% が prototype.js だった

    転送量の 18% が prototype.js だった 2008-06-08-2 [ThisSite] このブログのサーバ統計情報を Webalizer で見てみたら転送量の 18% が prototype.js だった。 さすがにこりゃないな、と思ったので、Google のを使うことにした。 - Google人気JavaScriptライブラリ配布開始、ネット全体でキャッシュ効果 http://journal.mycom.co.jp/news/2008/06/03/020/index.html - Developer's Guide - AJAX Libraries API - Google Code http://code.google.com/apis/ajaxlibs/documentation/index.html

    転送量の 18% が prototype.js だった
    youpy
    youpy 2008/06/11
  • Chumby Night #00 でした!

    Chumby Night #00 でした! 2008-05-21-1 [Chumby][EventReport] 恵比寿のタワーカフェにて「Chumby Night #00」が開催されました。 これは共同購入した楽しいガジェット「chumby」を購入代行者 から受け取り、ついでにオーナー同士の交流を深めるのが 主な目的のイベントです。 とりあえず、お疲れさまでした! 会場のタワーカフェー。 liquidroom というライブハウスの併設カフェです。 まずは chumby の搬入から。130台近くあります。 イベントの様子です。 イベント後はスタッフ3人で24時間営業の渋谷郵便局へ行き、 参加できなかった方の分の発送を行いました。 無事届くと良いな。 イベントの様子を短いムービーにまとめましたのでどうぞ。 雰囲気は伝わるかと思います。 chumby night #00 (Tokyo, Jap

    youpy
    youpy 2008/05/22
  • [を] Mac OS X から ssh 接続してもすぐ切れちゃう問題に対処

    Mac OS X から ssh 接続してもすぐ切れちゃう問題に対処 2008-02-26-2 [Tips][Mac] ここ最近、私を悩ます Mac OS X での困り事。 (1) Terminal から ssh でログインしてもしばらくすると切れちゃう。 (2) sshfs を使ってると同様に接続が切れるんだけど、 そのときうっかり Finder で変なところをいじると OS が固まっちゃう[2008-01-27-1]。 どうしたものかなあ、と思ってたらこんなページを発見! - keep-alive for ssh ttp://www.geocities.co.jp/AnimeComic/1098/documents/unixmemo/\ ssh-keepalive.html http://hnw.jp/documents/unixmemo/ssh-keepalive.html (追記08

    [を] Mac OS X から ssh 接続してもすぐ切れちゃう問題に対処
    youpy
    youpy 2008/04/12
  • Googleを支える技術

    Googleを支える技術 2008-03-25-1 [BookReview] 献頂きました。ありがとうございます。 そうでなくとも絶対買うですが。 ■西田圭介 / Googleを支える技術 - 巨大システムの内側の世界 結論から言いますと、 Google のバックエンドの技術について 興味のあるITエンジニアや学生で、 英語よりも日語を読むほうがはやい人は必読です。 グーグルについての技術的なトピックが 日語でさくっと読めます。 Google 社員による英語論文やドキュメントを情報源とし、 それらを咀嚼して平易に解説しています。 「情報系の大学3年生程度の予備知識」を前提に 書かれているとのことで、 情報系の基礎的な語彙が分かっていれば、 確かに難解な話はありません。 数式も出てこないです。 内容紹介 第一章は検索の話で、クロール、インデックス、 ランキング、と Google

    Googleを支える技術
    youpy
    youpy 2008/03/27
  • Wiki小話Vol.8「イントラWikiを語る。」

    Wiki小話Vol.8「イントラWikiを語る。」 2007-09-29-1 [EventReport][Video][Wiki] 発表者のみなさん、参加者のみなさん、おつかれさまでしたー!!! Wiki小話/Vol.8 - イントラWikiを語る。 http://wikibana.socoda.net/wiki.cgi?Wiki%be%ae%cf%c3%2fVol%2e8 Wikiに関連した話題を取り上げるミニセミナー「Wiki小話」。 今日、新宿のルノアール会議室で開催された第八回は イントラネットでの Wiki をテーマに3人の方にお話していただきました。 話者テーマ塚 牧生Enterprise 2.0 : 社内Wikiの目的と選択ふしはら かんイントラの中のWiki江渡 浩一郎qwik.jp運用報告 発表内容の一部は Xacti で撮影しましたので、 可能な部分は今後 YouTu

    Wiki小話Vol.8「イントラWikiを語る。」
    youpy
    youpy 2007/10/01
  • はてな投げ銭はなぜ日本の PayPal になれなかったのか

    はてな投げ銭はなぜ日の PayPal になれなかったのか 2007-08-06-3 [WebTool] はてな (http://www.hatena.ne.jp) が提供してきたサービスのうち、 私にとって衝撃的だったというか未来を感じさせたものが二つある。 一つは「はてなわんわんワールド」、もう一つは「はてな投げ銭」だ。 今となってはどちらも、廃れた、とは言いすぎかもしれないけど、 はてなのサービス群の中でも非常に目立たないポジションになっている。 わんわんワールドは置いといて、ここでは投げ銭の話をする。 投げ銭ははてなのユーザ同士がお金をやりとりできるサービスで、 手数料はかかるけど簡単な小額決済ができるのが素晴らしく、 マイクロペイメントの命か!?と興奮したものだ。 もう二年も前の話になるのか…。 (ref. [2005-08-12-3][2005-08-11-6][2005-0

    はてな投げ銭はなぜ日本の PayPal になれなかったのか
    youpy
    youpy 2007/08/07
  • イーモバイルでユビキタス生活スタート!

    イーモバイルでユビキタス生活スタート! 2007-08-05-2 [Gadget] ユビキタスで指来たっす!(ref. [2007-03-19-2]) ということで、 emobile (http://emobile.jp/)でユビキタス生活が始まりました。 端末はUSB接続でMacでもWindowsでも使える D01HW (http://emobile.jp/products/hw/d01hw/)。 丸っこくてカワイイです。 新宿のヨドバシで4980円で入手。 下の写真はWindowsマシン (Let's note R4) で使っている様子。 問題なく使えます! 下の写真はMac (黒MacBook) で使っている様子。 問題なく使えます! YouTube もけっこうスイスイとみれます。 というわけで、お気に入りのカフェやら風が気持ちいい公園やら、 そういう良さげな場所でWebサイト開発し

    イーモバイルでユビキタス生活スタート!
    youpy
    youpy 2007/08/06
  • Yahoo!デベロッパーネットワークにテキスト解析APIが登場!

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場! 2007-06-18-1 [WebTool][NLP][MECAPI][Programming] Yahoo!デベロッパーネットワークに「テキスト解析」が登場しました。 第一弾は日形態素解析APIです。 ヤフーのいろんなところに使われている WebMA という 形態素解析エンジンのAPIです。 - Yahoo!デベロッパーネットワーク - テキスト解析 - 日形態素解析 http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html MECAPI の仕様に似ていますが、まあそういうものです。 (MECAPI https://maapi.net/) で、先日 MECAPI で作った「文で検索」[2007-04-03-1]の WebMA 版を作ってみました。「文で検索2」

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場!
    youpy
    youpy 2007/06/19
    「さて、MECAPI(MeCab) と WebMA の違いですが、なんといっても後者は語彙が豊富です。ウェブに現れる語彙をじゃんじゃん追加しているので、特に固有名詞なんかには強いです。」
  • 3Dインターフェースは主流にはならないだろうなあ

    3Dインターフェースは主流にはならないだろうなあ 2007-04-27-2 [Opinion] とりあえず最初にまとめとくと: 3Dはインタフェースの主流になっていないし、今後もならないと思う。 なぜなら「インターフェースってのは適所適材でないと逆効果」で、その上「3Dが適するものってそんなに多くない」から。 あたり前のことですが。 以下蛇足。 § 「FPN-IT技術者は超保守的、セカンドライフへの無関心が持つ意味」(HB!, INTERNET ARCHIVE)という記事にて、 ビジネスウイーク誌を読まなくても、10年たてば3Dのインターフェースが主流になるでしょう。 との主張がなされていました。しかし私は懐疑的です。 商品の種類によっては商品写真をクルクルまわす見せ方が主流になるかもしれません。これを3Dと呼ぶならば(微妙なところですが)「その分野では3Dのインターフェースが主流になる」

    3Dインターフェースは主流にはならないだろうなあ
    youpy
    youpy 2007/04/29
  • 高校の学習指導計画書に「高橋メソッド」と「もんたメソッド」が!

    高校の学習指導計画書に「高橋メソッド」と「もんたメソッド」が! 2007-03-29-3 大庭慎一郎情報。 高校の先生用の資料集に「高橋メソッド」と 「もんたメソッド」が載っている! 「新版 情報A 情報の活用と実践 / 学習指導書 指導計画・資料編」 ■高橋メソッド[2007-03-08-1] ■もんたメソッド[2005-06-01-3]

    高校の学習指導計画書に「高橋メソッド」と「もんたメソッド」が!
    youpy
    youpy 2007/03/30
  • Googleが大規模日本語データを公開するという話

    Googleが大規模日語データを公開するという話 2007-03-13-1 [NLP] 3月に滋賀で行われる言語処理学会全国大会で、グーグルが 特別セッションをやるそうです。大規模日語データについて。 Google: 大規模日語データ公開に関する特別セッション http://www.google.co.jp/events/anlp2007.html グーグル株式会社では、日語の言語処理研究推進のため大規模日語 データの公開を検討しています。つきましては仕様を決定するにあたり、実際 にデータを御利用頂く研究者 / 技術者の皆様の「生の声」を是非お伺い したく存じます。今回、言語処理学会様の御好意により、下記のとおり データ仕様に関する特別セッションを設けて頂ける事になりました。 日時: 2007年3月20日(火) 18:30 〜 19:00 会場: 龍谷大学 瀬田学舎 言語処理学会

    Googleが大規模日本語データを公開するという話
    youpy
    youpy 2007/03/14
  • 1