タグ

ブックマーク / chalow.net (19)

  • 英語テキストをかなり自然に読み上げてくれるサイト iSpeech

    英語テキストをかなり自然に読み上げてくれるサイト iSpeech 2008-11-11-3 [海外][WebTool][PodCasting] Digg か delicious かで話題にあがってた iSpeech という、英語テキスト読み上げてくれるサイト。 Mac OS X のスピーチソフトとは関係ない、と思います。 - Convert your favorite Websites and Blogs to speech with iSpeech - Text to speech podcast with your iPod http://www.ispeech.org/ デモページでは入力した文章をしゃべってくれます。 - live text to speech demo http://www.ispeech.org/text.to.speech.demo.php ブログパーツとして

    英語テキストをかなり自然に読み上げてくれるサイト iSpeech
    teahut
    teahut 2008/11/12
    >Mac OS X のスピーチソフトとは関係ない、と思います
  • ジンバブエのインフレ率がすごすぎる

    ジンバブエのインフレ率がすごすぎる 2008-07-18-1 [News][Money] ジンバブエの年間インフレ率が220万%になったそうな。 すごすぎる。 1個100円で売れる物資(例えばペットボトルの水)を 1月1日に持っていたら、12月31日には220万円位で売れるってことか。 額面だけ見るとすごいな。 逆に220万円の貯金があっても、 年末には100円分位の価値しかない。 ペットボトルの水くらいしか買えない。 これはショック。 自国の「お金」の価値がほとんどなく、 「物」を持っていた方が安全な状態なわけで、 まさに絵に描いたような経済崩壊。 - ジンバブエ経済は崩壊状態、インフレ率2200000%(読売新聞) http://www.yomiuri.co.jp/world/news/20080717-OYT1T00621.htm 今年1月に発行された1000万ジンバブエ・ドル札は既

    ジンバブエのインフレ率がすごすぎる
    teahut
    teahut 2008/07/23
    ハイパーインフレになるまでの顛末あり
  • chalow version 2 へ向けての大改造

    chalow version 2 へ向けての大改造 2008-01-26-1 [Chalow] このブログで使っているブログツール chalow を Ver.2 へ向けて 大幅にいじっています。後方互換とか気にせずに好き勝手にやっています。 chalow の改造にあわせてついでにこのブログのデザインなども 変更しています。まあ、テストも兼ねているのですよ。 最大の変更ポイントは、 月別ページ、日別ページ、カテゴリ別ページの廃止です。 記事ページとトップページ以外は CGI で動的生成します。 といっても検索 CGI の日付周りのオプションを強化するだけですが。 あとは、まだ着手していませんが検索 CGI も含めた完全 UTF-8 化。 出力は UTF-8 に統一しようかと。 といった感じで、Webサーバに依存した方向へと舵を取っています。 普通の Text to 静的HTML のコンバータ

    chalow version 2 へ向けての大改造
    teahut
    teahut 2008/01/27
    記事ページとトップページ以外は CGI で動的生成
  • 転置インデックスの構成とブーリアン検索

    転置インデックスの構成とブーリアン検索 2008-01-18-1 [IIR][Algorithm] 「Introduction to Information Retrieval」[1]の第一章[2008-01-12-1] の転置インデックスまわりの用語と検索手順などの解説です。 ちょっと前に書いた 『ウェブ検索を「の索引」で説明する試み』[2007-06-17-6] という記事の続きでもあります。 「転置インデックスによる検索システムを作ってみよう!」 [2007-11-26-5]もご参考に。 § 転置インデックス (inverted index または inverted file) は、 dictionary と postings の二つの部分から構成されます。 dictionary は索引語 (term) の集合です。 term が登場する文書の ID を posting と呼びます

    転置インデックスの構成とブーリアン検索
    teahut
    teahut 2008/01/19
    /OR NOT/AND NOT/ かな?
  • [を] 転置インデックスによる検索システムを作ってみよう!

    転置インデックスによる検索システムを作ってみよう! 2007-11-26-5 [Algorithm][Programming] 転置インデックス[2007-06-17-6]による検索システムの実装は パフォーマンスを無視すれば意外と簡単です。 それを示すために Perl で簡単な検索システムを作ってみました。 検索方式は転置インデックス(Inverted Index)、 ランキングには TF-IDF[2005-10-12-1] を用いました。 検索対象ファイルは一行一記事で以下のフォーマットとします。 [記事ID][SPC][記事内容]\n 記事IDは数字、記事内容は UTF-8 の文字で構成されるものとします。 以下のようなサンプル test.txt を用意しました。 1 これはペンです 2 最近はどうですか? 3 ペンギン大好き 4 こんにちは。いかがおすごしですか? 5 ここ最近疲れ

    [を] 転置インデックスによる検索システムを作ってみよう!
    teahut
    teahut 2007/11/27
    アルゴリズムの本質は簡単ということがよくわかる.文字単位で分割するのは utf8::decode $c; @char = split '', $c; のが簡単で読みやすいかも (出力時に utf8::encode $_; で戻すことになるけど).
  • chalow version 1.0 を公開

    chalow version 1.0 を公開 2007-10-19-2 [Chalow] chalow version 1.0 を公開しました。 http://chalow.org/ http://chalow.org/cl/2007-10-19.html 特に大きな変化はないのですが、長い間ほったらかしだったのを反省して、 リリースしました。

    chalow version 1.0 を公開
    teahut
    teahut 2007/10/21
    新しいケータイスクリプトは同梱されてないっぽい…orz
  • カイ二乗値で単語間の関連の強さを調べる

    カイ二乗値で単語間の関連の強さを調べる 2007-09-19-1 [Algorithm][Programming] カイ2乗値を使って単語間の関連度を調べる方法。 つまり、関連語を探すときに、χ二乗値を関連度として使う。 perl によるサンプルコード (chiword.pl)。昔、勉強がてら作ったコード。 #!/usr/bin/perl use strict; use warnings; my %cnt; my $pair_num; while (<>) { chomp; next if /^\s*$/; my @list = sort split(/,/, $_); for (my $i = 0; $i < @list; $i++) { for (my $j = $i + 1; $j < @list; $j++) { next if $list[$i] eq $list[$j]; $c

    カイ二乗値で単語間の関連の強さを調べる
    teahut
    teahut 2007/09/20
  • Webとコーパス 第三回「英文校正サイト NativeChecker」

    Webとコーパス 第三回「英文校正サイト NativeChecker」 2007-09-18-3 [WebAndCorpus] Web上のテキストデータをコーパスとして見る、 というテーマでブログ記事を書いています。 今回は英文校正サイト NativeChecker を取り上げます。 なお、この記事は「三省堂辞書サイトのブログ」へも転載という形で 提供していますので、そちらでもお楽しみ下さい。 - 第三回「英文校正サイト NativeChecker」 - Sanseido Word-Wise Web [三省堂辞書サイト] http://dictionary.sanseido-publ.co.jp/wp/ ちなみに Sanseido Word-Wise Web によれば、明日19日は、 子供向けかと油断すると結構エグいサバイバル小説「蝿の王」[2004-06-15-4]の 著者ウィリアム・ゴ

    Webとコーパス 第三回「英文校正サイト NativeChecker」
    teahut
    teahut 2007/09/20
    >「made by wood」と入力すると、ウェブでの出現頻度と (snippetが出てくる)... 前置詞の部分を様々なバリエーションに換えて出現頻度を調べたい場合、「by」をクリックして出てくるメニューで「その他の表現」を選択します。
  • ウェブサイエンス入門-インターネットの構造を解き明かす

    ウェブサイエンス入門-インターネットの構造を解き明かす 2007-09-02-2 [Book][Algorithm] こんなを買いました。 ■斉藤和巳 / ウェブサイエンス入門-インターネットの構造を解き明かす 可視化、構造分析、SEOスパム分析、トピック抽出などの Webまわりの楽しげな話題がたくさん。ウェブマイニングとか テキストマイニングとかが大好きな私としては素通りできません。 一度一気にざっと目を通して、その後部分部分つまみ読みしたりしてたん だけど、具体的なアルゴリズムや数式(そんなに難しくないやつ)も のっていて、実用的かも。

    ウェブサイエンス入門-インターネットの構造を解き明かす
    teahut
    teahut 2007/09/02
    >斉藤和巳 / ウェブサイエンス入門—インターネットの構造を解き明かす... 可視化、構造分析、SEOスパム分析、トピック抽出... 具体的なアルゴリズムや数式(そんなに難しくないやつ)ものっていて、実用的かも
  • Webでの単語共起を調べるサイトを作った

    Webでの単語共起を調べるサイトを作った 2007-07-29-3 [Programming][NLP] ヤフー検索を用いてWebでの単語共起を調べるサイト 「Web単語共起」(http://yapi.ta2o.net/tangokyouki/) を作りました。 日語だけじゃなく英語もいけますよ。 Yahoo!ウェブ検索APIで検索結果100件を取ってきて、 日語の場合は形態素解析(MeCabを使用)をかけて、 単語の出現頻度をカウントして表示します。 Unigram は1語単位でのカウント、 Bigram は連続2語単位でのカウント、 Trigram は連続3語単位でのカウントを意味します。

    Webでの単語共起を調べるサイトを作った
    teahut
    teahut 2007/07/31
    >Yahoo!ウェブ検索APIで検索結果100件を取ってきて、日本語の場合は形態素解析(MeCabを使用)をかけて、単語の出現頻度をカウントして表示します。
  • 社内ブログ導入・運用ガイド

    社内ブログ導入・運用ガイド 2007-07-23-2 [Blog][BookReview] 献いただきました。ありがとうございます! ■木村早苗(著), 内藤裕紀, 安藤正樹(監修) / 社内ブログ導入・運用ガイド 社内コミュニケーションの活性化の方策としてのブログ導入のです。 運用のポイントと、様々なバリエーションの事例が紹介されていて 参考になります。 せっかくみんなで(外部非公開で)ブログを使うなら コミュニティ内データベースとしての価値が高まる方向に 向かうと良いな。そのためには、高機能な検索(ゆれ表現の吸収など 痒いところに手が届く性能、つまりGoogleレベルのイントラ検索)、 イントラ版ソーシャルブックマーク的な機能(記事単位投票で 有用な情報を埋もれさせない)は必須ですね。 イントラネット上のツールで社内コミュニケーション活性化だと言われて まずイライラするのは、インタ

    社内ブログ導入・運用ガイド
    teahut
    teahut 2007/07/24
    >高機能な検索(ゆれ表現の吸収など痒いところに手が届く性能)、イントラ版SBM機能は必須... イントラネット上のツールでまずイライラするのは、インターネットでは普通に便利に使っている様々なツールが使えないこと
  • Yahoo!デベロッパーネットワークにテキスト解析APIが登場!

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場! 2007-06-18-1 [WebTool][NLP][MECAPI][Programming] Yahoo!デベロッパーネットワークに「テキスト解析」が登場しました。 第一弾は日形態素解析APIです。 ヤフーのいろんなところに使われている WebMA という 形態素解析エンジンのAPIです。 - Yahoo!デベロッパーネットワーク - テキスト解析 - 日形態素解析 http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html MECAPI の仕様に似ていますが、まあそういうものです。 (MECAPI https://maapi.net/) で、先日 MECAPI で作った「文で検索」[2007-04-03-1]の WebMA 版を作ってみました。「文で検索2」

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場!
    teahut
    teahut 2007/06/19
    >特に固有名詞なんかには強いです。
  • 「ひとりで作るネットサービス」探訪に登場しました!

    「ひとりで作るネットサービス」探訪に登場しました! 2007-06-11-2 『田口元の「ひとりで作るネットサービス」探訪』に登場しました! ITmedia Biz.ID:「サービスは半日で完成させる」--SETAKE・たつをさん http://www.itmedia.co.jp/bizid/articles/0706/11/news034.html SETAKE や EReK など、比較的最近に公開したサービスを主に取り上げて頂きました。下記の4つです。 - 有名人身長推定サイト SETAKE (ref. [2007-04-29-2]) ttp://setake.net/ - 英語例文検索 EReK (ref. [2007-05-17-2]) http://erek.ta2o.net/ - 買ったら検索 (ref. [2007-04-29-3]) http://kattara.ta2o.

    「ひとりで作るネットサービス」探訪に登場しました!
    teahut
    teahut 2007/06/12
    >ユーザ登録が必要なサービスは作らない, 毎日必ず動作確認, サービスのスクリーンショットを印刷した「プレゼンセット」を持ち歩く
  • 「伝説の社員」になれ!の出版記念セミナーへ行ってきました

    「伝説の社員」になれ!の出版記念セミナーへ行ってきました 2007-05-19-3 [Book][EventReport][Video] 土井英司著『「伝説の社員」になれ!』の出版記念講演会へ行ってきました。 土井さんのお話が熱かったです。いろいろとやる気が出てきます! ■土井英司 / 「伝説の社員」になれ! 成功する5%になる秘密とセオリー この自体もかなり面白いのです。 あなたが「つまらない仕事」でコキ使われてしまうのは、じつはあなたが 自分を「高く売っている」からなのです。(p.16) なんて、なるほどー、と思います。 安い方が動きやすいのであとあとプラスになると。 高く売るときと安く売るときを見極めるのが重要ですね。 さて、講演会の第二部は「シゴタノ!」の大橋悦夫さんと アルファブロガー発生源の徳力基彦さんを交えてのパネルディスカッション。 お二人それぞれの著書、「スピードハック

    「伝説の社員」になれ!の出版記念セミナーへ行ってきました
    teahut
    teahut 2007/05/24
    >あなたが「つまらない仕事」でコキ使われてしまうのは、じつはあなたが自分を「高く売っている」からなのです。
  • 「スピード3倍仕事術×年収10倍アップ勉強法」セミナーに行ってきました

    「スピード3倍仕事術×年収10倍アップ勉強法」セミナーに行ってきました 2007-05-20-1 [Book][EventReport][Video] ついてるブログ「俺と100冊の成功」の聖幸さん主催の初のセミナーが 開催されました。スタッフとしてお手伝いさせて頂きました。ツイてる! (ref. [を] 3倍と10倍のセミナーが開催されるそうでツイてる![2007-05-09-1]) 「スピード3倍仕事術×年収10倍アップ勉強法」セミナー http://blog.zikokeihatu.com/20070520/ 講師は「スピードハックス」[2007-02-10-1]やシゴタノ!の 大橋悦夫さんと、 「無理なく続けられる 年収10倍アップ勉強法」[2007-05-09-3]の 勝間和代さん。 内容は、大橋さんのプレゼン(1)、勝間さんのプレゼン(2)と続き、 「スピードハックス」の共著

    「スピード3倍仕事術×年収10倍アップ勉強法」セミナーに行ってきました
    teahut
    teahut 2007/05/24
    >とりあえず「妬まない、怒らない、愚痴らない」でいきたいと思います!
  • 検索エンジンのしくみ本

    検索エンジンのしくみ 2006-12-22-1 [BookReview] ■神崎洋治, 西井美鷹 / 体系的に学ぶ検索エンジンのしくみ 講義資料用作成参考にしようと、さくっと速読。 ちょっと古めだけど、「しくみ」の基的なところはきっちり押さえてある。 とくにコアのエンジンの説明はかなり丁寧。初心者向けですね。 (自分用メモ:gooの「Web検索日語処理」まわりについてちょっとだけ 言及があった。検索連動広告GA,OJの具体的な解説も。MAの優勢性説明に は「インドア」と「インド」を使用。PATRICIAまでのってる) 仕組みだけでなく、この分野自体に興味にある人は、今なら 「ザ・サーチ」や「グーグル誕生」や「検索エンジン戦争」 を読んだ方がいいかも。 ref. - [を] ザ・サーチ[2006-02-26-3] - [を] Google誕生[2006-07-27-3] - [を] 検

    検索エンジンのしくみ本
    teahut
    teahut 2007/05/13
    >体系的に学ぶ検索エンジンのしくみ, ザ・サーチ, Google誕生, 検索エンジン戦争
  • SETAKEに身長差が一目で分かるセタケ君が登場

    SETAKEに身長差が一目で分かるセタケ君が登場 2007-05-06-1 [SETAKE] 有名人の身長を推定するWeb2.0的集合知サイト SETAKE (ttp://setake.net/) をバージョンアップ。 身長差が一目で分かるようにするため「セタケ君」を登場させました。 人の形をしたアイコンがセタケ君です。 [[images/070506-setake-kun.jpg]] なお、「最頻値」はネットで最も多く出ている値、「平均値」は名前とそのページに出ている値(○○cm)を集めて平均したものです。セタケ君の背は「最頻値」に基づいています。

    SETAKEに身長差が一目で分かるセタケ君が登場
    teahut
    teahut 2007/05/07
    >有名人の身長を推定するWeb2.0的集合知サイト SETAKE
  • 3Dインターフェースは主流にはならないだろうなあ

    3Dインターフェースは主流にはならないだろうなあ 2007-04-27-2 [Opinion] とりあえず最初にまとめとくと: 3Dはインタフェースの主流になっていないし、今後もならないと思う。 なぜなら「インターフェースってのは適所適材でないと逆効果」で、その上「3Dが適するものってそんなに多くない」から。 あたり前のことですが。 以下蛇足。 § 「FPN-IT技術者は超保守的、セカンドライフへの無関心が持つ意味」(HB!, INTERNET ARCHIVE)という記事にて、 ビジネスウイーク誌を読まなくても、10年たてば3Dのインターフェースが主流になるでしょう。 との主張がなされていました。しかし私は懐疑的です。 商品の種類によっては商品写真をクルクルまわす見せ方が主流になるかもしれません。これを3Dと呼ぶならば(微妙なところですが)「その分野では3Dのインターフェースが主流になる」

    3Dインターフェースは主流にはならないだろうなあ
    teahut
    teahut 2007/05/02
    >「3Dのインターフェースが主流になる」ことはないでしょう。本当は3Dが良いんだけど2Dに甘んじていた分野が置き換わるだけかと。
  • USB FMトランスミッターを買った!

    USB FMトランスミッターを買った! 2007-03-17-1 [Gadget] PC音楽を手軽に外部スピーカーへ飛ばせる USB FMトランスミッター。 先日気になったやつ。(ref. [2007-02-17-3]) ■サイバーガジェット USB FMトランスミッター パソコン用 CY-PCTR-WH ノートPCを利用している場合、外部スピーカに接続するためのケーブルが邪魔になるという悩みがありました。これでは、"使う場所を選ばない"というノートPCの魅力が半減です。そんな悩みをこの商品が解消します。 結局、アマゾンで発注。今朝届きました。 なかなか良い感じです。手軽さが素晴らしい。 うちにある古いラジカセ[2001-06-02-1]が大活躍。 メモ: - Windows (XP, 2000) でしか使えません。 - ドライバソフトとか不要。差すだけ。 - 差した瞬間から、PCで出る

    USB FMトランスミッターを買った!
    teahut
    teahut 2007/03/17
    >ノートPCを利用している場合、外部スピーカに接続するためのケーブルが邪魔になるという悩みがありました。これでは、"使う場所を選ばない"というノートPCの魅力が半減です。そんな悩みをこの商品が解消します。
  • 1