タグ

ブックマーク / nais.to/~yto (13)

  • [を] テキストマイニングを使う技術/作る技術

    テキストマイニングを使う技術/作る技術 2006-12-28-3 [書評・感想] テキストマイニングの分野で有名なIBMの那須川哲哉氏による入門書。 全編具体的で分かりやすい。 ■那須川哲哉 / テキストマイニングを使う技術/作る技術 ―基礎技術と適用事例から導く質と活用法 テキストマイニングというと、ブログや掲示板での特定の何かの評判情報 検索など、近年その活躍の場が一般ユーザの目に付くところまで広がって 来ている。 このはテキストマイニングを支える技術、事例紹介、技術以外の側面 (運用など)はもちろん、「テキストマイニングとは何か」ということ についても初心者にも分かりやすいよう、かなり丁寧に解説されている。 一番重要なポイントが最初の方で述べられてる。これ、大切。 [...]テキストマイニングというものは、あくまで人間が膨大な文書データ を有効活用するた

    hayashih
    hayashih 2006/12/29
  • [を] 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード

  • [を] encodeURI

    encodeURI 2003-11-17-2 JavaScript 1.5 から encodeURI という関数があって、文字どおり URL エンコードしてくれます (例: %E3%82)。しかしその前に文字コードを勝 手に UTF-8 に変換してしまうようです。とはいえ、実は私にとっては好 都合だったりして。などなど。 - JavaScriptにおけるURLエンコードの処理 <http://www.cresc.co.jp/tech/java/URLencoding/JavaScript_URLEncoding.htm> 懇切丁寧な解説。 - JavaScriptでURLエンコード <http://www.suepon.com/jsm/script/jsm38.html> 裏技的? ■David Flanagan / JavaScript 第5版 ■Shelley

  • [を] ハートマークの出し方

    ハートマークの出し方 2006-01-02-3 [Tips] ハートマークは実体参照で出すのがいいよ♥ 半角で「♥」と書けばOK! ブログサービスによってはうまくいかないこともあるかも…。 mixi (http://mixi.jp/) では使えます。 ♥ → ♥ あと、白いハートは「♡」で! ♡ → ♡ その他のやり方として、フォントを指定して使う方法もあるよ。 使える場面が限られてるし、人によっては見えないこともあるから オススメじゃないけど(OSやブラウザによって見えなかったりする)。 <font face="Webdings">Y</font> → Y <font face="symbol">©</font> → © 参考: - @nifty:FHPG:お役立ち:FAQ:ハートマークは? <http://forum.nifty.com/fhpg/ut

  • [を] あなたに語る夢はない

    あなたに語る夢はない 2006-10-12-1 [ネタ] 「あなたに語る夢はない」。 夢はあるが、あんたには話さん。 「最近の若者は夢がない」への反抗としてどうでしょう? 以上、単なる思い付き。

    hayashih
    hayashih 2006/10/15
  • [を] Software Design 2006年10月号のPlagger特集のメモ

    Software Design 2006年10月号のPlagger特集のメモ 2006-09-24-1 [] Software Design (ソフトウエア デザイン) 2006年 10月号 [雑誌] posted with Yasazon (2006.09) 定価 : ¥ 970発売日 : 2006/09/16出版社/メーカー : 技術評論社 Plagger 特集より、インストールコマンドメモ (pp.78-81): wget http://www.perl.com/CPAN/src/perl-5.8.8.tar.bz2 bzip2 -dc perl-5.8.8.tar.bz2|tar xvf - cd perl-5.8.8 sh Configure -des -Dprefix=$HOME/perl make make install export PATH=$HOME/perl/

  • [を] Google マップに地下通路情報が

    Google マップに地下通路情報が 2006-09-26-1 [WebTool] Googleマップ(http://maps.google.co.jp/)に、いつの間にか、地下鉄の 出口だけじゃなく地下通路の情報がつきましたね。便利さアップですね。 都市部では地下通路情報は重要です。see [2005-10-03-3] 【規約違反の可能性があるため画像取り下げ】 ref. - Googleマップがまた進化--“日”に合わせて地図データを全面更新 http://japan.cnet.com/news/media/story/0,2000056023,20248507,00.htm Google Maps

  • [を] 裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する

    裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する 2006-09-17-1 [YahooHacks][NLP] 今回の YahooHacks は、 長い文を検索キーとしてWeb検索をするというハックです。 一年前の検索会議[2005-09-30-3]で紹介しましたが、 今回ゼロから書き直しました。 サンプルコードが長くなってしまってすいません…。 (一時的にデモを置いておきます。そのうち消えます。ご了承下さい。 http://nais.to/~yto/tmp/yahoohacks-samp/hack_sentence.cgi 検索例:SEOの10ステップと...←うろ覚えタイトル ) ■■■長い文をそのまま検索キーとして Web 検索する どこかからコピペしてきた長い文をそのまま Yahoo! で検索しても ヒットしないことが多いです。 そういう場合

  • [を] 図書館で無線LAN

    図書館で無線LAN 2006-08-10-3 夜、東京都立中央図書館へ行ってきました[2005-12-09-2]。 ノートパソコン持ち込み用の席があり、電源だけでなく、 Yahoo! BBの公衆無線LANもあるのです[2006-07-29-1]。 平日は21時まで開いているのが良いです。月曜もやっているのもポイント。 - 東京都立中央図書館 http://www.library.metro.tokyo.jp/12/index.html http://bbmobile.bb.yahoo.co.jp/bin/detail?pf=13&ct=area&ac=13103& bc=HSP0002700001&sc=0058

  • [を] 人気の出るブログと長く続くブログは違う

    人気の出るブログと長く続くブログは違う 2006-05-26-1 [Blog] 長く続くブログは「自分」が最大の読者。 人気の出るブログは「読者」が読者。 両方を兼ね備えたブログもあるけど。 人気ブログには一貫したテーマがあるわけです。 とはいえ Passion For The Future とか百式みたいに一貫したテーマで 長く続けるってのはたいていの人は飽きたり疲れたりで無理。 うちのブログはかなりごちゃまぜで一貫してるとは言いがたい。 だからこそ長続きしてるのかも。 「テーマをしぼる」「有意義なことだけ書く」とかにこだわらないで 好きなようにだらだら書くと意外に低燃費で続けられるかな。 だらだらやりつつも後には何かが残る、というのが理想。 Referrer (Inside): [2008-09-26-2] [2007-07-01-2]

    hayashih
    hayashih 2006/05/27
    そのとおり
  • [を] 「次」と「前」の意味と並び順

    「次」と「前」の意味と並び順 2006-05-22-2 [Blog][WebTool] 次の日、前の日、次のページ、前のページ、次の記事、前の記事。 「前」「次」はそれぞれどういう意味か。 またそれらはどういう順番で並んでいるか。 気になったので調査中。 サービス名[位置]と表記意味livedoor blog[左] 前の記事古い記事へlivedoor blog[右] 次の記事新しい記事へtDiary[左] 前の日記古いページへtDiary[右] 次の日記新しいページへMovable Type 系[左] 古い記事へMovable Type 系[右] >> 新しい記事へはてなダイアリー[左] 前の日 古いページへはてなダイアリー[右] 次の日 新しいページへYahoo! 360°[左] 前の日記古いページへYahoo! 360°[右] 次の日記新しいページへ2ちゃんねる[左] 前10

  • [を] 第三回 検索会議 『Yahoo! HACKS』

    第三回 検索会議 『Yahoo! HACKS』 2005-09-30-3 [EventReport] 行ってきました! 今回は開催側からの参加となりました。 半年前の前回の検索会議[2005-03-05-2]のときには単なる一参加者だった ことを思うとなんというか感慨深いです。このようなイベントで、 人生の転換のきっかけを与えてくれた主宰者のお二人に感謝です。 ということで、「行ってきました!」というよりも ご参加ありがとうございました! Academed!A | 第三回 検索会議 Yahoo! Hacks <http://academedia.jp/event200509/> Yahoo! JAPAN協賛による検索会議も第三回。今回は単純に検索を利用する だけではなく、検索を使ってどんな新しいサービスが可能か、さきごろ公 開されたYahoo! APIなどを活用した

  • [を] 日本語形態素解析入門

    形態素解析入門 2005-03-30-2 [NLP] 山下達雄 / 日形態素解析入門 Version 0.9.1 / 1999 <http://nais.to/~yto/doc/tech/jma/jma19990514.pdf> (1.4M) 奈良先端科学技術大学院大学(NAIST)自然言語処理学講座(松研)に D2の学生として所属していた1998年6月9日のミーティングで、 新入生(M1) 向けに「日形態素解析」の入門講座を行った。 その際に用いた資料を1999年5月14日に改定したものをPDF化して公開する。 文書自体は Version 0.9.1 で、 その後さらに加筆修整するつもりだったのだが、 結局そのままだったようだ。ChaSen についての記述など内容は古いし、 当然のことながらあちこちに重大な間違いがあるかもしれない。 しょっぱなから大

    hayashih
    hayashih 2005/06/08
  • 1