Julian Frumar Co-founder and Director of User Experience at Omnisio Inc. jules Startup School 08 Startup school is an annual free conference for hackers interested in startups. This year notable speakers included Mike Arrington, Marc Andreessen, Jeff Bezos and Paul Graham. The official website is http://startupschool.org/ David Heinemeier Hansson at Startup School 08 David Heinemeier Hansson, cre
ベイジアンフィルターで日本語を取り扱う時に問題になってくるのが、文章を品詞レベルに分解する処理。英語の場合は、文章はスペースで区切られた品詞の集合で構成されるため、余分なことをせずに簡単に処理できる。例えば、'How do I set up an AirPort wireless network?'という文章の場合、ベイジアンフィルターは、スペースで区切られた単語を、分類するための判断材料として自動的に取り込んでくれる。 ところが、日本語の場合は、「エアポートの無線ネットワークはどうやって設定しますか?」という文章を、「エアポート の 無線 ネットワーク は どう やっ て 設定 し ます か ? 」のように、品詞をスペースで区切った文章に変換して、ベイジアンフィルターに渡してあげる必要があるらしい。これはすごく高度な作業だ。自分のレベルではどうやっても出来ない。 そこで、この高度な作業を
2008年01月30日 Mechanize で日本語のリンクを辿れない? WWW::Mechanizeで日本語のリンクを辿るコードを 下記のように書いた。 $KCODE='s' require 'mechanize' require 'nkf' agent = WWW::Mechanize.new page = agent.get("http://www.asahi.com/") tw = NKF.nkf("-e","天気") lnk = page.links.text(/#{tw}/) page = agent.click(lnk) puts page.uri しかし、検索対象となるリンクの語句によっては、 premature end of regular expression: というエラーが出て動かなかったりする。 原因はこちらの現象だった。 ちなみに漢字コードを含んだスクリプトで問
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く