■ ページが見つかりません 以下の項目についてもう一度お確かめください。 ・ URLは間違っていないか (大文字小文字などの入力ミス、参照ページの記載ミスなど) ・ リンクが切れていないか (引っ越しした、削除されたなど)
■ ページが見つかりません 以下の項目についてもう一度お確かめください。 ・ URLは間違っていないか (大文字小文字などの入力ミス、参照ページの記載ミスなど) ・ リンクが切れていないか (引っ越しした、削除されたなど)
ベイジアンフィルターで日本語を取り扱う時に問題になってくるのが、文章を品詞レベルに分解する処理。英語の場合は、文章はスペースで区切られた品詞の集合で構成されるため、余分なことをせずに簡単に処理できる。例えば、'How do I set up an AirPort wireless network?'という文章の場合、ベイジアンフィルターは、スペースで区切られた単語を、分類するための判断材料として自動的に取り込んでくれる。 ところが、日本語の場合は、「エアポートの無線ネットワークはどうやって設定しますか?」という文章を、「エアポート の 無線 ネットワーク は どう やっ て 設定 し ます か ? 」のように、品詞をスペースで区切った文章に変換して、ベイジアンフィルターに渡してあげる必要があるらしい。これはすごく高度な作業だ。自分のレベルではどうやっても出来ない。 そこで、この高度な作業を
2chdic.070813.zip 83's : MeCab用、2ちゃんねる辞書からお借りしたMeCab用2ch語辞書が自分の使っているmecab version 0.95 に対応してなかったので、色々修正。 コストもほんの少しだけ頑張ってみたけど、面倒なんで大部分がお借り元と一緒の3206です。暇を見てちゃんとコスト考えようかね。 自分で何か付け加えたりとかはしていないので、最近の2ch語にも対応しておりません。 左・右接続IDはデフォルトのIPA辞書の品詞・形態を元にしました。というか、デフォルトの辞書も左右のID一緒問題ないのかな。 辞書の追加の仕方は 本家を参照してください。 糞スレ立てんな、ヴォケが 糞スレ 名詞,一般,*,*,*,*,糞スレ,クソスレ,クソスレ 立てん 動詞,自立,*,*,一段,体言接続特殊,立てる,タテン,タテン な 助詞,終助詞,*,*,*,*,な,ナ,ナ
見た目はフナムシっぽいのですが、動きはサイバーパンクです。 YouTubeの動画を見てもらえば一目瞭然ですが、8つの車輪付きの脚をうまく使って歩いたり、横に移動したり、さらには回転も自由自在。障害物も簡単に乗り越えられます。デザインは似てませんけど、イメージ的には攻殻機動隊のタチコマですね。 このタチコマ風ロボット、Halluc II (ハルク・ツー)は現在日本科学未来館にて展示、操作体験モニター受付中です。1日3名という狭き門なので、ちょっと頑張らないといけないかも知れませんね。なお操作は普通のコックピットで行うもので、決して脊髄に電極を差して動かすものではありませんのでご安心を。 (野間恒毅) イベント情報 [日本科学未来館] 【関連記事】 無人で動くロボットな自動車 【関連記事】 戦闘ロボットが、四角いリングで火花を散らし、はじけとぶ(動画) 【関連記事】 岩石破砕レーザーで火星人と
2007.08.20 「Yahoo!の形態素解析をMeCabで無理やり再現してみる」を試してみて カテゴリ:ことばの処理 Yahoo!の形態素解析をMeCabで無理やり再現してみる を読む。 MeCabで形態素解析器を作りたい場合は以下の二つの言語リソースが必要です。 1. 辞書 (単語と品詞のペアの集合) 2. 入力文と、それに対応する正解出力ペア(正解データ) 学習させるときには、辞書と、正解データを用意しなきゃならない。これが面倒だから、なかなか自作の辞書を作る気にならない。Wikipedia のデータをダウンロードすれば、大量のテキスト文章は得られるけれども、正解出力を手作業で作るのは大変だし、元辞書も作らなきゃならないから、不可能に近い。 じゃわ、正解出力をちゃんと手作業で作るのではなくて、Yahoo! API の 日本語形態素解析Webサービス を使って得られた解析結果を擬似的
2007.08.07 カブロボコンテストを見てみる カテゴリ:カブロボ カブロボでサイバーファンドマネージャーになろう! を見る。いつの間にか、 新規受付中 / 日々自動運用中 (いつからでも参加できます。) になっている。ランキング を見ると、現在のトップは運用日数 315日でトータル純損益 31.02% の FOOBER_07 というもののようだ。最優秀賞カブロボのパフォーマンス(10台合計) を見てみると、運用開始から 168 日経過で、全カブロボ資産評価額合計 \500,000,000 が \459,507,980 と負けている。運用成績がよいものと悪いものがあるので、そういうことになっているわけか。現在運用成績がよいのは、tantantakatan で 対TOPIX比 14.44% と立派な成績。 開発者: 長尾優さん ロボット名: tantantakatan 主な特徴: 短期の
P2Pとかその辺のお話 WinMXとかWinnyとか、日本ではろくな扱いを受けていないP2Pですが、海外ではけっこう真面目に議論されてるんですよというブログ。 何か大きなファイルを知り合いに転送したい、というときに相手がBitTorrentクライアントをPCにインストールしていなかったり、職場などBitTorrentクライアントがインストールされていないPCを利用しているときに、BitTorrentを利用してダウンロードしたい、ということがあるかもしれない。しかし、前者であれば、友人にBitTorrentクライアントを導入するよう進めたり、その利用方法を一から説明するのも大変だし、後者であればネットワークの管理者にBitTorrentを利用させてもらうとう頼むのも億劫なもの。そうしたときに、役立つのが今回紹介するBitLetかもしれないよ、というお話。BitLetはWebベースのJavaア
GPU Gems 3 GPU Gems 3 is now available for free online! The CD content, including demos and content, is available on the web and for download. You can also subscribe to our Developer News Feed to get notifications of new material on the site. Foreword Composition, the organization of elemental operations into a nonobvious whole, is the essence of imperative programming. The instruction set archite
Beepを使って作りました。Windows限定。コマンドライン引数で音律(12音平均律だったら12)と、いくつの音を使うか(これで曲が決まります)を指定できます。 24音平均律の25がいい感じの曲になっています。 一応実行形式も用意しました。ダウンロードはこちらから。 -- -*- compile-command: "ghc -W -ffi -o fib2.exe fib2.hs" -*- module Main (main) where import Control.Concurrent (threadDelay) import System.IO import System (getArgs) import System.Win32 (UINT, BOOL) foreign import stdcall unsafe "Beep" cBeep :: UINT -> UINT -> IO
TextMap is a search engine for entities: the important (and not so important)people, places, and things in the news. Our news analysis system automatically identifies and monitors these entities, and identifies meaningful relationships between them. TextMap analyzes both the temporal and geographical distribution of news entities. We literally monitor the state-of-the-world through our analysis of
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く