タグ

フィルタリングに関するfoaranのブックマーク (9)

  • 2006-05-08

    朝6時半に奇跡的に目が覚めて、情報線形代数のレポートをやる。夜は寝てしまいましたからね○刀乙。 10時出発,12時半到着。出たときはめちゃ暖かかったのに、着くときには小雨が降って寒かった。 ひさしぶりのテニス。病み上がりで少しフラフラしたけど楽しかった。 今日学んだPointは ・打つ時に左肩が早く開きすぎ ・テークバックから打つまでの間で面が地面に対して垂直になるまでが遅い。もっと早くフラットの面を作らなくちゃ。 という事。気をつけよう。 1人目の先生のところへ。 Kikkerの事を話したんだけど興味を持ってもらえた様子。関係ないけどCeekz氏は結構いろんなところで知られているようだ。 TODOをこなそうと思ったが、VMWareでFedora Core3入れたり、Hyper Estraierなど検索システムを調べたり、検索アルゴリズムとかを調べたりしてたら12時ぐらいに・・・・・・。

    2006-05-08
  • TOP - Abalanceグループサイト

  • 今日の井原. - オモシロクリエイターってなんすか

  • 2006-09-12

    ⊂( ⊂(´_ゝ`)ぐー 授業はがっつりとテニス。 授業後はシングルスで、K村君ではなく、N川君と試合。 6-1で勝利。まだまだ、負けないぜぇー!! 3学でジュース買って皆とくつろぐ →コンビニ弁当をべる →宿舎風呂に入る →部屋で夕寝 まったりと(投票) あいかわらず、MMと格闘しつつ、人に意見を伺ったり。 さて、何すんべ。 そういえば、昨日出社した時に名刺を受け取りました。 なかなかかっこいいのでお気に入り。 見たい人は、会った時に声かけて下さい。 ブックマーク連携型検索エンジン「netPlant」の開発 http://www.ipa.go.jp/jinzai/esp/2006youth/gaiyou/2-04.html 今年の未踏ユースに採択されたみたいなんだけど、質的にはKikkerと同じシステムになる気がする。 そこで第二に、ウェブサービスを公開することにより、収集したメタデ

    2006-09-12
  • Kazuho@Cybozu Labs: キーワード抽出モジュールを作ってみた

    « IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日 キーワード抽出モジュールを作ってみた 一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。 竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパラメータのチューニングを行ったところ、十分な品質が出そうなので、書き直して公開することにしました。 普通の Perl モジュールなので、 perl Makefile.PL && make && make install すれば使うことができます (15:50追記: すみません。 MeCab

  • 2006-04-29

    やっとできました。 今までのKikkerでははてブをクロールした結果しか扱っていませんでしたが、CEEK.JP NEWS*1をクロールしてニュースサイトのようにしてみました(情報源はばっちりですよ)。 これによって、今までGeekしか使いようがなかった*2Kikkerが、誰でも便利に使って情報を集められるKikkerになったわけです。 宣伝 あなたはどうやってWeb上のホットな話題を集めていますか?毎日たくさんのサイトを巡回して情報を集めてきているのですか?それには無駄な時間がかかりすぎていませんか? Kikkerはそんなあなたの代わりに情報の取捨選択を行ってくれます。無駄な時間を削減してその時間をあなた与えてくれます。 是非ご覧になって下さい。 [Top Page] http://ryogrid.myhome.cx:1234/ [ニュース表示のサンプル(Ryoに対してのリンク)] htt

    2006-04-29
  • 今日の井原 - 文章要約プログラムを書いてみよう!その2 〜TF/IDFといっしょ!〜 

    Home > December 2003 > ʸ�������ץ��������񤤤Ƥߤ褦�� �����Σ�����TF/IDF�Ȥ��ä��硪���� December 19, 2003 ʸ�������ץ��������񤤤Ƥߤ褦�� �����Σ�����TF/IDF�Ȥ��ä��硪���� �����Ƥ��ơ������Ǥ�������³������ ���ͤ��񤤤�ʸ�������ץ����������󤷤ᤷ���������Τ��Ȥ͡ˡ��������ˤ�ô�äƤ����Τ���TF/IDF�٤Ȥ������르�ꥺ�����������Ϥ����ˤĤ��Ʋ��⤷�ƹԤ����������Ĥ�̾�������Τ����Ǥʤ��������񤷤������ȻפäƤ��ޤ������ºݤˤϴʷ��ǰ����䤹�����Τ���ľ��Ū�Ȥ������ȤäƤ���Ũ�ʥ��르�

  • キーワード抽出

    世界中には100万を超えるインターネットのホームページがあるといわれています。 四六時中休まずに世界中のホームページを探して記事を取り込むサーチロボットができて、この大量の記事を取り込むことは不可能ではなくなりました。 また、高速の全文検索システムでこの膨大な記事から指定したキーワードを持つ記事をすべて瞬時に検索することもできます。 しかし、この中から興味のある記事だけを探すのは大変な作業です。なぜなら100万件の記事から検索すると、思い付くキーワードをいろいろ使って絞り込んでも、数百件の記事を検索結果として出してしまうことが珍しくありません。当然利用者は記事数が多すぎて読みきれないので検索に失敗したとして投げ出してしまいます。そのようなことにならないためには、何かうまい絞り込み手段が必要です。 絞り込みの手段として  絞り込みの手段として、まず思い付くのは権威のある出典の記事だけが重要で

  • ベイジアンフィルタ - Wikipedia

    ベイジアンフィルタ (英: Bayesian filter, naive Bayes spam filtering) は単純ベイズ分類器を応用し、対象となるデータを解析・学習し分類する為のフィルタ。学習量が増えるとフィルタの分類精度が上昇するという特徴をもつ。個々の判定を間違えた場合には、ユーザが正しい内容に判定し直すことで再学習を行う[1]。 現状ではスパムメール(いわゆる迷惑メール)を振り分ける機能を持つソフトウェア(フィルタリングソフト)で、スパムフィルターでのスパム判定に利用されることが多い[1]。最近ではWeblogのトラックバック用フィルタ(トラックバックスパム対策)にも利用されるようになるなど、その利用範囲は徐々に広がりつつある。 概要[編集] ベイジアンフィルタでは、初期状態である程度までの振り分けができるように設定されている。振り分け対象となるデータ(迷惑メールなど)の学

    ベイジアンフィルタ - Wikipedia
  • 1