タグ

2007年8月16日のブックマーク (11件)

  • Nutch

    Nutch is a highly extensible, highly scalable, matured, production-ready Web crawler which enables fine grained configuration and accomodates a wide variety of data acquisition tasks. Scalable Relying on Apache Hadoop™ data structures, Nutch is great for batch processing large data volumes but can also be tailored to smaller jobs. Pluggable Out of the box Nutch offer powerful plugins i.e., parsing

    haida
    haida 2007/08/16
  • Bulknews - RSS Syndication

    2004.10.19 AV Watch, BB Watch を追加しました。 2004.04.05 Nikkei Net, ZAKZAK のリニューアルに対応しました。 2003.12.19 12/21 00:00-08:00 サービスが停止します。 2003.12.16 DB 障害が発生しましたが、復旧しました。 2003.12.01 SportsNavi を追加しました。 2003.10.08 go.cgi / view.cgi のリダイレクト等、リクエストした URL と異なるものとなってしまう不具合を修正しました。 2003.08.04 ブックモールPCの書籍新刊、uefa.comを追加しました。 2003.06.12 CNET Japanを追加しました。 2003.04.13 RSS Feed リストのXML(OPML) 出力を用意しました。 2003.04.01 Bulknew

  • Personalize Google Maps

    haida
    haida 2007/08/16
    mapplet
  • 47NEWS

    「沖縄アクターズスクール」創設者・マキノ正幸さん死去 安室奈美恵さん、DA PUMPら多くのスター輩出

    47NEWS
    haida
    haida 2007/08/16
  • デザイナーならブックマークしておきたい記事10選『10 lists every designer should bookmark』 | CREAMU

    Design デザイナーならブックマークしておきたい記事10選『10 lists every designer should bookmark』 デザインに使える記事を探している。 そんなあなたにおすすめなのが、『10 lists every designer should bookmark』。デザイナーならブックマークしておきたい記事10選だ。 以下にご紹介する。 » 101 ideas to get more freelance work and generate new clients leads フリーの仕事を増やすアイディア101選 » 25 best free quality fonts 無料で使えるクオリティの高いフォント25選 » Where can i find textures and background images? テクスチャと背景画像配布サイト集 » Free

  • NRIが“連想検索エンジン”を独自開発 - @IT

    2007/07/11 野村総合研究所は7月11日、ユーザーが興味のあるキーワードを入力すると、検索語に関連の深い内容のキーワードを自動的に検索結果に表示する検索技術“連想検索エンジン”を開発したと発表した。今後、システム開発を含む自社のITソリューションサービスで連想検索エンジンを活用した製品やサービスを事業化していくとともに、同社の公式ホームページでも活用していく。 一般的な検索では、検索にヒットしなかった場合に入力するキーワードを変えるなど工夫が必要だが、関連するキーワードを提示することで、目的の情報により早くたどり着けるという。キーワードの関連性を定義した「連想辞書」は自動生成する。また、文書データを入力して目的に合わせた連想キーワードの登録が行える。 検索のフロントエンド部分にはRuby on Railsを用い、ミドルウェア層にはオープンソースソフトウェアを採用した。開発スタイルと

    haida
    haida 2007/08/16
    連想検索
  • 「FASTはGoogleの検索技術より2年先行」 ― @IT

    2007/02/21 「Googleは検索技術の追究を諦めて、ネット広告に特化した」。Googleは検索技術そのものでは、先端的な検索技術を持つ他社に対して後れを取っており、自社の検索技術Googleのそれより2年先行している――、記者向け説明会で事業戦略を語ったファストサーチ&トランスファ 代表取締役社長の徳末哲一氏は、検索技術が開く新しい市場の可能性を感じている。同社は、エンタープライズ向け検索ソリューション市場で地歩を固めつつある。 四国お遍路はやめて検索ビジネスに 「四国にお遍路にでも出ようかなと言ったらに怒られましてね」。徳末氏は、長年在籍した日IBMを1992年に離れてから、日ピープルソフト、日ビジネスオブジェクツの代表取締役社長を歴任してきた。前職は2005年秋に退任。次に何をやるかべきか思案していた時期、約3カ月をかけて欧米やアジアを回った。そんな折に知人を通して

    haida
    haida 2007/08/16
    fast 自然言語処理
  • 辞書不要の形態素解析エンジン「マリモ」とは − @IT

    2007/08/15 検索サービスを提供するベンチャー企業のムーターは8月1日、辞書を必要としない形態素解析エンジン「マリモ」の提供を開始した。従来、形態素解析では品詞情報を含む日語辞書を用意するのが常識だったが、マリモでは、そうした辞書を不要とした。新技術のアプローチと特性について、開発元のムーターに話を聞いた。 統計処理で単語部分を推定 形態素解析とは、与えられた文を、文法上意味のある最小の単位(形態素)に区切る処理。「今日は晴れています」なら、「今日(名詞)/は(助詞)/晴れ(動詞)/て(助詞)/い(助詞)/ます(助動詞)」と分ける。検索エンジンをはじめ、さまざまな自然言語処理の場面で必要となる基礎技術だ。 形態素解析を行うには、あらかじめ品詞情報が付加された数十万語からなる辞書を用意する必要がある。また、新語や造語、専門用語に対応するには、個別に人力で単語を登録する必要がある。

    haida
    haida 2007/08/16
    自然言語処理
  • livedoor 検索 ブログ

    エンターテインメント 音楽, 芸能人・タレント, 韓流, お出かけ・レジャースポット, テレビ, マンガ・アニメ, 萌え, 文学・書籍, 新聞・雑誌, ゲーム, ... メディア・ニュース テレビ, ジャンル別ニュース, 雑誌, コミュニケーション, 時事・トピックス, ブログ(Blog), ラジオ, 新聞・通信社, 関連研究・学問, ランキング・データ, ... スポーツ 球技, スポーツ選手, ウィンタースポーツ, アウトドアスポーツ, 体操・フィットネス, モータースポーツ, ウォータースポーツ, 大会・イベント, サッカー, 野球, ... ビジネス・経済・産業 企業, 就職・転職, 国際ビジネス, ビジネスライフ, 起業・経営, 団体・組織, マネー, 地域振興, マーケティング, 株, ... 暮らし・趣味 シニア, 住まい, 趣味, お出かけ・レジャースポット, こども, 乗

    haida
    haida 2007/08/16
    未来検索
  • 未来検索ブラジル

    創業2003年。 未来検索ブラジルは インターネットの歴史と共に育った コンテンツとプログラムの会社です。 ネットメディア『ガジェット通信』、動画クリエイター事業『ガジェクリ』などのインターネットコンテンツ事業、アイドル紹介雑誌メディア『VDC』をはじめ、仮想通貨システム『モリタポ』、全文検索エンジン『groonga』、『コッソリアンケート』などのITコンサルティング事業でインターネットの一翼を担っています。 MAIN SERVISES メインサービス

    haida
    haida 2007/08/16
  • Feed Validator for Atom and RSS

    FEED Validator for Atom and RSS and KML Jump to navigation RSS Profile Support Added (more) Home · About · News · Docs · Terms Copyright © 2002-9 Sam Ruby, Mark Pilgrim, Joseph Walton, and Phil Ringnalda

    haida
    haida 2007/08/16
    rssのvalidator