タグ

pfiに関するy_yanbeのブックマーク (7)

  • PFI インタビュー: 情報科学科の先輩に聞く!|東京大学理学部 情報科学科/東京大学大学院情報理工学系研究科 コンピュータ科学専攻

    ソフトウェア開発でいま最も熱い分野のひとつ「検索エンジン技術」。激しい技術革新と、し烈な開発競争が繰り広げられるこの分野で、「PFI」というベンチャー企業が注目を集めている。PFIを創業したのは、情報科学科の先輩たち。かつて同期生だった3人は、自分たちの技術力でビジネスの世界に挑戦中だ。 株式会社プリファードインフラストラクチャー(Preferred Infrastructure:PFI) 2006年3月、記事登場の3名を含む6名のエンジニアが集まって設立。エンタープライズ向け全文検索エンジン『Sedue(セデュー)』の開発を核に、リコメンドエンジン、連想検索エンジン、関連記事推薦エンジンなどの自然言語処理/大規模データ処理系のミドルウェアを開発している。社名は「純粋関数型言語(Purely Functional programming language)」の頭文字PFに由来している。

    y_yanbe
    y_yanbe 2010/06/07
    「岡野原 よくあることですが、論文に書いてあるとおりではうまく動かないんです。アルゴリズムもすごく複雑でしたし。+1したり-1したり、押したり引いたりで動かしました。」
  • インターン募集 | 株式会社プリファードインフラストラクチャー

    プリファードインフラストラクチャー(PFI)では夏期インターンを募集しています。インターンでは、社内の新規プロジェクトチーム(大規模データを利用した自然言語処理や情報検索、画像解析など)に参加し一緒に開発を行ったり、新しいサービス・ソフトウェアを企画、開発してもらいます。期間は1~3ヵ月です。

  • 2-8(岡野原)

    6.テーマ概要 ITの急速な進化の中,ますますデータの効率的な保存方法,転送方法が必要とされている.そうした中,実際のデータの内容により自然に即した「単語」という塊を抽出して圧縮するという方法を開発するがこのプロジェクトの目的である.ここでいう単語というのは自然言語における単語ではなく,データの中で塊として見られるあらゆる形での単語を意味する.最終的には,これを用いた圧縮ソフトを開発するのが目的だが,ここでは,そのメインとなる単語抽出アルゴリズム (Word eXtraction,WX法) についての研究開発を行なう. 例えば,abracadabraというデータに対して,ここで開発するプログラムはabraという単語を抽出する.abraという単語を抽出する際に,文の実際的な意味はまったく利用せず,確率情報や,エントロピーなどを計算し,どれだけその単語が周りから「浮き出ているか」,「抽出す

    y_yanbe
    y_yanbe 2009/04/06
  • SSD向けに最適化した全文検索エンジン、プリファードが発表

    ベンチャー企業のプリファードインフラストラクチャーは2009年3月10日、全文検索エンジン「Sedue 24」の新バージョンを発表した。SSD(ソリッドステート・ドライブ)向けに最適化したことで数百Gバイトのデータの高速検索をサーバー1台で処理できるようになった。従来は複数サーバーを連携しなければ不可能だった。価格は500万円から。 Sedue 24は「圧縮接尾辞配列」と呼ぶアルゴリズムを使用する全文検索エンジン。検索対象データと同程度の容量のインデックスをサーバーの物理メモリーに展開して検索速度を向上している。新バージョンでは、このインデックスの展開場所を物理メモリーからSSDに変えることで1台のサーバーで数百Gバイトに及ぶデータを高速に検索できるようにした。 旧バージョンでサーバーの物理メモリーを超える量のデータを検索するには、複数サーバーで分散処理する必要があった。例えば50Gバイト

    SSD向けに最適化した全文検索エンジン、プリファードが発表
    y_yanbe
    y_yanbe 2009/03/10
    > 新バージョンでは、このインデックスの展開場所を物理メモリーからSSDに変えることで1台のサーバーで数百Gバイトに及ぶデータを高速に検索できるようにした。
  • はてなブックマーク全文検索機能の裏側

    そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu

    はてなブックマーク全文検索機能の裏側
  • はてなブックマーク開発ブログ

    はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク数ランキング」。2月26日(月)~3月3日(日)〔2024年3月第1週〕のトップ30です*1。 順位 タイトル 1位 メルカリ 小泉さんからのエグい学び|Shota Horii 2位 行動をチャンク化して「1日に1ターンしか行動できない」から脱却する | Piyopanman 3位 「それって陰謀論じゃないですか?」闇の国家「ディープステート」を信じる著名人一人一人に会ってみたら…どうなった? | 47NEWS 4位 いつか起業したいエンジニアへ #キャリア - Qiita 5位 日人はなぜ「生産性の高い社会」を理解できないふりをし続けるのか 6位 「情報セキュリティの敗北史」が面白すぎる。だめだこれは寝れない、なんだこの死ぬほどワクワクするは→賢者は歴史に学ぶ - Togetter 7位 味付け塩だけ、放置

    はてなブックマーク開発ブログ
  • はてなとプリファードインフラストラクチャー、戦略的提携に合意。第一弾としてはてなブックマークの新機能を共同開発し、本日リリース - はてなプレスリリース - 機能変更、お知らせな

    プレスリリース はてなが配信しているプレスリリースのバックナンバーです。 プレスリリースの受信を希望される媒体ご担当者様は、 hatenapr@hatena.ne.jp まで受信用アドレスをご連絡ください。

    はてなとプリファードインフラストラクチャー、戦略的提携に合意。第一弾としてはてなブックマークの新機能を共同開発し、本日リリース - はてなプレスリリース - 機能変更、お知らせな
    y_yanbe
    y_yanbe 2008/07/15
    PFIと提携かーなるほど
  • 1