タグ

アルゴリズムに関するespのブックマーク (3)

  • はてなブックマーク全文検索機能の裏側

    そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu

    はてなブックマーク全文検索機能の裏側
  • HTML::Feature - 重要部分を抽出するモジュール - - ダウンロードたけし(寅年)の日記

    以前からCPANで公開していたモジュールがあるんですが、日語での解説ドキュメントがなかったのと、最近大幅にブラッシュアップしたので、せっかくなので紹介記事を書きます。 HTML::Feature - Extract Feature Sentences From HTML Documents 「えいちてぃえむえる::ふぃーちゃー」と読みます。 ブログやニュース記事など様々なHTML文書から「重要部分」を推測して抽出してくれる perl モジュールです。 「重要部分」とはいわゆる「文」のことですね。文抽出とか焦点抽出とか色々な言い方があるかと思いますが、まぁ要するに特徴的な部分を推測して抽出するわけです。 どういうものか。 例えばブログ記事からヘッダーやフッター、その他のナビゲーションブロックを除いた「記事らしき部分」だけを切り取りたい、とします。 ぱっと思いつくのは「特定のコメントタグ

    HTML::Feature - 重要部分を抽出するモジュール - - ダウンロードたけし(寅年)の日記
  • 巡回セールスマン問題

    「あなたはセールスマンです。 現在、下の図の印の位置にいます。 これから、印の得意先を1軒づつすべて訪問して、 もとの位置に戻ってこなければなりません。 どのような順序で訪問すれば、歩く距離を最短にできるでしょうか。」 これが、コンピュータプログラムの 難問 として有名な 巡回セールスマン問題 です。 ゲームのつもりで、気軽に 最短巡回コース を考えてみて下さい。 まず、最初に訪問する得意先の印にマウスのカーソルを合わせます。 の色がブルーに変わります。 マウスのボタンをクリックすると巡回経路が描かれます。 順次をクリックし、すべての得意先を訪問し終わったら、 最後にをクリックすれば完了です。 誤ってクリックしてしまった場合は、をダブルクリックすると 巡回経路を消去できます。 次の得意先との距離 (len)、およびこれまでの巡回コースの合計距離 (

  • 1