タグ

2009年9月1日のブックマーク (16件)

  • 「実現したいことを計算機の問題に置き換えることが『技術力』」、伊藤CTOが“はてな流”大規模データ処理の極意を語る:CodeZine

    CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

    「実現したいことを計算機の問題に置き換えることが『技術力』」、伊藤CTOが“はてな流”大規模データ処理の極意を語る:CodeZine
    tanakaBox
    tanakaBox 2009/09/01
    はてな流DBチューニング
  • はてなブックマーク全文検索機能の裏側

    そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu

    はてなブックマーク全文検索機能の裏側
    tanakaBox
    tanakaBox 2009/09/01
    おもろい。
  • プログラマーに最適なデータマイニングの教科書 『集合知プログラミング』 - 図書館情報学を学ぶ

    集合知プログラミング 作者: Toby Segaran,當山仁健,鴨澤眞夫出版社/メーカー: オライリージャパン発売日: 2008/07/25メディア: 大型購入: 91人 クリック: 2,220回この商品を含むブログ (277件) を見る当初はサンプルコードがPythonということで購入した書ですが、読んでみると内容の素晴らしさに驚嘆しました。私が今までに読んだオライリーシリーズでも屈指の名作だと思います。 『集合知プログラミング』とは 『集合知プログラミング』は、Amazonの協調フィルタリングのように、ウェブ上のデータを収集してユーザーの嗜好にあったコンテンツを推薦したり、大量のデータを分かりやすく分類・可視化するプログラムを簡単に実装する技術を解説した書籍です。Webプログラミングをかじったことのある方でしたら、だれしもAmazonのような推薦サービスを作ってみたいと思ったこと

    プログラマーに最適なデータマイニングの教科書 『集合知プログラミング』 - 図書館情報学を学ぶ
    tanakaBox
    tanakaBox 2009/09/01
    データマイニング関連書籍。
  • GitHub - livedoor/cicindela2: a highly customizable recommendation engine written in perl + MySQL

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - livedoor/cicindela2: a highly customizable recommendation engine written in perl + MySQL
    tanakaBox
    tanakaBox 2009/09/01
    ]datamining] このページを見た人はこんなページも見ています。perl + MySQL
  • Tutorial_ja - bayon - Google Code

    Code Archive Skip to content Google About Google Privacy Terms

    tanakaBox
    tanakaBox 2009/09/01
    クラスタリングツール。Repeated Bisection法を使ってるみたい。
  • 目次

    ヘッダーをスキップ Oracle Data Mining概要 11g リリース1(11.1) E05704-02 索引 次へ 目次 例一覧 図一覧 表一覧 タイトルおよび著作権の情報 はじめに 対象読者 ドキュメントのアクセシビリティについて 関連ドキュメント 表記規則 サポートおよびサービス Oracle Data Miningの新機能 Oracle Data Mining 11g リリース1(11.1)の新機能 Oracle Data Mining 10g リリース2(10.2)の新機能 第I部 概要 1 データ・マイニングとは データ・マイニングとは 自動検出 予測 グループ化 実用的な情報 データ・マイニングと統計 データ・マイニングとOLAP データ・マイニングとデータ・ウェアハウス データ・マイニングで可能なこと、不可能なこと 適切な問題の設定 データの理解 データ・マイニング

    tanakaBox
    tanakaBox 2009/09/01
    Oracle Data Mining。オラクル面白そうだ。
  • クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた - てっく煮ブログ

    集合知プログラミング を読んでいたら、K-means 法(K平均法)の説明が出てきました。K-means 法はクラスタリングを行うための定番のアルゴリズムらしいです。存在は知っていたんだけどいまいちピンときていなかったので、動作を理解するためにサンプルを作ってみました。クリックすると1ステップずつ動かすことができます。クラスタの数や点の数を変更して、RESET を押すと好きなパラメータで試すことができます。こうやって1ステップずつ確認しながら動かしてみると、意外に単純な仕組みなのが実感できました。K-means 法とはK平均法 - Wikipedia に詳しく書いてあるけど、もうすこしザックリと書くとこんなイメージになります。各点にランダムにクラスタを割り当てるクラスタの重心を計算する。点のクラスタを、一番近い重心のクラスタに変更する変化がなければ終了。変化がある限りは 2. に戻る。これ

    tanakaBox
    tanakaBox 2009/09/01
    K-means法の可視化
  • 微分積分

    静岡理工科大学情報学部コンピュータシステム学科菅沼研究室のページです.主として,プログラミング言語( HTML,C/C++, Java, JavaScript, PHP, HTML,VB,C# ),及び,システムエンジニアとしての基礎知識(数学,オペレーションズ・リサーチやシステム工学関連の手法)を扱っています.

    tanakaBox
    tanakaBox 2009/09/01
    巡回セールスマン問題を遺伝的アルゴリズムで解く。
  • Garev Project

    注意: 以下の内容は、遺伝的アルゴリズム(GA)をあまりよく知らない素人が 行ったシミュレーションの結果です。これを元に遺伝的アルゴリズムについて 何か知ったつもりになったり、他の人に知ったかぶりした時などに 起きた損害、かいた恥などには一切責任を取りませんのであしからず。 イントロダクション プログラムは小学生の頃から組んでいたが、まともに組み出したのは 中学生くらいからだろうか。当時プログラムという趣味はかなり マニアックで、「プログラマーオタク」という図式がほぼ成り立っている頃 だった。僕らは非力なコンピューターを駆使し、ゲームを作ったり パズルを解くプログラムを作って速度を競ったりといろいろやったものだ。 さて、プログラムというと、普通考えるのはアルゴリズムの事だろう。 アルゴリズムとはある問題を解くとき場合の手順を抽象化したもので、 プログラムで表現するとほとんど整数を扱

    tanakaBox
    tanakaBox 2009/09/01
    遺伝的アルゴリズムで、オセロを作った試行錯誤の記録。面白い。
  • クラスタリングによる迷路作成アルゴリズム

    はじめに クラスタリングアルゴリズムにより、解くと絵が浮かび上がる 迷路を作成する方法を紹介する。 クラスタリングとは ウェブのリンク情報や、mixiの友人関係など、ネットワークの性質を 知りたいことがよくある。このとき、ネットワークの性質として このネットワークにおいて任意に選んだ要素Aと要素Bはつながっているか? このネットワークは全体がつながっているか? つながっていないとしたらいくつのグループに分かれるか? 要素数最大のグループはどれか? などの情報が欲しくなる。このような解析をするときに 必要となるのがクラスタリングである。 クラスタリングとは、同値関係のリストが与えられたときにグループ分けを することである。たとえば、 友達友達友達である と定義すると、友人関係は同値関係を作る。 その上で、 A君とB君は友達 C君とE君は友達 B君とD

    tanakaBox
    tanakaBox 2009/09/01
    スゲー。
  • ■邪神の啓示――『ドルアーガの塔』編

    黒字=2ちゃんねらーの質問 緑字=遠藤氏の回答(文頭のS、A~Eは遠藤氏による質問の評価点。Pはペナルティ級) 赤字=GIL@D/LAB.管理人のコメント(ないのが大半です) □ ドルアーガシリーズのストーリーって、ゲームのために作られたっていう感じがしなくてすごく好きです。勇気を身軽さにかえるティアラとか、力にかえる黄金の鎧とかの設定も当に生きた設定だと思います。 ★ バビロニアンキャッスルサーガは、もちろん「バベルの塔」にインスパイアされて作ったものです。 ある日、同僚の女子社員(和田久美ちゃん、この子が個性的な子なんですよ)と一緒に池袋まである講演会を聞きに行きました(半分仕事)。その会場で渡されたチラシの裏につらつら書いていったイメージを、彼女と共にストーリーの形にまとめたわけです。 天界と魔界の分化、イシターとドルアーガの戦い、ドルアーガの封印などなどのプレストーリーは、いまだ

    tanakaBox
    tanakaBox 2009/09/01
    迷路生成アルゴリズムは棒倒し法。
  • 講義ノート — ocw

    Copyright 2008, by the Contributing Authors. Cite/attribute Resource. 講義ノート. (2008, October 17). Retrieved September 01, 2009, from ocw Web site: http://ocw.kyoto-u.ac.jp/faculty-of-engineering-jp/introduction-to-algorithm-and-data-structures/lecturenote. この作品は以下のライセンスによって許諾されます: Creative Commons License.

    tanakaBox
    tanakaBox 2009/09/01
    京都大学のアルゴリズムとデータ構造の講義資料。教科書はSICP。
  • Hapilabo

    ブラックジャックに次いでカジノで最もプレイされるゲームの一つとして頭角を現したクラシックゲームのポーカーは誰もがご存知でしょう。ポーカーは、5枚のカードを使ったカジノベースのゲームで、コンソールでプレイします。このゲームは1970年代に導入され、カジノのスロットマシンを彷彿とさせることから「ポーカースロット」と呼ばれていました。スロットと同様に、他のプレイヤーから独立していて、乱数発生メカニズムを採用しており、スロットマシンに似ています。 ポーカースロットはインター カジノのようなオンラインカジノでもプレイ可能です。 ゲームプレイ ゲームは、プレイヤーがマシンにお金を投入し、クレジットにベットすることから始まります。 「ディール」ボタンを押すと、プレイヤーには5枚のカードが渡され、そのうちの1枚は仮想のデックから交換することができます。 カードを引いて、プレイヤーの手札がペイテーブルのいず

    tanakaBox
    tanakaBox 2009/09/01
    分類がうまい。
  • 注目されるスウェーデンのマイナス金利 各国中央銀行が行方を注視 JBpress(日本ビジネスプレス)

    (2009年8月28日付 英フィナンシャル・タイムズ紙) 世界初の出来事にしては、驚くほどそっけない発表だった。しかし、スウェーデン中央銀行(リクスバンク)は去る7月、銀行の準備預金にマイナス金利を導入した世界初の中央銀行となり、未知の領域に足を踏み入れた。 日の金融危機が最悪期を迎えた時ですら、日の中央銀行は、市中銀行に貸し出しの増加を促すことを狙いとするこうした対策には手をつけなかった。 だが各国中央銀行は、過去2年間の異例の対策からの出口戦略を熟考する一方で、スウェーデンの実験を注意深く監視していくことになるだろう。 キング総裁が懸念する流動性の罠 イングランド銀行のマーヴィン・キング総裁は、英国で流動性の罠――現金が銀行システムの中に滞留したまま、裾野の広い経済の中に染み出て行かない状態――が大きな懸念になりつつあることから、スウェーデンを手にする可能性があると仄め

    tanakaBox
    tanakaBox 2009/09/01
    国家的実験。
  • ブログを成功させる攻略まとめ2009

    ネタ帳開始からこれまで書いたブログ運営術まとめ 2007年1月からスタートしたこのブログも早いもので2年9ヶ月という月日が流れました。 途中入院したり炎上したり友達が出来たり嫌われたりもしましたが、ブログは楽しいなぁと感じながらここまでやってきました。 これから続きを読むをクリックすると、延々と過去の「ブログに関するエントリー」が書き綴られていきます。 今回は今月、ようやくはてなブックマークが10万件を超えて、かねてから私がこのブログを始めようと思ったきっかけである、POP*POP(もうだいぶ前から更新停止)を超え、その嬉しさからついうっかり私のブログに関する様々なエントリーをまとめました。 ネタ帳について ネタ帳が当初から掲げているブログコンセプトは以下。 売れない、人が来ないホームページにならない為の インターネットの知識とブログネタ 幅広い範囲のようで、ネタ集めとなれば結構狭いと実感

    ブログを成功させる攻略まとめ2009
    tanakaBox
    tanakaBox 2009/09/01
    収益化に向けて。
  • 高木浩光@自宅の日記 - ダウンロード違法化反対家の知られるべき実像

    ■ ダウンロード違法化反対家の知られるべき実像 あるきっかけで、あるダウンロード違法化反対家の人の、自宅のものと思われるIPアドレスを知ってしまった。知ることができたのは、2007年と2008年のいくつかのある日におけるIPアドレスである。そのIPアドレスを手元のWinnyノード観測システムの接続ログと突き合わせてみたところ、5回の日時において、WinnyノードのIPアドレスとして観測されていたのを見つけた。 それらのIPアドレスがソースとなっていたキーを抽出し、16日の日記の方法で視覚化したところ、図1のとおりとなった。 他の区間でどうだったかを調べたいところだが、2007年の部分と2008年の部分では、ISPが異なっており、ポート番号も「4857」と「3857」という具合*1に違っていた。 一般的に個人宅に割り当てられるIPアドレスは時々変化しており、それを追跡することは通常、簡単でな

    tanakaBox
    tanakaBox 2009/09/01
    追跡