Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode
Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode
この前のエントリで、Hadoopを使って統計処理を行なう際に、データのサンプリングを行って高速化する方法について検討しました。 Hadoopを使ってサンプリングを行なうには - nokunoの日記 今回は、並列化とかややこしいことは考えずにPythonでデータのサンプリングを行なう方法を検証してみました。 重複を許すサンプリング重複を許すサンプリングの実装は簡単です。配列のサイズの中から必要な数だけランダムにインデックスをサンプリングすれば良いのです。 #!/usr/bin/env python import random def sampling(a, n): result = [] for i in range(n): index = random.randint(0,len(a)-1) result.append(a[index]) return result if __name_
集合知プログラミング を読んでいたら、K-means 法(K平均法)の説明が出てきました。K-means 法はクラスタリングを行うための定番のアルゴリズムらしいです。存在は知っていたんだけどいまいちピンときていなかったので、動作を理解するためにサンプルを作ってみました。クリックすると1ステップずつ動かすことができます。クラスタの数や点の数を変更して、RESET を押すと好きなパラメータで試すことができます。こうやって1ステップずつ確認しながら動かしてみると、意外に単純な仕組みなのが実感できました。K-means 法とはK平均法 - Wikipedia に詳しく書いてあるけど、もうすこしザックリと書くとこんなイメージになります。各点にランダムにクラスタを割り当てるクラスタの重心を計算する。点のクラスタを、一番近い重心のクラスタに変更する変化がなければ終了。変化がある限りは 2. に戻る。これ
Last Modified: Wed Oct 26 01:47:00 EDT 2005 (10/26, 14:47 JST) [English] 概要 unagi.py は緩く結合されたクラスタ環境のためのシステム監視ツールです。 これは複数のユーザがクラスタ上でさまざまなプログラムを走らせるときに、 各マシンの使用状況を報告することによって、ユーザが協力してそのマシン資源を 有効利用できるようにします。このプログラムはクラスタ上のすべてのマシンで走り、 システム情報を共有します。これはまた簡単な HTTP サーバとしての機能も そなえており、ユーザは状況報告をブラウザ上で見ることができます。 注意: unagi.py は公開用のサーバで走ることを意図してつくられては *いません*。 セキュリティ上の理由から、マシンの状態を外部のユーザに見せるべきではありません。 11マシンからなるクラス
Pythonの桁数無制限整数をつかって、べき乗計算を簡単におこない、RSA方式の概要を把握することを目的とします。実際に、Pythonでプログラムしながら、習得できるようなっています。 目次 1 実験しながら暗号の仕組みを学ぶ 2 実験をすすめるのに必要な知識 2.1 数学領域 2.2 Python の使い方 3 「シーザー暗号」をプログラムしてみる 3.1 シーザ暗号 3.2 ’z’ を超える値をどうするif 文による条件分岐 3.3 26 文字一回転を計算する剰余計算(modulo) 3.4 if 文ではなく、剰余計算で、シーザー暗号を確かめる 4 べき乗した値のmodulo 計算を使った暗号を考える 4.1 RSA 公開鍵暗号へ 5 RSA 公開鍵暗号 5.1 まずは、公開鍵暗号を計算してみよう 6 Python で計算しながら各ステップを確かめる 6.1 鍵生成 6.2 素数を手
2011.8.18 - 9.9 の間 はてなにインターンに行ってきました. インターン内容などについては他のインターン生の方が書いてくれているのでそちらをご参考に. 同期のインターン仲間のレポート はてなインターンが終わって始まった - 夜から朝にかけて by id:t-kashima はてなエンジニアインターンに女子で初めて参加したよ!その1 - わすれっぽいきみえ by id:kimikimi714 はてなブログ by id:giginet はてなインターンに意識の低い学生が参加して社長にTシャツ売りつけた話 - ヤルキデナイズドだった by id:uasi インターン生に、はてなはすごいと思わせたはてなの何か。 - LifeTimeException@hrk623 by id:hrk623 uenopの日記 by id:uenop はてなインターン2011リーダーがレポートを書きまし
さて、アルゴリズムの勉強のしかたと、ラムダ計算の勉強のしかたの目星をつけました。 アルゴリズムの勉強のしかた - きしだのはてな ラムダ計算の勉強のしかた、プログラム意味論 - きしだのはてな これでここで書いたプログラムの理論の基礎は勉強できたことになるんじゃないかと思います。 プログラムの理論とはなにか - きしだのはてな ところで、プログラムの勉強地図としてこういう図を書きました。 で、ハードウェアまわりについても、プロセッサを支える技術やネットワークはなぜつながるのかでひととおり勉強したとしましょう。 じゃあ次は、アジャイルか?テストか?UIデザインか?となるわけですが、やはりプログラマなら、プログラムの作り方や使いやすさの前に、作るプログラムの機能や性能で勝負したいじゃないですか。 いい感じに関数が分割できるよとか、読みやすい名前がつけれるよとか、効率よく仕事して定時に帰れるよと
OAuth 調べてみたら難しくて理解出来なかったので, Python で標準ライブラリだけで 1 から書いてみました. / \ / _ノ ヽ、_ \ / o゚((●)) ((●))゚o \ twitter の OAuth 難しいお… | (__人__)' | \ `⌒´ / ____ /⌒ ⌒\ /( ●) (●)\ /::::::⌒(__人__)⌒::::: \ だからやる夫でやるお! | |r┬-| | \ `ー'´ / Python のサンプルコードを付けていますが, 上から順に読めるようにおもいっきり手続き型で書いています. コメントで実際の処理の説明を書いています. Consumer Key と Consumer Secret の入手 / ̄ ̄\ / u \ .____ |:
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く