タグ

2014年8月13日のブックマーク (11件)

  • 機械学習に適した大規模分散計算環境Apache Spark - 自然言語処理 on Mac

    大規模分散計算環境のApache Sparkは、HadoopのMacReduceに比べてメモリ内で効率的に処理を行うことが特長で、機械学習、ストリーム処理、グラフ解析、SQLデータ分析などの機能ライブラリがあります。Spark自体はScala言語で実装されていますが、Scalaの他にPython用のAPIや対話的なシェルも用意されていて、どちらの言語でもプログラミングや動作確認が可能です。 動作確認は簡単にできて、Java6以上がインストールされていれば、Downloadsページから適当なビルド済みパッケージをダウンロードして解凍すると、ScalaまたはPythonの対話的シェルが起動できます: $ curl -O http://d3kbcqa49mib13.cloudfront.net/spark-1.0.2-bin-hadoop1.tgz $ tar zxf spark-1.0.2-b

    機械学習に適した大規模分散計算環境Apache Spark - 自然言語処理 on Mac
    sucrose
    sucrose 2014/08/13
  • テスト先に書きたい若者よ - hitode909の日記

    弊社では毎年インターンを受け入れているのだけど,いまもインターンが来てて,テスト先に書きたいけど油断すると先に実装を書いてしまう,とか話してた. 個人的には,テスト先に書くのが大事というよりかは,意識して仕様を先に考えるのが大事だと思っている.テストを先に書くと,先に仕様を考えざるを得ないので,良いスタイルが身につく. 僕がよくやるのは,関連しそうなクラスの絵をひと通りノートに書いてみて,その図だけで,うまく動くことを説明できるくらい考えてみる.その時点でおかしかったら,コード書いてもおかしくなる.ノートに方眼ついてるとクラス図書きやすい.UMLとかじゃなくても,自分で見て分かるくらいでもいいと思う. 紙でうまくいったら,外部仕様だけソースコードに書いてみる.クラス名と,メソッドの定義と,メソッドの上くらいに,ひと通りコメントでも書いてみて,この関数はこういうことをするんです,こういう引数

    テスト先に書きたい若者よ - hitode909の日記
    sucrose
    sucrose 2014/08/13
  • モナド教

    前提知識:モナド モナドを理解せずともモナド教を信ずることは出来ますが,理解していればより深く納得できるでしょう. 操作 :: 型 -> 型 は,"型"から"型"へ写す"操作"の存在を表します. モナドの文脈 m が必要とする2つの操作: return :: a -> m a で,値を保ちつつ文脈 m の中に入れ込むことが出来ます. (=<<) :: (a -> m b) -> (m a -> m b) で,「値を文脈に入った別の値へ写す操作」を「文脈に入った値を同じ文脈に入った別の値へ写す操作」に変換します. id :: a -> a は値をそのまま返す操作です. id を =<< で変換して得られる操作 join :: m (m a) -> m a で,二重に文脈に入った値を一重の文脈に入った値に戻すことが出来ます. 文脈の値から生の値を取り出す型 m a -> a を持つ操作は,一般

    sucrose
    sucrose 2014/08/13
  • Python のコーディング規約 PEP8 に準拠する - Qiita

    この Qiita の連載記事ではデータ分析のための主要言語として Python を利用してきました。ところでみなさんは Python のコーディング規約 PEP8 をご存知でしょうか。 ソースコードスタイルガイド PEP8 ソースコードは一般に「書かれる時間」よりも「読まれる時間」の方が長い、そのような事実に基づいて、「スタイルを統一し読みやすいコードを書こう」というアイデアのもとに作られたのがこのガイドです。 Style Guide for Python Code http://legacy.python.org/dev/peps/pep-0008/ 家は当然ながら英語ですが有志の方が日語に翻訳してくださっています。 PEP8 日語訳 https://github.com/mumumu/pep8-ja どちらにせよ Python を利用する方は必ず一読するべきかと思います。 自動的

    Python のコーディング規約 PEP8 に準拠する - Qiita
    sucrose
    sucrose 2014/08/13
  • 如何に人気シリーズであってもその人気には翳りが出るのは当然か

    ライトノベルは今や一大人気コンテンツの一つで、新刊が出る度にとりわけ人気シリーズはマンネリが続こうが買い支えられているので、 落とし所が掴めていないため、惰性で続けられてるのが多い。 漫画で言えば、『名探偵コナン』や『金田一少年の事件簿』などの推理漫画や『こち亀』のように永遠に年を取らない設定の漫画がある。 ライトノベルでも人気シリーズは多く、特にネットゲームを題材にした『ソードアート・オンライン』はシリーズ化して久しい。 しかし、そんな人気シリーズにも翳りが見えてきたようだ。 『ソードアート・オンライン』アリシゼーション編の最新刊の評価が両極端に割れている。 確かにシリーズが長すぎて冗長に陥ってるのも分かる。 もはや落とし所を誤ったとしか言いようがない。 同じようにシリーズ化が長くなり過ぎて仕切り直しをして再起を図った例もある。 『とある魔術の禁書目録』がそれだ。 今は新約もシリーズが長

    如何に人気シリーズであってもその人気には翳りが出るのは当然か
    sucrose
    sucrose 2014/08/13
    Webで読んでた身としてはSAOはアリシゼーション編が一番面白かった。どっちかっていうと後半のほうが好きだけど(先は長い
  • JavaScriptの ++i は i += 1 ではない - rikubaのブログ

    JSLintでは ++ を使うとエラーになる。++i の代わりに i += 1 と書くようにということのようだ。でも、+= 1 は ++ の正確な代替ではなかった。 加法演算子は被演算子の少なくとも一方が文字列なら、文字列連結処理になる。一方、前置増分演算子 (++) は初めに被演算子に ToNumber 内部関数を適用してから 被演算子 = 被演算子 + 1 を行う。つまり、結果は必ず数値(NaNを含む)となる。 ということで、++i の代わりになるのは、正確には i = +i + 1 だった(単項 + 演算子は ToNumber 内部関数を適用する)。

    JavaScriptの ++i は i += 1 ではない - rikubaのブログ
    sucrose
    sucrose 2014/08/13
  • ISO 3166-1 alpha-2 - Wikipedia

    A map of Europe, with ISO 3166-1 alpha-2 codes in place of the full names of countries and other territories. 'Exceptional reservations' codes CQ, EU and UK are not shown. ISO 3166-1 alpha-2 codes are two-letter country codes defined in ISO 3166-1, part of the ISO 3166 standard[1] published by the International Organization for Standardization (ISO), to represent countries, dependent territories,

    ISO 3166-1 alpha-2 - Wikipedia
    sucrose
    sucrose 2014/08/13
  • Python パッケージングのこれまでとこれから

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    Python パッケージングのこれまでとこれから
    sucrose
    sucrose 2014/08/13
  • %E8%87%AA%E5%AE%85%E3%81%A7%E5%A4%A7%E5%AE%B9%E9%87%8F%E3%82%B9%E3%83%88%E3%83%AC%E3%83%BC%E3%82%B8%E3%82%92%E9%81%8B%E7%94%A8%E3%81%99%E3%82%8B

    前回 RAID に関するちょっとした話を書きましたが個人が巨大なストレージを運用するにあたって得られたノウハウをだいたい全部書いておきます。 そもそもメリットあるのか? メリットはあります。金です。 Google Drive は安いですが、それでも 1TB 月 1000 円です。しかし運用にかなり制限がでます。柔軟に使える Amazon Web Service ならその 3 倍+転送量課金です。 16TB だと月 5 万円もかかってしまいます。ちなみにもっとも柔軟に使える EBS だと 16TB で 83000 円ぐらいです。 Google Compute Engine の低冗長性ストレージは S3 より少し安かった気はするけど別にとても安いわけではなかったと思う(よく覚えていないし調べるのがめんどくさい)。 50TB のストレージを Google Drive でごまかしごまかし運用したと

    sucrose
    sucrose 2014/08/13
  • 上位入賞者たちはどうやってチューニングしたのか!?Tuning Maniax総評

    8月下旬、Tuning Maniax2014表彰式を開催します。WordPressコース優勝者によるスペシャルセッションや、Maniaxシリーズ恒例のチャンピオンベルト贈呈式、審査員の方やAzureに詳しい参加者との交流など、充実した内容を予定しております。 会場となる日マイクロソフト社に来たことがない方も、せっかくの機会ですので、今回のイベントを締めくくる表彰式に是非遊びに来てください。 【Tuning Maniax 2014表彰式 開催概要】 日 時:2014年8月29日(金)19:00−21:30(18:30受付開始) 会 場:日マイクロソフトセミナールーム 参加費:無料 スケジュール: 18:30−19:00 受付開始 19:00−19:05 開会挨拶 19:05−19:55 優勝者スペシャルセッション「WordPress on Azure Web Sites / VM パフ

    上位入賞者たちはどうやってチューニングしたのか!?Tuning Maniax総評
    sucrose
    sucrose 2014/08/13
  • 限られた時間ではこだわりを捨てて目標を達成することが最重要 - 武蔵野日記

    週末はずっと雨だったが、久しぶりに晴れたので2回洗濯機を回してから出勤。ドラム式の全自動洗濯乾燥機だが、雨続きでもないと乾燥機は使っていないのである。 午前中は研究室で進捗を聞く。先行研究の手法が実装できたようで、実データで回しているが、予想通りではないとのこと。もっとデータを増やして試す、というので、ちょっと止める。こういうとき可能性は大きく分けると2つあって、 手法は正しいがデータが変(性質が違うデータを使っている、あるいは前処理でおかしなことをしていう) データは正しいが手法が変(バグがある、あるいは誤解して実装している) であって、どちらを疑うか、あるいは両方疑うかなのだが、データを増やしてみる、というのは手法的にデータの分量がないと動かなさそうな手法で、かつデータを増やせば解決しそうな場合の話である。結果を見ると明らかにデータ量の問題ではないので、もしデータを疑うなら、他のデータ

    限られた時間ではこだわりを捨てて目標を達成することが最重要 - 武蔵野日記
    sucrose
    sucrose 2014/08/13