タグ

2011年11月24日のブックマーク (6件)

  • matzさんの技術者とアイデアにかんするまとめ

    Yukihiro Matz @yukihiro_matz 制限がないほうが成功しやすいというのは勘違いだ。イノベーションも成功も制限や制約をなんとかしようというモチベーションによってこそ達成できる。むしろ積極的に自らに制約を課そう 2011-11-21 18:12:47 Yukihiro Matz @yukihiro_matz 熱意はあるが技術も金もない人が、技術者になんとかして(安くorタダで)作ってもらおうとする構図に飽き飽きしてる。その熱意は自分で技術を学ぶとか、スポンサーを説得する方向に使ってもらいたい。 2011-11-21 22:30:50 Yukihiro Matz @yukihiro_matz 優秀な中国人に打ち勝つためには?:ネットバー:ITmedia オルタナティブ・ブログ http://t.co/7PiMnwVc / 技術で勝てないならマネジメント力で、なんだそうだが

    matzさんの技術者とアイデアにかんするまとめ
    ma38su
    ma38su 2011/11/24
  • シェルスクリプトの引数をそのまま別のコマンドにわたす command ${@+"$@"} - わからん

    シェルスクリプトの引数をそのまま別のコマンドにわたす。これは引数の多いコマンドに対し、いくつかの引数を固定にしたラッパーをつくるときなんかによく使います。今回の個人的なシェルスクリプトブームにのっかって、Bruce Blinn さんの名著「入門UNIXシェルプログラミング」にあった細かい指摘の仕組みも調べておきました。 以下の書き方では、引数がなかった場合、command に空文字が渡されてしまいます。細かいこと言っちゃってごめんね。 command "$@" だけど、次のようにすれば、空文字が渡りませんよ。 command ${@+"$@"} man を読むと、対象が null か unset されているなら何もパラメータ展開しない、つまり何もしないという定義をうまく適用したものだ、ということがわかりました。 ${parameter:+word} Use Alternate Value.

    ma38su
    ma38su 2011/11/24
  • Hadoop0.23 YARNメモ(Hishidama's Hadoop0.23 YARN Memo)

    概要 YARNは、Hadoop0.23におけるジョブ実行フレームワークの名前。 0.23より前のHadoopはMapReduceというアルゴリズム(に基づくフレームワーク)だったので、次世代MapReduceという意味でMapReduce2.0(MRv2)とも呼ばれているが、実際はもうMapReduceではないので、別の名前が付けられたのだろう。 YARNでは、以下のような手順でアプリケーションを実行する。 (ResourceManager(RM)とかApplicationMaster(App Mstr・AM)とかの関係については、YARN Architectureを参照) ClientがResourceManagerに対してプログラム(ApplicationMaster)の実行を依頼(submit)する。 ResourceManagerは、どこかのノードでApplicationMaste

    ma38su
    ma38su 2011/11/24
    分散ジョブ実行フレームワーク
  • 最速の疎ベクトルはどれだ - Preferred Networks Research & Development

    海野です。 自然言語処理などで機械学習を行おうとすると、非常に疎なベクトル表現を使いたくなります。疎、というのはほとんどの要素が0である、という意味です。前々から疎ベクトルライブラリのパフォーマンスに関して気になっていたので、幾つか調べてみました。 Jubatus Workshopでも話したとおり、機械学習を適用しようとすると、普通は対象のデータをベクトル表現に落とします。特に言語データの場合は、それぞれの単語や文字などを特徴次元とするため、非常に疎なベクトルとなってしまいます。純粋な配列(C++で言えばstd::vector)を使ってしまうと、大量にメモリをってしまうため疎ベクトル専用の表現を使うのが普通です。 今日は様々な疎ベクトルライブラリのパフォーマンス比較を行おうと思います。比較したライブラリは以下のとおり。真の意味で、疎ベクトルのライブラリは、Eigenとublasだけで、残

    最速の疎ベクトルはどれだ - Preferred Networks Research & Development
  • 機械学習 はじめよう 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    機械学習 はじめよう 記事一覧 | gihyo.jp
  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
    ma38su
    ma38su 2011/11/24