タグ

ブックマーク / open-groove.net (2)

  • Mahoutを実行できるまで – OpenGroove

    Hadoopエコシステムの一員で機会学習のフレームワーク、Mahout。この分野は数学的素養、統計的学問のバックアップがないと云々とよく言われるが…「そんなこと言ってたらいつまでたってもできないんだよ。INPOSSIBLE is just opinion なんだよ!」と勝手に自分を奮い立たせてお試し導入してみた。 が、例によって躓きまくる。何も考えずにHadoop Hacks内Mahout Hacksに従ってソースからインストールしたら動かない。英語のフォーラムに書いてあったことだの、あれこれ試しまくったが、そもそもマシン上のHadoopはCDH4。yum install mahout であっさりCDH版インストール、環境変数も何も設定しなくとも動きましたよ…。 オプションも何も指定せずにmahoutコマンドを打つと、help?らしきものが出力される。 $ mahout MAHOUT_LO

  • sedコマンドでファイルを上書き編集 – OpenGroove

    標題のテーマ、今までリダイレクト使ってまどろっこしいことしていた。 # sed -e "s/AAA/ZZZ/g" INFILE.txt > OUTFILE.txt # cp OUTFILE.txt INFILE.txt つまり、一度OUTFILE.txtに置換内容を吐き出してから、OUTFILE.txtをオリジナルのINFILE.txtに反映、とするやり方。しかし!-iオプションを使えば断然スマートにできることを今さら知る。 # sed -i -e "s/AAA/ZZZ/g" INFILE.txt これだけで、対象ファイルが上書き編集される。これにはちょっと感動。 以下のようにすればバックアップファイルもとってくれる。-iとダブルクォーテーションの間は詰める。 # sed -i".org" -e "s/AAA/ZZZ/g" INFILE.txt これをどういう時に使いたいかというと、通常の

  • 1