タグ

ブックマーク / blog.hoxo-m.com (4)

  • データ分析のワークフローをdrakeで管理して効率的に作業を進めよう - 株式会社ホクソエムのブログ

    要約 drakeパッケージは、GNU makeのようにあらかじめ定義されたワークフローを自動的に実施する仕組みを、Rユーザに馴染みやすいデータフレーム形式で提供する ワークフローの構築と管理、実行はRの関数として提供され、依存関係を可視化する関数も用意される drakeパッケージを使うことで、データ分析でありがちな「再実行」の負担(再計算、コードの保守)を軽減することが可能となる 各オブジェクトは自動的にキャッシュされ、コードや依存関係に変更のない場合はキャッシュが利用される ワークフローの各処理の状況、依存関係を可視化する関数も用意され、ワークフロー管理が容易になる 要約 はじめに シーシュポスの岩 既存の解決策 drake: Rユーザのためのワークフロー処理パッケージ ワークフロー管理の基礎 ワークフローと依存関係の可視化 ワークフローの変更 参考URL はじめに データ分析の作業は、

    データ分析のワークフローをdrakeで管理して効率的に作業を進めよう - 株式会社ホクソエムのブログ
  • ナウでヤングなRの環境変数管理方法 ·

    こんにちは。ホクソエムのグローバル推進事業部にて部長を努めます瓜生(@u_ribo)です。この記事ではRにおける環境変数の設定方法のおさらいと、ナウな手法を使った環境変数の管理方法について紹介します。 環境変数を利用していますか? Rでは、利用している環境やユーザの設定を環境変数として記録・利用できるようになっています。具体的な項目についてはドキュメントに記されている通りですが、例えばユーザのホームディレクトリ (HOME)やロケール (LC_ALL)などがあります。こうした環境変数は直接意識して利用することは稀ですが、頻繁に使う値やディレクトリのパスなどを環境変数として保存しておくと便利なことがあります。 現在設定されている環境変数の値を確認するにはSys.getenv()関数を実行します。引数に何も指定せずに実行すると全ての環境変数と値が出力されますが、引数に環境変数名を指定すること

    ナウでヤングなRの環境変数管理方法 ·
  • RStudioアドイン 10選 ·

    Rユーザのみなさん、RStudio使っていますか。RStudioを使うなら、RStudioアドインも使いましょう。便利です。 … でも、\どんなアドインがあるのかわからない!/ という声をしばしば聞きます。というわけでお気に入りのアドインを10個まとめました。用途ごとに部門を設けて紹介します。 RStudioアドインとは そもそもRStudioアドインとは何か。それを説明しておかないといけませんね。 RStudioアドインとは、0.99.878以降のバージョンで実装されているRStudioの一機能です。複雑な処理をボタン一発で実行したり、ショートカットとして利用したり、GUI操作で処理を実行できるようになります。 RStudioアドインはメニューバーの「Addins」というボタンあるいは設定されたショートカットから呼び出すことができます。アドインは、Rの関数と同様にパッケージによって提供さ

    RStudioアドイン 10選 ·
  • DJタカヤナギ=サンで学ぶRを用いた画像操作 ·

    こんにちは、ホクソエムの市川です。 日々の業務の合間にちょっとクソコラを作りたいこと、あると思います。 でもクソコラに手間はかけたくない。 そんな時に使えるのがimagerパッケージです。 ちなみに画像操作に使えるRのパッケージには他にもEBImageパッケージ、magickパッケージ等があります。 それぞれに利点はあるのですが、EBImageはbioconductorからインストールする必要があるので手間がかかり、magickは画像の上に図形を描くのが意外と面倒だったりします。 繰り返しますがクソコラに手間はかけたくない。 ということで今回はCC0ライセンスで公開されているDJタカヤナギ=サンの画像を用いてimagerパッケージの使い方について学びたいと思います。 画像の読み込みと表示 画像の読み込みにはload.image()を用います。 読み込んだ画像の情報はprint.cimg()

    DJタカヤナギ=サンで学ぶRを用いた画像操作 ·
    p_tan
    p_tan 2017/04/11
    Rでの画像処理パッケージimager
  • 1