タグ

2017年8月9日のブックマーク (2件)

  • データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - cucumber flesh

    探索的なデータ分析 (Explore Data Analysis: EDA)を行う際は、データの要約や欠損の有無の確認、可視化が欠かせない作業となります。 特に可視化は、データのもつ性質や関係を表現するのに大変役立ちます。一方で、可視化に用いた図はコードとは別に保存する必要があったり、作図のためのコードを書いたりと、面倒な側面もあります。 … きちんとした作図は面倒だけどデータの性質や欠損について把握したい。そんな時にはコンソール上での可視化を試しましょう。そのためのパッケージをHadley Wickhamが開発しています。 https://github.com/hadley/precis Rにはそもそも、オブジェクトの情報を要約してくれるsummary()関数があるのですが、この precisパッケージは、それを置き換えるような設計を目指しているそうです。早速使ってみましょう。 # gi

    データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - cucumber flesh
  • Linuxメモ : icdiffコマンドで横並び、文字単位で差分を表示 - もた日記

    icdiff インストール 使い方 git diffで使う icdiff icdiff: side-by-side highlighted command line diffs github.com 2つのファイルを横並び(サイドバイサイド)で比較する場合、diff -yを使う、vimdiffを使う、WindowsならWinMergeなどのソフトを使う方法があるが、今回はicdiffコマンドを試してみる。 icdiffを使うとコマンドラインで図のように横並び、文字単位で差分を表示することができる。icdiffはImproved Colored Diffの略だと思われる。 インストール pipでインストールできるので下記コマンドを実行。 $ pip install icdiffまたはここからバイナリをダウンロードしてパスが通っているディレクトリに置く。 ヘルプメッセージは以下の通り。 $ i

    Linuxメモ : icdiffコマンドで横並び、文字単位で差分を表示 - もた日記