タグ

tidydataに関するchess-newsのブックマーク (5)

  • 全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ

    (12/13追記 タイトルや表記に過剰な表現があり、セル結合を全否定するかのような印象を与えてしまいました。そのような意図はなかったのですが、補足記事を書きましたので、併せて読んでいただけると幸いです。すみませんでした。) 人類よ、なぜそんなにセル結合を使いたがる? それが罪深い行為とも知らずに……。 思わず神視点になってしまいましたが、この世界にはExcelのセル結合を無意味に使いたがる人が多すぎます。いや、メリットがないことはないのですが、それを余裕で上回るデメリットがあることを意識している人が少ないように思われます。データというのは、コピペしやすいこと、集計しやすいこと、数え間違いをしづらいことが第一なので、それを損ねるような行為は許されざる大悪というべきでしょう。断固として弾劾していきます。 綺麗なデータとは ここにエクセルで作った、同じソースから作成した3種類のデータ(東京都の区

    全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ
  • 【神Excel】8個の基本パターンで完全習得「リスト形式」の教科書 - わえなび ワード&エクセル問題集 waenavi

    一般の事務的な仕事Excelを使うとき、次の3種類の表を作ることが多いです。ところが、この3つの違いが分からない人(自覚症状のない人)が結構多いです。 入力のための表(フォーム) 表示または印刷のための表(レポート) データを格納するための表(リスト・テーブル) 3つとも同じような作り方をすると、「官公庁の神エクセル」などと揶揄されるような残念なExcelファイルを作ってしまいます。 そこで、今回は、Excelデータベースの基中の基「リスト形式の表」の作り方を解説します。問題は全部で8問ありますが、最後に総合問題を用意しています。並べ替えやピボットテーブルを覚える前にぜひ習得しましょう。 「リスト形式とCSV」完全マスターシリーズ(この記事は第1回です) 8個の基パターンで完全習得「リスト形式」の教科書 気で理解したい初心者のためのCSV勉強会資料 CSVファイルとExcelの関

    【神Excel】8個の基本パターンで完全習得「リスト形式」の教科書 - わえなび ワード&エクセル問題集 waenavi
  • なぜVLOOKUPを使えるとExcel中級者なのか - 本しゃぶり

    Excel中級者の定義は、VLOOKUPを使えることである。 この力を手にした時、人は神を追放する。 Excel中級者 「Excelが使える」とはどの程度のことを指すのか。企業の募集などで「Excelが使える人」と言う場合、それはExcelの達人を求めているわけではない。かと言って使える関数がSUMとAVERAGE程度の、初心者を指すわけでもない。ここで必要とされるのは「Excel中級者」である。 求められているのが「Excel中級者」ならば話は早い。VLOOKUPが使えればそれでいいのだから。 この定義について、今では異論のある人はほとんどいない。しかし、なぜVLOOKUPが使えたら中級者*1と言えるのか分かっている人は少ない。だからこの記事でそれを解説したいと思う。 VLOOKUPとは 表や範囲から行ごとに数値や文字列などを検索するには、検索/行列関数の 1 つ、VLOOKUP を使用

    なぜVLOOKUPを使えるとExcel中級者なのか - 本しゃぶり
    chess-news
    chess-news 2017/06/04
     降順並んでないとダメとか仕様がなかったっけ? / お客様は神様というのと同じ意味で、神 / 整然データのお話
  • 【翻訳】整然データ|Colorless Green Ideas

    効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。 ここに公開するのは、以下の論文の全訳である。 Wickham, H. (2014). Tidy data. Journal of Statistical Software, 59 (10). doi:10.18637/jss.v059.i10 この論文は、「整然データ」(tidy data) という概念を提唱したものである。これは、Rなどでデータ分析を容易にする有用な概念になっている。 なお、この概念についての簡単な解説として、「整然データとは何か」という文章を用意したので、先をそちらを読んでもよいだろう。また、“tidy” という英語をなぜ「整然」という日語に訳したかについては「なぜ“tidy data”を「整然データ」と訳

    【翻訳】整然データ|Colorless Green Ideas
  • 整然データとは何か|Colorless Green Ideas

    整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。 はじめに データ分析の際には、データが扱いやすい形式になっている必要がある。データの中身がぐちゃぐちゃになっていたり、データの形式が統一されていなかったりすれば、分析は骨の折れる作業となる。 それでは、どのようなものがデータ分析において扱いやすい形式のデータになるのだろうか。この問題に対する唯一の正しい解答というものは存在しない。しかし、表の形式で表すことができるデータを考える場合、ハドリー・ウィッカム (Hadley Wickham) 氏が提唱した整然データ (tidy d

    整然データとは何か|Colorless Green Ideas
    chess-news
    chess-news 2017/01/09
     ほんとこれ 変換方法をもっと知りたい
  • 1