データに関するatSushiのブックマーク (2)

  • GCPとDockerでKaggle用計算環境構築 - Qiita

    Kaggle Advent Calendar 13日目の投稿です。 初めまして、Lain(@lain_m21)と申します。Qiita初投稿です! 今回はKaggle関連のトピックで何か短いのを一書こうと思い、私が普段行なっているコンペ用の環境構築についていくつか良いなと思ったtipsをシェアしたいです。 先に結論からまとめておくと、 ローカルPCよりクラウドの計算資源をうまく使おう AWSもいいけど、GCPの方が目的に応じてインスタンススペックを細かくチューニングできるので良いぞ 今後のクラウドの環境構築をスムーズにするためにdockerを使おう といった感じです。昨今のコンペの規模を考えるとクラウドで計算することが増えると思うのですが、いちいちコンペごとに環境構築したりめんどくさいと思うので、できるだけdockerで自動化して楽しよう!というのが趣旨になります。 一応順を追って説明しま

    GCPとDockerでKaggle用計算環境構築 - Qiita
  • 全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ

    (12/13追記 タイトルや表記に過剰な表現があり、セル結合を全否定するかのような印象を与えてしまいました。そのような意図はなかったのですが、補足記事を書きましたので、併せて読んでいただけると幸いです。すみませんでした。) 人類よ、なぜそんなにセル結合を使いたがる? それが罪深い行為とも知らずに……。 思わず神視点になってしまいましたが、この世界にはExcelのセル結合を無意味に使いたがる人が多すぎます。いや、メリットがないことはないのですが、それを余裕で上回るデメリットがあることを意識している人が少ないように思われます。データというのは、コピペしやすいこと、集計しやすいこと、数え間違いをしづらいことが第一なので、それを損ねるような行為は許されざる大悪というべきでしょう。断固として弾劾していきます。 綺麗なデータとは ここにエクセルで作った、同じソースから作成した3種類のデータ(東京都の区

    全人類に告ぐ。セル結合をやめろ。 - hibitの技術系メモ
  • 1