タグ

ブックマーク / qiita.com/Ken-Kuroki (2)

  • Juliaでデータサイエンス100本ノック(構造化データ加工編) - Qiita

    データサイエンティスト協会によるデータサイエンス100ノック(構造化データ加工編)をJuliaで解きました。 はじめに わざわざ紹介するまでもありませんが、Juliaは書きやすくて実行が速いモダンな科学計算向け言語として昨今注目を集めています。ただ、まだデータをこねくりまわすコード例が少なく、前処理などの用途で使うには少しとっつきづらさも残っていると思います。つい先月公開されたデータサイエンス100ノック(構造化データ加工編)はそんな日頃遭遇するデータ処理のタスクを効果的にカバーしているもので、Python、R、SQLでの回答例もついています。ということで、いっちょこれをJuliaでやって実地で使えるように練習しようと思い立ち、やってみました。いくぶんでも参考になるかもしれないので、あくまで一回答例として公開してみます。 コード https://github.com/Ken-Kurok

    Juliaでデータサイエンス100本ノック(構造化データ加工編) - Qiita
  • JuliaならDataFrameでforループしても十分速い - Qiita

    うわっ…私のpandas、遅すぎ…?って時にやるべきこと(先人の知恵より) こちらに書かれている通り、pandasはたしかに遅い、特に使い方によっては極端に遅い。かといってforループを回避するためにあれこれ読みにくいコードを書きたくない。……だったらJuliaにしたらいいよ! という記事です。 pandasはどのくらい遅いか? 元記事のデータは非公開のコードで加工されたもののようなので、ここでは他の公共データセットのデータを使わせてもらいます。Scikit-learnに入っているCalifornia Housingを使いましょう。約2万件しかデータがないのはちょっと物足りないので10回連結して約20万件に水増しします。 import sklearn from sklearn.datasets import fetch_california_housing import pandas as

    JuliaならDataFrameでforループしても十分速い - Qiita
  • 1