Hiro_Matsunoのブックマーク - はてなブックマーク

Juliaでデータサイエンス100本ノック（構造化データ加工編） - Qiita
データサイエンティスト協会によるデータサイエンス100本ノック（構造化データ加工編）をJuliaで解きました。はじめにわざわざ紹介するまでもありませんが、Juliaは書きやすくて実行が速いモダンな科学計算向け言語として昨今注目を集めています。ただ、まだデータをこねくりまわすコード例が少なく、前処理などの用途で使うには少しとっつきづらさも残っていると思います。つい先月公開されたデータサイエンス100本ノック（構造化データ加工編）はそんな日頃遭遇するデータ処理のタスクを効果的にカバーしているもので、Python、R、SQLでの回答例もついています。ということで、いっちょこれをJuliaでやって実地で使えるように練習しようと思い立ち、やってみました。いくぶんでも参考になるかもしれないので、あくまで一回答例として公開してみます。コード https://github.com/Ken-Kurok
Hiro_Matsuno 2020/08/03
リンク
JuliaならDataFrameでforループしても十分速い - Qiita
うわっ…私のpandas、遅すぎ…?って時にやるべきこと（先人の知恵より）こちらに書かれている通り、pandasはたしかに遅い、特に使い方によっては極端に遅い。かといってforループを回避するためにあれこれ読みにくいコードを書きたくない。……だったらJuliaにしたらいいよ！という記事です。 pandasはどのくらい遅いか？元記事のデータは非公開のコードで加工されたもののようなので、ここでは他の公共データセットのデータを使わせてもらいます。Scikit-learnに入っているCalifornia Housingを使いましょう。約2万件しかデータがないのはちょっと物足りないので10回連結して約20万件に水増しします。 import sklearn from sklearn.datasets import fetch_california_housing import pandas as
Hiro_Matsuno 2020/07/26
リンク
1

はてなブックマーク

タグ

ブックマーク / qiita.com/Ken-Kuroki (2)

お知らせ

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / qiita.com/Ken-Kuroki (2)

Juliaでデータサイエンス100本ノック（構造化データ加工編） - Qiita

JuliaならDataFrameでforループしても十分速い - Qiita

お知らせ

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス