[B! python][kaggle] ishideoのブックマーク

ishideo id:ishideo

pythonとkaggleに関するishideoのブックマーク (18)

GitHub - smly/kaggle-book-gokui: 付録コード
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
ishideo 2023/02/06
kaggle

book

code

github

python
リンク
[polars] python-kaggle-start-book-ch02_05
Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster
ishideo 2023/01/26
polars

python

kaggle
リンク
Google ColabとVSCodeを用いた分析環境運用方法〜kaggle Tipsを添えて〜 - ギークなエンジニアを目指す男
こんにちは。takapy（@takapy0210）です。本エントリは下記イベントでLTした内容の元に、補足事項やコードスニペットなどをまとめたものになります。 kaggle-friends.connpass.com ちなみに今回LTしようと思ったきっかけは以下のような出来事からだったので、みなさんのTipsなども教えていただけると嬉しいです！情報出回ってる感あるけど、colab pro × vscode ssh のオレオレ運用方法を晒すことにより、もっと良い方法のフィードバックもらえるのではドリブンでLTするのはありなのかもしれない・・・？— takapy | たかぱい (@takapy0210) 2021年8月1日 LT資料当日みなさんから頂いたコメント環境構築手順 ngrokアカウント作成と認証キーの取得 ColabにGoogleドライブを接続、ngrok、sshサーバー起動
ishideo 2021/08/27
google

colaboratory

vscode

kaggle

python
リンク
Kaggleで書いたコードの備忘録その１～データ分析で使った手法一通り～（可視化、データ加工、検証、特徴量抽出、モデル、AutoML等） - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
ishideo 2021/08/02
kaggle

python

automl

qiita

pandas
リンク
GitHub - bjpublic/kaggleml
ishideo 2021/05/21
bjpublic

kaggle

code

book

korean

github

python
リンク
【Python/機械学習/Kaggle】ローカルで編集・パソコン間で共有可能な環境をColabとGoogleドライブで簡単構築 - Qiita
はじめに「Colaboratory を使えばGPU付きの環境を無料で使えるけど、git使おうとしたりファイル編集したりする時面倒...」と思っていた時期がありました。パソコン版 Google ドライブを使うと、ローカルにドライブをマウントできるので、ローカルで編集してGPUが必要なときはColabで実行というのが簡単にできます。ターミナルからコマンドで操作できるので、クラウドのストレージとしても使いやすいです。また、最近 Colab Pro が日本にやってきました。月額1000円で Kaggle などでも十分戦える環境が手に入ります。もともと無料枠でもかなり使えましたが、課金すると優先的に良いGPUが割り当てられるなどのメリットがあります。対象者 Kaggle に参加するためのGPU搭載マシンがない方（Kaggle Notebook では物足りない方）ちょっとした機械学習の環
ishideo 2021/03/30
python

ml

colaboratory

kaggle

qiita

google

drive
リンク
Kaggleコード遺産 - Qiita
この記事はどんな記事なのだ？こんにちはなのだ、kaggle masterのアライさんなのだ。この記事はkaggle advent calendar 2019 その1の13日目の記事なのだ。前日はu++さんのKaggle Days Tokyoの記事なのだ。アライさんも参加したかったのだ。明日はtakapy0210さんの学習・推論パイプラインについてなのだ。楽しみなのだ。 Kagglerの間では連綿と受け継がれる便利関数がいくつかあるのだ。アライさんはそれをKaggleコード遺産と呼ぶことにしたのだ。この記事ではKaggleコード遺産の紹介とその出処の検証1を行おうと思うのだ。面白かったら是非upvoteしてくださいなのだ。さあKaggleパークの冒険に出発なのだ！おことわり今回の記事はPythonコードに限った話になってしまったのだ。KaggleのNotebookではRも使える
ishideo 2021/03/29
python

kaggle

time

utility

optimize

ml

qiita
リンク
pythonで実行時間を測定しつつ時間も取得したい - nykergoto’s blog
実行時間を測定するには? KaggleMasterのアライさん著・Kaggleコード遺産でおなじみ timer を使うのが便利です! いつもお世話になってます😊 Kaggleコード遺産 - Qiita from contextlib import contextmanager from time import time # https://qiita.com/kaggle_master-arai-san/it ems/d59b2fb7142ec7e270a5#timer をちょっといじったやつ @contextmanager def timer(logger=None, format_str='{:.3f}[s]', prefix=None, suffix=None): if prefix: format_str = str(prefix) + format_str if suffix:
ishideo 2021/03/29
python

time

timer

kaggle
リンク
特徴量エンジニアリングのライブラリ xfeat を使ってみて便利だったこと - Taste of Tech Topics
こんにちは。機械学習エンジニアをしている古賀です。最近は愉快な上司@tereka114 のもと、精度の上がらないモデルに四苦八苦しています。そんな私が普段データ分析をする際に難しいことの一つとして、特徴量エンジニアリングがあります。特徴量エンジニアリングとは、元のデータに新たな特徴量を追加することでモデルの精度を向上させるプロセスのことです。この結果によってモデルの精度が大きく変わりますが、正しく実行するにはデータへの深い理解やデータ分析力が必要になります。私もあまり得意ではないのですが、これを簡単にする xfeat という便利なライブラリがあると上司が教えてくれたので、実際に使ってみて便利だったことをまとめました。 ※本記事は、Pythonその3 Advent Calendar 2020 の15日目の内容になります。目次は以下です。 xfeat とは準備実行環境 xfea
ishideo 2020/12/16
python

xfeat

kaggle

lightgbm

optuna

cudf

data-science
リンク
GitHub - fkubota/kaggle-Cornell-Birdcall-Identification: Cornell Birdcall Identification コンペのリポジトリ
ishideo 2020/10/07
kaggle

github

issue

jupyter

notebook

python
リンク
Kaggleで多くの実験を回すためにやっている簡単なこと
はじめにこんにちは。fkubota(Kaggle Expert 20201001現在)です。先日公開したKaggle日記の記事が好評だったので、調子に乗ってもう一つ。今回は、僕が行っているとても簡単だけど効果が大きいKaggleの実験高速化の話です。おそらく当たり前すぎてこれまで記事にされなかったのかもしれませんが、これから積極的にKaggleに参加したいビギナーのために書きます。今回も、キラキラした画期的な特徴量エンジニアリングではなく、泥臭いテクニックを話します。なぜ多くの実験を行いたいか言うまでもないですが、多くの実験を行ったほうが勝つ確率は上がります。僕は今回の鳥コンペが初画像コンペでしたのでより多くの実験を行って勘所をつかむ必要がありました。案の定、Pytorchの癖をはじめはつかむことができず、コンペの1/3はPytorchのお勉強に使ってしまいました。とにかく、ビギ
ishideo 2020/10/07
kaggle

ml

zenn

python

pdb

debug
リンク
IT未経験からMLエンジニアになるまでの2年半でやったこと - MLaaSS - Machine Learning as a Self-Satisfaction
はじめに自身の転職活動にあたり皆さんの転職エントリが非常に参考になったので、私も同じ境遇の方の参考になればと思い、書き残すことにしました。（ただ、本当に私と似た境遇の方にはなかなかリーチしづらい気がしていますが・・・） TLDR; 30歳でIT未経験からMLエンジニアに転職約2年半独学で勉強（ほとんどkaggleしてただけ）無関係に思えた現職での経験もなんだかんだ転職で役に立った目次自己紹介現職について転職の理由勉強したこと転職活動終わりに 1.自己紹介かまろという名前でTwitterなりkaggleなりをやっています。kaggleでは画像やNLPといったdeep learning系のコンペを中心に取り組んでおり、2019年の9月に金メダルを獲得しMasterになることができました。恐らくここが他の転職エントリを書かれている方々と大きく異なる点かと思うのですが、現職
ishideo 2020/07/08
kaggle

python

ml

machine-learning

data-science
リンク
GitHub - upura/python-kaggle-start-book: 『PythonではじめるKaggleスタートブック』のサンプルコード・脚注・正誤表
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
ishideo 2020/07/02
python

kaggle

code

book

github
リンク
Kaggleで戦いたい人のためのpandas実戦入門 - ML_BearのXじゃ言えない話
はじめに自分は元々pandasが苦手でKaggleコンペ参加時は基本的にBigQuery上のSQLで特徴量を作り、最低限のpandas操作でデータ処理をしていました。しかし、あるコードコンペティションに参加することになり、pythonで軽快にデータ処理をこなす必要が出てきたので勉強しました。そこで、当時の勉強メモをもとに「これだけ知っていればKaggleでそこそこ戦えるかな」と思っているpandasの主要機能をまとめました。注記実戦入門のつもりがほぼ辞書になってしまいました orz pandasとはなんぞや的な内容は書いていません (import pandasやDataFrameとは何かなど) pandas1.0系でも動くように書いたつもりですが間違ってたらすみません目次はじめに注記目次 Options DaraFrame 読み書き CSVファイル読み込み書き出
ishideo 2020/04/01
pandas

dataframe

python

kaggle
リンク
イベントレポート: LeanとDevOpsの科学[Accelerate] 出版記念イベント #devops - クリエーションライン株式会社
エグゼクティブ向けAI駆動開発実装体験ラウンドテーブル開催レポート！ AI駆動開発(AIDD)CLくん2026.05.12 1 生成AIと目標設定してみたら思いのほか良い体験だった話 AI ChatGPT＆AIk-yamamoriKaizen2026.05.11 1 AIエージェント Harness設計比較 AIj-liangLLM用語解説2026.05.01 4 Strandsで簡単な生成AIチャットボットを作ってみた #strands #ai #llm #gemini AI AWSd-higuchiGCPLLMPython2026.05.01 1 GitLab 18.11 製品アップデートニュース #GitLab #GitLabjp AI AI駆動開発(AIDD)DevOpsGitLab2026.04.30 1 Mirantis製品リリース＆サポート最新情報（2026年4月）#Miran
ishideo 2019/04/18
apachespark

kaggle

python

pandas

pyspark

spark

mlops
リンク
Kaggleで使える！Pandasテクニック集 - Qiita
はじめに Kaggleで使えるPandasの使い方を備忘録として残します。随時更新していく予定です。更新：2019年1月29日15時　様々なコンペで使える便利な関数を追記しました。 Pandas Basics Cheat Sheet(基本的な使い方) [引用]https://becominghuman.ai/cheat-sheets-for-ai-neural-networks-machine-learning-deep-learning-big-data-678c51b4b463 プログレスバーを表示する df.apply()やdf.map()の進捗を見たい時に、 tqdmというライブラリを使うことでプログレスバーを表示することができます。 import pandas as pd import numpy as np from tqdm._tqdm_notebook import t
ishideo 2019/01/31
kaggle

pandas

python

qiita
リンク
Stacking/Blendingをheamy、Stacknetをpystacknetで高速に実装する - フリーランチ食べたい
この記事は機械学習工学 / MLSE Advent Calendar 2018 - Qiita の15日目です。 Stacking/Blendingは実装が面倒 Kaggleなどでよく使われるアンサンブル手法にStacking/Blendingがありますが自分で実装すると結構面倒ですまたモデルの精度を測る際にK-Fold Validationを行うこともありますが、同じpredictを何度も発生してしまい、単純に行うと無駄な処理が多くなってしまいます。今回紹介するライブラリheamyでは、それらの問題点が解決されており、抽象化されたAPIで簡単にStacking/Blendingを実装でき、かつ、内部でpredictされた結果がキャッシュされており、高速に計算を行うことができますまたheamyではWeighted Averageも簡単に実装できる仕組みがあります。また、St
ishideo 2018/12/19
python

heamy

blending

stacking

stacknet

pystacknet

kaggle
リンク
時間のかかる前処理をDaskで高速化 - ぴよぴよ.py
最近仕事で自然言語処理を使ったモデルを作成していたんですが、前処理やモデルを作る際に数分〜数十分単位の処理待ちの空き時間が頻繁に発生してしまい、その度集中力が切れる問題に悩まされていました。モデルの学習に時間がかかってしまうのはまた別の解決策を考えるとして、今回は時間のかかる前処理をDaskをつかって高速化した方法をお話ししようと思います。この記事は PyLadies Advent Calendar 2018 - Adventar の18日目の記事になります。 Daskとは？ Daskとは、numpyやpandasなどのデータを簡単に並列計算するライブラリ。あまり公式のチュートリアルがわかりやすくない(気がする)ので、基本的な使い方は Python Dask で並列 DataFrame 処理 - StatsFragments を見てみると良い。サンプルデータ今回はKagg
ishideo 2018/12/19
python

dask

pandas

nltk

kaggle

numpy

multiprocessing

parallel
リンク
1