[B! kaggle] clavierのブックマーク

clavier id:clavier

kaggleに関するclavierのブックマーク (62)

今日からすぐできる Kaggleのススメ
clavier 2024/03/05
kaggle

slide

study
リンク
Kaggle learnで学ぶ機械学習の基礎（初級編） - Qiita
Kaggleで始める機械学習入門でKaggleのアカウントを作成して、一通りの操作ができました。次はKaggle learnの以下の初級講座を使って機械学習の基礎を学習します。この初級講座は７回のレッスンで構成されており、各回は解説パート(tutorial)と実践パート(exercise)に分かれています。実践パートでは、コンペと同様のNotebookでコードを動かす形になります。実際にやってみた感想です。＜良かった点＞・１回１時間程度でサクッとできる・１回あたりの内容は比較的かんたんで理解しやすい・解説パートで学んだコードを実践パートで入力し、答え合わせできるので達成感がある＜悪かった点＞・すべて英語… 英語なのは仕方ないですね。DeepLに頼りながら読み進めました。内容としては、まず決定木を使ってシンプルなモデルを構築します。次にその結果を評価する方法を学び、良いモデ
clavier 2024/01/15
kaggle

pandas

study

data

python
リンク
番外編：VS CodeでKaggleしよう！
kaggleパッケージをインストールして、VS Codeの統合ターミナルからKaggle APIにkaggleコマンドを使ってアクセスし、ローカル環境でKaggleノートブックを実行してみましょう。
clavier 2022/02/19
kaggle

vscode

editor
リンク
ポイントを押さえればTime-seriesコンペは怖くない　堅牢で速いコードを書くためのテクニックと心構え
「分析コンペLT会」は、KaggleやSIGNATEなど、データ分析のコンペに関連するLT（ライトニングトーク）を行う会です。能見氏は、「Time-series code competition」で生き残るために重要な4つのポイントについて発表しました。全2回。後半は、コード構成とエラーハンドリングについて。前半はこちら。コード構成とデバッグ能見氏（以下、能見）：次はコード構成とデバッグの話です。Time-seriesコンペに関して、Kaggle環境でコードを書き切るのは、コード量が多くなるのでけっこうつらくなりがちです。そのため、手元で書いてGitで管理することをおすすめします。ただ、Time-seriesコンペでは信頼性の高い、わりと複雑なコードを書かなければいけないので、デバッグやテストの管理がしやすいように書きたいというのもあるかなと思っています。自分がやりやすい方法で書くの
clavier 2022/02/15
kaggle

あとで読む

時系列分析

data
リンク
Kaggle Grandmasterになるまでの7年間の軌跡 - のんびりしているエンジニアの日記
皆さんこんにちはお元気でしょうか。冬だというのに、GPUと暖房で半袖装備でも過ごせています。今年、長きにわたるMaster生活の終演を迎え、ようやくGrandmasterになることができました。そこで、Grandmasterになるまでの経験をこちらに書き記しておこうと思います。この記事はKaggle AdventCalendar2021カレンダー2、25日目になります。 qiita.com 著者の背景 Kaggleへの取り組み 1-3年目 4年目 IEEE's Signal Processing Society Avito Demand Prediction Challenge Home Credit Default Risk 5年目あたり 6年目 Global Wheat Detection 7年目 Shopee - Price Match Guarantee Hungry Ge
clavier 2021/12/30
kaggle
リンク
State of Data Science and Machine Learning 2021
Download our executive summary for a profile of today's working data scientist and their tools
clavier 2021/11/06
kaggle

data

study

machinelearning

dataScience
リンク
Catboostとは？XgboostやLightGBMとの違いとPythonでの実装方法を見ていこうー！！｜スタビジ
当サイト【スタビジ】の本記事では、XgboostやLightGBMに代わる新たな勾配ブースティング手法「Catboost」について徹底的に解説していき最終的にPythonにてMnistの分類モデルを構築していきます。LightGBMやディープラーニングとの精度差はいかに！？こんにちは！消費財メーカーでデジタルマーケター・データサイエンティストをやっているウマたん(@statistics1012)です！ Xgboostに代わる手法としてLightGBMが登場し、さらにCatboostという手法が2017年に登場いたしました。これらは弱学習器である決定木を勾配ブースティングによりアンサンブル学習した非常に強力な機械学習手法群。計算負荷もそれほど重くなく非常に高い精度が期待できるため、Kaggleなどのデータ分析コンペや実務シーンなど様々な場面で頻繁に使用されているのです。
clavier 2021/11/06
kaggle

statistics

study

python

catboost

lightgbm

xgboost
リンク
Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜 | 株式会社AI Shift
こんにちは AIチームの戸田です近年、自然言語処理タスクにおいて、BERTを始めとするTransf ormerをベースとした事前学習モデルを感情分類や質問応答などの下流のタスクでfine-tuningする手法が一般的になっています huggingfaceのTransf ormersなど、事前学習モデルを簡単に使うことのできるライブラリもありますが、Kaggleなどのコンペティションで上位に入るには素のモデルのままでは難しく、ヘッダや損失関数などの工夫などが必要です本記事では私がKaggleのコンペティションに参加して得た、事前学習モデルのfine-tuningのTipsを共有させていただきます書きたい内容が多くなってしまったので、今回は学習の効率化について、次回精度改善について、と２回に分けて書かせていただきます事前準備学習データとして、先日終了したKaggleのコンペティション、C
clavier 2021/11/03
tuning

kaggle

study

performance

機械学習

data

tips

machinelearning

NLP
リンク
Google ColabとVSCodeを用いた分析環境運用方法〜kaggle Tipsを添えて〜 - ギークなエンジニアを目指す男
こんにちは。takapy（@takapy0210）です。本エントリは下記イベントでLTした内容の元に、補足事項やコードスニペットなどをまとめたものになります。 kaggle-friends.connpass.com ちなみに今回LTしようと思ったきっかけは以下のような出来事からだったので、みなさんのTipsなども教えていただけると嬉しいです！情報出回ってる感あるけど、colab pro × vscode ssh のオレオレ運用方法を晒すことにより、もっと良い方法のフィードバックもらえるのではドリブンでLTするのはありなのかもしれない・・・？— takapy | たかぱい (@takapy0210) 2021年8月1日 LT資料当日みなさんから頂いたコメント環境構築手順 ngrokアカウント作成と認証キーの取得 ColabにGoogleドライブを接続、ngrok、sshサーバー起動
clavier 2021/09/12
machinelearning

kaggle

python

VSCode

Colab

tips
リンク
ルールベース画像処理のススメ
データ分析LT会第二回で発表した際の資料です。 youtube: https://www.youtube.com/watch?v=jDZwX3jxhK4 conppass url: https://kaggle-friends.connpass.com/event/214854/ github repository: https://github.com/fkubota/bunseki_compe_LT_02
clavier 2021/06/20
kaggle

algorithm

機械学習

画像処理

image
リンク
pythonで気軽にパッケージを作るのは良いという話。
2021/06/18 分析コンペLT会#2 での発表資料です。
clavier 2021/06/19
python

programming

ci

kaggle
リンク
【挑戦者求ム】ぼくの考える最速のData LoadingとData Augmentation（Kaggle notebook） - Qiita
【挑戦者求ム】ぼくの考える最速のData LoadingとData Augmentation（Kaggle notebook）Python画像処理DeepLearningKagglePyTorch はじめにまぁタイトルの通りなのですが、Kaggle notebook上で行う最速のData LoadingとData Augmentationを考えてみたので紹介します。より速い方法を知っている方は教えてください！今回の題材は以下のように設定します。データこちらのコンペのデータを使います。10.2k枚のjpg形式の犬の画像です。 https://www.kaggle.com/c/dog-breed-identification/data 実行環境 GPUをenableにしたKaggle notebookで行います。 2 CPU cores 13 GB RAM Tesla P100 条件
clavier 2020/09/01
kaggle

Qiita
リンク
Kaggleで戦いたい人のためのpandas実戦入門 - ML_BearのKaggleな日常
はじめに自分は元々pandasが苦手でKaggleコンペ参加時は基本的にBigQuery上のSQLで特徴量を作り、最低限のpandas操作でデータ処理をしていました。しかし、あるコードコンペティションに参加することになり、pythonで軽快にデータ処理をこなす必要が出てきたので勉強しました。そこで、当時の勉強メモをもとに「これだけ知っていればKaggleでそこそこ戦えるかな」と思っているpandasの主要機能をまとめました。注記実戦入門のつもりがほぼ辞書になってしまいました orz pandasとはなんぞや的な内容は書いていません (import pandasやDataFrameとは何かなど) pandas1.0系でも動くように書いたつもりですが間違ってたらすみません目次はじめに注記目次 Options DaraFrame 読み書き CSVファイル読み込み書き出
clavier 2020/04/01
kaggle

pandas

python
リンク
機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ（2020年3月版）｜カレーちゃん🍛専業kaggler｜note
2018年6月末に公務員を退職し専業kagglerになり、2022年5月KaggleGrandMaster。現在は、広告の効果予測の研究・開発をしています。 ChatGPTの本を執筆中。まもなく出ます。
clavier 2020/03/17
kaggle

python
リンク
Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選 | 宙畑
2019年も様々なデータサイエンス関連のコンペが実施され、論文が発表されました。その中でも面白かったものはどれか、5人のkagglerの方に直接お伺いしました。 2019年はTellusxSIGNATEで実施された衛星データコンペの解説(第1回・第2回)が、データサイエンティストの方に読んでいただいた宙畑のヒット記事としてランクイン。では、データサイエンティストの方は他にどのようなコンペや論文に興味を持たれていたのか……と気になった宙畑編集部。今回、以下5名のKagglerの方に協力いただき、2019年の振り返りとして面白かったコンペと論文、そしてその理由を教えていただきました。あきやま様(@ak_iyama) jsato様(@synapse_r) Hiroki Yamamoto様(@tereka114) smly様(@smly) ※順不同 ※1名、非公表 Kaggleについては「世
clavier 2020/02/12
あとで読む

kaggle

python
リンク
Kaggleで世界11位になったデータ解析手法～Sansan高際睦起の模範コードに学ぶ｜ハイクラス転職・求人情報サイト AMBI（アンビ）
Kaggleで世界11位になったデータ解析手法～Sansan高際睦起の模範コードに学ぶ Kaggleの上位入賞者であるKaggle Grandmasterを獲得した、Sansan株式会社のデータサイエンティスト高際睦起さん。模範となるソースコードをもとに考え方や解析手法を教えていただきました。「Porto Seguro’s Safe Driver Prediction」とは？【技法1】前処理【技法2】特徴抽出【技法3】予測モデルの作成 Kaggle初心者は何から始めるべき？データサイエンティストを目指す若き人たちへ世界中のデータサイエンティストたちが集まり、企業や研究者が投稿したデータに対する高精度なモデルを競い合うプラットフォーム・Kaggle。メンバーは100万人を超えており、良問の多さや参加者のレベルの高さゆえに、機械学習を学ぶ者にとって優れた研鑽（けんさん）の場となって
clavier 2020/02/11
kaggle
リンク
社内でKaggleの布教活動をやっている話 - yasuhisa's blog
最近、社内勉強会で機械学習についてエンジニアに説明する機会があり、その際にKaggleについても説明しました。一方でうーん、「Kaggler はパラメータチューニングやアンサンブル等の自明でインクリメンタルな改善『しか』できない」というような誤解はどうやって解いていけばいいんだろう。— im132nd (@im132nd) 2018年4月4日という話もあり、(特にデータサイエンティスト以外の職種の人が)Kaggleをやる意義/メリットについてまとめてみました。ガッと勢いで書いたので、項目に結構被りがあります。なお、書いている本人はKaggleほぼ初心者であまり説得力がないです。Kaggle Masterの人がもっといいエントリを書いてくれるのを期待しています、議論の叩き台エントリです!! Kaggleをやる意義/メリット様々なデータセットを触ることができる kernelでデータ分析の
clavier 2020/02/11
kaggle
リンク
Kaggle Data Science Bowl 2019 上位解法まとめ - Tak's Notebook
https://www.kaggle.com/c/data-science-bowl-2019/ Data Science Bowl 2019 所感上位陣に共通していたポイント異なる点 1st Place Solution リンク Summary Validation Feature Feature Selection Model 2nd Place Solution リンク Summary Validation Feature Feature Selection Model Others 3rd Place Solution リンク Summary Validation Feature Feature Selection Model Others 4th Place Solution リンク Summary Validation Feature Model Others 7th Pl
clavier 2020/01/29
kaggle
リンク
Kaggle_Days_Tokyo_-_Feature_Engineering_and_GBDT_Implementation.pdf
Kaggle_Days_Tokyo_-_Feature_Engineering_and_GBDT_Implementation.pdf
clavier 2020/01/05
kaggle

特徴量

slide
リンク
Kaggleのカレンダー | Advent Calendar 2019 - Qiita
Kaggleに関連することなら何でもOK。 Kaggleのノウハウ、小ネタ、使用するパッケージの紹介、コンペに参加した結果とか感想など。初心者向けも、強い人向けも、kaggle始めましたという内容もＯＫ。自分のブログでも登録できます。普段記事を書くことがない方も、がっつり書く方も、遠慮せずに書きましょう！過去：2018, 2018part2, 2017 その２もよろしくお願いします。 AI道場「Kaggle」への道 by 日経 xTECH ビジネスAI① Advent Calendar 2019でもKaggleテーマのadvent-calendarが行われています。
clavier 2020/01/05
kaggle

AdventCalendar
リンク
1 2 3 4 次のページ