[B! ml] tasukuchanのブックマーク

20200910コンピュータビジョン今昔物語（JPTA講演資料）

2020/09/10 12:00-(日本時間)に開催されたJPTA Tech Talk講演資料 https://www.meetup.com/ja-JP/JTPA-Japanese-Techno logy-Professionals-Association/events/272748322/ 深層学習がコンピュータビジョンの世界をどう変えたかRead less

tasukuchan 2020/09/11

cv
ml

リンク

時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ

本記事では、時系列予測に利用できるpythonのライブラリの使い方について説明をします。パッとライブラリを使うことを目指すため具体的なアルゴリズムの説明は省きます。 ※説明が間違えている場合があればご指摘いただけると助かります。目次利用データライブラリ Prophet PyFlux Pyro Pytorch Lightgbm 補足:Darts まとめソースコードこのブログで記載されているソースコードはGitHubに上げておいたのでもしよろしければ参考にしてください。 github.com 利用データ今回用いるデータはkaggleのM5 Forecasting - Accuracyと呼ばれるコンペティションで利用されたデータを用います。作成したランダムなデータよりも実データのほうが予測をしている感があるからです。予測に使うデータはwalmartの売上データです。下図はその

tasukuchan 2020/07/20

ml

リンク

機械学習アルゴリズムの学習法

TL;DR 機械学習のアルゴリズムには詳しくなりたいけど実装はしない、という立場の人向けの学習資料まとめ知人向けで、具体的には同僚医師がターゲット読者（めちゃ狭い！）だが、一定度他の人にも役に立つかも改めて色々眺めてみてやっぱり大学の講義は質の高いものが多いと思った知人が機械学習のアルゴリズムを学びたいと言っているので、オススメの資料などを見繕ってみるブログエントリ。機械学習への関わり方を雑にアルゴリズムと実装で分けた場合に、アルゴリズムには詳しくなりたいけど実装をするわけではない、という立場の人向けである。このようなタイプの人はそんなにいないと思うけど、具体的にはドメインエキスパートとして機械学習エンジニアと一緒にアルゴリズム・データ改善に取り組んでいて、アルゴリズムでどんなことをやっているかをちゃんと理解したい、みたいなのが一例となる。なんとなくのイメージ的な理解だけだと、

tasukuchan 2020/07/06

ml

リンク

【一問一答】マヅコの知らない「異常検知」の世界 - Qiita

これから異常検知を勉強される初心者、中級者の方のために一問一答集を作ってみました。実際にあった質問も含まれますが、ほとんどの質問は、私が勉強しながら疑問に思ったことです。なお、各質問には私の失敗談を添えております。皆さんは私のような失敗をしないよう祈っております(^^)。異常検知に特化した内容となっておりますので、ご了承ください。初心者の方向け勉強の仕方編 Q：異常検知を勉強したいのですが、何から手をつけて良いのか分かりません。 A：書籍を買って読むのがおススメです。最初、私はネット情報で勉強していました。しかし、それにも限界があります。ところが、書籍（入門　機械学習による異常検知）を買って読んだところ、かなり知識を得ることができました。最初から、書籍を買っていれば、一年くらい得することができたのに... と思うこともあります（^^；ただ、こちらの本はディープラーニング系

tasukuchan 2020/07/02

ml

リンク

Stanford CS229: Machine Learning Full Course taught by Andrew Ng | Autumn 2018

Led by Andrew Ng, this course provides a broad introduction to machine learning and statistical pattern recognition. Topics include: supervised learning (gen...

tasukuchan 2020/04/25

ml

リンク

機械学習モデルの判断根拠の説明（Ver.2）

【第40回AIセミナー】「説明できるAI　〜AIはブラックボックスなのか？〜」 https://www.airc.aist.go.jp/seminar_detail/seminar_040.html 【講演タイトル】機械学習モデルの判断根拠の説明【講演概要】本講演では、機械学習モデルの判断根拠を提示するための説明法について紹介する。高精度な認識・識別が可能な機械学習モデルは一般に非常に複雑な構造をしており、どのような基準で判断が下されているかを人間が窺い知ることは困難である。このようなモデルのブラックボックス性を解消するために、近年様々なモデルの説明法が研究・提案されてきている。本講演ではこれら近年の代表的な説明法について紹介する。Read less

tasukuchan 2020/01/30

ml

リンク

機械学習における欠損値補完について考える - rmizutaの日記

※この記事で使用している多重代入法のパッケージは正式な多重代入法の枠組みとは異なりますのでご注意願います。はじめに最近多重代入法という欠損値補完の手法があることを知りました。統計学の界隈では欠損値補完は多重代入法を使用するのがベターのようですが、機械学習の文脈ではあまりその手法が使用されている形跡がなかったので、なぜそうなのか調査・実験した結果を記述します。参考資料欠測データ処理: Rによる単一代入法と多重代入法欠損値について欠損には大きく以下の３種類があります。・MCAR(Missing Completely At Random):完全にランダムに欠損・MAR(Missing At Random):観測データに依存する欠損・MNAR(Missing Not At Random):欠損データに依存する欠損多くの学習器は欠損値を入力できないので欠損値に対応する必要が

tasukuchan 2019/07/01

ml

リンク

【13個掲載】機械学習に使える日本語のデータセットまとめ - Qiita

※本記事は、Lionbridge AI発の連載記事を再編集したものです。他の機械学習に使えるオープン・データセットまとめ記事は、こちらからご覧ください。本記事は、日本語のデータセットを紹介いたします。日本語の公開データセットを無料ダウンロードできるポータルサイトや、自然言語処理に使える日本語のテキストデータセットを含みます。機械学習に使える日本語のデータセットポータル DATA GO JP: 日本政府のデータカタログサイト。日本政府は、公共データを広く公開することにより、国民生活の向上、企業活動の活性化等を通じ、我が国の社会経済の発展に寄与する観点から、機械判読に適したデータ形式を、営利目的も含めた二次利用が可能な利用ルールで公開する「オープンデータ」の取組を推進しています。このウェブサイトは、二次利用が可能な公共データの案内・横断的検索を目的としたオープンデータの「データカタログサイ

tasukuchan 2019/03/26

nlp
ml

リンク

np.dot, np.tensordot, np.matmulの違い - 西尾泰和のScrapbox

np.einsumという表現力の高いメソッドを知ったので、np.dot, np.tensordot, np.matmulをそれぞれnp.einsumで表現することで違いを確認してみる。

tasukuchan 2019/02/27

ml
numpy

リンク

数式をnumpyに落としこむコツ

Tokyo.SciPy #2 にて発表した、数式(あるいは数式入りのアルゴリズム)から実装に落とす場合、何に気をつけるのか、どう考えればいいのか、というお話。対象は、どうやって数式をプログラムすればいいかよくわからない人、ちょっとややこしい数式になると四苦八苦してしまい、コードに落とすのにすごく時間がかかってしまう人、など。ここでは実行速度についてはひとまずおいといて、簡潔で間違いにくい、ちゃんと動くコードを書くことを目標にしています。

tasukuchan 2019/02/27

ml

リンク

データサイエンスや機械学習のチートシートを最も効率的に収集する方法 - Qiita

機械学習・データサイエンスのチートシート集、便利なものがたくさん出回っていますが、ちまちまブラウザからダウンロードしていたりしませんか？そんな貴方にお勧めなのがこちらのレポジトリ。 FavioVazquez/ds-cheatsheets https://github.com/FavioVazquez/ds-cheatsheets はい、クリックあるいはコマンド一つで100を超えるチートシートが一括でダウンロードできちゃいますね。以上、釣りタイトル失礼しました。と、これだけではなんなので、個人的に有用性が高いと感じたものを、大きなサムネイル付きでまとめてみました。ソースとして、DataCamp及びRStudio公式ページの情報量は圧倒的なので、一読をお勧めします。科学計算・データ操作・可視化 Python (NumPy/SciPy/Pandas/matplotlib/bokeh) Pyt

tasukuchan 2019/02/25

こんなんあるんや

ml

リンク

GitHub - ludwig-ai/ludwig: Low-code framework for building custom LLMs, neural networks, and other AI models

Ludwig is a low-code framework for building custom AI models like LLMs and other deep neural networks. Key features: 🛠 Build custom models with ease: a declarative YAML configuration file is all you need to train a state-of-the-art LLM on your data. Support for multi-task and multi-modality learning. Comprehensive config validation detects invalid parameter combinations and prevents runtime failu

tasukuchan 2019/02/18

ml

リンク

画像処理100本ノックを「Google Colaboratory」で楽々学習 - Qiita

画像処理100本ノックとは以下のような素晴らしい記事を発見しました。 https://qiita.com/yoyoyo_/it ems/2ef53f47f87dcf5d1e14 （リンク切れ）画像処理を、OpenCV等の高度なライブラリを使わず行うことで、画像処理の理解を深める、非常に有用な練習問題集です。自分も画像処理の基礎を学びなおしたかったので、自己学習のため活用させていただくことにしました。ただ、初学者にとってハードルになりそうなのが、環境構築のところです。GitHubのREADMEに丁寧に描かれているのですが、初学者にとっては難易度高く、時間もかかります。また、自宅以外の環境でちょっと学習したいときなどにも不便です。そんな手間を解消するために、Googleが提供している環境構築不要・無料でPythonの開発が可能なWebサービス「Google Colaboratory」を使

tasukuchan 2019/02/18

ml

リンク

特徴量選択の今とこれから - 学習する天然ニューラルネット

特徴量選択とは特徴量選択の難しさ特徴量選択の手法の大別教師ありの特徴量選択 filter method 単変量とクラスラベルの関連性を上げる関係性を上げて冗長性を下げる関係性を上げて多様性を上げる wrapper method Forward SelectionとBackward Elimination 遺伝的アルゴリズムと粒子群最適化その他のwrapper method embedding method L1正則化 Regularized tree 特徴量選択のこれから超高次元データと特徴量選択のアンサンブル不均衡データにおける特徴量オンライン特徴量選択深層学習を用いた特徴量選択最後に特徴量選択とは特徴量選択(Feature Selection, 変数選択とも)はデータサイエンスにおいて非常に重要である。例えば、製造業において欠陥品を判別するタスクを考えてみよ

tasukuchan 2019/02/12

ml

リンク

機械学習の数理: 学部の講義で出した100問の演習課題 – Joe Suzuki (鈴木譲) 公式ブログ

機械学習の数理100問の改訂版 (2019年2月24日)。 2018年度の講義も残りわずかになった。私が着任した昨年度から、基礎工学部情報科学科数理科学コース3年「計算数理B」で、機械学習の数理に関する講義を行っている。その中で、計算数理B100問を学生に解かせている。線形回帰ロジスティック回帰と判別分析クロスバリデーションとブートストラップ情報量基準スパース推定非線形決定木サポートベクトルマシン教師なし学習機械学習の演習と言うと、参加費が◯十万円の企業のセミナーなどでも、中身を理解させないで、データを流し込むだけのものが多い。そういうのをみると、頭を使わない勉強方法を奨励しているように思えてならない。この100問は、理論(簡単な数式の証明)だけでなく、R言語でかかれたソースプログラムを理解するようにしている。データサイエンスの人材が◯万人不足すると指摘する声は多

tasukuchan 2019/02/03

ml

リンク

Papers with Code - Browse the State-of-the-Art in Machine Learning

Browse State-of-the-Art 11,907 benchmarks 4,488 tasks 109,489 papers with code

tasukuchan 2019/02/02

ml

リンク

ランダムフォレストと検定を用いた特徴量選択手法 Boruta - 学習する天然ニューラルネット

特徴量選択とは Borutaとはとりあえず使ってみるベースラインの判別 Borutaの判別 Borutaのアイデアの概要 Borutaのアルゴリズム 1. 判別に寄与しないはずの偽の特徴量を作る。 2. 偽の特徴量と一緒にランダムフォレストを訓練。 3. 各特徴量の重要度と偽の特徴量の特徴量を比較。 4. 複数回比較し検定を行うことで、本当に重要な特徴量のみを選択。検定について 1. 棄却したい帰無仮説と受容したい対立仮説を用意する。 2. 観測値から検定統計量Tを定める。 3. 帰無仮説が正しいとしてTの分布を求める。 4. 十分小さい有意水準αを定め、帰無仮説が正しいときにとなる領域を棄却域とする。 5. 観測されたTがに入っていたら対立仮説を受容し、入っていなければ帰無仮説を受容する。まとめ補足使う際のTips等 2019/01/06追記参考特徴量選択とは特徴量選択

tasukuchan 2019/01/08

ml

リンク

2018年版もっとも参考になった機械学習系記事ベスト10 - Qiita

こんにちは NewsPicks Advent Calendar 2018の 5日目を担当させていただきます、NewsPicks の戸辺と申します。 2年ほど前に「機械学習をゼロから1ヵ月間勉強し続けた結果」という記事を書き、多くの方に読んでいただきました。そこから引き続き機械学習に携わっており、今年も多くの機械学習系の記事を拝読させていただきました。それら中から「実戦でためになった」「機械学習の勉強に役に立った」という観点から、僕なりのベスト10をあげてみました。長い冬休み(余談ですが、社会人で一番長く休めるときですよね!?)は知識のアップデートをするのにいい機会だと思いますので、まとめ読みしてみてはいかがでしょうか。では、スタート！まずは 2018年にみんなが使った Colaboratory 関連から 1位: 【スマホOK/実行しながら学ぶ】東大松尾研のデータサイエンティスト育成/

tasukuchan 2018/12/05

ml

リンク

@kenmatsu4のマイページ - Qiita

Kaggle Master (https://www.kaggle.com/kenmatsu4) データ解析的なことや、統計学的なこと、機械学習などについて書いています。【今まで書いた記事一覧】http://qiita.com/kenmatsu4/it ems/623514c61166e34283bb Follow

tasukuchan 2018/11/19

ml
math

リンク

「内積が見えると統計学も見える」第5回プログラマのための数学勉強会発表資料

「第5回プログラマのための数学勉強会発表資料 (2015/11/21[sat])」内容は統計学の素養がある方には基本的な事項ですが、ベクトルと内積で見方を変えてみたという点と、あまり統計学に親しみがない方にも理解してもらえるようなまとめになっている、というところに本スライドの独自性があると考えていますので、その辺り良ければご覧ください＾＾Read less

tasukuchan 2018/11/19

ml
math

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

mlに関するtasukuchanのブックマーク (37)

お知らせ

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

今週のはてなブックマーク数ランキング（2024年5月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス