[B! 機械学習] hippy-hikkyのブックマーク

hippy-hikky id:hippy-hikky

機械学習に関するhippy-hikkyのブックマーク (37)

Probabilistic Deep Learning for Wind Turbines
hippy-hikky 2021/11/17
CNN-AEでの次元圧縮＋能動学習によりデータポイントを削減して計算効率を上げる。

機械学習

ベイズ

GaussianProcess
リンク
代理モデルによる機械学習モデルの説明 - Qiita
はじめに代理モデル (surrogate model) とは複雑な機械学習モデル（e.g., DNN, GBDT）を近似する簡単なモデル（e.g., パラメタ数の少ないDNN, 単純決定木, etc）のことを指します．代理モデルは推論の高速化・機械学習モデルの説明などさまざまな用途に使われています．この記事では代理モデルによる機械学習モデルの説明をハンズオン的に紹介します．これは非常にシンプルかつ柔軟な手法ですが，アドホックな部分が多いためかハンズオン的な解説は見当たりませんでした．Christoph Molnar による Interpretable Machine Learning の Global Surrogate に概要は示されているので機械学習に詳しい人はこちらを読めば十分かもしれません．関連するライブラリに LIME や TreeSurrogate がありますが，わたしがこ
hippy-hikky 2021/09/27
代理モデルでそこそこ近侍できたとして、解釈の扱いがめちゃくちゃ難しそう。一面の解釈であることが有耶無耶になって結果だけが一人歩きするやつ。

機械学習
リンク
MLOps: The Ultimate Guide
hippy-hikky 2021/08/23
https://github.com/datarevenue-berlin/OpenMLOps/ MLOps, 独自仕様な有料ツールとかあるけど、Open sourceなツールを組み合わせる方が自由度が高いしビジネスにフィットできるぜ　って言ってる。

機械学習

MLOps
リンク
Recent Advances in Language Model Fine-tuning
Fine-tuning a pre-trained language model (LM) has become the de facto standard for doing transfer learning in natural language processing. Over the last three years (Ruder, 2018), fine-tuning (Howard & Ruder, 2018) has superseded the use of feature extraction of pre-trained embeddings (Peters et al., 2018) while pre-trained language models are favoured over models trained on translation (McCann et
hippy-hikky 2021/04/07
言語モデルのFineTuningに関する最新手法の紹介。特に、言語モデルを微調整する手法について。

機械学習

Transformer

NLP
リンク
CTR予測における確率補正について - MicroAd Developers Blog
はじめにこんにちは. マイクロアドで機械学習エンジニアをしている福島です. 主に広告のClick Through Rate (CTR)予測やReal-Time-Bidding (RTB)の入札最適化を担当しています. 今回はマイクロアドでのCTR予測における確率補正について紹介したいと思います. はじめに CTR予測とは問題1　学習データが不均衡問題2　機械学習モデルの出力を確率として扱うのは不適切な場合がある問題3　学習データの信頼度が高くない CTR予測における確率補正アンダーサンプリングによって生じたバイアスの除去 Isotonic Regressionによる確率補正確率補正の効果検証終わりに CTR予測とは RTBでは下図のように, 広告主とメディア間でリアルタイムにオークションが開催され, オークションに勝利した広告がメディアに表示されます. マイクロアドでは現在オ
hippy-hikky 2021/01/25
imbalancedなデータでの確率の推論

機械学習
リンク
公正配慮型データマイニング Fairness-aware Data Mining
hippy-hikky 2021/01/07
公平性

公平性

機械学習

あとで読む
リンク
AIと公平性（入門編） - Qiita
はじめに ABEJAのアドベントカレンダーの第・・・何番目だろ・・・？？ ABEJAでは、法務担当者をやっています。弁護士を10年ほどやっていますが、ふとしたことで機械学習の世界をやってみたくなり、独学で、数学書やPRMLや青本やカステラ本やグッドフェロー先生の本を読んだりして、数学やら機械学習理論やらPythonの勉強をしたり、OJTで学んで、3年ほどRDチームを立ち上げて、機械学習モデルの開発・実装や技術調査に携わっていました。今は、法務関係の仕事がメインです。今日のテーマはAIと公平性です。色々テーマはあるのですが、ABEJAの中の人のご希望により公平性にしました。当初は他のアドベントカレンダーの記事みたいに、コードをいっぱい書いて、「公平性確保のためのいろいろな論文を実装して効果を試してみた」「公平性に関する定義について理論面を解説してみた」系の記事にしようかと思っていたの
hippy-hikky 2021/01/07
「実現すべき公平性とは何かの具体化・特定」が重要であるという議論はその通りだと思う。でも、結局人間だって経験から学習した結果知らず知らずでバイアスがかかるわけで、排除は不可能なんじゃないかな。

機械学習

公平性

AI

倫理
リンク
Semi-Supervised Learning With Label Propagation - MachineLearningMastery.com
hippy-hikky 2021/01/04
グラフベースの半教師あり学習。sklearnに実装されているので、使う分には簡単そう。使う分には。

機械学習

graph-based

Semi-Supervised
リンク
【US版Google公式ブログ記事】テック専門家に聞く：機械学習モデルはどのように自らを説明するのか？ | AI専門ニュースメディア AINOW
HOME/ AINOW編集部 /【機械学習の解釈可能性】テック専門家に聞く：機械学習モデルはどのように自らを説明するのか？【Google公式ブログ】 US版Googleブログ記事のひとつ『テック専門家に聞く：機械学習モデルはどのように自らを説明するのか？』では、同ブログ編集部のスタッフのひとりであるAndrea Lewis Åkerman氏が、Googleに在籍している研究者Been Kim氏に機械学習について質問した時の回答をまとめています。質問のテーマは「機械学習の解釈可能性」についてです。「医師」のような特定の職業名が男性に関連付けられて翻訳されるような現象は、「AIのバイアス」として知られています。こうしたバイアスを緩和・除去するうえで重要となるのが、機械学習モデルがバイアスを伴った判断を下した理由を理解可能なように説明する「解釈可能性」です。 Kim氏によると、解釈可能性を実現
hippy-hikky 2020/11/20
機械学習

説明可能性
リンク
https://brandinho.github.io/bayesian-perspective-q-learning/
hippy-hikky 2020/11/20
報酬の不確実性を表現するために、確率分布を利用する。リスクを考慮した学習として研究されているが、状態行動空間の探索にも有効であると。

機械学習

ベイズ

研究

ReinforcementLearning
リンク
Cloud TPUを用いたBERT推論処理基盤の開発
ML事業部の近江崇宏です。 Stockmarkでは日々、膨大な数のニュース記事に対してBERTの推論処理を行なっています。このような重いタスクを効率的に処理するために、最近、TPUを用いたBERTの推論処理基盤をGoogle Cloud Platform上に構築し、運用を開始しました。その結果として、これまで1週間程度かかっていた、数千万件のデータの処理を1日以内で完了できるようになるなどの大きな効果を得られました。今回はこの取り組みについて紹介します。はじめに近年のニューラルネットワークの研究の発展により、画像認識や自然言語処理の様々なタスクを人間と同等もしくはそれ以上のレベルで処理できるようになりました。その結果として、ビジネスでのニューラルネットワークの利用が進んでいます。その一方で、ニューラルネットワークには、モデルの巨大さに起因して処理時間が長いという大きな問題があります。その
hippy-hikky 2020/11/20
MLOps, TPU. 速度だけでなくコストメリットも.

機械学習

NLP

TPU
リンク
State of AI Report 2023
State of AI Report 2023 The State of AI Report analyses the most interesting developments in AI. We aim to trigger an informed conversation about the state of AI and its implication for the future. The Report is produced by AI investors Nathan Benaich and the Air Street Capital team. Download 2023 Report Compute Index 📧 Newsletter Now in its sixth year, the State of AI Report 2023 is reviewed by
hippy-hikky 2020/10/25
あとで読む

機械学習
リンク
ガウス過程・深層ガウス過程とそれらの音声情報処理への応用
メタデータをダウンロード RIS形式 (EndNote、Reference Manager、ProCite、RefWorksとの互換性あり)
hippy-hikky 2020/10/13
ガウス過程、深層ガウス過程の解説記事。深層ガウス過程→GPの性能はカーネルの選択に依存する。そこで、「別のガウス過程回帰を用いて入力変数自体を変換する」というものとのこと

機械学習

ベイズ

GaussianProcess
リンク
A Brief Survey of Time Series Classification Algorithms
By geralt at pixabayA common task for time series machine learning is classification. Given a set of time series with class labels, can we train a model to accurately predict the class of new time series?
hippy-hikky 2020/10/13
時系列データの分類問題における代表的なアルゴリズムの紹介。`Sktime`というライブラリを公開しててそこに実装がある。

機械学習

統計

TimeSeriese
リンク
Jochen Görtler
I am a freelance software engineer and research scientist based in Germany. With a Ph.D. in computer science, I develop visualization systems that help us make sense of complex data and machine learning models. Jochen Görtler ✌️ Build understanding. The systems I develop typically leverage a combination of frontend and backend components. Because of this, I have expertise in a wide range of langua
hippy-hikky 2020/10/12
ガウス過程のvisualな解説

GaussianProcess

機械学習

統計

あとで読む
リンク
Nonparametric Bayes Tutorial
This tutorial took place at the 2016 Machine Learning Summer School (MLSS) at the University of Cádiz in Cádiz, Spain. See this link for the latest versions and videos of this tutorial. Monday, May 16 Part I: 9:00–10:30 AM Part II: 10:45–11:45 AM Part III: 12:00–1:30 PM Instructor: Professor Tamara Broderick Em ail: Description Nonparametric Bayesian methods make use of infinite-dimensional mathema
hippy-hikky 2020/08/16
ノンパラベイズ（中華料理店過程）に関するチュートリアル。良さげ。

機械学習

ベイズ
リンク
Bayesian Deep Learning and Probabilistic Model Construction - ICML 2020 Tutorial
hippy-hikky 2020/07/28
機械学習

ベイズ

深層学習

あとで読む
リンク
GitHub - pokaxpoka/deep_Mahalanobis_detector: Code for the paper "A Simple Unified Framework for Detecting Out-of-Distribution Samples and Adversarial Attacks".
hippy-hikky 2020/07/21
Out-of-Distributionの実験リポジトリ。

機械学習

研究
リンク
GitHub - js05212/BayesianDeepLearning-Survey: Bayesian Deep Learning: A Survey
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
hippy-hikky 2020/07/16
BayesianDeepLearning関連の論文リスト。タイトルと推論手法のリストだけだけどグループ化されてまとめてくれるのありがたい。

機械学習

ベイズ

サーベイ

論文
リンク
Subword segmentaion と SentencePiece について - Qiita
本記事の目的 Subword segmentaion の考え方について理解する。 Subword segmentation の新手法 (SentencePeiece) のロジックを理解する。参照論文の第２章、第３章にある式の展開を追う。参照論文参照論文の構成 Introduction Neural Machine Translation with multiple subword segmentations NMT training with on-the-fly subword sampling Decoding Subword segmentations with language model Byte-Pair-Encoding (BPE) Unigram language model Subword sampling BPE vs. Unigram language mode
hippy-hikky 2020/07/02
文章の分割を確率的に決める→Augmentatonと一緒。なるほど

機械学習

NLP

論文

あとで読む
リンク
1 2 次のページ