import torch x = torch.tensor([1., -1.]) w = torch.tensor([1.0, 0.5], requires_grad=True) loss = -torch.dot(x, w).sigmoid().log() loss.backward() print(loss.item()) print(w.grad)
1.Fairness Indicator:公正な機械学習を構築するためのツール(1/3)まとめ ・機械学習は不公平な偏見(バイアス)を反映または強化してしまう危険性がある ・GoogleがAI開発時の原則としてかかげるAI principlesではバイアスを避ける事を第二原則としている ・この度、公平性を検証するツールであるフェアネスインジケーターのベータ版をリリースした 2.機械学習の公平性とは? 以下、ai.googleblog.comより「Fairness Indicators: Scalable Infrastructure for Fair ML Systems」の意訳です。元記事の投稿は2019年12月11日、Catherina XuさんとTulsee Doshiさんによる投稿です。 産業界と学術界は、機械学習(ML)を使用してより良い製品を作成したり、重要な問題に取り組む事を
著者のBenedict Neo氏はアメリカ・アイオワ州立大学の統計学科に在籍しており、学業の傍らでMediumに記事を投稿しています(同氏の経歴はLinkedInを参照)。同氏が最近Mediumに投稿した記事『2021年のコンピュータビジョンにおける5つのトレンド』では、コンピュータビジョンにおける5つのトレンドを解説しています。 機械学習エンジニアのSayak Paul氏が行ったコンピュータビジョンに関する講演に感銘を受けたNeo氏は、この講演で語られたコンピュータビジョンにおける5つのトレンドをまとめた記事を公開しました。そうしたトレンドとは、以下の通りです。 高効率なAIモデル:AIモデルのサイズを抑制しながら、性能を劣化させない画像認識モデル開発。 クリエイティブな生成系ディープラーニング:顔写真からアニメキャラを生成するようなクリエイティブな現場での応用が期待されるディープラーニ
著者のTyler Folkman氏はコンテンツマーケティング会社Branded Entertainment NetworkでAI技術部門のリーダーを務めており(同氏の詳細は同氏公式サイトを参照)、以前に同氏が執筆した記事をAINOW翻訳記事『心配しないで、エクセルは意外と効果的』として紹介しています。最近、同氏が執筆した記事『データサイエンティストはコードの書き方を知っていなければならない』では、データサイエンティストがコードを上手に書けるようになるためのヒントが解説されています。 Folkman氏によれば、データサイエンティストはコードを書く機会が多いものも、ソフトウェアエンジニアほどには高品質なコードを書けず、また上手にコードを書く努力を怠っています。しかし、AIモデルがさまざまな製品や環境に実装されるようになった今日、データサイエンティストであっても高品質なコードを書けるようになるべ
Kaggle初心者がKaggleに挑戦した過程や得られた知見などを記事化していく新連載。初回である今回は、準備編として初心者向けにコンペを簡単に紹介します。また、連載目的やKaggleを始めて「これが良かったよ」という筆者の体験を共有します。 連載目次 機械学習やディープラーニングを勉強してきて、書籍やWeb上のコンテンツで用意された練習問題から、より実践的な問題で腕を磨きたいと思ったときに、データサイエンス/機械学習の世界的なコンペティション(以下、コンペ)プラットフォームであるKaggleや日本のSIGNATEを使ってみようと考えている人は少なくないと思います。そして書籍やWeb情報を基に、KaggleでTitanicコンペでSubmission(提出)をしてみた後、次はどんなコンペに参戦しようかを迷う人も少なくないのではないでしょうか? そんな人に向けて今回は、既に終わっているコンペ
株式会社アイスマイリー ~AI開発会社必見!人気のAI学習データ作成企業7社の実績を一挙紹介~ 人工知能を搭載したサービスの資料請求ができるAIポータルメディア「AIsmiley」を運営するアイスマイリー(東京都渋谷区、代表取締役:板羽晃司)は、人気のAI学習データ作成企業のアノテーション実績をまとめたWeb雑誌「AIアノテーション事例ガイド」をを2021年5月18日に公開します。注目のアノテーション企業7社が、各社の特徴、実績をもとに活用事例を解説します。 ■アノテーションとは? アノテーションとは「注釈」という意味を持つ英語です。ビジネスの場においては「データ活用」の際に利用されることが多い傾向にあり、 IT 用語としては「あるデータに対してタグやメタデータなどの情報を与えること」と定義されるのが一般的です。 テキストや画像、音声といったデータに、AI が学習できるように関連情報をつけ
オミータです。ツイッターで人工知能のことや他媒体で書いている記事など を紹介していますので、人工知能のことをもっと知りたい方などは気軽に@omiita_atiimoをフォローしてください! 2012年にAlexNet[Krizhevsky, A.(2012)]が登場してから、画像認識分野での発展は著しい。その発展を支えてきたものこそ大規模データセットImageNet[Deng, J.(2009)]である。ImageNetでSoTAを達成すると、そのモデルには最強モデルの称号が与えられると言っても過言ではない。2020年6月にGoogle Brainによって出されたこの論文は、そんな当たり前に使われてきたImageNetデータセットに対して疑問符を叩きつけるものとなっている。現存のImageNetでの性能評価が必ずしも正しいのだろうか。この論文を通してその答えを探しにいく。 本論文で使われて
Authors¶ TorchDrift is a joint project of Orobix Srl, Bergamo, Italy and MathInf GmbH, Garching b. München, Germany. The TorchDrift Team: Thomas Viehmann, Luca Antiga, Daniele Cortinovis, Lisa Lozza Acknowledgements¶ We were inspired by Failing Loudly: An Empirical Study of Methods for Detecting Dataset Shift, NeurIPS 2019 https://github.com/steverab/failing-loudly Hendrycks & Dietterich: Benchmar
機械学習は、システムがデータからパターンを学習して予測できるため、人気が高まっています。大量のデータの可用性とシステムの計算能力の向上により、数行のコードでよりアクセスしやすく簡単になります。一致する入力と対応する出力のセットを必要とするシステムをトレーニング/学習するために、それを独立変数およびターゲット変数と呼び、すべてのモデリングはそれらの間の関係を理解しています。新しい入力セットの出力を予測することは一般化と呼ばれ、モデルが出力をどれだけうまく予測できるかは、与えられたデータからトレーニング中に実行した学習に依存します。ただし、収集されたデータが母集団を正確に反映していない場合、システムは適切に一般化されません。 たとえば、高齢の患者から収集されたデータは、総人口に関して偏っています。データに偏りがある場合、システムは特定の結果が発生する可能性が高いと見なします。たとえば、特定
こんにちは,株式会社Ridge-iのリサーチチームの@machinery81です. 今回はNeurIPS2020で発表されたデータセットシフトを扱う機械学習に関連する論文を紹介します. 本記事は,Ridge-i主催の論文読み会で発表した以下の資料に基づいています. TL;DR 機械学習におけるデータセットシフト Covariate Shift Target Shift Concept Shift Domain Shift Sample Selection Bias Taxonomy of NeurIPS2020 papers about Dataset Shift 論文紹介 Rethinking Importance Weighting for Deep Learning under Distribution Shift Importance Weighting for Distribut
t検定とt値とは t値は、モデルの説明変数のそれぞれについて、計算されます。 このt値が「2」以上なら、その説明変数は、「統計学的に、モデルに組み込むのは良い」または、「統計学的に支持される」ことを意味する。 逆に、t値が「1」未満なら、「統計学的に、支持できない」ことになります。つまり、説明変数として、用いるのは宜しくない、ということを意味する。 偏回帰係数について、「説明変数の被説明変数への効果が0である」=「偏回帰係数が0」という帰無仮説を検定する。 両側5%の基準での検定 t値の絶対値が2未満 →帰無仮説が誤っているとは考えにくい t値の絶対値が2以上 →帰無仮説が誤っていると考え、効果のある変数だと見なせる $$ t値 = \frac{推定係数}{推定係数の標準誤差} $$ 回帰分析におけるt値の求め方について紹介します。 単回帰分析(説明変数の数が1つ)の時と、重回帰分析(説明
API Reference# This is the class and function reference of scikit-learn. Please refer to the full user guide for further details, as the raw specifications of classes and functions may not be enough to give full guidelines on their uses. For reference on concepts repeated across the API, see Glossary of Common Terms and API Elements.
BentoML is a flexible, high-performance framework for serving, managing, and deploying machine learning models. Supports multiple ML frameworks, including Tensorflow, PyTorch, Keras, XGBoost and more Cloud native deployment with Docker, Kubernetes, AWS, Azure and many more High-Performance online API serving and offline batch serving Web dashboards and APIs for model registry and deployment manage
機械学習品質マネジメントガイドライン 第2版 日本語版: ( 2021年7月5日公開 ) 機械学習品質マネジメントガイドライン 第2版 (本文) 旧版。より新しい第3版があります。 デジタルアーキテクチャ研究センター テクニカルレポート DigiARC-TR-2021-01 サイバーフィジカルセキュリティ研究センター テクニカルレポート CPSEC-TR-2021001 人工知能研究センター テクニカルレポート 機械学習品質マネジメントガイドライン付属文書1 機械学習品質評価・向上技術に関する報告書 デジタルアーキテクチャ研究センター テクニカルレポート DigiARC-TR-2021-02 サイバーフィジカルセキュリティ研究センター テクニカルレポート CPSEC-TR-2021002 人工知能研究センター テクニカルレポート 機械学習品質マネジメントガイドライン付属文書2 開発事例リフ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く