サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。
AI事業本部 Dynalystでデータサイエンティストをしている藤田です。 Dynalystの開発チーム内にはデータサイエンス(以降DS)チームがあり、そこにはデータサイエンティスト・機械学習エンジニア(以降まとめてデータサイエンティストと呼ぶ)たちが所属しています。私がこのチームで働く中で、「プロダクト所属のデータサイエンティストがどこまでエンジニアリングをすべきなのか」ということを考えることがあったのでまとめてみました。当然これは一般的な答えではなく、人・チーム・組織の現状や目指すべきところによって答えは変わるので、あくまで1チームの1個人が考えたこととして読んでもらえればと思います。 プロダクト所属と横断DS組織所属 エンジニアリング云々の話をする前に、まずプロダクト所属と横断DS組織所属のデータサイエンティストの違いについて軽く説明します。両者のメリット・デメリットについても書きた
人間が運転操作を行わなくても車が自動で走行する自動運転はすでに実用化されており、各社が行動での安全性を高めるためにさらなる実証試験を行っている段階です。そんな自動運転技術に機械学習がどのように貢献してきたかについて、自動運転技術を開発しているVoyageの共同創立者兼CEOのオリバー・キャメロン氏が解説しています。 The Next Leap in Self-Driving: Prediction - Let Me Level 5 With You https://olivercameron.substack.com/p/the-next-leap-in-self-driving-prediction キャメロン氏によると、過去10年間にわたって自動運転技術の中でも「オブジェクト検出技術」が主に論じられてきたとのこと。オブジェクト検出技術とは、横断歩道や車道の脇を歩いている人などを検出する
AI(人工知能)の著しい発展に大きく影響している技術のひとつである機械学習にも近年、注目が集まっています。そして、AI(人工知能)や機械学習の最新情報を知る手法の1つとして、論文を読むという選択があり、自分の目で見て実際の内容を理解することが出来るのです。ですが機械学習の論文と聞くと、専門機関や企業に所属していなければ目にすることが出来ないと考える人も多いですよね。 しかし、身の回りには必ずインターネットがある世の中。昔と違い知りたい情報や新しい情報はインターネット上で簡単に入手出来る時代になりました。 ですから今日は、機械学習の論文に限らず、論文を自分の目で読むべき理由や、探すのにおすすめなサイトや、自分で初めから読むのは厳しいと言った方におすすめなブログについて、お伝えしましょう。
簡単な設定で自律的にコースを走る1:18スケールのAI(人工知能)ミニカー「DeepRacer」、メロディーを入れると自動で伴奏をつけるAIキーボード「DeepComposer」――。 これらは米アマゾン・ウェブ・サービス(Amazon Web Services)が「Deepシリーズ」として提供するハードウエアだ。2つに共通するのは、ハイテクなおもちゃとしてではなく、開発者が機械学習技術を学ぶ「AI入門教材」として設計されている点である。日本がAI人材の育成に官民挙げて取り組む中、参考にすべき事例といえる。 re:Invent 2019の世界大会で日本人が1位、2位 2018年11月に発表されたDeepRacerは、実機や実コースがなくてもシミュレーション環境でレースを楽しめるハードルの低さもあり、1年の間に利用が広まった。世界中の数万人もの開発者が、周回コースを最速で回る機械学習モデルの
胸に貼って、無呼吸症候群を機械学習で検出するウェアラブル・パッチ2020.02.20 07:0012,238 岡本玄介 機械学習が、平常時と違う体内電圧を判断。 昼間の眠気や脳卒中、心臓病、記憶障害のリスク増加を引き起こしかねない無呼吸症候群。これを検出するためのウェアラブル・パッチが開発されています。 体内の電気信号とアルゴリズムが検出するご覧の通り、このパッチは胸に貼り付けて使います。IEEE SPECTRUMでは、無呼吸の検知方法は、体脂肪計にも使われる、身体を通過する電気信号を測定する生体インピーダンス法と、機械学習によるアルゴリズムを組み合わせたものだと伝えています。 「閉塞性睡眠時無呼吸」とも呼ばれる無呼吸症候群は、その対策として鼻の穴にチューブで空気を送るCPAP療法や、背中や枕の真ん中にテニスボールを仕込み、仰向けになることをジャマする方法が一般的に用いられます。ですがそれ
皆さんこんにちは。 お元気でしょうか。GoogleQA20thで悔しいけど楽しかったです。 自然言語処理のみのコンペを真面目に挑んだのは初で、勉強になることが多かったです。 今回は実験管理ツールの紹介と比較をします。 特徴がわかる範囲で簡単に実装も書いているので、参考にしてみてください。 実験管理ツール 実験管理の必要性 実験管理ツールの要件 実験管理ツールの紹介 Excel Excelとは 良い点 欠点 mag magとは サンプル実装 良い点 ここが少し残念 Weights and Biases Weights and Biasesとは サンプル実装 良い点 ここが少し残念 MLFlow サンプル実装 良い点 ここが少し残念 まとめ 最後に 実験管理ツール 実験管理の必要性 コンペティションや研究では多くのハイパーパラメータや構造などに対して様々な変更を加えます。 私の場合の例ですが、
AIの社会実装が進むにつれて注目されるようになった問題のひとつとして、AIが差別的な判断をくだしてしまう「AIによる差別」があります。 学習する膨大なデータを通して、AIが人間の潜在的な差別の傾向を読み取り、助長してしまうなど、これからもAIが意図せず差別を行ってしまう可能性は否定できません。公平なAIシステムを作るために、議論を積み重ね、時にはルールで制限することも重要です。 こうした問題に対して、人工知能学会倫理委員会が2019年12月10日に『機械学習と公平性に関する声明』を発表し、2020年1月9日には「機械学習と公平性」をテーマにしたシンポジウムを開催するなどの動きも見られます。 以上のような動向をふまえて、今回は「AIによる差別」の事例、その原因、そして世界各地の取り組みについて解説します。あわせて「AIによる差別」に対して講じるべき対策と「信頼できるAI」を普及させるために必
2019年も様々なデータサイエンス関連のコンペが実施され、論文が発表されました。その中でも面白かったものはどれか、5人のkagglerの方に直接お伺いしました。 2019年はTellusxSIGNATEで実施された衛星データコンペの解説(第1回・第2回)が、データサイエンティストの方に読んでいただいた宙畑のヒット記事としてランクイン。 では、データサイエンティストの方は他にどのようなコンペや論文に興味を持たれていたのか……と気になった宙畑編集部。 今回、以下5名のKagglerの方に協力いただき、2019年の振り返りとして面白かったコンペと論文、そしてその理由を教えていただきました。 あきやま様(@ak_iyama) jsato様(@synapse_r) Hiroki Yamamoto様(@tereka114) smly様(@smly) ※順不同 ※1名、非公表 Kaggleについては「世
はじめにこの記事は「eureka Advent Calendar 2019」24日目の記事です。 こんにちは、Data Analystの @pacocat です! 私はeurekaには2019年11月に入社したばかりなのですが、毎日楽しく仕事させてもらっています。最近はプロダクト開発のための定性調査の仕組みづくりを手伝ったり、事業分析や組織開発をしていたりと、様々な定量・定性データを活用してどのように事業成長に貢献できるか考える日々です。 前職ではAI PdMとして、ゲームや強化学習領域でのAI活用を推進していました(興味ある方はGDC2019での発表や各種スライド slideshare / speakerdeck をご覧ください)。直近はがっつりAIに関わっているわけではありませんが、趣味で推薦×強化学習分野のサーベイをしていたら面白い話題がたくさんあったので、それらの中からYouTub
心理実験 再現つまずく 揺らぐ信頼、研究刷新促す声 (日経新聞2019年12月15日朝刊記事抜粋) 「つまみ食いを我慢できる子は将来成功する」「目を描いた看板を立てると犯罪が減る」――。有名な心理学の実験を検証してみると、再現できない事態が相次いでいる。望む結果が出るまで実験を繰り返したり、結果が出た後に仮説を作り替えたりする操作が容認されていた背景があるようだ。信頼を失う恐れがあり、改めようとする動きが出ている。米科学誌「サイエンス」は15年、心理学研究への信頼が揺らいでいる事態を重く見て、主要な学術誌に掲載された心理学と社会科学の100本の論文が再現できるかどうかを検証した。結果は衝撃的で、同じ結果が得られたのはわずか4割弱にとどまった。日本の代表的な心理学会誌「心理学評論」も16年、再現できない実験に関する問題を特集号として取り上げた。 心理学で再現できない研究がなぜ目立つのか。大阪
NTTデータは2019年12月19日、ライフデータイニシアティブと連携して、電子カルテを含む詳細な医療情報を収集・匿名加工して提供する「匿名加工医療情報作成事業」を2020年1月6日に開始すると発表した。これまで利用が進んでこなかった医療情報を、研究者や自治体、製薬企業などへ提供することが可能になる。 NTTデータとライフデータイニシアティブは、2019年12月19日に「次世代医療基盤法」に基づく認定を初めて取得した。ライフデータイニシアティブが「認定匿名加工医療情報作成事業者」の認定を取得し、匿名加工医療情報作成において法律で定める管理業務や利用目的などの審査を実施する。NTTデータは「認定医療情報等取扱受託事業者」の認定を取得し、匿名加工医療情報を作成する業務の委託を受けてシステムの維持・運用をする。電子カルテ情報に加え、将来は画像情報などへと段階的にサービスを広げていく。 次世代医療
概要 当エントリは『機械学習 on AWS Advent Calendar 2019』の20日目のエントリです。 クラスメソッド 機械学習 on AWS Advent Calendar 2019 - Qiita クラスメソッド 機械学習 on AWS Advent Calendar 2019 | シリーズ | Developers.IO 先日、sklearnのversion「0.22」のリリースハイライトを見ていて「plot_partial_dependence」というAPIが気になり調べてみたので、結果をレポートします。 本エントリーの内容をざっくり言うと、「目的変数と特徴量の関係性」を可視化する際に便利なAPIである「plot_partial_dependence」が「sklearnの version0.22」でリリースされたのでその内容のレポートと、というものになります。 目的変数と
この記事はRettyアドベントカレンダー19日目の記事です。 昨日はretty-y-takaseによるプロポーザル提出は個人のモチベーションに左右されずコントロールすることが可能なのかでした。 1. はじめに こんにちは、Rettyのデータ分析チームでマネージャーをやっている平野(twitter / fb)です。 データ分析チームを去年の4月に立ち上げてから1年と9ヶ月が立ちました。1年目ではチームの意義や組織における位置づけ・分析するための環境つくりなど手広くやってきました。 1年目を振り返ると、データ分析チームとして各データアナリストがPJに貢献する体制が構築できたのと、分析するためのデータレイク層やデータマート・ダッシュボード開発など進み、組織としては最低限のデータ活用を行える土壌が整えることができたと思っています。 そのときの取り組んだ内容は去年のアドベントカレンダーで紹介してます
ちょっと前に、しょうもないことを某所で放言したら思いの外拡散されてしまいました。 機械学習の説明可能性(解釈性)、大半のケースで求められているのは厳密な分類・回帰根拠ではなく受け手の「納得感」なので、特に実ビジネス上は説明可能性に長けたモデルを開発するより、納得できないお客さんを巧みに関係性構築した上で口八丁で完璧に説得できる凄腕営業ピープルを雇う方が重要— TJO (@TJO_datasci) 2019年11月23日 これ自体は与太話なので実際どうでも良い*1のですが、最近色々な研究や技術開発の進展はたまた実務家による考察などを見ていて、「機械学習の説明可能性(解釈性)というのは思った以上に複雑な迷宮だ」と感じることがままあったのでした。 ということで、今回の記事では僕のサーベイの範囲でザッと見て目についた資料などを超絶大雑把にリストアップした上で、主に実務における説明可能性とは何かとい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く