タグ

2020年7月6日のブックマーク (13件)

  • Machine Learning Summer School 2020

    The Machine Learning Summer School 28 June - 10 July 2020 (virtual) by the Max Planck Institute for Intelligent Systems, Tübingen, Germany Video Log (vlog) A vlog is a short clip that shows impressions from our participants, our speakers, and the organizing team. Greetings from our participants around the world. Vlog 1: Bernhard, Nicolo, and Stefan Vlog 2: Stefan Bernhard Nicolo Vlog 3: Constantin

  • 「AI開発プロセス」を体系的に整理し、AI案件への試行適用を開始 | NTTデータ

    株式会社NTTデータ(以下:NTTデータ)は、「AI開発プロセス」を策定し、2020年7月より当社が行う全てのAI案件への試行適用を開始します。 AI開発プロセスは、AIが組み込まれたシステム(以下:AIシステム)の開発における共通的な工程を体系化して定義したもので、全社での300以上のユースケースをもとに策定されました。AI開発プロセスには、AIシステムの総合的な品質保証を念頭におき、社会的に求められる倫理、コンプライアンス上のチェック観点や、AIシステム開発において重要となるデータの事前加工や品質管理に関するノウハウが組み込まれています。プロセスを適用することで、性能、拡張性、セキュリティー、プライバシーなど総合的な観点から、お客さまが安心して利用できるAIシステムを実現します。 試行適用ではまず日国内におけるAI案件を対象とし、有効性が確認された後グローバルでの展開も視野に検討

    「AI開発プロセス」を体系的に整理し、AI案件への試行適用を開始 | NTTデータ
  • AGC、FRONTEOと共同でAI Q&Aシステム「匠KIBIT」を開発

    AGC、FRONTEOと共同でAI Q&Aシステム「匠KIBIT」を開発ガラス製造の匠をコンピューター上で実現 AGC株式会社(社:東京、社長:島村琢哉 以下、AGC)と株式会社FRONTEO(社:東京、社長:守正宏 以下、FRONTEO)は、コンピューター上にガラス製造の知見を集約し、AIを用いて簡単にその知見を引き出すことができる、AI Q&Aシステム「匠KIBIT」を共同で開発しました。AGCの国内ガラス製造拠点中心に運用を開始しており、今後は欧州を含む世界中のAGCのガラス製造拠点に、システムの展開を検討しています。 AI Q&Aシステム「匠KIBIT」 「匠KIBIT」使用時の様子 ガラス製造は、溶解・成形・加工などの複数の技術が組み合わされており、操業には独自の高い技術力が必要です。技術力が他社との差別化に繋がっている一方、各工場が蓄積したノウハウの共有や、熟練技術者か

    AGC、FRONTEOと共同でAI Q&Aシステム「匠KIBIT」を開発
  • End-to-End音声認識の計算量を削減した話

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、音声処理黒帯(黒帯はヤフー内のスキル任命制度)の藤田です。今日のブログでは、音声認識技術の研究開発におけるヤフーの最新の取り組みを紹介します。 特に、近年注目されているTransformerという手法に基づく、End-to-End音声認識の計算量を削減した研究を紹介します。この研究は、難関国際会議IEEE ICASSP2020に投稿し、採択されました。また、arXivでプレプリントを公開しています。そして、ESPnetというEnd-to-Endモデルのツールキット上でソースコードも公開しています。興味のある方はぜひ、こちらもご参照ください。 音声認識で用いられるEnd-to-Endモデルとは? 音声認識技術は音声をテキ

    End-to-End音声認識の計算量を削減した話
  • 銀行での不正検知の精度向上へ 暗号のままデータ連携・機械学習ができるわけ | DG Lab Haus

    銀行での不正検知の精度向上へ 暗号のままデータ連携・機械学習ができるわけ TOP AI 銀行での不正検知の精度向上へ 暗号のままデータ連携・機械学習ができるわけ 近年、振り込め詐欺などの特殊詐欺は、認知件数、被害総額ともに減少傾向にあるとはいうものの、その被害総額は300億円を超えるなど、依然として深刻な状況にある。 このような金融犯罪を防ぐため、多くの金融機関では、AI人工知能)を活用して、不正取引を自動検知するシステムの導入を検討している。AIの学習には大量の学習データが必要になるが、取引データには口座番号等の個人情報が含まれるため、他の銀行のデータを利用する事ができず、学習データとして利用できる十分な量の取引データを用意するのが難しかった。こうしたシステムの検知精度は、学習するデータの量に依存してしまうため、現在の機械学習技術では高い精度を実現することができていない。 こうした課題

    銀行での不正検知の精度向上へ 暗号のままデータ連携・機械学習ができるわけ | DG Lab Haus
  • だから僕はpandasを辞めた【データサイエンス100本ノック(構造化データ加工編)篇 #1】 - Qiita

    データサイエンス100ノック(構造化データ加工編)のPythonの問題を解いていきます。この問題群は、模範解答ではpandasを使ってデータ加工を行っていますが、私達は勉強がてらにNumPyの構造化配列を用いて処理していきます。 次回記事(#2) はじめに Pythonでデータサイエンス的なことをする人の多くはpandas大好き人間かもしれませんが、実はpandasを使わなくても、NumPyで同じことができます。そしてNumPyの方がたいてい高速です。 pandas大好き人間だった僕もNumPyの操作には依然として慣れていないので、今回この『データサイエンス100ノック』をNumPyで操作することでpandasからの卒業を試みて行きたいと思います。 今回は8問目までをやっていきます。 今回使うのはreceipt.csvだけみたいです。初期データは以下のようにして読み込みました(データ型

    だから僕はpandasを辞めた【データサイエンス100本ノック(構造化データ加工編)篇 #1】 - Qiita
  • AIプロジェクトの成否は「MLOps(機械学習基盤)」にかかっている

    AIプロジェクトの成否は「MLOps(機械学習基盤)」にかかっている:2020年、AI活用の成否を分かつ技術とは(2) 人工知能AI)を活用して価値を提供する企業が現れる中、PoCでつまずく企業が見直すべきポイントはどこにあるのか。そして今後必要不可欠になる考え方とは何か。機械学習に必要な教師データを企業に提供するLionbridgeに話を聞いた。 AI技術を活用して、実ビジネスで成果を獲得している企業が着実に増えつつある。 ごく身近なところで言えば、定額制動画配信サービスで知られるNetflixが挙げられる。同社はレコメンドアルゴリズムに機械学習を活用。その他、機械学習を用いて成功作品の特性を見いだし、Netflixの独自コンテンツ制作に生かしたり、広告素材制作に分析結果を生かして会員獲得増を果たしたりと、AIを実益に結び付けている。 言うまでもなく、こうした事例は同社のようなWeb系

    AIプロジェクトの成否は「MLOps(機械学習基盤)」にかかっている
  • MIT、人種差別的と批判された大規模画像データセット「Tiny Images」をオフラインに

    米マサチューセッツ工科大学(MIT)は6月29日(現地時間)、多数のAIシステムのトレーニングに利用されてきた8000万点以上の画像を集めたデータセット「Tiny Images」をオフラインにしたと発表した。カテゴライズの用語に差別的なものがあると指摘されたため。 MITのアントニオ・トラルバ教授は声明文で、「影響を受けた可能性のある人々に謝罪する」と語った。 問題を指摘したのはプライバシー関連の米新興企業UnifyIDのチーフサイエンティスト、ビナイ・プラブー氏とアイルランド国立大学ダブリン校のアベバ・ビルハネ教授。両氏は6月25日、「Large image datasets: A pyrrhic win for computer vision?」(リンク先はPDF)という匿名の論文(7月1日に正式版を公開)で、Tiny Imagesに女性の画像に「売春婦」というラベルが付いていたり、黒

    MIT、人種差別的と批判された大規模画像データセット「Tiny Images」をオフラインに
  • Titanic:タイタニック号乗客者の生存状況(年齢や性別などの13項目)の表形式データセット

    連載目次 データセット解説 Titanic dataset(タイタニックデータセット。以下、Titanic)は、「1912年に北大西洋で氷山に衝突して沈没したタイタニック号への乗客者の生存状況」の表形式データセット(=構造化データセット)である(図1、複数の研究者が「Encyclopedia Titanica」上から抽出し、Frank E. Harrell, Jr.氏が取りまとめ、Thomas Cason氏が大幅に更新&改善して作成されたデータセットである)。 Titanicは、主に分類(つまり「生存状況の予測」)を目的としたディープラーニング/機械学習/統計学の研究や初心者向けチュートリアルで使われている(※ただし、ディープラーニングを行うにはデータ数が1309件と少なすぎる点に注意が必要だ)。特に、Kaggleの初心者チュートリアル「Titanic: Machine Learning

    Titanic:タイタニック号乗客者の生存状況(年齢や性別などの13項目)の表形式データセット
  • 産総研:機械学習品質マネジメントガイドラインを公開

    発表・掲載日:2020/06/30 機械学習品質マネジメントガイドラインを公開 -AIを用いた製品やサービスの品質を安全、安心に管理するために- ポイント マネジメントが困難とされる機械学習を用いたAIシステムの品質管理方法をガイドラインとして公開 機械学習AIシステムの品質要件を分類・整理し、開発者が客観的に評価できる枠組みを構築 企業での利用とそのフィードバックにより有用性を高めながら、国際標準化を目指す 国立研究開発法人 産業技術総合研究所【理事長 石村 和彦】(以下「産総研」という)サイバーフィジカルセキュリティ研究センター【研究センター長 松 勉】ソフトウェア品質保証研究チーム【研究チーム長 大岩 寛】と人工知能研究センター【研究センター長 辻井 潤一】は、民間企業・大学などの有識者と共同で、AIシステムの設計開発における品質マネジメントについて体系的にまとめた「機械学習品質マ

  • 機械学習アルゴリズムの学習法

    TL;DR 機械学習のアルゴリズムには詳しくなりたいけど実装はしない、という立場の人向けの学習資料まとめ 知人向けで、具体的には同僚医師がターゲット読者(めちゃ狭い!)だが、一定度他の人にも役に立つかも 改めて色々眺めてみてやっぱり大学の講義は質の高いものが多いと思った 知人が機械学習のアルゴリズムを学びたいと言っているので、オススメの資料などを見繕ってみるブログエントリ。 機械学習への関わり方を雑にアルゴリズムと実装で分けた場合に、アルゴリズムには詳しくなりたいけど実装をするわけではない、という立場の人向けである。 このようなタイプの人はそんなにいないと思うけど、具体的にはドメインエキスパートとして機械学習エンジニアと一緒にアルゴリズム・データ改善に取り組んでいて、アルゴリズムでどんなことをやっているかをちゃんと理解したい、みたいなのが一例となる。 なんとなくのイメージ的な理解だけだと、

    機械学習アルゴリズムの学習法
  • DataScienceCentral.com - Big Data News and Analysis

    The Economics of “Do More With Less”: Blending AI with Organizational Discipline Bill Schmarzo | September 15, 2024 at 8:14 am I hear it in nearly every customer conversation: “We must find a way to do more with less.” This modern busi... How AI is transforming marketing strategies John Lee | September 12, 2024 at 2:34 pm In 2024, artificial intelligence (AI) will likely transform the marketing in

    DataScienceCentral.com - Big Data News and Analysis
  • データサイエンスを過度に民主化するな | AI専門ニュースメディア AINOW

    著者のRahul Agarwal氏はインドで活躍するデータサイエンティストであり、AINOW翻訳記事『機械学習システムを構築するための6つの重要なステップ【前編】』と後編の著者でもあります。同氏が最近Mediumに投稿した記事『データサイエンスを過度に民主化するな』では、「データサイエンティストになるのは簡単」という風潮が批判されています。 データサイエンティストが「21世紀における最もセクシーな仕事」と呼ばれるようになって久しい現在では、この職種から得られる報酬や肩書を求めるデータサイエンティスト志望者があふれています。こうした志望者の少なからずは、オンライン講座で機械学習モデルを実装するコーディングスキルを学んだ後にデータサイエンティストを名乗るようになります。 こうしたコーディングスキルを習得しただけの自称データサイエンティストは自信過剰に陥っている、同氏は指摘します。というのも、実

    データサイエンスを過度に民主化するな | AI専門ニュースメディア AINOW