タグ

2020年6月9日のブックマーク (17件)

  • 中国・清華大学の「世界的AI研究者2000人」リストに載った8人の日本人

    清華大学の学術論文検索サービス「AMiner」は、世界に影響を持つAI研究者2000人「AI2000」を公表した。 AMinerのホームページより 中国の清華大学が開発した学術論文検索サービス「AMiner」は、世界で影響のあるAI研究者2000人のリスト「AI2000」を公開した。AMinerは今回、AMinerが収集した学術論文に関する検索、引用などのデータをもとに、独自の自動検索アルゴリズムで分野別(20分野)、国別、所属別などに研究者をリストアップしている。 選ばれた2000人の研究者は、自動検索アルゴリズムで自動抽出されたものとみられる。研究分野の正確性や現時点の肩書きなどの精度の課題はあるものの、リストの結果自体は実に興味深い。 リストにあるAI研究者が所属する最多の国はアメリカ。国別のリストの合計約1800人のうち、最多の研究者1100人が、アメリカ所属だ。中国は170人あま

    中国・清華大学の「世界的AI研究者2000人」リストに載った8人の日本人
    misshiki
    misshiki 2020/06/09
    “音声認識、情報検索と推論の分野に集中”
  • 2020年人工知能学会全国大会の論文著者を分析をしてみた|tori

    2020年度 人工知能学会全国大会(第34回)はコロナ禍の影響で熊開催からオンライン開催となり,日中の人工知能研究者が馬肉と熊ラーメンべられないことに落胆しまくったわけですが,それでも1000件近い発表があるようで,過去最大規模です. そんなわけで,人工知能学会の人たちが一堂に会する会議なわけですから,ここで発表している人を分析すればきっと日人工知能の研究者の関係が明らかになるはずです. というわけで,人工知能学会全国大会のプログラムをクローリングして著者情報を集めてきました. ネットワーク分析早速研究者同士の関係性を明らかにするために,ネットワーク分析を行います.今回はシンプルに,一緒に論文を書いている人は近い関係だろうという仮定を置いて,著者をノード,共著関係にある人をリンクでつなぐ,という作業を行います. ネットワークには,ノード,つまり研究者が1972人,リンク数つま

    2020年人工知能学会全国大会の論文著者を分析をしてみた|tori
    misshiki
    misshiki 2020/06/09
    “ネットワーク分析/次数中心性/媒介中心性/ページランク/データ共有”
  • SVMで言語を判定する(Pythonによるスクレイピング&機械学習テクニック) - 俺人〜OREGIN〜俺、バカだから人工知能に代わりに頑張ってもらうまでのお話

    今回は、Webから取得したテキストファイルを読み込ませて、それが何語で書かれたテキストなのかを判定しました。 機械学習の一大テーマである自然言語処理の復習です。(そこまで大掛かりなことをやっているわけではないですが・・・。) 今回も Pythonによるスクレイピング機械学習開発テクニック増補改訂 Scrapy、BeautifulSoup、scik [ クジラ飛行机 ]の第4章を参考にさせていただきながら、取り組んでいます。 ※今回は、「lang/train」,「lang/test」ディレクトリの配下に英語、フランス語、インドネシア語、タガログ語の四種類の言語のファイルを配置してある前提です。また、それぞれのファイルは先頭2文字がen(英語),fr(フランス語),in(インドネシア語),tl(タガログ語)というデータを作成します。(機会があれば、このファイルを自動で作成またはスクレイピング

    SVMで言語を判定する(Pythonによるスクレイピング&機械学習テクニック) - 俺人〜OREGIN〜俺、バカだから人工知能に代わりに頑張ってもらうまでのお話
  • 広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives

    この資料は2020年度人工知能学会第34回全国大会のオーガナイズドセッション「広告とAI」にて発表した際の資料です。 広告クリエイティブは主に画像やテキストなどから構成され、デジタル広告において購買対象となる顧客に対し、効果的に製品の情報を届ける重要な役割を担っている。こうしたクリエイティブは主に人手により、大量に作成および運用されている。しかし効果の高いクリエイティブを作るのは非常にコストがかかる。そのため、配信効果の高いクリエイティブの作成や運用のために、機械学習技術を用いた研究開発が世界中で盛んに行われている。特に広告クリエイティブを構成する素材の分析や、広告クリエイティブの配信効果を事前に予測するCTR予測・CVR予測、配信効果の高い広告クリエイティブの自動生成といったタスクが注目されている。講演では、データマイニング分野で最難関国際会議であるKDD2019において発表した広告ク

    広告クリエイティブと機械学習技術における現状と展望 / The Present and Future of Machine Learning for Ad Creatives
  • TechCrunch | Startup and Technology News

    StrictlyVC events deliver exclusive insider content from the Silicon Valley & Global VC scene while creating meaningful connections over cocktails and canapés with leading investors, entrepreneurs and executives. And TechCrunch…

    TechCrunch | Startup and Technology News
    misshiki
    misshiki 2020/06/09
    “ボットによるディープフェイクテキスト投稿がもたらす脅威について筆者らが行った実験から、今後の攻撃はより高度で検出困難になる可能性が明らかになった。”
  • NVIDIA製AIスパコンのCPUはAMD EPYC

    NVIDIA製AIスパコンのCPUはAMD EPYC
    misshiki
    misshiki 2020/06/09
    “同CPUは現状、サーバー向けx86 CPUで唯一PCI Express 4に対応するもので、この点がNVIDIAの競合であるAMDのCPUを採用した理由とみられる。”
  • 第8回 分類問題をディープラーニング(基本のDNN)で解こう

    ―――【多クラス分類編】――― それでは準備が整ったとして、(1)から順に話を進めていこう。 (1)データの準備 前述の通り、多クラス分類問題では「Fashion-MNIST」データセットを用いる。このデータセットは、TensorFlowやtf.kerasで簡単に導入できるので、特別な準備は必要ない。Fashion-MNISTデータセットの内容は、図5に示すようなファッション商品の小さな写真であり、教師データとなるラベルには、分類カテゴリーごとに(商品カテゴリー名ではなく)0~9のクラスインデックスが指定されているので、カテゴリー変数エンコーディングの作業も不要である。 # TensorFlowライブラリのtensorflowパッケージを「tf」という別名でインポート import tensorflow as tf import matplotlib.pyplot as plt  # グラ

    第8回 分類問題をディープラーニング(基本のDNN)で解こう
    misshiki
    misshiki 2020/06/09
    “多クラス分類”の一連の解説。
  • 第8回 分類問題をディープラーニング(基本のDNN)で解こう

    ラベル「0」: 手書き数字「0」 ラベル「1」: 手書き数字「1」 ラベル「2」: 手書き数字「2」 ラベル「3」: 手書き数字「3」 ラベル「4」: 手書き数字「4」 ラベル「5」: 手書き数字「5」 ラベル「6」: 手書き数字「6」 ラベル「7」: 手書き数字「7」 ラベル「8」: 手書き数字「8」 ラベル「9」: 手書き数字「9」 # TensorFlowライブラリのtensorflowパッケージを「tf」という別名でインポート import tensorflow as tf import matplotlib.pyplot as plt  # グラフ描画ライブラリ(データ画像の表示に使用) import numpy as np               # 数値計算ライブラリ(データのシャッフルに使用) # Fashion-MNISTデータ(※NumPyの多次元配列型)を取得する

    第8回 分類問題をディープラーニング(基本のDNN)で解こう
    misshiki
    misshiki 2020/06/09
    “二値分類”の一連の解説。
  • 昔は弾道計算、今はAIモデルのパラメーター算出に重要な「微分・積分」

    昔は弾道計算、今はAIモデルのパラメーター算出に重要な「微分・積分」:「AIエンジニアになるための「基礎数学」再入門(8)(1/2 ページ) AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回は数学AIがデータとの最適な対応関係を見つけるのに重要となる「微分・積分」についてPythonコードと図を交えて解説します。 AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載『「AIエンジニアになるための「基礎数学」再入門』。前回は、「関数」について解説し、「関数とはデータ間の対応関係を定量的に表したもので、AIはデータ間に存在するこの対応関係を数値的に見つけ出すことである」と説明しました。今回は関数の性質を深く知り、AIがデータとの最適な対応関係を見つけるのに重要となる「微分・積分」について解説し

    昔は弾道計算、今はAIモデルのパラメーター算出に重要な「微分・積分」
    misshiki
    misshiki 2020/06/09
    “損失関数を微分して最適パラメーターを得る”まで説明。
  • [Jetson Nano] Nsight で TensorFlow Lite アプリの 性能ボトルネック を観測 - Qiita

    1. 概要 NVIDIA が提供するプロファイリングツール Nsight を使って、Jetson Nano で動作するアプリの性能ボトルネックを見つける方法をまとめます。 今回私が Nsight を使おうと思ったきっかけは、前回記事 でもネチネチと作業したように、 TensorFlow Lite GPU Delegate (OpenGLESバックエンド) を使ったアプリを少しでも速くしたかったからです。 ですので、下記のような Posenet による姿勢推測処理負荷の高いアプリを観測対象とします。 なお、観測対象アプリのソースコードは下記にあります: https://github.com/terryky/tflite_gles_app/tree/master/gl2posenet 2. Nsight について 2.1 Nsight 3兄弟 公式ページ にある通り、2019/12月時点におい

    [Jetson Nano] Nsight で TensorFlow Lite アプリの 性能ボトルネック を観測 - Qiita
    misshiki
    misshiki 2020/06/09
    “NVIDIA が提供するプロファイリングツール Nsight を使って、Jetson Nano で動作するアプリの性能ボトルネックを見つける方法をまとめます。”
  • PyTorchモデルをモバイルやエッジで利用するための方法の整理 - ほろ酔い開発日誌

    はじめに 最近では、Deep LearningのライブラリとしてPyTorchが利用される機会が多くなっています。私自身も以前はTensorflow/Kerasを利用していましたが、現状はPyTorchを使うことがほとんどです。 しかし、PyTorchは実装がしやすいものの、モバイルやエッジデバイスへのデプロイを考える上では不安な点が残ります。今回は、PyTorchを様々なプラットフォーム上で利用することを考えたときにどのような方法があるかを整理します。 モバイル 選択肢の整理 現在、モバイル (iOS/Android)へのデプロイを考えるときにメジャーな選択肢が3つあります。 Core ML (Apple) PyTorchをonnxに変換し、onnxをcoreMLに変換する Tensorflow Lite (Google) PyTorchをonnxに変換し、Tensorflow/Kera

    PyTorchモデルをモバイルやエッジで利用するための方法の整理 - ほろ酔い開発日誌
    misshiki
    misshiki 2020/06/09
    “PyTorchは実装がしやすいものの、モバイルやエッジデバイスへのデプロイを考える上では不安な点が残ります。今回は、PyTorchを様々なプラットフォーム上で利用することを考えたときにどのような方法があるかを整理”
  • 教師データを使わないAIの予測精度監視!データセットシフトとドメインシフトを完全に理解しろ!

    3つの要点 ✔️ 教師データを使わずに、データセットの変化から機械学習モデルの精度低下を定量化する方法を提案 ✔️ データセットの変化(dataset-shfit)を定量化する方法をリストアップし、改良を加えた ✔️ 感情分類モデルにおいて、ドメインシフト量からMAE2.15[%]で予測精度の低下量を回帰する線形モデルを作ることができた To Annotate or Not? Predicting Performance Drop under Domain Shift written by Hady Elsahar,Matthias Gallé (Submitted on 3 Nov 2019) Comments: Published by EMNLP-IJCNLP2019 Subjects: Machine Learning 導入 図1. ドメインシフト量から精度低下を予測する線形回帰モ

    教師データを使わないAIの予測精度監視!データセットシフトとドメインシフトを完全に理解しろ!
    misshiki
    misshiki 2020/06/09
    “教師データを使わずに、データセットの変化から機械学習モデルの精度低下を定量化する方法を提案。データセットの変化(dataset-shfit)を定量化する方法をリストアップし、改良を加えた”
  • AIで認知症発症を予測!アルツハイマーへの進行を特定する特徴量を抽出

    3つの要点 ✔️ 軽度認知機能障害(MCI)におけるアルツハイマー病(AD)の発症をベースラインで予測 ✔️ 磁気共鳴イメージング(MRI)を用いた CNN による特徴量抽出とLasso による Cox 回帰モデルの二つを併用 ✔️ 従来予測困難であった MCI から AD 発症の予測を 86.4% の確率で推定 A deep learning model for early prediction of Alzheimer’s disease dementia based on hippocampal magnetic resonance imaging data written by Hongming Li, Mohamad Habes, David A. Wolk, Yong Fan (Submitted on 5 Aug 2019) Comments: Published by Al

    AIで認知症発症を予測!アルツハイマーへの進行を特定する特徴量を抽出
    misshiki
    misshiki 2020/06/09
    “磁気共鳴イメージング(MRI)を用いた CNN による特徴量抽出とLasso による Cox 回帰モデルの二つを併用”
  • その知識は本当に有用?知識を用いた対話生成の教師なし手法"Decoupling"を提案

    3つの要点 ✔️ 対話生成モデルにおける外部知識の影響を示唆 ✔️ 知識を用いた対話生成で"Decoupling"という教師なし学習による手法を提案 ✔️ データセットにおける知識のギャップ問題を体系的に説明 Unsupervised Injection of Knowledge into Dialogue Generation via Language Models written by Yi-Lin Tuan, Wei Wei, William Yang Wang (Submitted on 30 Apr 2020) Comments: Published by arXiv Subjects: Computation and Language (cs.CL) はじめに 応答対話生成は、自然言語処理の最終応用としてしばしば見られ、対話の履歴を正しく理解し、人間らしい応答を生成する能力を習

    その知識は本当に有用?知識を用いた対話生成の教師なし手法"Decoupling"を提案
    misshiki
    misshiki 2020/06/09
    “対話生成モデルにおける外部知識の影響を示唆。知識を用いた対話生成で"Decoupling"という教師なし学習による手法を提案。データセットにおける知識のギャップ問題を体系的に説明”
  • 深層学習による医師の新サポート技術: CNN を用いた腎結石のリアルタイム自動検出システム

    3つの要点 ✔️ デジタル画像から腎結石の組成パターンを抽出する深層学習手法を提案 ✔️ 5つの主要カテゴリーを自動で判定する CNN を構築 ✔️ デジタル画像からの再現率 85% 以上を実現!腎結石の除去をサポート Deep Learning Computer Vision Algorithm for Detecting Kidney Stone Composition written by Kristian M Black, Hei Law, Ali Aldoukhi, Jia Deng, Khurshid R Ghani (Submitted on 11 Feb 2020) Comments: Published by BJU international (2020) Subjects: Computer vision (cs.CV) 背景 腎結石は、腎臓から尿道までの尿路に結石が

    深層学習による医師の新サポート技術: CNN を用いた腎結石のリアルタイム自動検出システム
    misshiki
    misshiki 2020/06/09
    “デジタル画像から腎結石の組成パターンを抽出する深層学習手法を提案。5つの主要カテゴリーを自動で判定する CNN を構築。デジタル画像からの再現率 85% 以上を実現!腎結石の除去をサポート”
  • 営業支援ツールSenses、AI搭載のOCR機能をリリース

    営業支援ツールSensesAI搭載のOCR機能をリリース名刺やメモの画像をテキスト化、SFAへの自動入力が可能に クラウド営業支援ツール「Senses(センシーズ)」を提供する株式会社マツリカ(東京都品川区、代表取締役:黒佐 英司、飯作 供史)は、AIを用いて画像から文字データを取り込むOCR機能を、日より提供開始します。機能により、メモや名刺の写真、スクリーンショットの画像から、文字データを取り込んでSensesに入力することが可能になり、SFAへの情報入力の負担を大きく削減できるようになりました。 ■ OCR機能とは OCR(Optical Character Recognition:光学式文字認識)とは、写真やスクリーンショット等の画像データから文字を認識し、文字データとして取り込むことができる機能です。 取り込んだ文字データをSensesに反映することで、入力の工数削減かつ精

    営業支援ツールSenses、AI搭載のOCR機能をリリース
    misshiki
    misshiki 2020/06/09
    “自然言語処理に特化したディープラーニングを使用し、文字データとSenses内にある取引先情報を紐付けるモデルを構築”
  • Web と機械学習 - W3C ワークショップ

    misshiki
    misshiki 2020/06/09
    “このワークショップの第一の目標は機械学習のツール開発者とウェブプラットフォームのフレームワーク提供者が集まって、機械学習の能力を生かしてオープンウェブプラットフォームをさらに拡充することです。”