タグ

2020年9月28日のブックマーク (21件)

  • EMNIST:手書きアルファベット&数字の画像データセット

    図1 EMNIST ByClassに含まれる「手書き文字」の例 ※データセットの配布元: 「The EMNIST Dataset | NIST」。 ※出典: EMNIST: an extension of MNIST to handwritten letters. Han Xiao, Cohen, G., Afshar, S., Tapson, J., & van Schaik, A. arXiv:1702.05373 EMNISTは、MNISTの拡張版(an Extension of MNIST to handwritten letters)として、NIST Special Database 19から抽出&加工して作られたサブセットである。主に画像認識を目的としたディープラーニング/機械学習の研究や初心者向けチュートリアルで使われることが意識されている。そのため、MNISTは「0」~「9

    EMNIST:手書きアルファベット&数字の画像データセット
    misshiki
    misshiki 2020/09/28
    数字だけだと簡単すぎるのでアルファベットも機械学習で使ってみたいときに。
  • 『効果検証入門から見直すデータサイエンス』株式会社サイバーエージェント 安井 翔太氏(2020年8月28日webセミナー)

    近年AI技術を筆頭に様々なデータサイエンス技術がビジネスの現場に用いられるようになってきました。しかし、果たしてそれらの技術当にビジネスに何らかの効果をもたらしているのでしょうか? 講演では、因果推論を背景にした効果検証における基礎の導入を行い、ビジネスで語られる効果の測り方を見直すと共に、効果検証の観点でAI技術を中心としたデータサイエンスを見直す試みを行なってみたいと思います。 ※『因果推論・効果検証入門』講演1のアーカイブ ※その他概要はこちら→https://techplay.jp/event/789307

    『効果検証入門から見直すデータサイエンス』株式会社サイバーエージェント 安井 翔太氏(2020年8月28日webセミナー)
    misshiki
    misshiki 2020/09/28
    1時間のセッション動画が公開されていた。
  • wiki40b  |  TensorFlow Datasets

    Deploy ML on mobile, microcontrollers and other edge devices

    wiki40b  |  TensorFlow Datasets
    misshiki
    misshiki 2020/09/28
    Wiki-40bはTensorFlow Datasetsにも入っている。
  • Python in Visual Studio Code – September 2020 Release - Python

    We are pleased to announce that the September 2020 release of the Python Extension for Visual Studio Code is now available. You can  download the Python extension  from the Marketplace, or install it directly from the extension gallery in Visual Studio Code. If you already have the Python extension installed, you can also get the latest update by restarting Visual Studio Code. You can learn more a

    Python in Visual Studio Code – September 2020 Release - Python
    misshiki
    misshiki 2020/09/28
    Visual Studio CodeのPython– 2020年9月リリース。バグ修正とちょっとした機能改善。
  • Pythonで画像データをスクレイピング 手軽に画像収集したい方必読! - AI Academy Media

    icrawlerとは icrawlerとはウェブクローラのミニフレームワークです。 It supports media data like images and videos very well, and can also be applied to texts and other type of files. と公式に記載があるように、画像や動画などのメディアデータをサポートしており、 テキストやその他の種類のファイルにも適用可能です。 公式マニュアル インストール Macならターミナル、Windowsならコマンドプロンプトを開き、次のコマンドを実行してください。 pip install icrawler Jpyter Notebookのセルや、Colabのセルの中では次のように実行します。 !pip install icrawler 犬との画像をダウンロードする 今回はGoogle

    Pythonで画像データをスクレイピング 手軽に画像収集したい方必読! - AI Academy Media
    misshiki
    misshiki 2020/09/28
    Pythonライブラリ“icrawlerを使い画像データを収集するサンプルプログラム”これは簡単そう。
  • 耳から顔を深層学習で生成 生体認証にも有用? 独研究

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 独カールスルーエ工科大学とトルコのイスタンブール工科大学による研究チームが開発した「Ear2Face」は、 耳の画像から正面の顔画像を生成する深層学習を用いた手法だ。生体認証の識別部位として耳を活用する。 耳も顔も個人の生体形質であり、遺伝子型に基づいて生成されることから、耳と顔の間には遺伝的による暗黙の関係があると仮定して開発されたのが今回の手法だ。 この仮定を踏まえて、被験者の耳の画像から正面から見た顔の画像を生成するための深層学習ネットワークを設計する。ネットワークは、耳から生成した顔画像と元の顔画像を真偽判定しながら学習するGAN(Generative Adversarial Ne

    耳から顔を深層学習で生成 生体認証にも有用? 独研究
    misshiki
    misshiki 2020/09/28
    事例“「Ear2Face」は、 耳の画像から正面の顔画像を生成する深層学習を用いた手法だ。生体認証の識別部位として耳を活用する。”GAN使用。
  • Weekly Machine Learning #195

    misshiki
    misshiki 2020/09/28
    “変化し続けるベンチマークDynabenchが公開されました。評価データセットが変わっていくという常識を覆す挑戦で、近年のベンチマーク過適合問題に一石を投じていると思います”とのこと。
  • Bringing the Mona Lisa Effect to Life with TensorFlow.js

    misshiki
    misshiki 2020/09/28
    TensorFlow.jsの事例。モナリザが目で追いかけてくるように見える「モナリザ効果」をアニメーション化。「First Order Motion Model for Image Animation」というモデルを使用。
  • TBSテレビ、AIと人間による文字起こしサービスを一般提供 時間を半分以下に | Ledge.ai

    株式会社TBSテレビは9月23日、同社が開発する人工知能AI音声認識技術を使った文字起こしエディタ「もじこ」を吉積情報株式会社にライセンス提供し、一般企業に販売開始したと発表。 テレビやラジオ業界では日々、文字起こしが多く発生する。しかし、非常に手間のかかる作業であるため、番組制作の現場では大きな負担になっていたという。TBSテレビ文字起こし作業を少しでも減らすために、「もじこ」を開発したとしている。 音声認識率100%は無理 文字起こしの時間を約半分以下に TBSテレビは「もじこ」の開発にあたり、どれほど技術が進歩しても音声認識率が100%ではないことに着目。最新のAI音声認識エンジンを活用し、取材した音声・動画ファイルなどの素材を自動で文字起こしした後、人間が正しく認識されていない文章をすぐに「修正・編集」ができるように開発した。 具体的には、長時間録音・録画されたファイルでも、

    TBSテレビ、AIと人間による文字起こしサービスを一般提供 時間を半分以下に | Ledge.ai
    misshiki
    misshiki 2020/09/28
    “最新のAI音声認識エンジン...で文字起こしした後、人間が正しく認識されていない文章をすぐに「修正・編集」ができるように開発した”とのこと。一般企業に販売開始らしい。使ってみたい。
  • AIを“導入しただけ”の企業がワークマンに勝てないワケ

    自称“AI人工知能)ベンチャーでの経験を基に、情報発信するマスクマン”こと、マスクド・アナライズさんが、AIをめぐる現状について、たっぷりの愛情とちょっぴり刺激的な毒を織り交ぜてお伝えします。今後は、AI情報だけでなくIT業界全般に役立つ情報もお届けしていきます。 お問い合わせのメールは info@maskedanl.com まで。Twitter:@maskedanl (編集:井上輝一) 目的が曖昧なAI導入企業 目的が明確なワークマン ここ数年のAIブームでは、「わが社も」「とりあえず」「他社がやってるから」「いきなり」「上司の命令」というフレーズが各所で飛び交い、「AIなら何でも解決できそう」というイメージによって、他の方法で解決できる問題に対してもAIが使われました。 こうしてAI導入が目的化した結果、費用対効果や分析精度など来の目的を見失い、失敗に終わる企業が相次ぎました。 ワ

    AIを“導入しただけ”の企業がワークマンに勝てないワケ
    misshiki
    misshiki 2020/09/28
    “実質的なCIO(最高情報責任者)によるトップダウン”が大事とのこと。データ分析業務に責任と権限がないと、各所に振り回されて失敗しやすいというのは分かる気がする。
  • AIの導入を妨げる3つの理由--データのサイロ化、使えない生データ、データの信頼性不足

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 新型コロナウイルス感染症が人工知能機械学習AI/ML)の導入にどのような影響を与えることになるのか、結論はまだ出ていません。しかし、これまでの兆候を見る限り、企業は変化した世界で事業を継続するためにAI/MLへの依存度を高めており、導入は増加の一途をたどることになりそうです。 AIへの投資を実のあるものにするためには、データレイクによるデータの集約、生データを分析可能な形にする自動変換、データの信頼性を高めるためのガバナンスという、データ管理の3つの課題を考慮すべきです。 IDCの調査にあるように、パンデミック以前、AI/ML市場は力強い成長を続け、2023年には世界の支出額が1000億ドル近くにまでなると見られていました。この予測

    AIの導入を妨げる3つの理由--データのサイロ化、使えない生データ、データの信頼性不足
    misshiki
    misshiki 2020/09/28
    “AIへの投資を実のあるものにするためには、データレイクによるデータの集約、生データを分析可能な形にする自動変換、データの信頼性を高めるためのガバナンスという、データ管理の3つの課題を考慮すべき”とのこと
  • 衛星画像の「影除去」から解析まで オンリーワンのAI・ディープラーニング技術(秋山文野) - エキスパート - Yahoo!ニュース

    '''衛星画像の「影除去」から解析まで オンリーワンのAI・ディープラーニング技術 株式会社Ridge-i 柳原 尚史''' 災害発生時に「緊急で発生箇所を知る」ことができれば、その後の対応に大きな力になります。2019年にJAXAからの委託により、光学衛星画像からディープラーニングを活用した解析により、土砂崩れ箇所を自動で検出する技術を開発し、第4回宇宙開発利用大賞で経済産業大臣賞を受賞した株式会社Ridge-i(リッジアイ)。広域を1分前後で高速解析し、約80パーセントの高精度検出が実現しました。熟練の検査員が目視で行っていた作業を自動化、高速化するとその先にどんな世界が開けるのか。代表取締役社長の柳原尚史さんに伺いました。 --災害箇所の検出を広域で1分前後、そして80パーセントの高精度で検出することができたとのことですが、広域というのはどのぐらいの広さですか? 柳原:被災地域を含む

    衛星画像の「影除去」から解析まで オンリーワンのAI・ディープラーニング技術(秋山文野) - エキスパート - Yahoo!ニュース
    misshiki
    misshiki 2020/09/28
    Ridge-iの柳原さんへのインタビュー記事。
  • Principles and Practice of Explainable Machine Learning

    Artificial intelligence (AI) provides many opportunities to improve private and public life. Discovering patterns and structures in large troves of data in an automated manner is a core component of data science, and currently drives applications in diverse areas such as computational biology, law and finance. However, such a highly positive impact is coupled with significant challenges: how do we

    misshiki
    misshiki 2020/09/28
    説明可能なAI・機械学習の論文。前半は分野とツールの調査報告。後半では、適切な質問でモデルを説明する方法について考察”とのこと。ざっくりとして読んでいないが、必要なときに読み直したい。
  • Oracleの機械学習OSS「Tribuo」を試してみた - Qiita

    はじめに 先日、OracleJavaによる機械学習ライブラリーをオープンソースで公開したというニュースを目にしたので、軽く触ってみました。 CodeZineニュース - OracleJavaによる機械学習ライブラリ「Tribuo」をオープンソースで公開 マイナビニュース - OracleJava機械学習ライブラリ「Tribuo」を発表 これを見ると、機械学習の一般的なアルゴリズムに加えてXGBoostなども使えるようです。 特徴 公式サイトのトップページには以下の3つの特徴が挙げられています。 来歴(Provenance):Tribuoのモデル、データセット、評価には来歴があるため、それらを作成するために使用されたパラメーター、データの変換方法、ファイルなどが正確に追跡できる(※)。 型安全:Javaを使用しており、番環境ではなくコンパイル時にミスを発見できる。 相互運用可能:XG

    Oracleの機械学習OSS「Tribuo」を試してみた - Qiita
    misshiki
    misshiki 2020/09/28
    Javaで機械学習できる“Tribuo”の実行体験と感想が書かれている。現状では手軽だけど機能不足とのコメント。
  • ORBISアプリコンテンツ「AIアイブローシミュレーター」に機械学習と画像認識の技術を提供

    ORBISアプリコンテンツ「AIアイブローシミュレーター」に機械学習と画像認識の技術を提供~男性女性それぞれに最も似合う理想の眉の形をAIが分析・提案~ フューチャーアーキテクト株式会社(社:東京都品川区、代表取締役社長:神宮 由紀、以下フューチャーアーキテクト)は、オルビス株式会社(社:東京都品川区、代表取締役社長:小林琢磨、以下オルビス)のAIによる眉分析で男性女性それぞれに似合う眉の形とお手入れ方法を提案するORBISアプリコンテンツ「AIアイブローシミュレーター」(2020年9月25日リリース)に機械学習と画像認識の技術を提供しました。 ​ ※2024年2月1日に画像の差替えを行いました 「AIアイブローシミュレーター」は、スマートフォンで顔写真を撮影するだけで、AIが顔のパーツや比率に基づいたオルビス独自の16分類のフェイスプロポーション分析から男性女性それぞれに似合う眉の形

    ORBISアプリコンテンツ「AIアイブローシミュレーター」に機械学習と画像認識の技術を提供
    misshiki
    misshiki 2020/09/28
    事例“AIによる眉分析で男性女性それぞれに似合う眉の形とお手入れ方法を提案するORBISアプリコンテンツ「AIアイブローシミュレーター」”
  • 第2回:敵対的サンプル -標的型の回避攻撃-

    コラムは、AIの安全を確保する技術を理解していただくために書かれています。コラムの内容を検証する場合は、必ずご自身の管理下にあるシステムにて、ご自身の責任の下で実行してください。許可を得ずに第三者のシステムで実行した場合、法律により罰せられる可能性があります。 コラムの内容を深く理解するには、敵対的サンプルの基知識を有していることが好ましいです。 敵対的サンプルをご存じでない方は、事前にAIセキュリティ超入門:第2回 AIを騙す攻撃 – 敵対的サンプル –をご覧ください。 ハンズオン コラムは、実践を通じてARTを習得することを重視するため、ハンズオン形式で進めていきます。 ハンズオンは、皆様のお手元の環境、または、筆者らが用意したGoogle Colaboratory*2にて実行いただけます。 Google Colaboratoryを利用してハンズオンを行いたい方は、以下のUR

    第2回:敵対的サンプル -標的型の回避攻撃-
    misshiki
    misshiki 2020/09/28
    PythonライブラリART「Adversarial Robustness Toolbox」。“AIに対する攻撃手法(敵対的サンプル攻撃、データ汚染攻撃、モデル抽出、メンバーシップ推論など)とそれらに対する防御手法を検証”ができる。第2回 標的型の回避攻撃
  • Amazon redesigns the Echo with a new spherical design and a custom machine learning processor

    misshiki
    misshiki 2020/09/28
    新しいEchoにはAZ1 Neural Edgeシリコンモジュールと呼ばれるものが追加されたそうです。“コマンドをクラウドに送信する前に、ローカルの機械学習音声認識アルゴリズムを使用して音声リクエストの音声を処理”とのこと。
  • Wikipediaの前処理はもうやめて「Wiki-40B」を使う - Ahogrammer

    最近の自然言語処理では、大規模なテキストから単語の分散表現や言語モデルを学習させて使っています。学習する際のテキストとしては、分量や利用しやすさの都合からWikipediaが選ばれることが多いですが、その前処理は意外と面倒で時間のかかる作業です。そこで、記事では比較的最近リリースされた前処理済みのデータセット「Wiki-40B」とその使い方を紹介します。 Wiki-40Bとは? Wiki-40Bは、40言語以上のWikipediaを前処理して作られたデータセットです。このデータセットは言語ごとに学習/検証/テスト用に分かれているので、単語分散表現や言語モデルの学習・評価に使えます。言語ごとの対応状況については、以下のページを参照するとよいでしょう。 wiki40b | TensorFlow Datasets 前処理としては、大きくは以下の2つに分けられます。 ページのフィルタリング ペー

    Wikipediaの前処理はもうやめて「Wiki-40B」を使う - Ahogrammer
    misshiki
    misshiki 2020/09/28
    分量や利用しやすさから自然言語処理ではWikipediaが選ばれることが多いが前処理が面倒。そこで“本記事では比較的最近リリースされた前処理済みのデータセット「Wiki-40B」とその使い方を紹介”とのこと。
  • Python初学者のためのPandas100本ノック - Qiita

    Information 2024/1/8: pandas , Polars など18を超えるライブラリを統一記法で扱える統合データ処理ライブラリ Ibis の100 ノックを作成しました。長期目線でとてもメリットのあるライブラリです。こちらも興味があればご覧下さい。 Ibis 100 ノック https://qiita.com/kunishou/items/e0244aa2194af8a1fee9 2023/2/12: 大規模データを高速に処理可能なデータ処理ライブラリ Polars の 100 ノックを作成しました。こちらも興味があればご覧下さい。 Polars 100 ノック https://qiita.com/kunishou/items/1386d14a136f585e504e はじめに この度、PythonライブラリであるPandasを効率的に学ぶためのコンテンツとして

    Python初学者のためのPandas100本ノック - Qiita
    misshiki
    misshiki 2020/09/28
    Pandasの基礎から、機械学習での実用、Kaggle実践の3段階でレベル分けされて問題が設定されている。
  • Scientific Computing in Python: Introduction to NumPy and Matplotlib

    Since many students in my Stat 451: Introduction to Machine Learning and Statistical Pattern Classification class are relatively new to Python and NumPy, I was recently devoting a lecture to the latter. Since the course notes are based on an interactive Jupyter notebook file, which I used as a basis for the lecture videos, I thought it would be worthwhile to reformat it as a blog article with the

    Scientific Computing in Python: Introduction to NumPy and Matplotlib
    misshiki
    misshiki 2020/09/28
    初めての人向け。NumPy配列中心のチュートリアル。“Pythonでの科学計算:NumPyとMatplotlibの紹介 -ビデオチュートリアルを含む”
  • マスクの下に隠れた顔をAIで補完する

    1992年三重生まれ、会社員。ゆるくまじめに過ごしています。ものすごく暇なときにへんな曲とへんなゲームを作ります。 前の記事:逃げ回るQRコードを狙ってスキャン!QRコードシューティングゲーム > 個人サイト ほりげー マスクのせいで顔がとにかく分からない コロナ禍で、マスクはもはや必需品となった。新しい生活様式というやつだ。 日頃お世話になっているマスクをもてなしたりもした。 当たり前だが、マスクをすると顔の下半分が隠れてしまう。もともとマスク(=mask)には「仮面」という意味や「隠す」という意味がある。マスクで顔が隠れるのは自然なことだ。 確かに、来のマスクといえば、こっちのような気がする。(こーだいさん: 野菜に仮面をかぶせると心があるように見えるより) 何が言いたいかというと、感染予防のためにマスクをつける「新しい生活様式」では、人々はマスクという仮面をつけたままコミュニケーシ

    マスクの下に隠れた顔をAIで補完する
    misshiki
    misshiki 2020/09/28
    発想が面白くて良い。