並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 565件

新着順 人気順

onnxの検索結果1 - 40 件 / 565件

  • 『親ガチャ』というワードが若者に流行 「自分の人生がハズレなのは親ガチャのせい」 : 痛いニュース(ノ∀`)

    『親ガチャ』というワードが若者に流行 「自分の人生がハズレなのは親ガチャのせい」 1 名前:令和大日本憂国義勇隊(栄光への開拓地) [SE]:2021/09/08(水) 17:00:28.11 親ガチャに外れた… 「親ガチャに外れちゃったよ」。昨今、学生たちの会話に耳を傾けていると、時折そんな声が聞こえてくるようになった。オンラインゲームで希望のアイテムを入手するための電子くじシステムを「ガチャ」という。もともとは店舗などに置いてある小型の自動販売機で、硬貨を入れてレバーを回すとカプセル入りの玩具が無作為に出てくるガチャガチャが語源である。そのシステムに自分の出生をなぞらえたのが親ガチャである。 ガチャでどんなアイテムが当たるかは運任せである。ときには一発で大当たりすることもあるが、いくら課金しても弱いアイテムしか入手できないこともある。自分の出生もそれと同じことで、私たちは誰しもどんな親

      『親ガチャ』というワードが若者に流行 「自分の人生がハズレなのは親ガチャのせい」 : 痛いニュース(ノ∀`)
    • DeepLearning/機械学習を始めると必ずいるカス - BizDeep

      (2018.1227)なんか急にバズったのでちょっと追記しました。 ディープラーニング人材はやばい奴だらけ これから「AIを仕事に導入したい!」と思う人は沢山いるでしょう。 ただ「ディープラーニング」や「AI」という言葉に関しては世間で色々な誤解がされており、正しく現状を理解できている人はとても少ないように思います。 ディープラーニングという言葉はAlexNetがでた2012年頃に流行り出しました。 実際に企業が仕事としてディープラーニングに手を出し始めたのはAWSがGPUインスタンスをリリースした頃からだと思うので2014年ぐらいからでしょうか。 まだ流行り出して5年も経っていない技術であるため、最新の研究レベルでもディープラーニングの全容は明らかになっていなかったり(参照: ディープラーニングの解釈に関するサーベイ論文) 、正しくディープラーニングを理解するための教科書や参考書などもま

        DeepLearning/機械学習を始めると必ずいるカス - BizDeep
      • Preferred Networks、深層学習の研究開発基盤をPyTorchに移行 - 株式会社Preferred Networks

        PyTorch開発チームおよびオープンソースコミュニティと連携し、フレームワーク開発、MN-CoreプロセッサのPyTorchサポートなどを推進 株式会社Preferred Networks(本社:東京都千代田区、代表取締役社長:西川徹、プリファードネットワークス、以下、PFN)は、研究開発の基盤技術である深層学習フレームワークを、自社開発のChainer™から、PyTorchに順次移行します。同時に、PyTorchを開発する米FacebookおよびPyTorchの開発者コミュニティと連携し、PyTorchの開発に参加します。なお、Chainerは、本日公開されたメジャーバージョンアップとなる最新版v7をもってメンテナンスフェーズに移行します。Chainerユーザー向けには、PyTorchへの移行を支援するドキュメントおよびライブラリを提供します。 PFN 代表取締役社長 西川徹は、今回の

          Preferred Networks、深層学習の研究開発基盤をPyTorchに移行 - 株式会社Preferred Networks
        • マイクロソフト、Windows 10に機械学習の実行環境とAPIを備えた「Windows ML」搭載へ。Windowsを学習済みモデルの実行プラットフォームに

          マイクロソフトは、Windows 10に機械学習専用のAPI「Windows ML」を搭載すると、3月7日に米国で開催したイベント「Windows Developer Day 2018 March」において明らかにしました。 Windows MLには大きく分けて2つの側面があります。1つは、あらかじめ学習済みのモデルをONNX形式として読み込んでWindows 10上で実行するという、Windowsマシン上での機械学習実行環境の提供です。クラウドに依存することなく、学習済みモデルをローカルで実行できます。 「ONNX形式」とは、マイクロソフト、Facebook、Amazon Web Servicesが協力して策定している学習済みモデルの共通フォーマット。またWindows MLが提供するツールを用いてCaffeやCNTKの学習済みモデルの読み込みもサポートするとのこと。 そして2つ目は、そ

            マイクロソフト、Windows 10に機械学習の実行環境とAPIを備えた「Windows ML」搭載へ。Windowsを学習済みモデルの実行プラットフォームに
          • FastAPI入門 - モダンなPythonフレームワークの特性をチュートリアルで手軽に学ぶ|ハイクラス転職・求人情報サイト AMBI(アンビ)

            FastAPI入門 - モダンなPythonフレームワークの特性をチュートリアルで手軽に学ぶ PythonのWebフレームワークとしていま注目を集めるFastAPIは、シンプルにコードが書けるだけでなく、パフォーマンスが高いWebアプリケーションのバックエンドサーバーが構築可能です。同フレームワークの勘所をPythonスペシャリストの杜世橋さんが、初心者向けのハンズオン、そしてより実践的な画像への自動タグ付けサービス実装をとおして解説します。 FastAPIはいま非常に注目されているPythonのWebフレームワークの1つです。Flaskのようにシンプルに書ける一方でPythonのType Hintの機能をうまく活用し、HTTPのリクエスト/レスポンスをPythonの関数の引数/戻り値とシームレスにマッピングして非常に効率的に開発ができるのが最大の特徴です。非同期処理にも対応していてその名

              FastAPI入門 - モダンなPythonフレームワークの特性をチュートリアルで手軽に学ぶ|ハイクラス転職・求人情報サイト AMBI(アンビ)
            • おわりに - なぜ機械学習はうさん臭く感じられるのか? / 真面目なプログラマのためのディープラーニング入門

              本講座では計8回にわたり、ディープニューラルネットワークの原理と実装について 説明してきた。ニューラルネットワークの原理は基本的には 勾配降下法であり、その基盤となっているのが関数の微分可能性である。 ニューラルネットワークにはさまざまな形態が存在するが、 画像処理・画像認識の場合は畳み込みニューラルネットワークが非常に 有効であることがわかっている。また、ニューラルネットワークの 出力形式や損失関数を変えることにより、ニューラルネットワークが 物体検出や奥行き推定など、さまざまなタスクに利用可能であることを紹介した。 さて、本講座は「真面目なプログラマのための」ディープラーニング入門、 と銘打っている。真面目なプログラマとは何か? 諸説いろいろあるだろうが、 多くのプログラマは、ソフトウェア開発において 仕様の明確さや、 システムの効率・堅牢性、そして 保守のしやすさといったものを 追求

              • Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開

                Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OSの実行形式バイナリなどの種類を瞬時に判別してくれます。 下記はコマンドラインとしてMagikaを実行した例で、フォルダ内のファイルの種類を出力しています。 特別に最適化された1MBのモデルでを用いて推論を実行 Magikaはファイルの判別に、Kerasを用いて特別に最適化されたディープラーニングによる、わずか1MBのモデルを用いていると説明されています。 このモデルは推論エンジンのOnnx上で実行されています。実行速度はGPUを用いずCPU上で処理されたとしても数

                  Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開
                • AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃

                  AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 2020.10.08 Updated by Ryo Shimizu on October 8, 2020, 11:13 am JST 「最近のAIがすごい」と言われてからもう6年ほどが経過した。 なかでも人目を引いたのは、なんといっても2016年のAlphaGoだろう。最難関ゲームの一つと言われる囲碁において、人間のトップ棋士に対しAIが圧勝したのである。 これは「深層強化学習」というAIだが、実際のところ、「深層強化学習」を実用的に利用した例はまだ少ない。 多くのAIベンチャーやAIベンダーが扱う「AI」技術は、古典的な統計解析か、時折ニューラルネットを使っているくらいで、「深層学習」ではあっても「深層強化学習」とは完全に別物である。ラジオもコンピュータも同じ電気で動くものだが別物であるのと同じだ。 深層強化学

                    AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃
                  • 初心者が言語モデルを勉強するための本(2023年6月版) - ぱたへね

                    流行のLLMを勉強したくて沢山本を読みました。 この後もしばらくLLM(GPT)関係の出版が続きそうなので、現状の本でまとめてみました。 参考: nowokay.hatenablog.com まとめ。 Transformerの仕組みを知りたい人で、画像のDeep Learningなら分かるって人はVision Transformer入門 言語モデルをデータセットを作る所からやってみたい人には、作ってわかる! 自然言語処理AI とにかくすぐに動かしたい人には、機械学習エンジニアのためのTransformers ビジネス的に何ができるのかを知りたい人はBERT入門 Vision Transformer入門 Vison Transformerになっていますが、Transformerの説明がとても詳しくお勧めです。実際に写経してパーツパーツで動かせるのはこの本だけ。Transformer一点突破な

                      初心者が言語モデルを勉強するための本(2023年6月版) - ぱたへね
                    • WebAssemblyでの機械学習モデルデプロイの動向

                      本記事はMLOps Advent Calendar 2020の 2 日目の記事です。 WebAssembly(Wasm)は機械学習モデルをデプロイする新たな手段になりうるでしょうか。 この記事では、機械学習モデル(特に Deep Learning)を Wasm でデプロイする周辺技術の動向や内部の仕組みをざっくりと説明します。 Table of Contents tkat0 です。WebAssembly(Wasm)面白いですね。 私も最近はyewでフロントエンドを書いて遊んでいます。Rust で React っぽいことできるのは新鮮で面白いです。 Wasm は、なんとなく速い JavaScript?とか機械学習で何に役立つの?とか思ってる方も多いと思います。 しかし、Wasm はブラウザでの推論時に使えるだけでなく、機械学習モデルのサービングやエッジデバイスでの推論にも使えると知ったら驚き

                        WebAssemblyでの機械学習モデルデプロイの動向
                      • steps to phantasien

                        August 2022 Moved March 2022 Moving WSL2 「ハイブリッド勤務」にむけて Too Obvious To Innovate January 2022 Off Notes December 2021 2021 Outside Work November 2021 Restarting Extra Curricular Book: The Second Shift Webcam 横書き日記 - 完了 Publishing Blog Draft Behind oauth2-proxy on Cloud Run 横書き日記 Revisiting Writing Office HP C1030 Chromebook Alder Lake and The End Of Linux Laptop October 2021 Cycle Laptops Parties A

                        • [速報]AWS、独自の機械学習用プロセッサ「AWS Inferentia」発表。高速な推論処理に特化。AWS re:Invent 2018

                          [速報]AWS、独自の機械学習用プロセッサ「AWS Inferentia」発表。高速な推論処理に特化。AWS re:Invent 2018 Amazon Web Servicesはラスベガスで年次イベント「AWS re:Invent 2018」を開催しています。 イベント3日目のアンディ・ジャシーCEOによる基調講演において、AWSが独自に開発した機械学習用プロセッサ「AWS Inferentia」が発表されました。 機械学習の処理には、大量のデータを用いて機械に学習を行わせてモデルを作る処理と、学習済みのモデルを用いて推論する処理があります。「AWS Inferentia」は推論を高速かつ効率よく実行することに特化したプロセッサです。 TensorFlow、MXNET、PyTorch、Caffe2、ONNXなど主要な機械学習フレームワークに対応。ユーザーはより低コストで推論処理を行えるよ

                            [速報]AWS、独自の機械学習用プロセッサ「AWS Inferentia」発表。高速な推論処理に特化。AWS re:Invent 2018
                          • DNN推論用ライブラリ「Menoh」リリースについて - Preferred Networks Research & Development

                            Python以外も使いたくないですか?  特にDeepLearning界隈で. Menoh開発者の岡田です.この記事ではMenohの紹介と開発に至った動機について説明します. Menohのレポジトリ: https://github.com/pfnet-research/menoh Menoh(メノウ)は学習済みのDNNモデルをONNX形式から読み込んで動作させる推論専用のライブラリです.実装はC++で書きましたが,C言語のインターフェースを持たせて,他の言語用からもその機能を呼び出しやすくしてあります.リリース時点でC++版ラッパーとC#版ラッパー,Haskell版ラッパーがあり,Ruby版ラッパーとNodeJS版ラッパー,Java(JVM)版ラッパーが開発中です.バックエンドにはIntelの開発しているMKL-DNNを採用し,GPUが無くてもIntel CPUが使える環境で高速にモデルの

                              DNN推論用ライブラリ「Menoh」リリースについて - Preferred Networks Research & Development
                            • React死亡?React終了?~Facebookの特許事項付きライセンスの問題~ - Qiita

                              前書き 本記事は大幅改装中です。 下記本文は現状参考までにとどめておいてください。 Facebookは2017年9月26日リリースのReact Ver16と、jest、Flow、Immutable.jsの4プロジェクトに関しBSD+PATENTを改め、MITライセンスへ移行しました。 現状はその他のプロジェクトにおいて、BSD+PATENTライセンスが有効ではありますが、おそらくはReactに関してその影響は排除されているものと推測されます。 あくまで推測なので、確実な論拠を得てからその件は記述いたします。 この件を知った発端 QiitaでECMAScriptの最新事情を眺めていたら、Reactが有名なSNS企業のFacebookがやらかしてOSSコミュニティで村八分になっているとのこと。 どういうことか 実際にgoogleで調べてみたらその関連の記事が出ること出ること。多くは英語記事であ

                                React死亡?React終了?~Facebookの特許事項付きライセンスの問題~ - Qiita
                              • A curated list of awesome Go frameworks, libraries and software - Awesome Go

                                Awesome Go We use the Golang Bridge community Slack for instant communication, follow the form here to join. Sponsorships: Special thanks to Awesome Go has no monthly fee, but we have employees who work hard to keep it running. With money raised, we can repay the effort of each person involved! You can see how we calculate our billing and distribution as it is open to the entire community. Want to

                                  A curated list of awesome Go frameworks, libraries and software - Awesome Go
                                • WebAssemblyを用いてBERTモデルをフロントエンドで動かす - OPTiM TECH BLOG

                                  はじめまして。R&Dチーム所属、20.5卒の伊藤です。 普段の業務では自然言語処理と格闘していることが多いです。 今回は自然言語処理モデルとして有名なBERTをWebAssemblyを使用してフロントエンドで動かしてみた話になります。 最近、自然言語処理ライブラリとして普段お世話になっているHugging Face社のTransformersのTokenizerがRustで実装されていることを知り、それならばWebAssemblyにコンパイルして動かせるのではないかと試したみたのがきっかけです。 Tokenizerのみ動かしても実用性に乏しいため、Tokenizerから得られた結果からBERTを用いた推論をブラウザで動作させるまでを行い、備忘録がでら手順をまとめました。 どなたかの参考になれば幸いです。 8/26追記 本記事内のコードを含むリポジトリを公開しました!Dockerを使用してブ

                                    WebAssemblyを用いてBERTモデルをフロントエンドで動かす - OPTiM TECH BLOG
                                  • ivy が面白い

                                    ivyとはなにか 機械学習の統一を目指すフレームワークです。現在、JAX, TensorFlow, PyTorch, Numpy をサポートしています。JAXはNumpy互換なので、実質的に Tensorflow&Pytorch の共通APIのフレームワーク(かなり乱暴なまとめ方)です。 研究のペーパーでよく見るのはPytorchですが、産業ではTensorflowがよく使われるようです。 下の表にもありますが、開発者の設計思想を読むと「書き換えの手間」が想像以上に労力を必要とする文面が多く見受けられます。 余談で手元にTensorflowとPytorchの本が2冊あるのですが、実装に互換性があればそういう悩みが減って深層学習の学習が身近になるかもしれないですね。 特に初学者は「最初にどの山に登るのがいいのか」で迷うと思うので。 ivy登場以前から、学習済みモデルを異なるプラットフォームで

                                      ivy が面白い
                                    • OpenCVの新しい顔検出をブラウザでも試してみる

                                      この記事はOpenCV Advent Calendar 2021の 23 日目の記事です。 はじめに 3 日目の記事で紹介されているように、OpenCV 4.5.4 では新しく顔検出/顔認識の API が実装されました。この記事ではこの顔検出 API をブラウザから呼んでみることにします。ブラウザから呼び出すにあたって、先にきちんとパフォーマンスを確認して使用する解像度を決めます。更に高速化のために SIMD とマルチスレッドを使った OpenCV の Wasm バイナリを作ります。その後、実用的な環境を想定して React のフロントエンドから呼び出すようにしてみます。ついでに WebRTC で実際に加工した画像が送信できることのデモまで行います。 OpenCV.js での新機能の扱い OpenCV.js で JavaScript から呼び出せる機能はホワイトリスト形式になっており、ビル

                                        OpenCVの新しい顔検出をブラウザでも試してみる
                                      • Apple A4チップやAMD Ryzenの生みの親であるジム・ケラー氏がNVIDIAのCUDAとx86アーキテクチャを「沼」と呼んで批判

                                        AMDのAthlonやZenマイクロアーキテクチャ、Apple A4などさまざまなチップの開発に携わったアーキテクトでエンジニアのジム・ケラー氏が、X(旧Twitter)で「NVIDIAのCUDAは沼です」と批判したことが報じられています。 Jim Keller criticizes Nvidia's CUDA, x86 — 'Cuda’s a swamp, not a moat. x86 was a swamp too' | Tom's Hardware https://www.tomshardware.com/tech-industry/artificial-intelligence/jim-keller-criticizes-nvidias-cuda-and-x86-cudas-a-swamp-not-a-moat-x86-was-a-swamp-too ケラー氏の経歴は以下の記事を

                                          Apple A4チップやAMD Ryzenの生みの親であるジム・ケラー氏がNVIDIAのCUDAとx86アーキテクチャを「沼」と呼んで批判
                                        • 七声ニーナを支えるバックエンド技術 | BLOG - DeNA Engineering

                                          データ統括部AI基盤部の竹村( @stakemura )です。本記事では、このたびリリースされた、自分の声をキャラクターの声に変換できるWebサービス VOICE AVATAR 七声ニーナ を支えるバックエンド技術についてお話しします。 本サービスはDelight Boardという部署横断型のプロジェクトにて、1000人を超える社員投票により自分の案がまさかの採択となったことがきっかけとなります。幸運にも、百戦錬磨のプロジェクトメンバーに助けられ今日のリリースを迎えましたが、採択当時は人脈も信用貯金も何もない入社一年目の思いつきにすぎず、言い出しっぺである自分の力不足によりタイトなスケジュールでの開発となってしまいました。本記事では、その限られた開発期間の中で、自分が何を考えて実装したかを中心にお伝えします。 サービングに求められる要件 七声ニーナの音声変換はブラウザから受け取った入力音声

                                            七声ニーナを支えるバックエンド技術 | BLOG - DeNA Engineering
                                          • 無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー

                                            AI技術の進化によって、絵や文章だけではなく音声変換もAIでリアルタイムに行うことが可能になりました。ボイスチェンジャーAIにはRVC(Retrieval-based Voice Changer)やMMVCなどさまざまな種類が存在しますが、「VC Client」は複数ボイスチェンジャーAI向けモデルに対応しており、簡単にリアルタイム音声変換ができるとのことなので実際に試してみました。 GitHub - w-okada/voice-changer https://github.com/w-okada/voice-changer GitHubのレポジトリにアクセスします。 「事前ビルド済みのBinaryでの利用」の欄にあるテーブルで、「win」にある「通常」をクリック。 ダウンロードリンクが表示されるので、「このままダウンロード」をクリックします。なお、VC ClientはZIP形式で配布され

                                              無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー
                                            • 兼雑記

                                              もともと雑だった記憶がより粗雑になり、最後に icfpc にマジメに参加したのっていつだったっけ、車焼いたやつ?くらいの感じです。最近の icfpc は昔の言葉で言うとマラソンマッチ的、現代語で言うと AHC 的な印象を持っています。これらは今でも嫌いではないのですが、フツーに仕事でマラソンタスクがあって、時間がなくて取り組めていないという状況だと、ちょっと参加するモチベが湧きづらい、そんな感じです がまぁ今回は公式サイトから張られてる画像やリンクが、明らかに icfpc の伝説回であるところの 2006/2007 を参照しているので、期待があったのでした。いや、なんか、伝説回というの、好みや、当時と今のレベル差、僕自身の過去の美化、なんかのいろいろな効果が、あるとは思います。でも、それらを全てさっぴいたとしても、主催者が投下した労力という点で、 2006/2007 はここ20年で最大級の

                                                兼雑記
                                              • 機械学習プロジェクトをいい感じにプロダクトに載せていく今風のやり方について考える | Qrunch(クランチ)

                                                機械学習プロジェクトをいい感じにプロダクトに載せていく今風のやり方について考える この記事は裏freee developers Advent Calendar 2018の18日目の記事です。 どうも、@aflcです。freeeで機械学習とかやってます。freeeだとRoyで通ってます。 今日は、なんとかしてモデルは作ったもののその後どうしよう、という話をします。 TL;DR TensorFlow Servingとkubelessで、サーバーとか何も考えずにデプロイ出来るようになることを目指します。 本日話す内容 機械学習モデルのデプロイ 前処理・後処理の実装 モデルのバージョン 話さない内容 評価・テスト 開発時の環境 TensorFlow以外で実装する場合 APIの設計 などなど Python以外の言語の話題 はじめに あなたが様々な苦労を乗り越え、イカした機械学習モデルを構築できたとし

                                                  機械学習プロジェクトをいい感じにプロダクトに載せていく今風のやり方について考える | Qrunch(クランチ)
                                                • BERTの推論速度を最大10倍にしてデプロイした話とそのTips - JX通信社エンジニアブログ

                                                  背景 はじめまして、JX通信社でインターンをしている原田です。 近年深層学習ではモデルが肥大化する傾向にあります。2020年にopen aiが示したScaling Laws([2001.08361] Scaling Laws for Neural Language Models) の衝撃は記憶に新しく、MLP-Mixerが示したように、モデルを大きくすればAttention構造やCNNでさえも不必要という説もあります。([2105.01601] MLP-Mixer: An all-MLP Architecture for Vision) しかし大きな深層学習モデルを利用しようとすると、しばしば以下のような問題に悩まされます。 推論速度が問題でプロダクトに実装不可能 GPU/TPUはコスト上厳しい プロダクトの性質上バッチ処理が不可能(効率的にGPU/TPUが利用できない) 例えばJX通信社

                                                    BERTの推論速度を最大10倍にしてデプロイした話とそのTips - JX通信社エンジニアブログ
                                                  • AIの急速な導入がWindowsの予定を変えた!? Windows 12がすぐには出ない可能性 (1/2)

                                                    Windows 12は名前に過ぎないので 出るか出ないのかは、すべてMicrosoft次第 「Windows 11」というのはMicrosoftが提供するOSの名前である。Windows 95以来のWindowsは、ソフトウェアなのにバージョンではなく名前で区別されるようになった。 もちろんそれぞれのWindowsにもバージョン番号自体はある。現在のWindows 11には、Ver.23H2というバージョンがあって、次のバージョンは、Ver.24H2になる予定だ。しかし、これもWindows 11という名前の中で、それぞれを区別する名前の一部でしかない。 これらはあくまでも名前なので、技術的な観点ではなく、ビジネス的な観点から付けられる。Windows 10もWindows 11も、内部的には「10.0.xxxxx」というバージョン番号を持つ。この番号になったのは、Windows 10から

                                                      AIの急速な導入がWindowsの予定を変えた!? Windows 12がすぐには出ない可能性 (1/2)
                                                    • 音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと

                                                      「Unreal Engine (UE) Advent Calendar 2022 その3」23日目の記事です。 はじめに OpenAIの音声認識AI「Whisper」がすごいらしい。これをUnreal Engineでリアルタイムに動かせるようにしたら応用範囲が広がっておもしろいんじゃないかと思いました。 (「異議あり!」って実際に声に出させたいよね) (NLPアドベンチャーを音声入力で、みたいな夢も広がる) しかし、いざやってみたらいろいろな課題にぶつかりました。この記事は、それらをどう解決したかの記録です。 目次 目標設定:C++とONNX Runtimeで実装する Whisperの処理の全体感 課題と対応 課題1:マイク入力と前処理をC++で実装する 課題2:Whisperの機械学習モデルをONNXにエクスポートする 課題3:ONNXモデルをtransformer&FP16向けに最適化

                                                        音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと
                                                      • AI and Deep Learning in 2017 – A Year in Review

                                                        The year is coming to an end. I did not write nearly as much as I had planned to. But I’m hoping to change that next year, with more tutorials around Reinforcement Learning, Evolution, and Bayesian Methods coming to WildML! And what better way to start than with a summary of all the amazing things that happened in 2017? Looking back through my Twitter history and the WildML newsletter, the followi

                                                        • Unity再入門して「AI x アート」やってみたい - karaage. [からあげ]

                                                          今更ながらUnityに興味しんしん丸 ずっと興味あって、少し手を出してはいたものの、全然がっつり取り組めていなかったUnity。最近、Unity使えば、AIもVRもシミュレーションもマルチプラットフォーム対応もできるということで、今更ながら熱が高まってきました。 GWに取り組むべく、個人的に気になるUnity関係の情報をまとめてみたいと思います。 目的としては、AIと組み合わせた映像・音楽表現的なことをしたいなと考えいます。なので、普通にゲームとか作りたい人にはあんまり参考にならない情報かもしれないので、その点はご了承ください。 学習サイト・書籍 Unityの学習サイトですが、試行錯誤して感じましたが、公式が分かりやすい情報を発信していますね。しかも充実しています。 UnityステーションというYouTube動画は、Unityの活用法をたくさん紹介しているので、見てるだけで結構面白いです。

                                                            Unity再入門して「AI x アート」やってみたい - karaage. [からあげ]
                                                          • 機械学習エンジニアから見たWWDC2018 - dwango on GitHub

                                                            Dwangoの中の、機械学習の研究開発部署Dwango Media Villageで働くエンジニアの大垣です。 今回はAppleのWWDCに機械学習エンジニアとして参加してきたので、スマホアプリエンジニアとはおそらく少し異なる視点からのレポートになるだろうと思い、自分なりにWWDCの機械学習系のセッションのまとめをしようと思います。 AR関連技術を推しに推した基調講演 画像はWWDC 2018基調講演のハイライトシーンより。ARKit2のデモゲーム"SwiftShot" https://developer.apple.com/videos/play/wwdc2018/101/ 基調講演については他のブログでたくさん触れられてるので網羅的には書かなくても良いかなと思います。 私は10:00からの基調講演に対して9:00過ぎくらいに会場ついたのですが、だいたい会場全体の前から2/3くらいの席だ

                                                              機械学習エンジニアから見たWWDC2018 - dwango on GitHub
                                                            • MicrosoftとAWS、ディープラーニングの「Gluon」をオープンソース公開

                                                              米Microsoftと米Amazon.com傘下のAWS(Amazon Web Services)は10月12日(現地時間)、ディープラーニングのライブラリおよびインタフェースの「Gluon」(グルーオン:クォーク同士を結合する働きがあるとされる基本粒子という意味)をGitHubで公開したと発表した。ライセンスはApache License 2.0。 Gluonは、様々なニューラルネットワークのコンポーネントの集まりを使って機械学習モデルを作成するための分かりやすいAPIを提供する。コンポーネントを他のデータ構造と同様に扱えるため、機械学習に慣れていない開発者でも、比較的簡単にモデルを構築できるという。 GluonはAWSで使われている機械学習フレームワークの「Apache MXNet」をサポートする。Microsoftの「Cognitive Toolkit」でも近く使えるようになり、長期

                                                                MicrosoftとAWS、ディープラーニングの「Gluon」をオープンソース公開
                                                              • 転職してからやってること - 兼雑記

                                                                転職してからやってるプロジェクトについて何か書いてみようかと思います。 https://github.com/pfnet-research/chainer-compiler/ 公式ぽいブログも書きました。 https://research.preferred.jp/2019/01/chainer%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E3%81%95%E3%82%89%E3%81%AA%E3%82%8B%E9%AB%98%E9%80%9F%E5%8C%96%E3%80%81%E3%83%87%E3%83%97%E3%83%AD%E3%82%A4%E3%81%AE%E7%B0%A1%E4%BE%BF%E5%8C%96%E3%80%81/ あまり綺麗にまとまった文章を書ける気がしないので、つらつらと時系列で思い出して行こうかと思います。 転職前、 define

                                                                  転職してからやってること - 兼雑記
                                                                • 機械学習は次のステージへーーMIT研究者が発明、“No-Hardware AI”「Neural Magic」のインパクト - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                                  Image Credit : Neural Magic HP ピックアップ:Neural Magic gets $15M seed to run machine learning models on commodity CPUs ニュースサマリ:“No-Hardware AI” 企業を謳う「Neural Magic」は、11月6日、シードラウンドにて1,500万ドルの資金調達を実施したと発表した。出資者にはComcast Ventures NEA、Andreessen Horowitz、Pillar VC、Amdocsが名を連ねる。 同社は、MITでマルチコア処理と機械学習を長年研究してきた2人の研究者によって2018年に設立された。ディープラーニングモデルを処理する高コストなGPUやTPUなどの専用AIハードウェアを使うことなく、汎用CPUでより大きなモデルをより速く、より高い精度で処理

                                                                    機械学習は次のステージへーーMIT研究者が発明、“No-Hardware AI”「Neural Magic」のインパクト - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                                  • Rembgを使って画像から背景を削除してみた | DevelopersIO

                                                                    こんにちは、Twitter監視botの八木です。 いつものようにTwitter監視を行なっていると、あるツイートが目に飛び込んできました。 120 : Remove Image Background using Python https://t.co/888CDqtc68 pic.twitter.com/14g18gzi2n — Python Coding (@clcoding) October 7, 2022 Rembgという、画像から背景を削除するPythonライブラリがあるようです。 ツイートの画像を見てみると、非常に綺麗に背景が削除されています。すごい。 ツイートはPythonコードからの呼び出しですが、READMEをみるとCLIもありました。 今回はこのCLIでいろんな画像を処理してみます。 前提条件 PC: MacBook Pro (13-inch, M1, 2020) OS:

                                                                      Rembgを使って画像から背景を削除してみた | DevelopersIO
                                                                    • マイクロソフト、WebAssemblyとWebGLで推論エンジンを実装した「ONNX Runtime Web」(ORT Web)をオープンソースで公開

                                                                      マイクロソフト、WebAssemblyとWebGLで推論エンジンを実装した「ONNX Runtime Web」(ORT Web)をオープンソースで公開 マイクロソフトは、WebAssemblyとWebGLで機械学習の推論エンジンを実装した「ONNX Runtime Web」(ORT Web)をオープンソースで公開しました。 INTRODUCING: #ONNXRuntime Web (ORT Web), a new feature in ONNX Runtime to enable JavaScript developers to run and deploy machine learning models in browsers https://t.co/Ey3tsNlkEe pic.twitter.com/9uGyK8Pra0 — onnxruntime (@onnxruntime)

                                                                        マイクロソフト、WebAssemblyとWebGLで推論エンジンを実装した「ONNX Runtime Web」(ORT Web)をオープンソースで公開
                                                                      • WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場

                                                                        WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場 ONNX Runtime WebがWebGPUに対応。Webブラウザ上でさらに高速な推論処理が可能になった。Stable Diffusion Turbo全体をWebブラウザ上で高速に実行可能で、RTX4090を用いた場合1秒以内で結果が出力される。 ONNX Runtime Webの基になっている「ONNX Runtime」はクロスプラットフォーム対応の推論エンジンです。TensorFlow、PyTorch、SciKit Learnなどをはじめとするさまざまな機械学習のモデルに対応し、これらで生成されたモデルによる推論処理をプラットフォームに依存せず実行するランタイムの役割を果たします

                                                                          WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場
                                                                        • エッジで機械学習ってなんだろう -ブラウザ、スマホ、IoT機器での推論を概観する- - Qiita

                                                                          本内容は、技術書典7 合同本『機械学習の炊いたん2』収録の、「エッジで機械学習」記事を公開したものです。内容は2019年9月時点の調査等に基づきます。 最近Raspberry Pi 4の検証結果などをみていると、エッジ、かつCPUでもそれなりの速度で動くケースもみられます。またこの後にM5StickV(K210)などを触りましたが、専用チップも使い所があります。今後、それらの動きもできれば補足したいと思います。 9/12-22に開催された技術書典9では、新刊『機械学習の炊いたん3』を頒布しました。私は、「AIエンジニア、データサイエンティストのための経営学、ソフトウェア工学」を寄稿しています。他にも機械学習のビジネス、エンジニアリング、数理までもりだくさん。気になられたら、ぜひご覧ください! 他にも、技術書典9「機械学習、データ分析」系の新刊リスト - Qiitaの通り、たくさんの本が出品

                                                                            エッジで機械学習ってなんだろう -ブラウザ、スマホ、IoT機器での推論を概観する- - Qiita
                                                                          • SberSwapで、個別の学習プロセス無しでFaceSwapを実現する | cedro-blog

                                                                            1.はじめに 今までのFaceSwapは、個別に学習プロセスが必要なため処理に時間がかかるのが難点でした。今回ご紹介するのは、個別の学習プロセス無しでFaceSwapを実現するSberSwapという技術です。 2.SberSwapとは? 下記の図は、SberSwapのモデル図でAEI-Netと呼ばれており、3つの部分で構成されています。 1つ目がIdentity Encoderで、画像XsからベクトルZidを求めます。2つ目がMulti-level Attributes Encoderdで、U-Netと同様な構造を持ち画像Xtから特徴Zattを取り出します。そして、3つ目がAAD Generatorで、これらの情報から目的とする画像を生成します。 3.コード コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい

                                                                              SberSwapで、個別の学習プロセス無しでFaceSwapを実現する | cedro-blog
                                                                            • Awesome Go : 素晴らしい Go のフレームワーク・ライブラリ・ソフトウェアの数々 - Qiita

                                                                              元記事: Awesome GO Awesome List in Qiita Awesome Ruby Awesome Java Awesome JavaScript Awesome Node.js Awesome Python Awesome Selenium Awesome Appium オーディオ/ミュージック オーディオを操作するためのライブラリ. EasyMIDI - EasyMidi は, 標準の MIDI ファイル (SMF) を作業するためのシンプルで信頼性の高いライブラリです. flac - FLAC ストリームをサポートするネイティブ Go FLAC エンコーダ/デコーダ. gaad - ネイティブ Go AAC ビットストリームパーサ. go-sox - libsox の Go バインディング. go_mediainfo - libmediainfo の Go バインデ

                                                                                Awesome Go : 素晴らしい Go のフレームワーク・ライブラリ・ソフトウェアの数々 - Qiita
                                                                              • JetsonにEdge TPUにM5StickV で、エッジAI用やるには何を選べばいいの? - masato-ka's diary

                                                                                1. 概要 追記 公開当初Jetson Nanoの性能表記に誤記があったため修正しています。 最近組み込みデバイス(以下エッジと表現)で画像認識や音声認識、センサ情報の処理といったディープラーニングを利用した処理を実行することが容易になっている。低消費電力で、高速にディープラーニングを処理するためのエッジAI用アクセラレータが各社から発売されていることがその理由の一つだろう。 こういった、エッジAI用のアクセラレータは各社によってその使用や対応フレームワーク、利用できるディープラーニングのネットワーク構成に違いがある。どれも同じように利用できるわけではない。自分でエッジAI用アクセラレータを利用しようとしたときにいくつか調べてみた内容をメモがわりに残してみる。ちなみに個人で遊べるものを中心にしてるので、産業的にどうなのかは知らない、悪しからず。。。 あとこのブログではAndroid Thi

                                                                                  JetsonにEdge TPUにM5StickV で、エッジAI用やるには何を選べばいいの? - masato-ka's diary
                                                                                • ONNXモデルのチューニングテクニック (基礎編)

                                                                                  基礎編 / 応用編1 / 応用編2 サイバーエージェント AI Lab の Conversational Agent Teamに所属している兵頭です。今回は私が半年ほど蓄積したONNXのチューニングテクニックを全てブログに残したいと思います。皆さんが既にご存知であろう基本的なことから、かなりトリッキーなチューニングまで幅広くご紹介したいと思います。長文になりますがご容赦願います。 このブログのメインターゲット層は「リサーチャーが実装したモデルを実環境へデプロイするタスクを有する方々」です。一部リサーチャーの方々の参考になる情報が混じっていることもあるかもしれませんが、あまり興味を引かない内容だとは思います。リサーチャーメインの組織に属しながらリサーチエンジニアの立ち位置で身を投じていますので、研究の観点の少し手前あるいは少しその先の部分を担っている立場からこのブログを記載しているものとご認

                                                                                    ONNXモデルのチューニングテクニック (基礎編)