「onnx」を検索 - はてなブックマーク

1 - 40 件 / 913件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

onnxの検索結果1 - 40 件 / 913件

『親ガチャ』というワードが若者に流行「自分の人生がハズレなのは親ガチャのせい」 : 痛いニュース(ﾉ∀`)
- 547 users
- itainews.com
- 世の中
- 2021/09/08
『親ガチャ』というワードが若者に流行「自分の人生がハズレなのは親ガチャのせい」 1 名前：令和大日本憂国義勇隊(栄光への開拓地) [SE]：2021/09/08(水) 17:00:28.11 親ガチャに外れた… 「親ガチャに外れちゃったよ」。昨今、学生たちの会話に耳を傾けていると、時折そんな声が聞こえてくるようになった。オンラインゲームで希望のアイテムを入手するための電子くじシステムを「ガチャ」という。もともとは店舗などに置いてある小型の自動販売機で、硬貨を入れてレバーを回すとカプセル入りの玩具が無作為に出てくるガチャガチャが語源である。そのシステムに自分の出生をなぞらえたのが親ガチャである。ガチャでどんなアイテムが当たるかは運任せである。ときには一発で大当たりすることもあるが、いくら課金しても弱いアイテムしか入手できないこともある。自分の出生もそれと同じことで、私たちは誰しもどんな親
FastAPI入門 - モダンなPythonフレームワークの特性をチュートリアルで手軽に学ぶ｜ハイクラス転職・求人情報サイト AMBI（アンビ）
- 216 users
- en-ambi.com
- テクノロジー
- 2023/01/30
FastAPI入門 - モダンなPythonフレームワークの特性をチュートリアルで手軽に学ぶ PythonのWebフレームワークとしていま注目を集めるFastAPIは、シンプルにコードが書けるだけでなく、パフォーマンスが高いWebアプリケーションのバックエンドサーバーが構築可能です。同フレームワークの勘所をPythonスペシャリストの杜世橋さんが、初心者向けのハンズオン、そしてより実践的な画像への自動タグ付けサービス実装をとおして解説します。 FastAPIはいま非常に注目されているPythonのWebフレームワークの1つです。Flaskのようにシンプルに書ける一方でPythonのType Hintの機能をうまく活用し、HTTPのリクエスト/レスポンスをPythonの関数の引数/戻り値とシームレスにマッピングして非常に効率的に開発ができるのが最大の特徴です。非同期処理にも対応していてその名
おわりに - なぜ機械学習はうさん臭く感じられるのか? / 真面目なプログラマのためのディープラーニング入門
- 210 users
- euske.github.io
- テクノロジー
- 2022/03/21
本講座では計8回にわたり、ディープニューラルネットワークの原理と実装について説明してきた。ニューラルネットワークの原理は基本的には勾配降下法であり、その基盤となっているのが関数の微分可能性である。ニューラルネットワークにはさまざまな形態が存在するが、画像処理・画像認識の場合は畳み込みニューラルネットワークが非常に有効であることがわかっている。また、ニューラルネットワークの出力形式や損失関数を変えることにより、ニューラルネットワークが物体検出や奥行き推定など、さまざまなタスクに利用可能であることを紹介した。さて、本講座は「真面目なプログラマのための」ディープラーニング入門、と銘打っている。真面目なプログラマとは何か? 諸説いろいろあるだろうが、多くのプログラマは、ソフトウェア開発において仕様の明確さや、システムの効率・堅牢性、そして保守のしやすさといったものを追求
Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開
- 167 users
- www.publickey1.jp
- テクノロジー
- 2024/02/18
Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OSの実行形式バイナリなどの種類を瞬時に判別してくれます。下記はコマンドラインとしてMagikaを実行した例で、フォルダ内のファイルの種類を出力しています。特別に最適化された1MBのモデルでを用いて推論を実行 Magikaはファイルの判別に、Kerasを用いて特別に最適化されたディープラーニングによる、わずか1MBのモデルを用いていると説明されています。このモデルは推論エンジンのOnnx上で実行されています。実行速度はGPUを用いずCPU上で処理されたとしても数
初心者が言語モデルを勉強するための本（2023年6月版） - ぱたへね
- 155 users
- natsutan.hatenablog.com
- テクノロジー
- 2023/06/22
流行のLLMを勉強したくて沢山本を読みました。この後もしばらくLLM（GPT）関係の出版が続きそうなので、現状の本でまとめてみました。参考： nowokay.hatenablog.com まとめ。 Transformerの仕組みを知りたい人で、画像のDeep Learningなら分かるって人はVision Transformer入門言語モデルをデータセットを作る所からやってみたい人には、作ってわかる! 自然言語処理AI とにかくすぐに動かしたい人には、機械学習エンジニアのためのTransformers ビジネス的に何ができるのかを知りたい人はBERT入門 Vision Transformer入門 Vison Transformerになっていますが、Transformerの説明がとても詳しくお勧めです。実際に写経してパーツパーツで動かせるのはこの本だけ。Transformer一点突破な
- LLM
- あとで読む
- 入門
- 本
- 学習
- 書籍
- 機械学習
- 言語
- GPT
- 勉強
AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃
- 155 users
- wirelesswire.jp
- テクノロジー
- 2020/10/08
AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 2020.10.08 Updated by Ryo Shimizu on October 8, 2020, 11:13 am JST 「最近のAIがすごい」と言われてからもう6年ほどが経過した。なかでも人目を引いたのは、なんといっても2016年のAlphaGoだろう。最難関ゲームの一つと言われる囲碁において、人間のトップ棋士に対しAIが圧勝したのである。これは「深層強化学習」というAIだが、実際のところ、「深層強化学習」を実用的に利用した例はまだ少ない。多くのAIベンチャーやAIベンダーが扱う「AI」技術は、古典的な統計解析か、時折ニューラルネットを使っているくらいで、「深層学習」ではあっても「深層強化学習」とは完全に別物である。ラジオもコンピュータも同じ電気で動くものだが別物であるのと同じだ。深層強化学
WebAssemblyでの機械学習モデルデプロイの動向
- 141 users
- www.tkat0.dev
- テクノロジー
- 2020/12/02
本記事はMLOps Advent Calendar 2020の 2 日目の記事です。 WebAssembly（Wasm）は機械学習モデルをデプロイする新たな手段になりうるでしょうか。この記事では、機械学習モデル（特に Deep Learning）を Wasm でデプロイする周辺技術の動向や内部の仕組みをざっくりと説明します。 Table of Contents tkat0 です。WebAssembly(Wasm)面白いですね。私も最近はyewでフロントエンドを書いて遊んでいます。Rust で React っぽいことできるのは新鮮で面白いです。 Wasm は、なんとなく速い JavaScript？とか機械学習で何に役立つの？とか思ってる方も多いと思います。しかし、Wasm はブラウザでの推論時に使えるだけでなく、機械学習モデルのサービングやエッジデバイスでの推論にも使えると知ったら驚き
- WebAssembly
- 機械学習
- wasm
- あとで読む
- machinelearning
- TensorFlow
- MLOps
- deploy
- tvm
- continuousDelivery
WebAssemblyを用いてBERTモデルをフロントエンドで動かす - OPTiM TECH BLOG
- 93 users
- tech-blog.optim.co.jp
- テクノロジー
- 2021/08/13
はじめまして。R&Dチーム所属、20.5卒の伊藤です。普段の業務では自然言語処理と格闘していることが多いです。今回は自然言語処理モデルとして有名なBERTをWebAssemblyを使用してフロントエンドで動かしてみた話になります。最近、自然言語処理ライブラリとして普段お世話になっているHugging Face社のTransformersのTokenizerがRustで実装されていることを知り、それならばWebAssemblyにコンパイルして動かせるのではないかと試したみたのがきっかけです。 Tokenizerのみ動かしても実用性に乏しいため、Tokenizerから得られた結果からBERTを用いた推論をブラウザで動作させるまでを行い、備忘録がでら手順をまとめました。どなたかの参考になれば幸いです。 8/26追記本記事内のコードを含むリポジトリを公開しました！Dockerを使用してブ
- BERT
- WebAssembly
- 自然言語処理
- NLP
- 機械学習
- wasm
- あとで読む
- Rust
OpenCVの新しい顔検出をブラウザでも試してみる
- 92 users
- zenn.dev/kounoike
- テクノロジー
- 2021/12/23
この記事はOpenCV Advent Calendar 2021の 23 日目の記事です。はじめに 3 日目の記事で紹介されているように、OpenCV 4.5.4 では新しく顔検出/顔認識の API が実装されました。この記事ではこの顔検出 API をブラウザから呼んでみることにします。ブラウザから呼び出すにあたって、先にきちんとパフォーマンスを確認して使用する解像度を決めます。更に高速化のために SIMD とマルチスレッドを使った OpenCV の Wasm バイナリを作ります。その後、実用的な環境を想定して React のフロントエンドから呼び出すようにしてみます。ついでに WebRTC で実際に加工した画像が送信できることのデモまで行います。 OpenCV.js での新機能の扱い OpenCV.js で JavaScript から呼び出せる機能はホワイトリスト形式になっており、ビル
- opencv
- あとで読む
- ブラウザ
- WebAssembly
- wasm
- 顔認識
- javascript
ivy が面白い
- 92 users
- zenn.dev/sho7noka
- テクノロジー
- 2022/10/15
ivyとはなにか機械学習の統一を目指すフレームワークです。現在、JAX, TensorFlow, PyTorch, Numpy をサポートしています。JAXはNumpy互換なので、実質的に Tensorflow&Pytorch の共通APIのフレームワーク(かなり乱暴なまとめ方)です。研究のペーパーでよく見るのはPytorchですが、産業ではTensorflowがよく使われるようです。下の表にもありますが、開発者の設計思想を読むと「書き換えの手間」が想像以上に労力を必要とする文面が多く見受けられます。余談で手元にTensorflowとPytorchの本が2冊あるのですが、実装に互換性があればそういう悩みが減って深層学習の学習が身近になるかもしれないですね。特に初学者は「最初にどの山に登るのがいいのか」で迷うと思うので。 ivy登場以前から、学習済みモデルを異なるプラットフォームで
- 機械学習
- TensorFlow
- pytorch
- あとで読む
- ivy
- python
- AI
- フレームワーク
- 学習
七声ニーナを支えるバックエンド技術 | BLOG - DeNA Engineering
- 91 users
- engineering.dena.com
- テクノロジー
- 2021/05/12
データ統括部AI基盤部の竹村( @stakemura )です。本記事では、このたびリリースされた、自分の声をキャラクターの声に変換できるWebサービス VOICE AVATAR 七声ニーナを支えるバックエンド技術についてお話しします。本サービスはDelight Boardという部署横断型のプロジェクトにて、1000人を超える社員投票により自分の案がまさかの採択となったことがきっかけとなります。幸運にも、百戦錬磨のプロジェクトメンバーに助けられ今日のリリースを迎えましたが、採択当時は人脈も信用貯金も何もない入社一年目の思いつきにすぎず、言い出しっぺである自分の力不足によりタイトなスケジュールでの開発となってしまいました。本記事では、その限られた開発期間の中で、自分が何を考えて実装したかを中心にお伝えします。サービングに求められる要件七声ニーナの音声変換はブラウザから受け取った入力音声
Apple A4チップやAMD Ryzenの生みの親であるジム・ケラー氏がNVIDIAのCUDAとx86アーキテクチャを「沼」と呼んで批判
- 91 users
- gigazine.net
- テクノロジー
- 2024/02/20
AMDのAthlonやZenマイクロアーキテクチャ、Apple A4などさまざまなチップの開発に携わったアーキテクトでエンジニアのジム・ケラー氏が、X(旧Twitter)で「NVIDIAのCUDAは沼です」と批判したことが報じられています。 Jim Keller criticizes Nvidia's CUDA, x86 — 'Cuda’s a swamp, not a moat. x86 was a swamp too' | Tom's Hardware https://www.tomshardware.com/tech-industry/artificial-intelligence/jim-keller-criticizes-nvidias-cuda-and-x86-cudas-a-swamp-not-a-moat-x86-was-a-swamp-too ケラー氏の経歴は以下の記事を
Firefox、WebAssemblyのコンパイル処理が75倍速に。SpiderMonkeyのJITコンパイラ改善で
- 79 users
- www.publickey1.jp
- テクノロジー
- 2024/10/21
Firefox、WebAssemblyのコンパイル処理が75倍速に。SpiderMonkeyのJITコンパイラ改善で FirefoxのJavaScriptエンジンでありWebAssemblyの実行エンジンでもある「SpiderMonkey」の開発チームは、WebAssemblyのコンパイル処理を従来よりも最大で75倍高速にする改善を行ったことを、ブログ「75x faster: optimizing the Ion compiler backend | SpiderMonkey JavaScript/WebAssembly Engine」で明らかにしました。二段目のコンパイラがメモリを使いすぎているこの性能改善のきっかけは、マイクロソフトがオープンソースで公開している機械学習ライブラリ「ONNX Runtime」のWebAssembly版をSpiderMonekyで実行した際に、最適化の
無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー
- 78 users
- gigazine.net
- テクノロジー
- 2023/04/22
AI技術の進化によって、絵や文章だけではなく音声変換もAIでリアルタイムに行うことが可能になりました。ボイスチェンジャーAIにはRVC(Retrieval-based Voice Changer)やMMVCなどさまざまな種類が存在しますが、「VC Client」は複数ボイスチェンジャーAI向けモデルに対応しており、簡単にリアルタイム音声変換ができるとのことなので実際に試してみました。 GitHub - w-okada/voice-changer https://github.com/w-okada/voice-changer GitHubのレポジトリにアクセスします。「事前ビルド済みのBinaryでの利用」の欄にあるテーブルで、「win」にある「通常」をクリック。ダウンロードリンクが表示されるので、「このままダウンロード」をクリックします。なお、VC ClientはZIP形式で配布され
Llama 3.2 の使い方｜npaka
- 74 users
- note.com/npaka
- テクノロジー
- 2024/09/28
以下の記事が面白かったので、簡単にまとめました。・Llama can now see and run on your device - welcome Llama 3.2 1. Llama 3.2 Vision 11B・90B1-1. Llama 3.2 Vision 11B・90B「Llama 3.2 Vision 11B・90B」は、Metaがリリースした最も強力なオープンマルチモーダルモデルです。画像+テキストのプロンプトでは英語のみ、テキストのみのプロンプトでは英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語をサポートしています。コンテキスト長は128kトークンで、画像を含む可能性のある複数ターンの会話が可能です。ただし、モデルは単一の画像に注目する場合に最適に機能するため、transformers実装では入力で提供された最後の画像のみに注
- LLM
- あとで読む
- text
- AI
BERTの推論速度を最大10倍にしてデプロイした話とそのTips - JX通信社エンジニアブログ
- 71 users
- tech.jxpress.net
- テクノロジー
- 2021/08/26
背景はじめまして、JX通信社でインターンをしている原田です。近年深層学習ではモデルが肥大化する傾向にあります。2020年にopen aiが示したScaling Laws（[2001.08361] Scaling Laws for Neural Language Models）の衝撃は記憶に新しく、MLP-Mixerが示したように、モデルを大きくすればAttention構造やCNNでさえも不必要という説もあります。（[2105.01601] MLP-Mixer: An all-MLP Architecture for Vision）しかし大きな深層学習モデルを利用しようとすると、しばしば以下のような問題に悩まされます。推論速度が問題でプロダクトに実装不可能 GPU/TPUはコスト上厳しいプロダクトの性質上バッチ処理が不可能（効率的にGPU/TPUが利用できない）例えばJX通信社
AIの急速な導入がWindowsの予定を変えた!? Windows 12がすぐには出ない可能性 (1/2)
- 68 users
- ascii.jp
- テクノロジー
- 2024/06/02
Windows 12は名前に過ぎないので出るか出ないのかは、すべてMicrosoft次第「Windows 11」というのはMicrosoftが提供するOSの名前である。Windows 95以来のWindowsは、ソフトウェアなのにバージョンではなく名前で区別されるようになった。もちろんそれぞれのWindowsにもバージョン番号自体はある。現在のWindows 11には、Ver.23H2というバージョンがあって、次のバージョンは、Ver.24H2になる予定だ。しかし、これもWindows 11という名前の中で、それぞれを区別する名前の一部でしかない。これらはあくまでも名前なので、技術的な観点ではなく、ビジネス的な観点から付けられる。Windows 10もWindows 11も、内部的には「10.0.xxxxx」というバージョン番号を持つ。この番号になったのは、Windows 10から
- windows
- 人工知能
- LLM
- Copilot
- AI
- Microsoft
- あとで読む
- 未分類
新世代AI読み上げソフトAivisSpeech、Style-Bert-VITS2とHeyGenアバターでレシピ動画を超簡単に料理してみた（CloseBox） | テクノエッジ TechnoEdge
- 68 users
- www.techno-edge.net
- テクノロジー
- 2024/11/24
AIによる音声合成は、Diff-SVC、RVC、Vocoflex、Seed-VCなどのボイチェン方面で追いかけてきましたが、最近では商用サービスがTTS（Text To Speech）によるボイスクローニングを充実させてきたことに注目しています。その一方で、オープンソース、フリーソフト側でもずいぶん進化しているのを見落としていました。そこに気づくきっかけとなったのは、「AivisSpeech」というソフトの登場です。 (▲AivisSpeech) ■AivisSpeechの登場AivisSpeechとは、日本で開発されたAI音声合成ソフトで、いくつかのプリセットボイスが使える推論用アプリがMac、Windows向けに提供されており、すぐに試すことができます。既存のアプリに似た使いやすいユーザーインタフェースで、感情表現やアクセントの修正などが直感的にできる他、音声をトレーニングしてその
- AI
- あとで読む
- 音声合成
- 音声
- 人工知能
- techfeed
- tool
- software
- 動画
音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと
- 67 users
- zenn.dev/akiya_souken
- テクノロジー
- 2022/12/23
「Unreal Engine (UE) Advent Calendar 2022 その3」23日目の記事です。はじめに OpenAIの音声認識AI「Whisper」がすごいらしい。これをUnreal Engineでリアルタイムに動かせるようにしたら応用範囲が広がっておもしろいんじゃないかと思いました。（「異議あり！」って実際に声に出させたいよね）（NLPアドベンチャーを音声入力で、みたいな夢も広がる）しかし、いざやってみたらいろいろな課題にぶつかりました。この記事は、それらをどう解決したかの記録です。目次目標設定：C++とONNX Runtimeで実装する Whisperの処理の全体感課題と対応課題1：マイク入力と前処理をC++で実装する課題2：Whisperの機械学習モデルをONNXにエクスポートする課題3：ONNXモデルをtransformer＆FP16向けに最適化
- 音声
- あとで読む
- プログラミング
- AI
- メモ
- game
- ゲーム
- *あとで読む
Unity再入門して「AI x アート」やってみたい - karaage. [からあげ]
- 66 users
- karaage.hatenadiary.jp
- テクノロジー
- 2021/04/30
今更ながらUnityに興味しんしん丸ずっと興味あって、少し手を出してはいたものの、全然がっつり取り組めていなかったUnity。最近、Unity使えば、AIもVRもシミュレーションもマルチプラットフォーム対応もできるということで、今更ながら熱が高まってきました。 GWに取り組むべく、個人的に気になるUnity関係の情報をまとめてみたいと思います。目的としては、AIと組み合わせた映像・音楽表現的なことをしたいなと考えいます。なので、普通にゲームとか作りたい人にはあんまり参考にならない情報かもしれないので、その点はご了承ください。学習サイト・書籍 Unityの学習サイトですが、試行錯誤して感じましたが、公式が分かりやすい情報を発信していますね。しかも充実しています。 UnityステーションというYouTube動画は、Unityの活用法をたくさん紹介しているので、見てるだけで結構面白いです。
- Unity
- 3Dプログラミング
- あとで読む
- AI
- 人工知能
- 学習
- techfeed
- 勉強
- アート
WASMでOCR使ってみた
- 65 users
- zenn.dev/smartshopping
- テクノロジー
- 2024/12/17
これは SMat Advent Calendar 2024 の12/17分の記事です。弊社では「SmartMat Cloud」というIoT重量計 x SaaSでモノの流れを可視化するサービスを提供しております。最近お客様がスムーズにオンボーディングできるように、スマホのweb appのプロトタイプを作っております。当時のスプリントのゴールは商品の初回登録の時はスマートマットのシリアル番号や製品バーコードを読み取って検索するプロトタイプを狙いました。バーコードリーダーはnpmのzxing-wasmがデファクトスタンダードでしたがスマートマットのシリアル番号はOptical Character Recognition(OCR)が必要でした。 OCR in the browser OCRはtesseract.jsでしょう？と思いましたが、ocrsというプロジェクトが気になりました。 ocrs
- wasm
- ocr
- あとで読む
- WebAssembly
- 開発
- まとめ
Rembgを使って画像から背景を削除してみた | DevelopersIO
- 60 users
- dev.classmethod.jp
- テクノロジー
- 2022/10/08
こんにちは、Twitter監視botの八木です。いつものようにTwitter監視を行なっていると、あるツイートが目に飛び込んできました。 120 : Remove Image Background using Python https://t.co/888CDqtc68 pic.twitter.com/14g18gzi2n — Python Coding (@clcoding) October 7, 2022 Rembgという、画像から背景を削除するPythonライブラリがあるようです。ツイートの画像を見てみると、非常に綺麗に背景が削除されています。すごい。ツイートはPythonコードからの呼び出しですが、READMEをみるとCLIもありました。今回はこのCLIでいろんな画像を処理してみます。前提条件 PC: MacBook Pro (13-inch, M1, 2020) OS:
マイクロソフト、WebAssemblyとWebGLで推論エンジンを実装した「ONNX Runtime Web」（ORT Web）をオープンソースで公開
- 59 users
- www.publickey1.jp
- テクノロジー
- 2021/09/06
マイクロソフト、WebAssemblyとWebGLで推論エンジンを実装した「ONNX Runtime Web」（ORT Web）をオープンソースで公開マイクロソフトは、WebAssemblyとWebGLで機械学習の推論エンジンを実装した「ONNX Runtime Web」（ORT Web）をオープンソースで公開しました。 INTRODUCING: #ONNXRuntime Web (ORT Web), a new feature in ONNX Runtime to enable JavaScript developers to run and deploy machine learning models in browsers https://t.co/Ey3tsNlkEe pic.twitter.com/9uGyK8Pra0 — onnxruntime (@onnxruntime)
エッジで機械学習ってなんだろう -ブラウザ、スマホ、IoT機器での推論を概観する- - Qiita
- 56 users
- qiita.com/tomo_makes
- テクノロジー
- 2020/09/22
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 本内容は、技術書典7 合同本『機械学習の炊いたん2』収録の、「エッジで機械学習」記事を公開したものです。内容は2019年9月時点の調査等に基づきます。最近Raspberry Pi 4の検証結果などをみていると、エッジ、かつCPUでもそれなりの速度で動くケースもみられます。またこの後にM5StickV(K210)などを触りましたが、専用チップも使い所があります。今後、それらの動きもできれば補足したいと思います。 9/12-22に開催された技術書典9では、新刊『機械学習の炊いたん3』を頒布しました。私は、「AIエンジニア、データサイエンテ
- 機械学習
- あとで読む
- IoT
- FPGA
- TensorFlow
- GPU
- CPU
- qiita
WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場
- 56 users
- www.publickey1.jp
- テクノロジー
- 2024/03/08
WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場 ONNX Runtime WebがWebGPUに対応。Webブラウザ上でさらに高速な推論処理が可能になった。Stable Diffusion Turbo全体をWebブラウザ上で高速に実行可能で、RTX4090を用いた場合1秒以内で結果が出力される。 ONNX Runtime Webの基になっている「ONNX Runtime」はクロスプラットフォーム対応の推論エンジンです。TensorFlow、PyTorch、SciKit Learnなどをはじめとするさまざまな機械学習のモデルに対応し、これらで生成されたモデルによる推論処理をプラットフォームに依存せず実行するランタイムの役割を果たします
- WebAssembly
- gpu
- ブラウザ
- WebGL
- browser
- あとで読む
SberSwapで、個別の学習プロセス無しでFaceSwapを実現する | cedro-blog
- 53 users
- cedro3.com
- テクノロジー
- 2022/02/01
1.はじめに今までのFaceSwapは、個別に学習プロセスが必要なため処理に時間がかかるのが難点でした。今回ご紹介するのは、個別の学習プロセス無しでFaceSwapを実現するSberSwapという技術です。 2.SberSwapとは？下記の図は、SberSwapのモデル図でAEI-Netと呼ばれており、３つの部分で構成されています。１つ目がIdentity Encoderで、画像XsからベクトルZidを求めます。２つ目がMulti-level Attributes Encoderdで、U-Netと同様な構造を持ち画像Xtから特徴Zattを取り出します。そして、３つ目がAAD Generatorで、これらの情報から目的とする画像を生成します。 3.コードコードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい
- 機械学習
- deeplearning
- GitHub
- ai
- 画像
- 動画
ONNXモデルのチューニングテクニック (基礎編)
- 51 users
- cyberagent.ai
- テクノロジー
- 2022/11/15
基礎編 / 応用編１ / 応用編２サイバーエージェント AI Lab の Conversational Agent Teamに所属している兵頭です。今回は私が半年ほど蓄積したONNXのチューニングテクニックを全てブログに残したいと思います。皆さんが既にご存知であろう基本的なことから、かなりトリッキーなチューニングまで幅広くご紹介したいと思います。長文になりますがご容赦願います。このブログのメインターゲット層は「リサーチャーが実装したモデルを実環境へデプロイするタスクを有する方々」です。一部リサーチャーの方々の参考になる情報が混じっていることもあるかもしれませんが、あまり興味を引かない内容だとは思います。リサーチャーメインの組織に属しながらリサーチエンジニアの立ち位置で身を投じていますので、研究の観点の少し手前あるいは少しその先の部分を担っている立場からこのブログを記載しているものとご認
画像生成AI「Stable Diffusion」をM1搭載Macのローカル上で実行する方法
- 50 users
- gigazine.net
- テクノロジー
- 2022/09/02
非常に高精度な画像を生成できるとして大きな話題を呼ぶ画像生成AI「Stable Diffusion」は、オープンソースであるためユーザーがローカル環境で実行することもできますが、記事作成時点ではNVIDIA製GPUの使用が推奨されています。そのため、「Stable Diffusionが気になっているけどMacユーザーだからローカルで実行できない」という人もいるはず。そんなMacユーザーに向けて、「Stable DiffusionをM1・M2チップ搭載Macのローカル上で実行する方法」についてオープンソースの機械学習モデルをクラウドのAPIで実行するウェブサービス・ Replicateが解説しています。 Run Stable Diffusion on your M1 Mac’s GPU - Replicate – Replicate https://replicate.com/blog/ru
PyTorchのnightlyに侵害　「すぐにアンインストールしてください」
- 49 users
- www.itmedia.co.jp
- テクノロジー
- 2023/01/03
Linux Foundationのプロジェクト、PyTorch Foundationは2022年12月31日（米国時間）、Python用深層学習用フレームワーク「PyTorch」のnightly版ユーザーに対し「すぐにnightly版とtorchtritonをアンインストールし、最新版をインストールしてください」と呼び掛けた。12月25日から30日の間にpipを介してインストールされたパッケージが侵害されていたとしている。このパッケージは、Python Package Index（PyPI）コードリポジトリで侵害された悪意あるtorchtritonをインストールし、実行するという。このtorchtritonは、ユーザーの/etc/hosts、/etc/passwdなどのファイルを読み込み、h4ck.cfdというドメインにアップロードする。 PyTorch Foundationは緩和措置
PyTorch vs TensorFlow in 2023
- 47 users
- www.assemblyai.com
- テクノロジー
- 2021/12/15
Should you use PyTorch vs TensorFlow in 2023? This guide walks through the major pros and cons of PyTorch vs TensorFlow, and how you can pick the right framework. PyTorch and TensorFlow are far and away the two most popular Deep Learning frameworks today. The debate over which framework is superior is a longstanding point of contentious debate, with each camp having its share of fervent supporters
XboxでStable Diffusionを動作させる猛者が登場、ONNX利用でPythonへの依存をゼロにしてNVIDIAのCUDA・AMDのROCm・AppleのCoreML・QualcommのQNN・MicrosoftのDirectMLでも動いてWindows・Linux・macOS・Android・iOS・WebAssemblyなど全てOK、ほぼあらゆるアプリケーションへの統合が可能に
- 46 users
- gigazine.net
- テクノロジー
- 2023/06/18
Stable Diffusionは文字や画像を元に新たな画像を生成してくれるAIですが、実行環境としてPythonが必要とされてきました。そんな中、ONNXモデルおよびONNX Runtimeの活用とC++での実装でPythonへの依存をなくし、Xbox上で動作させることに成功した猛者が登場しました。 Stable Diffusion running on Xbox Series X and S for the first time - YouTube 左端の大きなアイコンが今回作成された「Unpaint」というアプリ。記事作成時点ではストアには存在せず、インストールするにはユーザーが自分でパッケージに署名する作業が必要になります。Xbox Series XおよびXbox Series Sのどちらでも動作可能とのこと。左の大きな画面にXbox Series Xの出力が表示されています。起
Mojo may be the biggest programming language advance in decades – fast.ai
- 46 users
- www.fast.ai
- テクノロジー
- 2023/05/04
I remember the first time I used the v1.0 of Visual Basic. Back then, it was a program for DOS. Before it, writing programs was extremely complex and I’d never managed to make much progress beyond the most basic toy applications. But with VB, I drew a button on the screen, typed in a single line of code that I wanted to run when that button was clicked, and I had a complete application I could now
ヤフーのAIプラットフォーム紹介〜 AI開発をより手軽に
- 42 users
- techblog.yahoo.co.jp
- テクノロジー
- 2021/09/01
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーでデータエンジニア兼マネージャーをしている安藤です。社内で利用しているAIプラットフォームの構築、提供を担当しています。ヤフーには100を超えるサービスがあり、各サービスのデータ＊1が蓄積されています。ヤフーではこれらのデータをマルチビッグデータと呼んでいます。マルチビッグデータを利用し、ユーザの利便性やサービスの質向上のため、AI、機械学習の導入が増えています。今回は、社内で急速に利用が進んでいる内製のAIプラットフォームを紹介します。＊1 この記事で取り扱っているデータは、プライバシーポリシーの範囲内で取得したデータを個人が特定できない状態に加工しています。 AIプラットフォーム開発の目的 AIプラッ
Whisperでリアルタイムに文字起こしするアプリ - TadaoYamaokaの開発日記
- 39 users
- tadaoyamaoka.hatenablog.com
- テクノロジー
- 2023/01/29
前回の記事で、WhisperのモデルをONNXにして文字起こしができるようになったので、Windowsでスタンドアロンで実行できるアプリを作成した。 C#でWPFを使用して開発したので、実行できるのはWindowsのみである。 GitHubのReleaseからダウンロードできるようにした。 GitHub - TadaoYamaoka/RealtimeTranscribe: real-time transcription application 実行環境 .NET 6の.NET デスクトップランタイムが必要である。実行方法 ReleaseからダウンロードしたRealtimeTranscribe.zipを解凍して、「RealtimeTranscribe.exe」をダブルクリックすると起動できる。ラジオボタンで、「マイク」を選択すると音声をマイクから入力し、「ループバック」を選択するとPC
まとめて解説！機械学習・深層学習で使われるフレームワーク7選 | AI専門ニュースメディア AINOW
- 36 users
- ainow.ai
- テクノロジー
- 2020/08/07
こんにちは、AINOWライターのゆかわです。機械学習、特にディープラーニング（深層学習）のモデルを構築する際に重要となってくるのが、深層学習フレームワークです。今回は、そもそもフレームワークとは何なのか、有名なディープラーニングフレームワークなどについて特徴を解説していきます。フレームワークとは？ライブラリとの違いそもそもフレームワークとは？フレームワークとは、プログラムを作る際のひな形のようなものです。機械学習の分野では、主にディープラーニングモデルを作る際に、TensorFlowやPyTorchなどのフレームワークを用いるのが一般的です。例として車を作ることを考えると、フレームワークはある程度形になっている車体に、自分の好きなタイヤやハンドルなどをはめていくイメージです。一から車を作ることもできますが、ある程度形になっている方が、作業は圧倒的に楽です。また、フレームワ
- 機械学習
- 深層学習
- techfeed
- 開発
- あとで読む
- 学習
- ai
- development
CloudflareのDeveloper Week 2023の気になった発表のまとめ - console.lealog();
- 35 users
- lealog.hateblo.jp
- テクノロジー
- 2023/05/22
今年も祭りの季節がやってきましたね。 Developer Week 2023 | Cloudflare というわけで、今年も個人的に気になったものを。（発表されるのがだいたいJST深夜かつ最後が金曜日なので、どうやっても公開するの週明けになるんよな・・） Introducing Constellation, bringing AI to the Cloudflare stack https://blog.cloudflare.com/introducing-constellation/ Workersで機械学習のモデルが動かせるようになったとのことプライベートβ サポートされているランタイムで動作するモデルであれば、自作のものでも、用意されてるものでもOK 現状はONNX形式のみ対応 https://github.com/onnx/models https://github.com/d
Microsoftが「ML.NET 1.5.2」を公開、.NET開発者向け機械学習フレームワーク
- 35 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2020/10/09
Microsoftが「ML.NET 1.5.2」を公開、.NET開発者向け機械学習フレームワーク：ONNXエクスポートなどの機能も強化 Microsoftは、.NET開発者向けのオープンソース機械学習（ML）フレームワークの最新版「ML.NET 1.5.2」を公開した。Model Builderツールで「Azure ML」を使ってオブジェクト検出モデルをトレーニングできるようになった他、ML.NET CLIで画像分類モデルをローカルでトレーニングすることも可能になった。 Microsoftは2020年9月25日（米国時間）、オープンソースの.NET開発者向けクロスプラットフォーム機械学習（ML）フレームワークの最新版「ML.NET 1.5.2」を公開した。 ML.NETでは、.NETエコシステムから離れることなく、MLやデータサイエンスの経験が乏しい開発者でも、.NETアプリケーションにM
- 機械学習
- Microsoft
- C#
- .NET
- あとで読む
- AI
- 開発
Python 3.11 Performance Benchmarks Are Looking Fantastic - Phoronix
- 34 users
- www.phoronix.com
- テクノロジー
- 2022/06/07
Python 3.11 Performance Benchmarks Are Looking Fantastic Written by Michael Larabel in Software on 6 June 2022 at 02:00 PM EDT. Page 1 of 4. 64 Comments. Last month Python 3.11 Beta 1 was released as their first preview of this major update to the Python programming language. Besides new language features and other improvements, Python 3.11 performance is looking fantastic with very nice performan
Oracle、Javaによる機械学習ライブラリ「Tribuo」をオープンソースで公開
- 33 users
- codezine.jp
- テクノロジー
- 2020/09/18
「Tribuo」は、Oracle Labsの機械学習研究グループが、数年かけて構築してきた機械学習ライブラリで、Tribuoはラテン語の「割り当て」「配分」を意味している。分類、クラスタリング、異常検出、回帰アルゴリズムなど、機械学習ライブラリに期待される標準的な機能を提供し、データ読み込みパイプライン、テキスト処理パイプライン、およびデータ読み込み時の機能レベル変換といった機能を備える。「Tribuo」の、他の機械学習システムとは異なる大きな特徴は、すべての入力に範囲とタイプが記述可能なことであり、出力にも強力な型付けが行われているので、それが何を意味するものであるのかがわかりやすくなっている。さらに、どのようなトレーニングや処理が行われ、最終的にどのような評価となったのかといった来歴情報が、すべてモデルに記録されるので、モデルや評価を再現するためのトレーニングパイプラインを、正確
- Oracle
- Java
- あとで読む
- AI
PyTorchやTensorFlow互換のAI処理高速化プラットフォーム「MAX」プレビュー公開、Pythonを高速化した「Mojo」搭載
- 33 users
- www.publickey1.jp
- テクノロジー
- 2024/03/08
Modular社がAI処理を高速化するプラットフォーム「MAX」をプレビュー公開。PyTorchやTensorFlow、ONNXなどのAIモデルと入れ替えるだけで処理が最大5倍高速になる。 Pythonの高速なスーパーセット「Mojo」言語を発表したことで話題となったModular社が、AI処理を高速化するプラットフォーム「MAX」（Modular Accelerated Xecution）のデベロッパーエディションをブレビュー公開しました。 MAX Developer Edition Preview has officially launched! It's a drop-in replacement for running and serving @PyTorch, @tensorflow and @onnxai models much faster and leverages the
- Mojo
- PyTorch
- TensorFlow
- python
- AI
- あとで読む
- 人工知能
- techfeed
- software