[6ページ] 画像処理の人気記事 776件

201 - 240 件 / 776件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

画像処理の検索結果201 - 240 件 / 776件

TechCrunch
- 169 users
- jp.techcrunch.com
- テクノロジー
- 2019/09/12
"Number Go Up: Inside Crypto’s Wild Rise and Staggering Fall" by investigative reporter Zeke Faux has several chapters on FTX's founder, Sam Bankman-Fried, but it's also about crypto more broadly.
- neural
- あとで読む
- 技術
- アプリ
- 画像処理
- 動画
- 3dcg
- カメラ
- 開発
【速報】次世代の外観検査！？プロンプトを駆使した異常検知 - Qiita
- 168 users
- qiita.com/shinmura0
- テクノロジー
- 2023/05/24
先日、革新的な画像の異常検知（SAA）が出てきました。何やら革命的な臭いがする... SAMを使った異常検知手法https://t.co/wmwFcbULdq コードはこちらhttps://t.co/3npK3FhnEz pic.twitter.com/JDs30bEJyQ — shinmura0 (@shinmura0) May 22, 2023 本稿では、操作手順 & 触ってみた感想をご報告します。特長本題に入る前に、どこら辺が革新的なのかざっくり説明します。 ※　SAAの詳細は論文をご参照ください。学習データは不要通常、学習（正常）データを数百枚用意しますが、この手法では正常データを必要としません。ドメイン知識を導入できる予め、異常の傾向をプロンプトに入れることにより、異常の特徴をモデルに教えることができます。二点目が特に大きく、今までの異常検知では、積極的に異常の傾
- AI
- あとで読む
- 画像
- アルゴリズム
- 異常検知
- deeplearning
- qiita
- image
- ソフトウェア
- LLM
OpenCV をビジュアルプログラミングできるアプリを Electron + Vue.js で作成 - Qiita
- 166 users
- qiita.com/ufield
- テクノロジー
- 2019/11/24
要約 Electron + Vue.js で、OpenCVをビジュアルプログラミング的に実行できるアプリ(仮称: OpenCVFlow)を自分の勉強がてら作ってみました。上の動画のように、画像処理を定義したブロックを並べ、それをリンクでつなげることで、処理を順次実行して結果を確認、保存することができます。機能としてはそれほど多くなく、実用まではいかないかもしれませんが、なにか参考になれば幸いです。(個人的には、ElectronやVue.jsを本格的に使用するのは初めてでしたが、それなりに動くものが作れて満足しています。) 採用技術アプリケーションエンジン: Electron フロントエンドフレームワーク: Vue.js UIフレームワーク: Photon OpenCVライブラリ: opencv4nodejs デザインパターン: アトミックデザインアトミックデザインについて今回は、U
- Electron
- OpenCV
- あとで読む
- Vue
- vue.js
- js
- プログラミング
- GUI
- アプリ
- 画像処理
【やじうまPC Watch】あの「waifu2x」を超えた！？アニメに特化したAI超解像技術
- 165 users
- pc.watch.impress.co.jp
- テクノロジー
- 2022/05/31
- 技術
- あとで読む
- AI
- 機械学習
- technology
- anime
- PC
「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード＆デモが公開される
- 165 users
- gigazine.net
- テクノロジー
- 2023/06/27
AIを使って画像を生成する時、「ちょっとだけ修正を加えたい」と思うことは多いもの。そんな人たちの夢をかなえるツールが「DragGAN」です。DragGANは画像の中で動かしたいポイントを指示するだけでAIが自動で修正してくれるというもので、2023年5月に論文だけが提出されていましたが、2023年6月22日にソースコードが公開され、同時にデモも登場しました。 GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH 2023) https://github.com/XingangPan/DragGAN Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold https://vcai.mpi-inf.mpg.
- AI
- 人工知能
- あとで読む
- 画像処理
- 写真編集
- 画像
- 機械学習
- techfeed
VRで注目、新技術「NeRF」の衝撃　様々な視点の画像を美しく合成
- 164 users
- xtrend.nikkei.com
- テクノロジー
- 2020/09/12
複数の視点の画像から、新たな視点の画像を合成して作り出す「Novel View Synthesis」というタスクがある。VRやスポーツの自由視点映像などには不可欠な技術だ。この領域で驚異的な性能を発揮したのが「NeRF」（ナーフ）。果たしてどんなアルゴリズムで、美しい合成画像を作り出せるのか。世界中の研究者や技術者に衝撃を与えたその技術を、論文からひもといていく。まずは下の3枚の画像を見ていただきたい（図1）。左の2枚の写真を基に、一番右の画像のような新たな視点の画像を生成する技術を、今回は紹介していく。コンピュータービジョン分野やコンピューターグラフィックス分野の主要な研究課題の1つであり、応用先にはVR（仮想現実）やスポーツの自由視点映像など、様々な分野が挙げられる。これは「Novel View Synthesis」という、複数の視点の画像を手がかりに新たな視点の画像を合成する技術
- VR
- あとで読む
- 画像
- アルゴリズム
- 画像処理
- 技術
- 3d
- MachineLearning
- 3DCG
- 機械学習
迫真AI部 movie2movieの裏技
- 163 users
- www.nicovideo.jp
- テクノロジー
- 2022/10/19
話題のAI画像生成で動画を変換してみました。Stable Diffusion(AUTOMATIC1111)を魔改造してmovie2movie（動画→動画）変換してます。不安定に見えますが、試行錯誤を経てだいぶ絵っぽく見えてきてます。ただ迫真空手部しか変換してみてないので、今後色々やってみようかと思います。元動画の解像度が低いからか元とかけ離れた画像を生成しまくって、調整すっげぇキツかったゾ...。▼実現方法1. 動画→フレーム出力2. フレームをSwinIRで4倍高解像度化3. ポスタリゼーションをかけて境界をくっきりさせてみました（階調は10弱、ですかね...）4. 画像を512px * 512px にリサイズ5. img2img変換（余力があればここでもう一回高解像度化してみても良いかも。）6. フレーム→動画出力※プロンプトはシーン毎に少しずつ変えてみてます。すべてpythonで自動
お絵描きAIに対する反発はどうやら英語圏でもかなり酷いことになっているらしいという話
- 157 users
- togetter.com
- テクノロジー
- 2022/10/05
Imperatoria Hoppo (イムペラトリア・北方) @ImperatoriaH @you629 私は海外の人間ですが、AIで作られた＂アート＂に対するバックラッシュには心から同意できます。技術を身につけようとしない人が、本来は他人の作品から盗んで自分のものだと主張するための言い訳だと思うんです。 2022-10-04 13:14:26 そまりあ @somalia24906989 @you629 日本よりも海外の方がイラストレーターの地位が高いんですよね。今だに写真<イラストなので。歴史ある雑誌にもイラストが載っていた記憶が。となれば、海外の方の反発も相当なものなのでしょうね。 2022-10-04 16:53:01
- AI
- あとで読む
- 人工知能
- イラスト
- togetter
- 絵
- 機械学習
低解像度ビデオもすぐに高解像度に変換できる超解像アルゴリズムTecoGANがすごい
- 154 users
- ai-scholar.tech
- テクノロジー
- 2019/05/25
3つの要点 ✔️ 低解像から高解像へ変換 ✔️ 時間的に一貫したフレームを生成するために双方向損失関数を採用 ✔️ 超解像度へ変換するTecoGANを提案 Learning Temporal Coherence via Self-Supervision for GAN-based Video Generation Temporally Coherent GANs for Video Super-Resolution (TecoGAN) written by Mengyu Chu, You Xie, Jonas Mayer, Laura Leal-Taixé, Nils Thuerey (Submitted on 23 Nov 2018 (v1), last revised 21 May 2020 (this version, v4)) Comments: Published by arXi
- algorithm
- 機械学習
- 画像処理
- AI
- 超解像
- アルゴリズム
- あとで読む
- コナン
- 画像
- video
画像の解像度を「2倍」にするPhotoshopの新機能「スーパー解像度」の使い方＆仕組みはこんな感じ
- 153 users
- gigazine.net
- テクノロジー
- 2021/03/22
Photoshopには、RAWファイル現像プラグイン「Camera Raw」が付属しています。2021年3月にリリースされた「Camera Raw13.2」には、カメラで撮影した画像の解像度を2倍にする機能「スーパー解像度」が追加されているので、実際に使ってみました。新機能「スーパー解像度」の活用方法 https://blog.adobe.com/jp/publish/2021/03/10/cc-photo-from-the-acr-team-super-resolution.html ◆「スーパー解像度」の使い方実際に「スーパー解像度」を使って、画像の解像度を2倍にしてみます。まずは、Camera Rawで編集したい画像のRAWファイルを読み込みます。なお、「スーパー解像度」は記事作成時点では、最大で長辺6万5000ピクセル、あるいは総画素数500メガピクセルまでの画像に対応していま
- photoshop
- あとで読む
- AI
- 画像
- Adobe
- 写真
USBカメラモーションキャプチャーThreeDPoseTrackerの説明 - Qiita
- 153 users
- qiita.com/yukihiko_a
- テクノロジー
- 2020/06/19
ThreeDPoseTrackerとはまずは下記の動画をご覧ください。画像をクリックすると別タブでYoutubeが開きます。 ThreeDPoseTracker v0.1.0 Introduction movie 他にもこの辺を見て頂くとわかりやすいかもしれません。 USBカメラだけでできるモーションキャプチャを作ってみた - Motion capture with USB Cam only - 【NT京都2020】 https://youtu.be/L0ieoaOD6Po ThreeDPoseTrackerは、USBカメラや踊ってみた等の動画だけでモーションキャプチャーができるWindows10用アプリケーションです。ノートPCであれば内蔵のカメラを使えば追加の機材は必要ありません。ですが、ちょっと（かなり）強めのグラフィック環境が必要です。具体的にはGTX1050以上は欲しいです。
- Unity
- あとで読む
- pose
- 機械学習
- capture
- motion
- 3d
- ar
- 3DCG
【理不尽】「うちの猫ちゃんを擬人化しろ」AI「ｳｽ…」「うちの猫ちゃんをそんな眼で見るな！！！（激怒）」
- 152 users
- togetter.com
- 暮らし
- 2022/10/20
おむ @PlatyCiony △「うちの猫ちゃんを擬人化しろ」 AI「ｳｽ…(提出)」 △「うちの猫ちゃんをいやらしい眼で見るな！！！(激怒)」 AI「は？」 pic.twitter.com/dQMdUcaWja 2022-10-18 19:19:45
- AI
- イラスト
- 猫
- Togetter
- ねこ
- ネタ
- あとで読む
- 画像
AIイラスト専用投稿サイト「chichi-pui」が登場　閲覧無料、会員登録でプロンプト開示　運営は個人
- 152 users
- www.itmedia.co.jp
- テクノロジー
- 2022/10/31
関連記事 pixiv、AIイラスト急増で機能改修　検索フィルター、専用ランキングなど実装へピクシブが「pixiv」を、AI生成作品と人間の作品をすみ分けできるよう機能改修すると発表した。10月下旬に、検索時のフィルタリングやAI生成作品限定のランキング機能などを追加する。「ファンアートは自分で描いて」　画像生成AIのイラストにVTuberが苦言「ファンアートは自分で描いて」──画像生成AIが描いたAIイラストを巡って、バーチャルYouTuber（VTuber）の投稿が話題だ。SNS上などでは現在、3日にサービスを始めた画像生成AI「NovelAI Diffusion」などの影響から、AIイラストの投稿が相次いでいる。「イラストやデザインの仕事は退屈」──Stable Diffusion開発元の代表インタビュー記事が話題「イラストやデザインの仕事は退屈」──画像生成AI「Stabl
- AI
- イラスト
- あとで読む
- 人工知能
- 画像生成
- webサービス
- SNS
- tool
顔画像生成のためのデータセットを作る - すぎゃーんメモ
- 151 users
- memo.sugyan.com
- テクノロジー
- 2020/01/20
動機 TensorFlowの登場をきっかけに機械学習によるアイドル顔識別という取り組みをしていて、3年以上かけてコツコツとアイドルの自撮りを収集してラベルをつけてデータセットを作ってきたけど、アイドルヲタクはもう辞めてしまって現場にも全然行かなくなり、卒業・脱退の情報を追いながらラベルを更新していく作業を続ける情熱はすっかり薄れてしまった。もうアイドル顔識別プロジェクトは終了にしよう、と思った。しかし折角今まで集めたデータを捨ててしまうのは勿体無い。せめて最後に何か活用できないものか。と考えて、「画像生成」に再び取り組んでみることにした。過去に試したことはあったけど、それほど上手くはいっていない。 TensorFlowによるDCGANでアイドルの顔画像生成 TensorFlowによるDCGANでアイドルの顔画像生成その後の実験などこの記事を書いたのが2016年。この後
- 機械学習
- GAN
- あとで読む
- 画像
- machinelearning
- image
- machine learning
- 学習
- Python
最新Raspberry Pi OS（Bullseye）のAI画像認識環境構築方法
- 151 users
- zenn.dev/karaage0703
- テクノロジー
- 2022/04/03
ラズパイでAI画像認識環境構築ひさしぶりにラズパイでディープラーニングしようと思ったら、色々変わっていたのでメモ。追記：ラズパイ5に関しては以下記事参照ください。前提ハードウェアやソフトウェアの前提は以下です。 Raspberry Pi 4 Raspberry Pi OS(64-bit) with Desktop 2023-02-21(Bullseye) USBカメラ OSは64bitを使用します。32bitだとライブラリのバージョンが変わってくるのでこの記事のままだとインストールできませんので注意してください。 SDカードの書き込みやハードウェアのセッティングに関しては、以下記事参照ください。また、上記記事では、カメラとしてRaspberry Pi カメラモジュールを使っていますが、Raspberry Pi OSがBullseyeになってから、使用するライブラリが変わった(Pi
- RaspberryPi
- あとで読む
- Raspberry Pi
- ai
- 画像
- python
- 機械学習
- 環境
0からRust/Wasmを使ってブラウザで動くバーコードリーダを作ってみた話 @_mkazutaka | メルカリエンジニアリング
- 151 users
- engineering.mercari.com
- テクノロジー
- 2020/12/04
こんにちは！Mercari Advent Calendar 2020 の3日目は、メルカリWebPlatformチーム/Software Engineerの@_mkazutaka がお送りします。普段はメルカリのウェブ周りの開発をしておりGoやPHPやTypeScriptを書いています。メルカリでは半期に一度エンジニアのためのお祭りMercari Hack Weekを開催しています。この記事では、第2回Mercari Hack Weekから筆者が取り組んでいるRust/Wasmを使ったバーコードリーダについて紹介します。こちらプロダクションには出してるものでありません。お願いすればプロダクションへのリリースを許してもらえたと思いますが、筆者自身が出さない選択肢を取ったのでそれも含めて紹介します。 (注釈: いくつかの画像処理の話が出てきますが、筆者は画像処理の専門家でもなければ大学院で
- WebAssembly
- Rust
- あとで読む
- wasm
- バーコード
- メルカリ
- 画像
- コード
- ブラウザ
- browser
いまどきのVulkan
- 150 users
- speakerdeck.com/fadis
- テクノロジー
- 2021/11/20
3DグラフィクスAPI Vulkanの基本と最近のVulkanで使えるようになった機能について解説しますこれは2021年11月20日に行われたカーネル/VM探検隊 online part4での発表資料です動画: https://youtu.be/CIfezfwbA3g ソースコード: https://github.com/Fadis/gct/tree/kernelvm-online-4
- GPU
- vulkan
- あとで読む
- GPGPU
- メモリ
絵心がない線画を“いい感じの作品”に変える画像生成AI「Sketch-to-Image」　Googleなどが開発
- 149 users
- www.itmedia.co.jp
- テクノロジー
- 2022/12/02
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Google ResearchとイスラエルのTel Aviv Universityに所属する研究者らが発表した論文「Sketch-Guided Text-to-Image Diffusion Models」は、落書きのようにざっと描いた絵を入力テキストに従って詳細な画像を生成する深層学習モデルを提案した研究報告だ。手描きのスケッチを任意のテキストプロンプトによるスタイル制御で、自然な高精細画像に変換する。大規模なテキストから画像への拡散モデルは、与えられたテキストプロンプトに従った前例のない品質の多様な画像の合成を可能にし、コンテンツの作成と編集のための刺激的なツールとなってきた。しか
- AI
- 画像
- あとで読む
- google
- 機械学習
- 人工知能
- イラスト
- 画像処理
外人ってスマホの写真から邪魔な被写体を消す技術ほんと好きだよな
- 146 users
- anond.hatelabo.jp
- 暮らし
- 2021/10/21
昨夜GoogleがPixel6を発表して紹介動画をざっと見てたけどカメラ機能の紹介で「AI技術を駆使してこんなに簡単自然に写真の中の〇〇が消せます！」みたいなのにやたら力が入ってて、なんだかなーという気分になった新型コロナが流行る前の年、娘の幼稚園の入園式の記念写真撮影を友人が買って出てくれたおかげで俺と嫁はスマホやデジカメを気にする事なく式に参列することができた数日後、友人から写真が送られてきたのだが、その中にぎょっとするものがあったそれは正門前で娘と嫁が並んでいる記念写真だった娘と嫁以外の人間が一人も写っていなかった全く同じ構図で他の参列者や児童や先生が写っているものもあったので、何かのアプリで除去したものだとすぐに気づいた友人なりにサービスしたつもりだったのだろうが、その写真を見た娘は泣き出してしまった俺と嫁は「きっとカメラが壊れていたんだよ」と娘をなだめてその場を
- 写真
- 増田
- 機械学習
- 技術
- photo
- あとで消す
- HotEntry
うおぉ、今日、またしても激ヤバなAIをグーグルが発表してた！テキストから画像を生成するAI技術の発展が早すぎる。驚くべきことに、この画像はすべて下のテキストから生成されたものである。Parti：Pathways Autoregressive Text-to-Image（200億パラメータ）（pdf）https://gweb-research-parti.web.app/parti_paper.pdf
- 142 users
- twitter.com/jaguring1
- テクノロジー
- 2022/06/23
- AI
- あとで読む
- 技術
- Google
- 画像
- プログラミング
Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く？【2020年12月版】 - Qiita
- 142 users
- qiita.com/terryky
- テクノロジー
- 2020/12/13
Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く？【2020年12月版】RaspberryPiTensorflowLitexnnpack 1. はじめに今から半年前の2020年6月、ラズパイ４上でTensorFlow Liteを使った様々なAI認識アプリを動かしてみて、その動作速度をまとめました。当時のTensorFlowはバージョン2.2でしたが、現在は 2.4(rc4) へと進んでいます。進化が極めて速いDeepLearningの世界において、この半年間でTensorFlow Liteはどう変化したでしょうか。もし「手持ちのアプリは何も変えてないのに、TensorFlow Liteを新しくするだけでめっちゃ速く動くようになったぜ」というのだと嬉しいですよね。本記事では、前回計測に用いたアプリを再び最新版のTensorFlow Lite環
複雑なアニメーションをプログラムする〜Reanimate入門〜
- 142 users
- zenn.dev/lotz
- テクノロジー
- 2021/01/01
Reanimateはアニメーションを作成するためのライブラリです。 ReanimateはHaskellのライブラリとして実装されているのでプログラムによってアニメーションを記述することができます。ライブラリに実装されている機能も多く、ドキュメントも豊富ですし、オンラインのPlaygroundまで用意されていてかなり完成度の高いライブラリになっています。さらにLaTeXや物理エンジン（Chipmonk 2D）, POV-Ray, Blenderなど外部ツールとの連携もサポートされています。アニメーションの各フレームはSVGで書き出されるようになっており、幾何学的な図形やSVGフォントを使った文字などから構成されたアニメーションを作るのが得意です。作ったアニメーションは最終的にMP4, GIF, WebMに出力することができます（中間生成物である各フレームのSVGを取り出すことも可能です）。
話題の無料画像生成AI「Stable Diffusion」をオフラインのiPhoneのみで動かせるアプリ「Draw Things」を使ってみたよレビュー
- 140 users
- gigazine.net
- テクノロジー
- 2022/11/10
文章(プロンプト)を入力するだけで画像を生成してくれるAI「Stable Diffusion」が大きな注目を集めていますが、Stable Diffusionを使うには高性能GPUを搭載したマシンを用意する必要があるため興味はあっても使うのを諦めていた人も多いはず。そんな中、iPhoneに搭載されたチップを利用してオフラインでもStable Diffusionを用いた画像生成を可能にするアプリ「Draw Things」が公開されました。実際にDraw Thingsを使ってみたところ、モデルデータの切り替えやシード値の手動入力など高度な機能が山盛りの高性能画像生成アプリに仕上がっていたので、インストール手順や使い方をまとめてみました。 Draw Things: AI-assisted Image Generation https://draw.nnc.ai/ Draw Thingsを使うには、
画像生成AIに美樹さやかさんのデータを学習させたら、指定してないのにあの子が隣に映り込んだ･･･｢泣いた｣｢尊い｣
- 140 users
- togetter.com
- テクノロジー
- 2022/09/29
三雲岳斗 @mikumo 画像生成AIに美樹さやかさんのデータを学習させたら、指定してないのに勝手に佐倉杏子さんらしき人物が隣に映り込むようになった、って記事を読んで感動してる独りぼっちは、寂しいもんな… six-loganberry-ba7.notion.site/22-09-26-Stabl… pic.twitter.com/Zx5UZBAY1y 2022-09-28 18:47:35 リンク Notion Notion – The all-in-one workspace for your notes, tasks, wikis, and databases. A new tool that blends your everyday work apps into one. It's the all-in-one workspace for you and your team 406
- AI
- 画像
- togetter
- 学習
- まどか☆マギカ
- 機械学習
- あとで読む
- キャラ
- ネタ
- 人工知能
Lexica
- 139 users
- lexica.art
- テクノロジー
- 2022/08/24
The state of the art AI image generation engine.
- AI
- StableDiffusion
- stable diffusion
- webサービス
- prompt
- 機械学習
- image
- 画像
- search
- machinelearning
OpenAIのGPT-4oを日本語OCRとして使ってみる
- 139 users
- zenn.dev/tomioka
- テクノロジー
- 2024/05/14
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ
- AI
- あとで読む
- ChatGPT
- 日本語
- GPT
- OCR
- 人工知能
- api
オープンソースのマルチメディアツール「FFmpeg」と「Libav」はなぜ分裂したのか？
- 135 users
- gigazine.net
- テクノロジー
- 2023/04/23
2000年から開発が続いているFFmpegはオープンソースで開発されるコーデックツールで、動画や音声を記録・変換・再生するためのフリーソフトウェアです。FFmepgの開発体制は2011年にFFmpegとLibavという2つのプロジェクトに分裂した過去があり、この経緯についてグラフィックやアート関連のエンジニアであるbµg氏が自身のブログで説明しています。 The FFmpeg/Libav situation http://blog.pkh.me/p/13-the-ffmpeg-libav-situation.html FFmpegの開発プロジェクトがスタートした時、同時期にオープンソースのメディアプレイヤーであるMPlayerの開発プロジェクトがスタートしました。FFmpegは音声や動画を変換したり再生したりするためのライブラリとツールをまとめたもので、MPlayerもFFmpegのAPI
近似最近傍探索の最前線
- 135 users
- speakerdeck.com/matsui_528
- テクノロジー
- 2019/07/29
MIRU 2019 チュートリアル　http://cvim.ipsj.or.jp/MIRU2019/index.php?id=tutorial 松井勇佑（東京大学生産技術研究所）http://yusukematsui.me/index_jp.html ベクトルの集合を前にして新たにクエリベクトルが与えられたとき、そのクエリに最も似ているベクトルを高速に探す処理を近似最近傍探索という。近似最近傍探索は画像検索をはじめ様々な文脈で用いられる基本的な操作であり、速度・メモリ使用量・精度のトレードオフの中で様々な手法が提案されている。本チュートリアルでは、アプローチや対象とするデータの規模に応じて近年の手法を分類し、その概観を示す。また、各手法に対応するライブラリを紹介し、大規模データに対する探索を行いたい場合にどのように手法を選択すべきかの道筋を示す。
- algorithm
- アルゴリズム
- あとで読む
- 機械学習
- machinelearning
- slide
- ann
- programming
- search
- slides
AIで少年を作ってたら突然知らないおじさんの手が出現し、こっちに向かってくるガチの怪奇現象が発生した
- 132 users
- togetter.com
- テクノロジー
- 2022/10/22
はにわさん@がんばったりがんばらなかったり @haniwa82828282 AIのケツ叩いてうちPCをまた一人作ってたんですが、何故か突然虚空から少年のマフラーを摘むおじさんの手が出現し、数字を弄るとだんだんこちらに近づいてくるガチの怪奇現象が起きてしまっており泣いています　ホントにこわい　助けて pic.twitter.com/APRu2ZBbEV 2022-10-21 00:44:50
- AI
- あとで読む
- 画像
- illust
- 人工知能
- Togetter
- ネタ
DreamFusion: Text-to-3D using 2D Diffusion
- 131 users
- dreamfusion3d.github.io
- テクノロジー
- 2022/09/30
Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image
- AI
- 3DCG
- あとで読む
- 画像生成
- 3d
- デザイン
画像生成AI　速いマシンは世界が違う (1/4)
- 129 users
- ascii.jp
- テクノロジー
- 2023/04/02
「Stable Diffusion」のような画像生成AIは、ゲーム開発の場面で実際に使い物になるのでしょうか。マウスコンピューターのクリエイター向けPC「DAIV」のDAIV DD-I9G90（NVIDIA GeForce RTX 4090搭載）とDAIV DD-I7N60（NVIDIA RTX A6000搭載）を比較しながら、筆者が開発に関わるインディゲーム「Project-GENESIS」での背景のプロトタイプ制作を通じて、その可能性を探りました。画像の出力（生成）速度だけであればRTX 4090に圧倒的に軍配が上がりますが、複数のアプリをまたがった作業をする場合にはVRAM（ビデオメモリ）搭載量が48GBと多いRTX A6000が生産性を高めると考えて良さそうです。コンピュータの世界ではいつの時代も「速さは正義」であることを、画像生成AIを実践で使おうとして改めて痛感しました。 2機
写真の手前に映りこむ“邪魔もの”を消し去る技術　台湾大学やGoogleなどが開発
- 127 users
- www.itmedia.co.jp
- テクノロジー
- 2021/03/22
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。台湾大学、米Google、米カリフォルニア・マーセッド大学、米バージニア工科大学による研究チームが開発した「Learning to See Through Obstructions」は、画像内の手前に映りこんだ不要な障害物を除去する、機械学習ベースの技術だ。窓越しに撮影したときの水滴やガラスの反射、被写体の手前にあるフェンスなどを自然に消すことができる。背景にある対象物と障害物要素はそれぞれのレイヤーがカメラに対して異なる深度に位置しているため、撮影した画像では2つのレイヤー間で動きが異なる。フレームごとに視点がずれるよう連続に複数枚撮影することで発生する背景と映り込み箇所の位置ずれ量の
- 技術
- 写真
- あとで読む
- 画像
- 機械学習
- 画像処理
- カメラ
- AI
- 研究
DALL·E 2 を早くも破る！超リアル画像生成モデル Imagen を解説
- 125 users
- ja.stateofaiguides.com
- テクノロジー
- 2022/06/09
OpenCVをNPPにした結果→10倍高速に！
- 123 users
- zenn.dev/turing_motors
- テクノロジー
- 2023/02/03
この記事は「自動運転システムをエッジデバイスに組み込むための技術」を3回に分けて紹介するTURINGのテックブログ連載の第2回の記事「OpenCVをNPPにした結果→10倍高速に！」です。第1回の「C++でOpenCV完全入門！」、第3回の「詳解V4L2 (video for linux 2)」もぜひご覧ください！はじめに TURINGで働いている木更津高専の越智です。TURINGでは「We Overtake Tesla」を目標に掲げて、完全自動運転EVの開発・製造を行っています。 TURINGでは、社内で使っている自動運転ソフトウェアにおいて、画像処理部分のライブラリをOpenCVからNVIDIA Performance Primitives(NPP)に変更するプロジェクトに取り組んでいました。これによって、CPUで動かしていた画像処理をGPUバックエンドで動かすことができるようにな
- OpenCV
- NPP
- あとで読む
- GPU
- 画像処理
- CPU
- 画像
- コンピュータ
- 研究
1枚の写真から「存在しないそっくりさん」をAIが自動的に作り出してくれる「Artbreeder」を使ってみた
- 122 users
- gigazine.net
- テクノロジー
- 2020/05/12
自分がアップロードした写真からAIが「存在しないそっくりさん」を作り出してくれ、アップロードした写真を別の人物と掛け合わせたり、人物写真の人種・性別・年齢などを細かく調整したりすることも可能な「Artbreeder」が公開中です。敵対的生成ネットワーク(GAN)を利用しており、無料で使用することが可能で、ポートレート以外にも風景画やアニメキャラなども作成できるというネットサービスを実際に使ってみました。 Artbreeder https://artbreeder.com/ まずは上記URLにアクセスして「Start」をクリック。 Googleアカウントでもサインインできますが、今回はアカウントを作成していくため「Make an account」をクリック。ユーザー名・メールアドレス・パスワードを入力し、チェックボックスにチェックを入れたら「Register」をクリック。するとこんな感じ
- AI
- 機械学習
- 画像
- webサービス
- 写真
- あとで読む
- サービス
【iPad / iPhone Proシリーズ】LiDAR 3Dスキャンアプリ記事まとめ | STYLY
- 120 users
- styly.cc
- テクノロジー
- 2022/01/11
- LiDAR
- あとで読む
- AR
- iphone
- 3d
- アプリ
- XR
- ipad
- ios
- 3DCG
Stick Figure Recorder
- 119 users
- stickfigure-recorder.web.app
- テクノロジー
- 2021/03/16
Create animated stick figure gifs by recording youself with your webcam!
- webサービス
- 画像処理
- webservice
- AI
- animation
- generator
- browser
- create
- GIF
- ジェネレータ
AIによる過去記事リバイバル始めました :: デイリーポータルZ
- 118 users
- dailyportalz.jp
- テクノロジー
- 2021/10/24
こんにちは、デイリーポータルＺ編集部石川です。デイリーポータルＺは今年19周年を迎えたよみものサイトで、多すぎてもはや忘れましたが１万本だか２万本だかの過去記事アーカイブを保有しています。例えばこれなんかは2005年のヒット記事。納豆を一万回混ぜるよりサイドバー等のガワはちょっとずつ変えつつも、本文部分はHTMLごと当時のものがいまだ使用されています。時事ネタを載せているニュースサイトと違って、いま読んでも楽しんでいただける記事が多いと自負しています。納豆は2005年も2021年も変わらず納豆ですからね。書き手としても、自分で書いた記事でも15年くらいたつとすっかり忘れてるので、フレッシュな気持ちで読み返せます。しかしいま読むにはいかんせん、画像が小さい！ネット回線も細かったし、なんたってモニタの解像度が1080ピクセルとかだったころのページです。現代のモニタで見ると、ほと
WEB特集「くずし字」ＡＩが解読ラーメン判別法も応用！ | NHKニュース
- 118 users
- www3.nhk.or.jp
- テクノロジー
- 2019/12/02
くずし字の解読は、文学や歴史学など「文系」の専門家の領域ですが、ＡＩの開発は、日頃プログラミングやシステムの開発に携わる「理系」の研究者が得意とするところです。そのうちの１人、国際コンペに参加した福岡県の土井賢治さんを訪ねました。土井さんはＩＴ企業のエンジニアで、ネットオークションに出品された商品が本物か偽物かを、投稿された画像から判断するシステムの構築に携わっています。くずし字は「存在を知っている程度」だったということで、みずから読むことはできません。そんな土井さんが今回のコンペに参加した理由を聞いてみると、意外なきっかけがあったことが分かりました。「ラーメンの画像から店を当てるシステム」を応用できると考えたというのです。土井さんは、ＳＮＳに投稿されたラーメンの画像がどこの店舗で出されたのかを、数万枚の画像データをもとにＡＩが予測するシステムを運営していて、ファンの間で人気となっ
- AI
- あとで読む
- 技術
- 人工知能
- 文化
- 歴史
- 画像
絵描きAIって仕事で使える所までいくんかね？
- 116 users
- anond.hatelabo.jp
- テクノロジー
- 2022/11/07
絵描きの民主化だと言われているが、画像掲示板のネタか、政治家揶揄するための画像作り、くらいにしかなってない。そしてそれすら皆飽きるの早くて、書き込み量も減ってきている。 NovelAIでも1ヶ月経ち、サブスク登録した人も辞めていっている。ネット上からかなりの量の画像を学習させているわけだが、お金が取れるクオリティの画像は少なく、結局の所ノイズにしかなっていない。調整しようとしているパラメータに対して、自然言語だけでは調整しきれてないし、毎回違う画像が出てきてしまっている。リコメンド機能もまだない。レイヤー構造もまだない。解像度も足りない。次々と技術は出てきて、何かできそうだという感じはあるが、多額を注ぎ込んでも、ここまでしか出来ず、毎回学習に金がかかるのなら回収できそうにないとか、金額もある。
- AI
- 人工知能
- あとで読む
- 画像
- イラスト
- 技術
- 増田