並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 174件

新着順 人気順

"Computer Vision"の検索結果1 - 40 件 / 174件

"Computer Vision"に関するエントリは174件あります。 AI人工知能画像 などが関連タグです。 人気エントリには 『画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)』などがあります。
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

      画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
    • 【初心者向け】iPhone 3Dスキャンパーフェクトガイド|iwama

      内容の大幅更新を行ったため現在は上記リンクが最新の内容となっています。 こんにちはiPhone3Dスキャンを日本中に普及させる男ことiwamaです。 2020年の10月にiPnone12Proシリーズに初めてLiDARセンサーが搭載され、現在では様々な業界でiPhoneの3Dスキャンが活躍し始めています。 そこで今回はiPhone3Dスキャンって何?でどういうアプリがあるの?などの初心者向けの解説を行っていこうと思います。 ※この記事は2024年5月11日に更新作業を行なっています。 3Dスキャンについて学ぼうそもそも3Dスキャンって何?現実にある物体や空間をデジタル3Dデータ化する技術の事を(このnote内では)3Dスキャンといいます。 3Dスキャン技術には様々なモノが存在していますが今回はその中でもiPhoneで行える3Dスキャン技術である2種をざっくり解説していきたいと思います。 フ

        【初心者向け】iPhone 3Dスキャンパーフェクトガイド|iwama
      • iPhoneで始める3Dスキャン生活|iwama

        皆さん!3Dスキャンしてますかーーーーー!? どうもiPhone3Dスキャン大好きおじさんです。今回はiPhoneで始める3Dスキャンというお話をしていこうと思います。 iPad Pro(2020)にLiDARセンサーが搭載されたことで3Dスキャンが誰でも出来る時代が到来しました。 ただいきなりiPhoneやiPadで3Dスキャンができるよ!と言われてもピンとこない方が大半だと思うので、今回のnoteでは簡単な3Dスキャン技術の紹介からスキャンアプリ、スキャン方法などを説明していこうと思います。 3Dスキャンのざっくりとした区分まず3Dスキャンとは何なのかという話ですが、3Dスキャンとは現実にある物体を様々な手法でスキャンし、それをコンピュータ上で再現することだと個人的に思っています(もしかしたら違うかも) 3Dスキャンの方法としては、写真から3Dモデルを作成するフォトグラメトリとレーザー

          iPhoneで始める3Dスキャン生活|iwama
        • 伊藤園「おーいお茶」CMに生成したAIタレントを起用

          sponsored 手軽なのに安心なサイバーセキュリティ対策「QTクイックセキュリティアセスメントサービスpowered by KDSec」 自社のセキュリティ対策の弱点を2週間で可視化 中小企業向け問診型のセキュリティ診断 sponsored 気軽に着けられるサイズと価格、最長14日間の動作や充実の睡眠モニタリングなどが特長 人気スマートバンドがさらに魅力的に進化! ファーウェイ「HUAWEI Band 10」レビュー sponsored JN-i238G200F-HSP-Wをレビュー 200Hzの23.8型ゲーミングディスプレーが2万980円!? さすがに安すぎるけど大丈夫? sponsored Wi-Fi 7対応の「Archer BE450」「Archer BE220」、便利なスマートリモコン「Tapo H110」 Wi-Fi 7ルーターで一番売れてたTP-Link! Amazon限

            伊藤園「おーいお茶」CMに生成したAIタレントを起用
          • 距離センサ入門(ステレオカメラ、プロジェクション、LiDAR) - arutema47's blog

            Qiitaからのお引越し記事です。 目標 ステレオカメラ 概要 特徴 使用製品 パターンプロジェクションカメラ 概要 使用製品 iPhone ゾゾスーツ 工業製品(Ensenso, キーエンス) Time of Flight LiDAR Time of Flightの原理 特徴 スキャン型LiDAR フラッシュ型LiDAR 製品 Velodyne Series 追記 Livox Horizon iPhone iToF LiDAR 目標 通常のカメラは物体の明るさ、色を抽出するのに対し、距離センサは物体までの距離をセンシングします。そのため3DカメラやDepth Sensorなどと呼ばれたりします。 距離を知ることは多様なアプリケーションにおいて重要であり、例えば自動運転では前方車両までの正確な距離を知ることは必須です。またゲームなどのアプリケーションでは人の動作などを距離センサで抽出するK

              距離センサ入門(ステレオカメラ、プロジェクション、LiDAR) - arutema47's blog
            • 「売れなかった」ハムサンド、カメラ50台で真相解明 高輪GW駅「無人決済コンビニ」の実力

              「売れなかった」ハムサンド、カメラ50台で真相解明 高輪GW駅「無人決済コンビニ」の実力:開業から3カ月、成果は(1/3 ページ) 2020年3月14日に開業したJR山手線・京浜東北線の高輪ゲートウェイ駅。山手線の新駅としては約50年ぶりとなるだけに注目度は高く、開業初日には多くの観光客も訪れた。その一角で、注目を集めている店舗がある。AI(人工知能)技術を活用した無人コンビニ店舗「TOUCH TO GO」だ。有人レジはなく、来店客は店内で商品を手に取り、出口付近で「Suica」などを読み取り機にかざすだけで買い物を済ませられる。 こうした無人決済店舗は、米国では「Amazon Go」をはじめ実用化された例があるが、日本では長らく実験段階にとどまっていた。そうした中、TOUCH TO GOは国内では珍しい実用化事例として小売・流通業界はもちろん、他業界からも高い注目を集めている。無人もしく

                「売れなかった」ハムサンド、カメラ50台で真相解明 高輪GW駅「無人決済コンビニ」の実力
              • バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に

                ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。 バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。 一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。 関連記事 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。

                  バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に
                • 年末年始に振り返る 2021年の人工知能10大トレンドと必読論文

                    年末年始に振り返る 2021年の人工知能10大トレンドと必読論文
                  • Techable(テッカブル) - サイト閉鎖のお知らせ

                    Techable サイト閉鎖のお知らせ 長らくのご利用、誠にありがとうございました。 当サイトは2024年12月31日をもちまして閉鎖いたしました。 これまでのご支援に心より感謝申し上げます。

                      Techable(テッカブル) - サイト閉鎖のお知らせ
                    • AI素材.com

                      公式コラボAI素材の利用が可能 「いらすとや」 をはじめとした公式コラボAI素材も利用することができます(今後も順次増えていく予定)。

                        AI素材.com
                      • 文化庁の「AIと著作権」の解釈が話題に AIに詳しい弁護士「かなり踏み込んだ内容」

                        内閣府が公開している資料「AIと著作権の関係等について」がTwitterで話題になっている。文化庁が制作した資料で、5月15日に開催した内閣府のAI戦略チームの会議で使用されたもので、AIと著作権に関する現行法での見解などをまとめている。6月3日頃からTwitter上で話題になっており、AIに詳しい弁護士も「かなり踏み込んだ内容」と見解を述べている。 同資料では、著作権の役割は「『思想又は感情を創作的に表現した』著作物を保護するもの」と指摘。データ(事実)やアイデア(作風や画風)は著作物に含まれないという。 この上で、AIと著作権の関係は「生成・利用段階」と「AI開発・学習段階」を分けて考えるべきと説明している。AIが生成した画像などを公開したり、そのイラスト集を販売したりする場合は、通常の著作権侵害と同様の法が適当される。AI画像と既存の著作物との類似性や依拠性(既存の著作物を基に創作し

                          文化庁の「AIと著作権」の解釈が話題に AIに詳しい弁護士「かなり踏み込んだ内容」
                        • Google・Niantic・Appleが相次いで仕掛ける「VPS」とはなにか【西田宗千佳のイマトミライ】

                            Google・Niantic・Appleが相次いで仕掛ける「VPS」とはなにか【西田宗千佳のイマトミライ】
                          • OCR処理プログラム及び学習用データセットの公開について | NDLラボ

                            2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/

                            • 熊本大学とTOPPAN、くずし字AI-OCRで未解読だった「細川家文書」約5万枚の解読に成功。検索システムも構築

                                熊本大学とTOPPAN、くずし字AI-OCRで未解読だった「細川家文書」約5万枚の解読に成功。検索システムも構築 
                              • Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース

                                  Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース
                                • AI生成作品に対する、FANBOXにおける今後の対応|pixivFANBOX公式|pixivFANBOX

                                  いつもFANBOXをご利用いただきありがとうございます。 現在、FANBOXにおけるAI生成作品の取り扱いに関して多くのご意見をいただいております。急激に発展している技術への対応が追いついておらず、皆さまにご迷惑をおかけしていることを深くお詫び申し上げます。 皆さまからのご意見や現状を考慮し、私たちFANBOX運営の...

                                    AI生成作品に対する、FANBOXにおける今後の対応|pixivFANBOX公式|pixivFANBOX
                                  • ラズパイで画像認識、1日30円~のエッジAIが快進撃

                                    3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ企業がある。今年で創業5年になるIdein(イデイン、東京都千代田区)だ。「第1回 AI・人工知能EXPO【秋】」(幕張メッセ、10月28~30日)に出展した同社のブースを取材した。

                                      ラズパイで画像認識、1日30円~のエッジAIが快進撃
                                    • ついにPhotoshopへ驚異的AI機能「ジェネレーティブ塗りつぶし」追加へ、「画像の続きを生成する機能」「被写体を生成して画像内に追加」などができベータ版で利用OK

                                      Adobeが画像編集アプリ「Photoshop」にジェネレーティブAI「Firefly」を統合し、AI機能「ジェネレーティブ塗りつぶし」を追加することを発表しました。「ジェネレーティブ塗りつぶし」では「画像の続きを生成」「画像の一部をAIで生成した画像に置き換え」といった操作を実現可能です。 アドビ | Adobe https://www.adobe.com/jp/ Photoshopに搭載されるAI機能「ジェネレーティブ塗りつぶし」はこんな感じ - YouTube 「ジェネレーティブ塗りつぶし」の実例こんな感じ。まず、画像の一部を選択状態にします。 続いて「Generative Fill(ジェネレーティブ塗りつぶし)」をクリック。 すると、道路上のタイヤ痕が消えました。 続いて道路の中央部分を選択。 「yellow road lines(黄色い車線)」と入力して「Generate」をクリ

                                        ついにPhotoshopへ驚異的AI機能「ジェネレーティブ塗りつぶし」追加へ、「画像の続きを生成する機能」「被写体を生成して画像内に追加」などができベータ版で利用OK
                                      • 商用利用OKの画像生成AI「Emi」公開 クリエイターと対話して開発、無断転載画像不使用

                                        「AIいらすとや」など、権利クリアな画像生成AIを開発してきたAI Picasso社は、アニメ・マンガ風のイラストを生成できる画像生成AI「Emi」(Ethereal master of illustration)を9月25日に無償公開した。 Stable Diffusionベース。追加学習で無断転載画像を学習させておらず、権利がクリアな点が特徴。商用利用も可能だ。 Stable Diffusion XL 1.0と NVIDIAのGPU「H100」に、同社のノウハウを組み合わせて開発。最近の画風になるよう調整した。 追加学習に「Danbooru」などの無断転載サイトを使っていない。クリエイターの意見を聞きながら開発したという。 同社の従来のモデルと異なり商用利用可能にした。画像生成AI普及に伴い、創作業界に悪影響を及ぼさないようマナーを守る人が増えてきたことや、他の画像生成AIが商用可能な

                                          商用利用OKの画像生成AI「Emi」公開 クリエイターと対話して開発、無断転載画像不使用
                                        • 落書きを即3Dモデル化、つまんで動かし即アニメーションに Googleなど「Monster Mash」開発

                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 チェコ工科大学、米Google Research、スイス・チューリッヒ工科大学による研究チームが開発した「Monster Mash」は、手描きスケッチでモデリングとアニメーションを手軽に行えるツールだ。落書きのように大ざっぱに描いた絵から3Dモデルを素早く展開し、キャラクターの一部をつまんで移動させるだけでリアルタイムにアニメーションを作成できる。

                                            落書きを即3Dモデル化、つまんで動かし即アニメーションに Googleなど「Monster Mash」開発
                                          • 東京都が「デジタルツイン3Dビューア(β版)」を無料開放ーー23区の高精度点群データを公開、誰でもブラウザで東京を自由に探索可能 | Ledge.ai

                                            Top > 公共 > 東京都が「デジタルツイン3Dビューア(β版)」を無料開放ーー23区の高精度点群データを公開、誰でもブラウザで東京を自由に探索可能

                                              東京都が「デジタルツイン3Dビューア(β版)」を無料開放ーー23区の高精度点群データを公開、誰でもブラウザで東京を自由に探索可能 | Ledge.ai
                                            • 日本の警察は、今年3月から防犯カメラやSNSの画像を顔認証システムで照合していた

                                              全国の警察で3月から民間の防犯カメラやSNSの画像を顔認証システムで照合していた......  (写真とは関連がありません) REUTERS/Thomas Peter <全国の警察で3月から民間の防犯カメラやSNSの画像を顔認証システムで照合していたことを共同通信が報じた......> 前々回の記事「日本の警察は世界でも類を見ない巨大な顔認証監視網を持つことになるのか?」では、顔認証システムの拡充が進んでいることと、警視庁がリアルタイムで民間の監視カメラを一元管理し、顔認証システムで識別するシステムを持っていることをご紹介し、今後さらに拡充されていく可能性を指摘した。 それを裏付けるように9月12日に共同通信が全国の警察で3月から民間の防犯カメラやSNSの画像を顔認証システムで照合していたことを報じた(47NEWS、2020年9月13日)。日本の先を行くアメリカで顔認証システムの利用の見直

                                                日本の警察は、今年3月から防犯カメラやSNSの画像を顔認証システムで照合していた
                                              • トランプ氏が歌手テイラー・スウィフトさんの偽画像投稿 支持装う | 毎日新聞

                                                トランプ前大統領のソーシャルメディアへの投稿。左下の画像では、人気歌手のテイラー・スウィフトさんに似た女性がトランプ氏への投票を呼び掛けている=トゥルース・ソーシャルより 米国のトランプ前大統領が自身のソーシャルメディアで、人気アーティストのテイラー・スウィフトさんがトランプ氏を支持しているように見える偽画像を共有した。米メディアは、画像は人工知能(AI)で生成された可能性があると伝えている。 トランプ氏が18日に「トゥルース・ソーシャル」で共有した画像は、スウィフトさんに酷似した女性がアンクル・サム(米国を擬人化したキャラクター)に扮(ふん)し、「テイラーは、あなたがドナルド・トランプに投票することを望む」という文章が添えられている。 若い女性を中心に絶大な人気を誇るスウィフトさんは、女性の権利や多様性を重視し、「スウィフティーズ」と呼ばれるファンの忠実さと強い団結力でも知られる。トラン

                                                  トランプ氏が歌手テイラー・スウィフトさんの偽画像投稿 支持装う | 毎日新聞
                                                • コンピュータビジョン今昔物語 - 深層学習がCVの世界をどう変えたか - (JPTA Tech Talk講演資料) - takminの書きっぱなし備忘録 @はてなブログ

                                                  今回、CV勉強会に何度か参加&発表していただいたJin Yamanakaさんにお誘いいただき、JTPA (Japan Technology Professional Association)というところで、「コンピュータビジョン今昔物語 -深層学習がCVの世界をどう変えたか-」という大上段なタイトルで講演させていただきました。 www.meetup.com このJTPAのTech Talkでは、機械学習/深層学習の勉強会を開催してきたそうなのですが、私自身「これ」という深層学習の専門があるわけではないので、コンピュータビジョン全体の基礎的な技術の変遷を、深層学習と絡めて広く浅く網羅した話をさせていただきました。 ちなみにここで紹介した深層学習の技術は、「既存の技術を置き換えるために、深層学習は何をクリアしなくてはならないか?」という視点で、紹介するのが適当と思ったものを選んだつもりです。

                                                    コンピュータビジョン今昔物語 - 深層学習がCVの世界をどう変えたか - (JPTA Tech Talk講演資料) - takminの書きっぱなし備忘録 @はてなブログ
                                                  • Teslaにおけるコンピュータビジョン技術の調査

                                                    2. Mobility Technologies Co., Ltd. 宮澤 一之 株式会社Mobility Technologies AI技術開発部 AI研究開発第二グループ グループリーダー 経歴 April 2019 - March 2020 AI研究開発エンジニア@DeNA April 2010 - March 2019 研究員@三菱電機 March 2010 博士@東北大学 自己紹介 2 @kzykmyzw 3. Mobility Technologies Co., Ltd. 3 2014年10月:Autopilot誕生 2015年10月:「バージョン7.0」リリース 2016年01月:Summonベータ版をリリース 2016年10月:第2世代のハードウェアを全車種搭載へ 2018年10月:Autopilotにナビゲーション機能追加 2019年09月:Smart Summon機能リ

                                                      Teslaにおけるコンピュータビジョン技術の調査
                                                    • LiDARのないiPhoneで3Dスキャン可能に 米Nianticの「Scaniverse」

                                                      「Pokemon GO」(ポケモンGO)などのARゲームで知られる米Nianticは9月14日(現地時間)、iOS向け3Dスキャンアプリ「Scaniverse」がLiDARを持たないiPhoneにも対応すると発表した。iPhone XS以降の全てのiPhoneと過去4年間に発売されたほとんどのiPadで利用できるという。 LiDARに代わり、ニューラルネットワークを活用してカメラ画像から奥行きを推測する「ManyDepth」技術を搭載した。建物など大きな空間に適した「Areaモード」と人物やオブジェクトの細部を捉える「Detailモード」があり、DetailモードならScaniverseフォトグラメトリ処理を活用してLiDAR搭載デバイスと同等の高品位なスキャン結果が得られるとしている。 「LiDARを搭載していない端末でもScaniverseを利用したいという要望が多かった。(ManyD

                                                        LiDARのないiPhoneで3Dスキャン可能に 米Nianticの「Scaniverse」
                                                      • “レジのないスーパー”オープン 商品手に店出れば買い物終了 | NHKニュース

                                                        新型コロナウイルスの感染拡大が続く中、スマートフォンを持って入店し買いたい商品を手に取り店を出るだけで買い物を終えられる、レジのないスーパーがオープンしました。 この店舗はダイエーとNTTデータが、江東区にあるNTTデータの社内にオープンさせました。 店内にはレジがないのが特徴で、客はスマートフォンにQRコードを表示させて入店し買いたい商品を手に取って店を出ると、あらかじめ登録したクレジットカードで支払いを終えることができます。 客が購入した商品は、店内の32台のカメラと商品の棚に搭載された重さを量るセンサーで把握する仕組みになっています。 また弁当などの値引き情報を客のスマホに送る機能もあり、店員が値引きを知らせるシールを商品に貼る手間も省けるということです。 両社はこの店で課題などを検証し、今後こうした店を増やしていきたいとしています。 NTTデータの内山尚幸SDDX事業部長は「マンシ

                                                          “レジのないスーパー”オープン 商品手に店出れば買い物終了 | NHKニュース
                                                        • 無料で写真から3Dプリント出力可能なモデルを生成できるオープンソースの3D再構築ソフト「Meshroom」

                                                          3D再構成とカメラ追跡アルゴリズムを提供するフォトグラメトリフレームワークのAliceVisionに基づくオープンソースの3D再構成ソフトが「Meshroom」です。MeshroomはWindowsとLinux向けにリリースされており、無料でインストールすることができます。 AliceVision | Meshroom - 3D Reconstruction Software https://alicevision.org/#meshroom Meshroomがどんなソフトなのかは以下のムービーを見ればよくわかります。 Photogrammetry 2 – 3D scanning with just PHONE/CAMERA simpler, better than ever! - YouTube Meshroomは複数の大学やラボの協力によって開発された、フォトグラメトリソフトウェアです

                                                            無料で写真から3Dプリント出力可能なモデルを生成できるオープンソースの3D再構築ソフト「Meshroom」
                                                          • 研究ツールまとめ2023|cvpaper.challenge

                                                            はじめに今年の夏, MIRU 2023 チュートリアルにて「CVPR 2023 速報」[Full ver.] [MIRU ver.]を発表させて頂きました. MIRU2023会期中, 非常に辛(から)かった飲み会の席にて偶然にも面白いB4の学生さん(Oさん)とお話する機会がありました.その出会いをきっかけに, Oさんとは共同主著を前提として共同研究を実施させて頂くことになりました. もちろん, OさんはB4の学生さんということもあり, 初めての研究でコーディング未経験という状態からのスタートです. かねがね, cvpaper.challenge研究メンバーとしても, 極めて変化の激しいコンピュータビジョン分野にてトレンドを創出するためには, どのように効率的に研究を進めていけば良いのか, 研究メンバーのプレゼンスを最大化するための方法論については片岡さんとも相談を重ねていました. また,

                                                              研究ツールまとめ2023|cvpaper.challenge
                                                            • 商用可、「いらすとや」風の画像をAIが生成してくれる「AIいらすとや」がリリース/月額1,480円。無料で試すことも可能

                                                                商用可、「いらすとや」風の画像をAIが生成してくれる「AIいらすとや」がリリース/月額1,480円。無料で試すことも可能
                                                              • Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】 - Qiita

                                                                Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】RaspberryPiTensorflowLitexnnpack 1. はじめに 今から半年前の2020年6月、ラズパイ4上でTensorFlow Liteを使った様々なAI認識アプリを動かしてみて、その動作速度をまとめました。 当時のTensorFlowはバージョン2.2でしたが、現在は 2.4(rc4) へと進んでいます。進化が極めて速いDeepLearningの世界において、この半年間でTensorFlow Liteはどう変化したでしょうか。もし「手持ちのアプリは何も変えてないのに、TensorFlow Liteを新しくするだけでめっちゃ速く動くようになったぜ」というのだと嬉しいですよね。 本記事では、前回計測に用いたアプリを再び最新版のTensorFlow Lite環

                                                                  Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】 - Qiita
                                                                • AI作品の取り扱い一時停止について  | ファンティア スポットライト[Fantia Spotlight]

                                                                  いつもファンティアをご利用いただきありがとうございます。 ファンティア運営事務局です。 ファンティアでは2022年10月25日よりAI作品専用のカテゴリを新設し、AI作品を分けて表示する等の取り組みを行って参りました。 しかし、昨今の状況を鑑み、クリエイター様とその作品を守る対応が必要と考え、 ファンティアではAI生成による作品の取り扱いを一時停止させていただく運びとなりました。 今後、利用規約の改定とAI生成による作品の審査の見直しを行って参ります。 方針が決まり次第、利用規約改定のお知らせとともに、皆様にはご連絡をさせていただきます。 AIカテゴリにおいて活動いただいていたクリエイター様にはご迷惑をおかけする形となり、大変申し訳ございません。 何卒ご理解のほど、よろしくお願いいたします。 今後ともファンティアをよろしくお願いいたします。

                                                                    AI作品の取り扱い一時停止について  | ファンティア スポットライト[Fantia Spotlight]
                                                                  • Stable Diffusion発! 画像生成ブームに見るジェネラティブAIの人・もの・お金事情 - NTT Communications Engineers' Blog

                                                                    この記事は NTTコミュニケーションズ Advent Calendar 2022 18日目です…が、少々遅れてお届けします。 はじめに PS本 5G&IoTサービス部 増田です。Advent Calendar参加も(たぶん)3年目となりました。 「テキスト指示をもとに、AIがお好みの画像を生成する(Text-to-Image)」「今ある画像へ、テキスト指示で編集を加える(Image-to-Image)」 -- そんな画像生成AIが注目を集めています。2022年の上半期、Open AIによるDALL-E 2の公開、Midjourneyの登場と盛り上がりを見せました。2022年8月23日のStable Diffusion一般公開からは、使ってみた報告、従来研究との融合、商用プロダクト応用と、研究者、アーティスト、プログラマなど様々な人の参加により、界隈はさらに活気づいています。 画像生成AIの

                                                                      Stable Diffusion発! 画像生成ブームに見るジェネラティブAIの人・もの・お金事情 - NTT Communications Engineers' Blog
                                                                    • 数ミリ単位での位置情報取得が可能な「Micro-GPS」が開発される

                                                                      GPSは、スマートフォンや自動車、ドローンなどの位置情報取得に用いられていますが、「室内では位置情報を取得しづらい」「数mm単位での位置情報取得は難しい」といった問題が存在します。そんな中、アメリカ・プリンストン大学の研究チームが地面の情報をスキャンすることで非常に高精度な位置情報を取得するシステム「Micro-GPS」を開発しました。 High-Precision Localization Using Ground Texture https://arxiv.org/abs/1710.10687 Micro-GPS https://microgps.cs.princeton.edu/ Micro-GPSは地面の模様データを基に位置情報を数mm単位で認識可能。以下のムービーではMicro-GPSの仕組みが解説されています。 Micro-GPS ICRA2019 - YouTube Amaz

                                                                        数ミリ単位での位置情報取得が可能な「Micro-GPS」が開発される
                                                                      • iPhoneの自撮りで本物そっくりな動く3Dリアルアバター 米Metaが技術開発

                                                                        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米MetaのReality Labsの研究チームが開発した「Authentic Volumetric Avatars from a Phone Scan」は、スマートフォンで自撮りした短時間のスキャン画像から、本物そっくりの3D頭部アバターを生成するシステムだ。異なる視点やフォトリアリスティックな表情を表現し、高い忠実度で再現する。 現在、実在する人物のアバターを作成するためには膨大な人物データを取得する必要があり、そのデータを収集するには大規模なマルチビューキャプチャーシステムを必要とする。そのため軽量なデータキャプチャー、低遅延、許容できる品質でのアバター作成プロセスを自動化することが

                                                                          iPhoneの自撮りで本物そっくりな動く3Dリアルアバター 米Metaが技術開発
                                                                        • 動く人をリアルに着せ替え合成 揺れる服の動きも詳細に再現

                                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 独ブラウンシュヴァイク工科大学と独Max Planck Institute for Informaticsによる研究チームが開発した「High-Fidelity Neural Human Motion Transfer from Monocular Video」は、人物と服の細かな動きを別の人物に転写する深層学習フレームワークだ。動きに合わせて揺れる衣服のシワやひだなども忠実に再現し合成する。 今回のフレームワークは、ソース映像の人物の動きだけをターゲット映像の人物に転送し、それに伴う衣服の副次的動作も含めた写実的なアニメーション合成を目指す。 映像生成フレームワークは、4種類の深層学習ネ

                                                                            動く人をリアルに着せ替え合成 揺れる服の動きも詳細に再現
                                                                          • 動画生成AI「Dream Machine」の衝撃、グーグルは「Veo」で対抗、注目されるLumaAIとは

                                                                            Soraで短編映画、一部広告動画は炎上 OpenAIのSoraが2024年2月に発表されて以来、動画生成AIをめぐる動きが活発化している。Soraは非公開のまま一部のクリエイターにのみ提供されている状況だが、著名クリエイターや大手企業によるプロジェクトが次々と公開されている。 2024年6月に開催されたトライベッカ映画祭では、Soraを使用して制作された複数の短編映画が上映された。さらに、2024年5月初旬には、映像クリエイターのポール・トリロ氏がSoraを使用して制作したウォッシュド・アウトのAIミュージックビデオが公開され、話題となった。 また、玩具大手のトイザらスは2024年6月24日、OpenAIのSoraを使用して制作した初の商業広告を公開した。この広告は、トイザらスの創業者チャールズ・ラザラス氏の幼少期と、同社のマスコットであるジェフリー・ザ・ジラフをAIで再現したものだ。 ト

                                                                              動画生成AI「Dream Machine」の衝撃、グーグルは「Veo」で対抗、注目されるLumaAIとは
                                                                            • Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり

                                                                              Googleの研究チームが動画生成AI「Lumiere」を2024年1月24日(水)に発表しました。Lumiereではフレーム同士が自然につながった違和感の少ない動画を生成可能で、テキストや画像を入力して動画を生成できるほか、動画の一部分を指定して別の動画に置き換えたり、写真の一部分だけを動かしたりといった操作も可能です。 Lumiere https://lumiere-video.github.io/ テキストや画像を入力して動画を生成できるAIは数多く存在していますが、それらのAIの多くは「フレームを複数枚生成し、フレーム同士を補間する」という手法で動画を生成しているため、フレーム同士のつながりが不自然になりがちです。一方で、Lumiereは「動画全体のフレームを一度に生成する」という手法を採用しており、フレーム同士のつながりが自然で違和感の少ない動画を生成可能。生成可能な動画のフレー

                                                                                Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
                                                                              • ファミマ「無人店」1000店 規制の壁打開、全国展開 - 日本経済新聞

                                                                                ファミリーマートは無人のコンビニエンスストア店舗を2024年度末までに約1000店出す。通常店舗と同様に約3000品目の扱いが可能だ。本格的な無人店の大規模展開は日本で初めて。これまでは店舗に人の常駐を求める規制が足かせになっていたが20年にルールが緩和された。人口減少で日本の人手不足は今後深刻さを増す。デジタル技術で事業運営を効率化する動きが広がる。日本の労働生産性は主要7カ国(G7)中最低

                                                                                  ファミマ「無人店」1000店 規制の壁打開、全国展開 - 日本経済新聞
                                                                                • 物体検出のDeepLearning読むべき論文7選とポイントまとめ【EfficientDetまでの道筋】 - Qiita

                                                                                  Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? お久しぶりです。 2012年のHintonさんのAlexNetによるILSVRCでの圧勝を皮切りに、画像認識の世界でもDeepLearningが脚光を浴びることとなりました。 物体検出の世界でも現在DeepLearningを用いたモデルが主流になっています。 https://paperswithcode.com/sota/object-detection-on-coco を見ると、 COCO test-devにおいて、state-of-the-art(SoTA)のモデルはEfficientDet-D7xのようです。 独断と偏見も少々あり

                                                                                    物体検出のDeepLearning読むべき論文7選とポイントまとめ【EfficientDetまでの道筋】 - Qiita

                                                                                  新着記事