検索対象

並び順

ブックマーク数

期間指定

  • から
  • まで
AIに関するエントリは26574件あります。 人工知能画像大学 などが関連タグです。 最新エントリには 『テキストを入力するだけで3Dモデルを生成できる3D自動生成AI「DreamFusion」』などがあります。

AIの検索結果(絞り込み: 3 users 以上)26574 件中 1 - 40 件目

  • テキストを入力するだけで3Dモデルを生成できる3D自動生成AI「DreamFusion」

    入力したテキストをベースに画像を出力する「Stable Diffusion」のような拡散モデルが流行していますが、このアプローチを進化させて「テキストから3Dモデルの生成」を実現する3D自動生成AI(人工知能)「DreamFusion」の開発にGoogle Researchやカリフォルニア大学バークレー校の研究者たちが取り組んでいます。 DreamFusion: Text-to-3D using 2D Diffusion https://dreamfusion3d.github.io/ 通常、「テキストから3Dモデルを自動生成できるAI」を構築するには、「ラベル付けされた3Dアセットからなる大規模データセット」と「3Dデータのノイズを除去するための効率的なアーキテクチャ」の2つが必要となります。しかし、DreamFusionにはそのどちらも存在しません。DreamFusionでは、事前トレ

    テキストを入力するだけで3Dモデルを生成できる3D自動生成AI「DreamFusion」
    • Metaが動画生成AI「Make A Video」発表、空飛ぶスーパードッグや自画像を描くテディベアの動画を公開

      MetaのAI研究所「Meta AI」が、文字列(プロンプト)を入力するだけで動画を生成するAI「Make A Video」とその成果を発表しました。 Make-A-Video https://makeavideo.studio/ Introducing Make-A-Video: An AI system that generates videos from text https://ai.facebook.com/blog/generative-ai-text-to-video/ Meta AIは2022年7月に、プロンプトと簡単なイラストをもとにハイクオリティ画像を作れる「Make A Scene」を発表しています。 テキストの説明と超ざっくりしたイラストから高クオリティな画像を生成可能な「Make-A-Scene」をMetaが発表 - GIGAZINE 「Make A Video」

      Metaが動画生成AI「Make A Video」発表、空飛ぶスーパードッグや自画像を描くテディベアの動画を公開
      • もしかして認知症かも?電話で無料判定を。 - 中日新聞LINKED

        認知症は誰でもなり得る病気です。 自分自身で気になったり、身近な人の言動に違和感を感じたら、早めに受診することが大切。 そのきっかけとして役立つサービスが始まりました。 AI(人口知能)が認知症の疑いを判定。 これは、NTTコミュニケーションズが始めた電話サービス。 AI=人工知能を活用し、認知症の疑いがあるかどうかを、電話で測定するものです。 電話のガイダンスに従って、その日の日付と、自分の年齢を答えると、AI=人工知能が、声のトーンや回答の速さなど、1000余りの要素を分析。 その場で脳の健康状態をチェックし、認知症の疑いがあるかどうか、音声で結果を伝えてくれます。 来年3月まで無料でサービス。 判定にかかる時間は、およそ1分。軽度の認知症の疑いがあるかどうか、93%の確率でチェックできるそうです。 NTTコミュニケーションズの「脳の健康チェック無料サービス」は、0120-468ー35

        もしかして認知症かも?電話で無料判定を。 - 中日新聞LINKED
        • 自律移動ロボットの「つくばチャレンジ2022」チェックポイント通過や探索対象発見などの課題に挑戦 - ロボスタ ロボスタ - ロボット情報WEBマガジン

          シェア 0 ツイート 0 はてブ 0 つくば市は自律移動ロボットの「つくばチャレンジ2022」開催することを発表した。同チャレンジでは小学生・中学生・高校生を対象とした運営体験者を募集する。運営委員の一員となり、「どのようにしてロボットが自走しているのか」「なぜ壁や動いている車にぶつからずに走行できるのか」などについて、筑波大学等の専門家から直接話を聞くことができる。 共通の課題に対して実世界でしっかり動くロボットを作る 「つくばチャレンジ」は2007年から毎年実施している、つくば市内の市街地で移動ロボットが自律走行する技術チャレンジ。人々が普段使っている実環境(リアルワールド)における自律走行技術の進歩を目的とし、研究者と地域が協力して行う先端技術への挑戦と公開実験の場。様々な組織の研究者が移動ロボットを開発して実験を行い、その結果と経験を互いに共有することにより、技術レベルの向上を目指

          自律移動ロボットの「つくばチャレンジ2022」チェックポイント通過や探索対象発見などの課題に挑戦 - ロボスタ ロボスタ - ロボット情報WEBマガジン
          • ケモナーのためのStable Diffusion画像生成術 その2 ケモノ特化モデル編|キウィー|note

            まずはじめに、前回の記事を読んでくださった皆様。 ありがとうございます。 初めてのnoteへの投稿でどのくらい読まれるか、読みにくくないかなどの不安もありましたが、想像以上の反応をいただけました。 今回はその第二弾の記事になります。 本来はimg2img編を書くつもりだったのですが、ちょっと他の用事をしている間にケモノ特化のモデルが登場していたので先にそちらを紹介します。 この記事では主にモデルを変えたときの出力結果を紹介していきます。 前回のようなPromptの内容についての詳しい解説はしません。 e621, explicit content, kawaii, bangs, black long hair, art by [[hokusai katsushika]], gil elvgren, norman rockwell, thomas kinkade, intricate deta

            ケモナーのためのStable Diffusion画像生成術 その2 ケモノ特化モデル編|キウィー|note
            • やまかず on Twitter: "なんて日..。 テキストから動画を生成するAIの後に、3Dを生成するAIが出てきた。(両方とも過去のものより質が高い) 名前は「DreamFusion」。作者は匿名。 ええ、速すぎる ほんとに何が起きてるの… https://t.co/MAqM4PJUsA"

              なんて日..。 テキストから動画を生成するAIの後に、3Dを生成するAIが出てきた。(両方とも過去のものより質が高い) 名前は「DreamFusion」。作者は匿名。 ええ、速すぎる ほんとに何が起きてるの… https://t.co/MAqM4PJUsA

              やまかず on Twitter: "なんて日..。 テキストから動画を生成するAIの後に、3Dを生成するAIが出てきた。(両方とも過去のものより質が高い) 名前は「DreamFusion」。作者は匿名。 ええ、速すぎる ほんとに何が起きてるの… https://t.co/MAqM4PJUsA"
              • DreamFusion: Text-to-3D using 2D Diffusion

                Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image

                DreamFusion: Text-to-3D using 2D Diffusion
                • Phenaki

                  A model for generating videos from text, with prompts that can change over time, and videos that can be as long as multiple minutes. Read Paper The water is magical Prompts used: A photorealistic teddy bear is swimming in the ocean at San Francisco The teddy bear goes under water The teddy bear keeps swimming under the water with colorful fishes A panda bear is swimming under water Chilling on the

                  • DreamFusion: Text-to-3D using 2D Diffusion

                    Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image

                    • Make-A-Video

                      Make-A-Video is a state-of-the-art AI system that generates videos from text. Make-A-Video research builds on the recent progress made in text-to-image generation technology built to enable text-to-video generation. The system uses images with descriptions to learn what the world looks like and how it is often described. It also uses unlabeled videos to learn how the world moves. With this data, M

                      • “中の人”不要のAI VTuber、バンダイが本格展開 「ガンダムメタバース」でもお出迎え

                        バンダイナムコ研究所が開発した対話AIは多数のコメントから面白いものをピックアップして視聴者を盛り上げる。 バンダイナムコエンターテインメント(東京都港区)は9月29日、バンダイナムコ研究所(東京都江東区)のAI技術を使ってキャラクターがゲーム実況などを行う“AI VTuber”を展開すると発表した。6月からYouTubeで実験的に公開しているゲーム配信チャンネル「ゴー・ラウンド・ゲーム」(ごらんげ)を秋から本格稼働する。 従来のチャットbotは1対1の対話を目的としていたが、バンダイナムコ研究所が開発した対話AIは数百人規模の視聴者が投稿したコメントから「いま取り上げると面白いコメント」をピックアップしてリアクションを返す。「人間のライブ配信者が行っている行動をAIならではの記憶力やテキスト解析力などを組み合わせ、配信を盛り上げる」としている。 ごらんげでは「夕映(ゆは)」「佐鳥ネオン」

                        “中の人”不要のAI VTuber、バンダイが本格展開 「ガンダムメタバース」でもお出迎え
                        • バンナムのAI実況者プロジェクト「プレイBYライブ」発足。ゲームを遊び、コメントを拾い、リアクションを返す人工知能キャラ - AUTOMATON

                          バンダイナムコエンターテインメントは9月29日、AIキャラクターによるライブ配信・実況プロジェクト「プレイBYライブ」の発足を発表した。「ゴー・ラウンド・ゲーム(ごらんげ)」の活動が秋から本格化するほか、ガンダムファン向けのAIキャラクターも登場予定とされている。 「プレイBYライブ」は、“独立したバーチャルキャラクター像の具現化”を掲げる、AI技術を使ったライブ配信・実況プロジェクトである。AIキャラクター向けのゲーム環境で、ディープラーニングを用いたAIキャラクターが視聴者と絡みながらゲームの実況配信などをおこなうという。 システム面の特徴としては、意思決定AI/集団対話AI/音声合成AIの3つが挙げられている。意思決定AIは、ゲームのプレイや攻略をおこなうAIだ。従来のゲーム攻略AIは、プレイヤーの対戦相手や協力相手であった。意思決定AIは配信を前提に、キャラクターらしさや配信が盛り

                          バンナムのAI実況者プロジェクト「プレイBYライブ」発足。ゲームを遊び、コメントを拾い、リアクションを返す人工知能キャラ - AUTOMATON
                          • 20秒程度の電話でAIが認知機能を測定、NTT Comが無償トライアルを提供

                            NTTコミュニケーションズ株式会社は、AIにより認知機能の状態を測定できるサービス「脳の健康チェックフリーダイヤル」の無償トライアルを、世界アルツハイマーデーである2022年9月21日より開始しました。 このAIニュースのポイント NTT ComはAIにより認知機能の状態を測定できる脳の健康チェックフリーダイヤルの無償トライアルを2022年9月21日より開始 発話内容(年齢/日付)と声の質をもとに、AIが認知機能の変化を測定することができる 認知症を取り巻く課題は多岐に渡り、社会的にも大きな課題となっている NTTコミュニケーションズ株式会社(以下NTT Com)は、「認知症で不安になる本人・家族・企業が少なくなる社会へ」をコンセプトに掲げ、AIにより認知機能の状態を測定できるサービス「脳の健康チェックフリーダイヤル」の無償トライアルを、世界アルツハイマーデーである2022年9月21日より

                            20秒程度の電話でAIが認知機能を測定、NTT Comが無償トライアルを提供
                            • 営業活動を科学的に分析!顧客対応を見える化

                              株式会社ACESは、大同生命保険株式会社と、ACES Meetを用いて営業を科学し、顧客対応を「見える化」するプロジェクトを実施しました。 このAIニュースのポイント ACESは、大同生命保険と、ACES Meetを用いて営業を科学し、顧客対応を見える化するプロジェクトを実施 営業担当者間でのノウハウ共有やフィードバックを行うことによる、営業担当者の顧客対応品質の向上がねらい 笑顔や頷き、アイコンタクトなどの非言語情報をアルゴリズムにより定量化し、時系列変化による評価が可能 AIアルゴリズムの力でリアル産業のDXを目指す東大松尾研発のAIスタートアップである株式会社ACES(以下ACES)は、T&D保険グループの大同生命保険株式会社(以下大同生命)と、ACES Meetを用いて営業を科学し、顧客対応を見える化するプロジェクトを実施しました。 ACES Meetは、会議をDXし属人的なコミュ

                              営業活動を科学的に分析!顧客対応を見える化
                              • 千葉銀行がメタバース空間で内々定者向けイベントを実施

                                株式会社チェンジと株式会社千葉銀行は、2022年8月31日より、メタバース空間を活用した実証実験を開始したことを発表しました。 このAIニュースのポイント 株式会社チェンジと株式会社千葉銀行はメタバース空間を活用した実証実験を開始 2021年8月6日に締結したDX推進に関わる業務提携契約に基づく具体的な取組みのひとつ 2023年度の千葉銀行の内々定者に対し、メタバース空間を活用したイベントを実施 株式会社チェンジと株式会社千葉銀行(以下、千葉銀行)は、2022年8月31日(水)より、メタバース空間を活用した実証実験を開始したことを発表しました。 本実証実験は、チェンジが千葉銀行との間で2021年8月6日に締結したDX(デジタルトランスフォーメーション)推進に関わる業務提携契約に基づく具体的な取組みのひとつです。 今回は、チェンジがメタバース内での企画設計や運営支援、参加企業誘致などを担い、

                                千葉銀行がメタバース空間で内々定者向けイベントを実施
                                • アステリア、2号ファンドの組成に向けた出資の募集を開始

                                  アステリアは、アステリアグループの企業投資事業の2号ファンドとしてAsteria Vision Fund II L.P.の組成に向けた出資の募集を開始することを発表しました。 このAIニュースのポイント アステリアグループの企業投資事業の2号ファンドとしてAsteria Vision Fund II L.P.の組成に向けた出資の募集を開始することを発表 アステリアグループのさらなる成長の加速に向けAVF-IIの組成を決定 総額3,000万〜4,000万米ドル規模のファンドを組成し2023年初から投資活動を開始する予定 アステリア株式会社(以下 アステリア)は、アステリアグループの企業投資事業の2号ファンドとしてAsteria Vision Fund II L.P.(以下AVF-II)の組成に向けた出資の募集を開始することを発表しました。 アステリアグループは、2019年2月に投資子会社As

                                  アステリア、2号ファンドの組成に向けた出資の募集を開始
                                  • AI電話取次サービス ミライAIが専用シナリオ追加及びTeamsでのチャット連携にも対応

                                    ミライAIを提供するソフツーは、専用の会話フロー新機能を含むミライAI v1.0.0β5.2.0をリリースいたしました。 このAIニュースのポイント 折り返し専用シナリオの追加で、ミライAIが電話の一次受けを行うように 担当者が決まっていない新規の問合せ窓口や、サポートの窓口などでも利用できる Slack、Google Chat、Chatworkに加え、新たにMicrosoft Teamsにも対応 AI電話取次サービスミライAI(ミライエーアイ)を開発・提供する株式会社ソフツーは、小・中規模企業向けに折り返し専用の会話フロー(シナリオ)やMicrosoft Teamsとの連携等新機能を含むミライAI v1.0.0β5.2.0を2022年9月20日(月)にリリースしました。 ミライAIは、士業事務所や一人法人の方向けのサービスとして開始いたしましたが、今回の新機能の追加により、サービスの利用

                                    AI電話取次サービス ミライAIが専用シナリオ追加及びTeamsでのチャット連携にも対応
                                    • 門真プラットフォーム が NTTコミュニケーションズと連携 AI受発注マッチングシステムを提供開始

                                      門真プラットフォームは、エヌ・ティ・ティ・コミュニケーションズと連携し、KPF受発注システムを提供開始しました。 このAIニュースのポイント 「地域経済牽引事業」の門真市初の事業 門真プラットフォームは市内の中小製造事業者の受注拡大を目指す企業連携プラットフォーム AIマッチング機能により最適な受注企業を選定 門真市中小製造業連携門真プラットフォームは、エヌ・ティ・ティ・コミュニケーションズ株式会社と連携し、市内中小製造業の「KPF受発注システム」を提供開始しました。このシステムは、AIを用いたアルゴリズムにより受発注の最適なマッチングを実現するとともに、発注から支払いまでの業務を迅速化するものです。本システムの開始により、門真市内中小製造業の営業力強化、受注の増加、門真市の地域経済の発展が期待されています。 門真プラットフォームは、門真市内の中小製造事業者のそれぞれの専門能力を集結させ、

                                      門真プラットフォーム が NTTコミュニケーションズと連携 AI受発注マッチングシステムを提供開始
                                      • 大学初 対話エンジンとTeamsを連動させ窓口業務のDXを実現 京都橘大学がAI対話エンジンPKSHA Chatbotを導入

                                        PKSHA Workplaceが、京都橘大学において、深層学習と自然言語処理を活用した対話エンジンPKSHA Chatbotを運用することになりました。 このAIニュースのポイント 既存チャットボットの改善と通信教育課程での活用検討のため Microsoft Teamsとの連携による機能性の高さを評価 学生からの問合せだけでなく、大学教職員間のコミュニケーションにも活用できる 株式会社PKSHA Technologyは、グループ会社である株式会社PKSHA Workplaceにおいて、京都橘大学にて深層学習と自然言語処理 (NLP) を活用した対話エンジン「PKSHA Chatbot」を運用することを発表しました。 京都橘大学では、DX(デジタルトランスフォーメーション)の取組みを進める中で以前より窓口業務の省人化・可視化に向けプロジェクトを進めていました。通学課程においては、学内問合せの

                                        大学初 対話エンジンとTeamsを連動させ窓口業務のDXを実現 京都橘大学がAI対話エンジンPKSHA Chatbotを導入
                                        • 3ステップで簡単に カメラ映像のAI解析ツールRiNoCAのプレ販売を開始

                                          Ridge-iは、PCやタブレットから監視したい状況と対象エリアを設定するだけで、カメラ映像から対象物や人の行動を検知する、ノーコード動画解析AIツールRiNoCAのプレ販売を9月20日より開始します。 このAIニュースのポイント カメラ映像から監視対象行動の設定を行い、検知したらアラートを発出 これまでのAIカメラと違い、誰でも簡単に使うことができる プリセットの動作の種類に応じて介護現場、見守りサービスなどでも活用可能 AI・ディープラーニング技術のコンサルティングと開発を行う株式会社Ridge-iは、専門知識がなくてもPCやタブレットから監視したい状況と対象エリアを設定するだけで、カメラ映像から対象物や人の行動を検知するノーコード動画解析AIツールRiNoCAのプレ販売を9月20日より開始します(正式販売は2023年1月予定)。 RiNoCAはあらかじめ設定された検知機能から必要機能

                                          3ステップで簡単に カメラ映像のAI解析ツールRiNoCAのプレ販売を開始
                                          • 東京メトロ AIとデプスカメラを用いて混雑状況をホームに表示する実証実験開始

                                            東京メトロは、号車ごとのリアルタイム混雑状況について、9月28日(水)から早稲田駅のホームのディスプレイに表示する実証実験を実施します。 このAIニュースのポイント リアルタイムの混雑状況を早稲田駅でディスプレイに表示 この取組みにおける乗車時の行動変容の効果を検証するための実証実験 デプスカメラとAIを用いた列車混雑計測システムは、鉄道事業者では東京メトロのみ導入 東京地下鉄株式会社(東京メトロ)は、東京メトロmy!アプリで配信している、号車ごとのリアルタイム混雑状況について、2022年9月28日(水)から東西線早稲田駅西船橋方面行きホームのディスプレイに表示し、乗車時の行動変容の効果を検証する実証実験を実施します。 実証実験では、東西線高田馬場駅に設置しているデプスカメラで撮影し、リアルタイムに実測した号車ごとの混雑状況を早稲田駅で次に到着する列車の混雑状況としてディスプレイに表示しま

                                            東京メトロ AIとデプスカメラを用いて混雑状況をホームに表示する実証実験開始
                                            • レーザーでゴキブリを自動ロックオンして焼き殺すAI搭載タレットが登場

                                              by Douglas Muth ゴキブリは多くの人にとって悩みの種なので、「もし自動でゴキブリを退治してくれるAIが登場したら是非使いたい」という人は多いはず。そんな人の夢を実現するAI搭載の自動レーザー砲台が開発されました。 なお、この記事にはゴキブリの映像や画像が掲載されるので、苦手な人は注意してください。 Full article: Selective neutralisation and deterring of cockroaches with laser automated by machine vision https://doi.org/10.1080/00305316.2022.2121777 Scientists Create AI-Powered Laser Turret That Kills Cockroaches https://www.vice.com/en/a

                                              レーザーでゴキブリを自動ロックオンして焼き殺すAI搭載タレットが登場
                                              • Cloudflare、CAPTCHAに代わる認証「Turnstile」発表 「ゆがんだ文字で人類が浪費している時間を節約」

                                                Cloudflare、CAPTCHAに代わる認証「Turnstile」発表 「ゆがんだ文字で人類が浪費している時間を節約」 CloudflareがCAPTCHAに代わる新たな認証API「Turnstile」を発表した。ユーザーからは見えず、特別な操作も不要。約1秒で認証完了できるとしている。 CDNプロバイダーの米Cloudflareは9月29日、CAPTCHAに代わる新たな認証API「Turnstile」を発表した。人間が操作していることを示すシグナルを確認・認証する手法で、ユーザーからは見えず、特別な操作も不要。約1秒で認証完了できるとしている。 同社は「ゆがんだ文字や画像の組み合わせを解く認証テストに人類が毎日浪費している500年分の時間を節約する」と述べている Turnstileの認証テストはその時々で入れ替わり、難易度も細かく調整できるという。人間らしくない行動をする訪問者には、

                                                Cloudflare、CAPTCHAに代わる認証「Turnstile」発表 「ゆがんだ文字で人類が浪費している時間を節約」
                                                • ShodoのAI校正APIを一般公開しました - ライティングラボ by Shodo

                                                  ShodoのAI校正APIを一般公開しました ShodoのAI校正APIを一般公開しました! Shodoにユーザーアカウントがあれば、誰でも校正APIをご利用いただけます。 こんな文章のタイポや変換ミスをチェックしてくれます: 手元で書いたドキュメント Markdownで書いている技術書 エディターで書いた記事 ShodoのCLIコマンドもオープンソースで公開されています: $ pip3 install shodo $ shodo login $ shodo lint README.md Linting... 3:11 もしかしてAI 飛行機の欠便があり、運行(→ 運航)状況が変わった。 バ 6:5 もしかしてAI ません。 これが私で(→ の)自己紹介です。 こ 8:11 「ご」や「して」を付けると日本語として正しくなります こんにちは。なんでも相談(→ 相談して)ください。 こちらを.

                                                  ShodoのAI校正APIを一般公開しました - ライティングラボ by Shodo
                                                  • 画像生成AI「DALL・E」が誰でも簡単に利用可能になったので登録手順や使い方をまとめてみた

                                                    2022年8月に画像生成AI「Stable Diffusion」が一般公開されて以降、誰でも簡単に画像生成AIを利用できるシステムが開発されたり、画像生成AIを便利に使うためのサービスが続々と開発されたりと、大きな盛り上がりを見せています。新たに、AI研究団体のOpenAIが2021年1月に発表していた画像生成AI「DALL・E」を一般公開しました。これにより、これまで順番待ちが必要だったDALL・Eを誰でもすぐに利用可能となったので、利用登録の手順や使い方をまとめてみました。 DALL·E Now Available Without Waitlist https://openai.com/blog/dall-e-now-available-without-waitlist/ 「DALL・E」は入力した文章に沿った画像を出力してくれるAIで、2021年1月に最初のバージョンが公開されて以降

                                                    画像生成AI「DALL・E」が誰でも簡単に利用可能になったので登録手順や使い方をまとめてみた
                                                    • 第3回 AI・人工知能EXPO【秋】~人、企業、世界の未来へ。 導入検討企業や開発者、全てのニーズに応えた下半期日本最大の展示会~

                                                      国際産業見本市の主催・企画・運営における業界最大手のRX Japan株式会社(旧:リード エグジビジョン ジャパン株式会社)が、2022年10月26日(水)から28日(金)の3日間、幕張メッセにて「第3回 AI・人工知能EXPO【秋】」を開催します。 今期のテーマは「人、企業、世界の未来へ」。前期の出展社、来場者からの声を受け、出展ブースのゾーンニングなどこれまでにない工夫が成されています。秋開催ならではの新たな取り組みや見どころについて、メディアパートナーを務めるAIsmileyが主催企業にお話をお伺いしました。

                                                      第3回 AI・人工知能EXPO【秋】~人、企業、世界の未来へ。 導入検討企業や開発者、全てのニーズに応えた下半期日本最大の展示会~
                                                      • 関西ものづくりAI/IoT展にAIポータルメディア「AIsmiley」がブースを出展

                                                        関西ものづくりAI/IoT展にAIポータルメディア「AIsmiley」がブースを出展 ネットサービス 企業のDXを推進する国内最大級のAIポータルメディア「AIsmiley」を運営するアイスマイリー(東京都渋谷区、 代表取締役:板羽晃司)は、2022年10月5日(水)~7日(金)に開催する関西ものづくりAI/IoT展にブースを出展します。 ​画像引用元:関西 ものづくりAI/IoT展| RX Japan株式会社 https://www.manufacturing-world.jp/kansai/ja-jp/about/aiotex.html 会場では、DXを加速させるAIポータルメディア「AIsmiley」の活用方法のご案内とAIプロダクト導入の相談を受け付けます。AI導入の相談をしたい方、幅広く情報収集を行いたい方はぜひブース番号 8-4 までお越しくださいませ。皆さまのご来場を心よりお

                                                        関西ものづくりAI/IoT展にAIポータルメディア「AIsmiley」がブースを出展
                                                        • 関西ものづくりAI/IoT展にAIポータルメディア「AIsmiley」がブースを出展

                                                          企業のDXを推進する国内最大級のAIポータルメディア「AIsmiley」を運営するアイスマイリー(東京都渋谷区、 代表取締役:板羽晃司)は、2022年10月5日(水)~7日(金)に開催する関西ものづくりAI/IoT展にブースを出展します。 画像引用元:関西 ものづくりAI/IoT展| RX Japan株式会社 https://www.manufacturing-world.jp/kansai/ja-jp/about/aiotex.html 会場では、DXを加速させるAIポータルメディア「AIsmiley」の活用方法のご案内とAIプロダクト導入の相談を受け付けます。AI導入の相談をしたい方、幅広く情報収集を行いたい方はぜひブース番号 8-4 までお越しくださいませ。皆さまのご来場を心よりお待ちしております。 ■出展予定内容 ・AIポータルメディア「AIsmiley」有効活用のご案内 ・DX推

                                                          関西ものづくりAI/IoT展にAIポータルメディア「AIsmiley」がブースを出展
                                                          • AI画家「DALL・E 2」、ウェイティングリスト削除で誰でもすぐ利用可能に

                                                            米AI研究企業OpenAIは9月28日(現地時間)、文章から画像を生成するAI「DALL・E 2」のβ版に設けていたウェイティングリストを削除したと発表した。誰でもサインアップしてすぐに使えるようになった(有料)。 現在、150万人以上のユーザーが既にDALL・Eを使って1日当たり200万点以上の画像を作成しているという。 APIを介しての利用はまだできないが、現在テスト中だ。 AI生成画像については多様な問題もあるが、OpenAIは「ここ数カ月でコンテンツポリシーに違反するような性的や暴力的なコンテンツの生成を拒否するフィルターを強化し、悪用防止のための技術を構築した」としている。 関連記事 AI画家「DALL・E 2」一般公開へ 商用利用も可能に 悪用、差別防止機能を搭載 OpenAIが、文章から画像を生成するAI「DALL・E 2」のβ版を公開し、ユーザーの招待を始めた。招待人数は1

                                                            AI画家「DALL・E 2」、ウェイティングリスト削除で誰でもすぐ利用可能に
                                                            • AI画像生成の課題雑感

                                                              プロンプトエンジニア?現在のAI画像生成はほぼ画像検索といっていい、プロンプトは検索ワード並べてるのと変わらない。個人的にはエロ動画探すときの検索が一番似てると思った。 界隈でプロンプトエンジニアとか言い出した際には本当にセンスがなくて失望した。 適当なワードで画像検索してすばらしい景色の写真を見つけられて俺ってスゴイと思うだろうか。 俺の検索技術で最高なイラストを見つけてやったとか? キーワードによる画像生成の問題はコントロールがおおざっぱすぎることと、学習モデルが変更されたときに結果があっさり大幅に変わることである。 ユーザーが思ったところに思ったように描画してもらうにはもっと工夫が必要で、なぜかAI界隈はそういうのに無頓着でAI自動塗りなんてのもすごい大雑把な機能で「未来を予感」させながら実際は使い物にならんなこれと放置されている。 抽象モデルの必要性ツールを機能させるにはユーザーの

                                                              AI画像生成の課題雑感
                                                              • 無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ

                                                                画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみる ・P

                                                                無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                                • 画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか?

                                                                  入力したプロンプトを基に画像を生成するAI「Stable Diffusion」は一般公開以降、世界中の人々から注目を浴びており、さまざまなツールや応用方法も発表されています。そんなStable Diffusionで画像を生成する際の設定項目には、「画像生成でどれだけプロンプトに従うか」を決める「CFG(classifier-free guidance)スケール」という値があります。 CLASSIFIER-FREE DIFFUSION GUIDANCE.pdf https://arxiv.org/pdf/2207.12598.pdf 【論文解説】OpenAI 『GLIDE』を理解する | 楽しみながら理解するAI・機械学習入門 https://data-analytics.fun/2022/02/13/openai-glide/#toc5 The Road to Realistic Full

                                                                  画像生成AI「Stable Diffusion」でどれぐらいプロンプト・呪文の指示に従うかを決める「CFG(classifier-free guidance)」とは一体何なのか?
                                                                  • 画像生成AIに美樹さやかさんのデータを学習させたら、指定してないのにあの子が隣に映り込んだ・・・「泣いた」「尊い」

                                                                    三雲岳斗 @mikumo 画像生成AIに美樹さやかさんのデータを学習させたら、指定してないのに勝手に佐倉杏子さんらしき人物が隣に映り込むようになった、って記事を読んで感動してる 独りぼっちは、寂しいもんな… six-loganberry-ba7.notion.site/22-09-26-Stabl… pic.twitter.com/Zx5UZBAY1y 2022-09-28 18:47:35 リンク Notion Notion – The all-in-one workspace for your notes, tasks, wikis, and databases. A new tool that blends your everyday work apps into one. It's the all-in-one workspace for you and your team 406

                                                                    画像生成AIに美樹さやかさんのデータを学習させたら、指定してないのにあの子が隣に映り込んだ・・・「泣いた」「尊い」
                                                                    • 【動画】人の笑いに合わせて”一緒に笑う”人型ロボット開発 | NHK

                                                                      人の笑い声の特徴を分析して一緒に笑い声を出す機能を搭載した人型のロボットを京都大学の研究グループが開発しました。グループは、高齢化社会が進む中、会話や感情を読み取れるロボットの実現につなげたいとしています。 これは、京都大学大学院情報学研究科の井上昴治 助教らの研究グループが28日、京都市左京区で会見を開いて明らかにしました。 グループは、すでに開発されていた会話ができる人型のロボットに、AI=人工知能を活用して対話する相手の笑い声を分析し、一緒に笑い声を出す機能を搭載しました。ロボットは、実際に人が交わした82の会話のデータを搭載し、人の笑い声を周波数などで判断します。相手の声に同調する仕組みになっていて、声の大きさや特徴に応じてロボットが大きな笑い声や抑えたトーンの笑い声を出します。 井上助教は「初めて私の笑いに合わせて笑ってくれた時は、まるで心が通じ合ったように感じました。高齢化社会

                                                                      【動画】人の笑いに合わせて”一緒に笑う”人型ロボット開発 | NHK
                                                                      • AIの第一人者ルカン氏、現在のアプローチの多くは真の知能につながらないと批判

                                                                        Tiernan Ray (Special to ZDNet.com) 翻訳校正: 編集部 2022-09-28 15:09 LeCun氏は6月、「Open Review」に投稿した論文で、機械に人間レベルの知能を持たせることが期待できると考えるアプローチについて概観を示した。 この論文で暗に主張しているのは、現在のAIに関する大規模なプロジェクトのほとんどは人間レベルという目標に決して到達できないという点だ。 LeCun氏は、9月に入って米ZDNetが実施した「Zoom」でのインタビューの際、現時点で最も成功しているディープラーニング(DL)の研究手法の多くを非常に懐疑的に見ていることを明らかにした。 コンピューター科学分野のノーベル賞に相当する「ACM A. M. チューリング賞」を受賞したこともあるLeCun氏はZDNetに対し、同業者らの研究について「必要だが十分ではないと思う」と述

                                                                        AIの第一人者ルカン氏、現在のアプローチの多くは真の知能につながらないと批判
                                                                        • AIの第一人者ルカン氏、現在のアプローチの多くは真の知能につながらないと批判

                                                                          「Facebook」「Instagram」「WhatsApp」を運営するMeta Platformsで人工知能(AI)担当のチーフサイエンティストを務めるYann LeCun氏は、この分野に携わる多くの人を困惑させることになりそうだ。 LeCun氏は6月、「Open Review」に投稿した論文で、機械に人間レベルの知能を持たせることが期待できると考えるアプローチについて概観を示した。 この論文で暗に主張しているのは、現在のAIに関する大規模なプロジェクトのほとんどは人間レベルという目標に決して到達できないという点だ。 LeCun氏は、9月に入って米ZDNetが実施した「Zoom」でのインタビューの際、現時点で最も成功しているディープラーニング(DL)の研究手法の多くを非常に懐疑的に見ていることを明らかにした。 コンピューター科学分野のノーベル賞に相当する「ACM A. M. チューリング

                                                                          AIの第一人者ルカン氏、現在のアプローチの多くは真の知能につながらないと批判
                                                                          • Gettyが著作権を理由にAI作成の画像を禁止に。登録済みの画像は削除されるとのこと

                                                                            Gettyが著作権を理由にAI作成の画像を禁止に。登録済みの画像は削除されるとのこと2022.09.28 13:30 Kyle Barr - Gizmodo US [原文] ( そうこ ) Tags : AI(人工知能)アート写真 ストック画像サービスのGetty Imagesは、AI作成画像の登録を禁止することがわかりました。最近、AIが作り出す奇妙な画像がよく話題になりますが、GettyとしてはStable Diffusionも、DALL-Eも、もちろんMidJourneyもダメ。すでにGettyに登録済みのAI作成画像も削除されます。 GettyがAI画像禁止に乗り出したのは、著作権が理由。GettyのCraig Peters CEOは、The Vergeの取材で、著作権管理を厳しく行なうサービスにおいて、AI作成画像の「未対処の権利問題」は容認できないと語っており、サービスの利用者

                                                                            Gettyが著作権を理由にAI作成の画像を禁止に。登録済みの画像は削除されるとのこと
                                                                            • AIテスト自動化プラットフォーム「MagicPod」をミクシィが導入

                                                                              MagicPodが開発した、AIテスト自動化プラットフォーム「MagicPod」をミクシィが導入しました。 このAIニュースのポイント AIテスト自動化プラットフォーム「MagicPod」をミクシィが導入 特別なスキルを有していなくても、手軽に利用できるAIテスト自動化プラットフォーム 自動化を実現し、時間の大幅な短縮に成功 株式会社MagicPodが開発した、AIテスト自動化プラットフォーム「MagicPod」を株式会社ミクシィが導入しました。 「MagicPod」とは、モバイルアプリテスト、ブラウザ(ウェブアプリ)テストの両方に対応したAIテスト自動化プラットフォームです。プログラミングなどの特別なスキルがなくても直感的に使うことのできるデザイン、クラウドでのサービス提供によるメンテナンス性の高さ、AI技術を活用した自動修正によるテストプログラム修正の手間削減などによりリリースサイクル

                                                                              AIテスト自動化プラットフォーム「MagicPod」をミクシィが導入
                                                                              • 画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」

                                                                                画像生成AI「Stable Diffusion」は「プロンプト」として文字列を入力することで、その文字列の内容に沿った絵や写真を自動で生成してくれます。しかし、自分の理想により近い画像を生成してもらうためには、多種多様な文字列を大量にプロンプトとして入力する必要があり、この複雑なプロンプトを探ることが画像を生成する工程の中でも特に大変な作業の1つです。「KREA」はAIで生成された画像とそのプロンプトをまとめたデータベースで、自分が理想とする画像を生成するためのプロンプトを探る作業がはかどります。 KREA — create better prompts. https://www.krea.ai/ KREAのトップページはこんな感じ。 上段の「search for prompt」に「anime」と入力してみると、以下のようにサジェストが表示されました。 今回はサジェストを無視し、「anim

                                                                                画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」
                                                                                • 高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉

                                                                                  どうもこんにちは、あんどう(@t_andou)です。 今回はOpenAIの高精度な文字起こしAI「whisper」を試してみました。 ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。 実行環境 使用した動画と結果 まずはモデルごとに精度確認 small 処理時間 結果 所感 medium 処理時間 結果 所感 large 処理時間 結果 所感 使用した動画と結果その2 最後に 実行環境 GoogleColabでGPUはT4でした。 使用した動画と結果 以前、リアルな顔がしゃべるAIを作ったので、その動画を使います。 声もAIによるもののため、僕の耳には聞き取りやすいですが、whisperにとってはどうでしょうか。気になります。 (ちなみに、この動画内で話しているニュースの文章もAIによる生成物です。) www.youtube.co

                                                                                  高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉