ブックマーク / ascii.jp (48)

  • AIイラスト、こうしてゲームに使っています (1/4)

    東京ゲームショウのAI Frog Interactiveのブースの様子。NHKテレビ取材内容は記事化されている 筆者はインディーズゲーム開発スタジオAI Frog Interactiveの代表をしています。9月26日から29日にかけて開催された「東京ゲームショウ2024」のインディーゲームブースに出展したとき、AIを使ったゲーム開発について複数のテレビメディアの取材を受けました。そこではキャラクターデザインのアイデア出しなどで、画像生成AIの強みが発揮できるという話をしています。 発注指示書レベルのアートワークならAIで作れる 今年のゲームショウでも、テレビメディアが注目したのは生成AIを含むAIのトピックでした。日ゲーム業界でも、生成AIの導入は進んでいるという実感はあるのですが、生成AIを使っていること自体がゲームを面白くするわけではないので、売りになる要素とはいえません。そのた

    AIイラスト、こうしてゲームに使っています (1/4)
    quwachy
    quwachy 2024/10/14
    id:da6ff84315 カエルに欲情するのは君くらいだから大丈夫じゃない?
  • 中国製AIはハルシネーションレートですでに世界一

    AIがあたかも当のように事実と異なることを言ってしまうハルシネーション(幻覚)。どのくらい幻覚を見るかを示すハルシネーションレートは、各社がしのぎを削る大規模言語モデル(LLM)の精度の高さを証明する1つの指標となっている。 さて、各LLMのハルシネーションレートを比較すべくAI企業Vectaraが開発したGitHub上のHallucination Leaderboardを見ると、現在(2024年9月13日付け)は中国ChatGPTとも言われる「智譜AI(Zhipu AI)」のGLM-4-9B-Chatが1.3%でもっともハルシネーションレートが低い。出たばかりのOpenAI o1 miniの1.4%、GPT-4oの1.5%を抑えての1位は正直すごい(冒頭のグラフ参照のこと)。 そういえば先日、コープさっぽろCIOの長谷川秀樹氏が「ハルシネーションがある限り、企業では生成AIは使えない

    中国製AIはハルシネーションレートですでに世界一
    quwachy
    quwachy 2024/09/16
    堀元見とかはハルシネーションレートめっちゃ高くなりそう(体感では50%くらい)
  • グーグルAI、1000ページのPDFを読んで質問に答えられるように 白書レベルなら余裕

    グーグルは8月21日、生成AI「Gemini」を使用するための「Google AI Studio」「Gemini API」でアップロード可能なPDFの最大容量を、これまでの300ページから1000ページまたは2GBまでに拡大したと発表した。 同社でAI Studioなどを担当するLogan Kilpatrick氏によると、テキスト理解と画像理解の両方を利用して、1ページにつき1画像として処理しているという。 We just increased the max PDF page upload size to 1,000 pages or 2GB (up from 300 pages) in Google AI Studio and the Gemini API. 🗒️ We use both text understanding and the native multi-modal cap

    グーグルAI、1000ページのPDFを読んで質問に答えられるように 白書レベルなら余裕
    quwachy
    quwachy 2024/08/24
    GPT5は10万字返答できるようになるでしょ
  • iPhoneのブラウザー、魔法みたいに広告が消せるように

    まあ、魔法つっても普通に新機能なんですけどね。 iOS 18の新しい「Safari」では、「ちょっとこの広告、記事読むのにおジャマね」と思ったら、その広告を非表示にできる機能が標準搭載されるんです。しかも、ただ非表示にするだけじゃないんです。なんと、消える瞬間、魔法にかかったように霧散するというエフェクトが付いていて、当に魔法みたいな機能なんですよ。 実は消せるのは広告だけじゃなくて、しつこく表示されるクッキーのポップアップだったり、なんなら記事中の図版や文字ブロックもきれいさっぱり消し去ることができるので、別に広告が気になるわけでもないのに色々消しているのがただ気持ちいい!みたいな機能でもあります。実装されたら、ぜひ遊んでみてください。 ※アップルの最新OSのパブリックベータ版の画面は一般に公開することが禁じられていますが、稿では特別に取材許可を得たうえで掲載しています。 新しい「S

    iPhoneのブラウザー、魔法みたいに広告が消せるように
    quwachy
    quwachy 2024/08/10
    これが本当の消しゴムマジック
  • 「Stable Diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 迷走するStability AIと対照的な展開に

    画像生成AIモデル「Stable Diffusion」の共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」は8月1日(現地時間)、高品質な画像生成能力と多様な出力が特徴の最新の画像生成AIモデル「FLUX.1」を発表した。 Stable Diffusionの共同開発者が設立 Black Forest Labs(BFL)は、オープンソースの画像生成AIモデル「Stable Diffusion」の共同開発者として知られるRobin Rombach氏、Patrick Esser氏、Andreas Blattmann氏によって2024年に設立された新興企業。Andreessen Horowitz(a16z)を筆頭とする投資家から3100万ドルの資金を調達したことで注目を集めている。 3つのモデルを展開 We are excited to announce

    「Stable Diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 迷走するStability AIと対照的な展開に
    quwachy
    quwachy 2024/08/03
  • ChatGPTが人間のように話す新機能、いよいよ来週公開へ

    sponsored MSIがセール開催中!この夏に自作PCパーツを買う人はツイている サマーセールを活用すれば同じ予算でGeForce RTX 4070を4080にできないか考えてみた sponsored FRONTIERの「FRGBLSZ790/SG2」をチェック、自作erでも心くすぐられるケース内部 RTX 4070 Ti SUPERを垂直設置、デザインもゲーム性能も妥協なしのゲーミングPC sponsored ファーウェイ製スマートウォッチらしくバッテリー長持ちもうれしい スマートウォッチの新定番「HUAWEI WATCH FIT 3」はカロリー管理に強みあり! 軽快な装着感も◎ sponsored Core i5-14400搭載の「iiyama PC STYLE-S17M-144-UHX-BLACK」をチェック 9万円台で簡単な写真編集も! 幅95mmのスリムタワーPCがコスパ抜群

    ChatGPTが人間のように話す新機能、いよいよ来週公開へ
    quwachy
    quwachy 2024/07/27
    Soraはいつなんだ
  • 人が絵を描く“工程”をAIで再現 タイムラプス風動画が炎上した「Paints-Undo」 (1/4)

    7月9日、イラストが完成するまでの過程を生成できる画像生成ツール「Paints-Undo(ペイントアンドゥ)」が発表され、騒ぎとなりました。話題となったのは、人間がイラストを描いている様子をタイムラプスでとらえたかのように見えるデモ動画です。これが大きな反響を呼び、特に日では"炎上”ともいえる状態になりました。日では「タイムラプス動画を記録しておけば、“人間が描いた”と証明することができる」という話題が昨年からSNS上で出ていました。それを真っ向から否定することになりかねないという技術にも見えたことから、反発を含めて注目が集まったという印象です。よくよく見ると人間が描いているものとはかなり違い、また、技術の意図そのものも違っているようなのですが。 時間の流れを“逆転”させた動画を生成 Paints-Undoを開発したのは、「ControlNet」など画像生成AIツールの研究開発で知られ

    人が絵を描く“工程”をAIで再現 タイムラプス風動画が炎上した「Paints-Undo」 (1/4)
    quwachy
    quwachy 2024/07/23
  • 危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ (1/4)

    発表後、悪い意味で話題になってしまっていた画像生成AI「Stable Diffusion 3 Medium(SD3M)」に動きがありました。開発元のStability AIは、Weta Digitalの元CEOのプレム・アッカラジュ(Prem Akkaraju)氏がCEOに就任し、新たな資金も調達しました。これで組織として当座の危機は脱したと言えそうです。また、Stable Diffusion 3(SD3)のライセンスについての変更を打ち出してきました。果たして失われた信頼は取り戻せるでしょうか。 人気モデル「Pony Diffusion」開発者との対立 基的な情報からすると、やはり、SD3Mはコケたと言っていい状況です。参考情報となりますがGoogleトレンドを見てみると、6月12日のリリース直後は1日で150万ダウンロードされるほど注目を集めていたものの、すぐにシュリンクしてしまって

    危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ (1/4)
    quwachy
    quwachy 2024/07/15
    エマドモスタークを追い出した時点で会社としては終わっている
  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
    quwachy
    quwachy 2024/07/02
  • 無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない

    Invoke、Comfy Org、Civitai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。 企業による技術の独占を防ぎ、アクセシビリティを確保 「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivitai、大規模な学習データセットを構築するLAIONだ。 彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープン

    無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない
    quwachy
    quwachy 2024/06/28
    CEOをクビにして主要開発者も辞めたから早晩潰れると言われていたけど、いよいよか
  • 「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」

    AIスタートアップ「Etched」は6月25日(現地時間)、ChatGPTなど最新のAI技術の基盤となっている「Transformer」アーキテクチャーに特化したチップ「Sohu」を発表した。この発表は、現在NVIDIAが支配的な地位を占めるAIチップ市場に、新たな競争をもたらす可能性がある。 Transformer処理に特化 AIチップ市場は現在NVIDIAが圧倒的なシェアを持つ。同社の汎用GPUは様々なAIモデルを効率的に処理できる柔軟性から市場の約80%を占めている。 多くの大手テクノロジー企業がAI開発のためにNVIDIAのチップに数十億ドルを投資しているのが現状だ。 Etchedの「Sohu」は、ASIC(Application-Specific Integrated Circuit:特定用途向け集積回路)と呼ばれる、特定の用途に最適化された集積回路だ。汎用性は低いものの、特定

    「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」
    quwachy
    quwachy 2024/06/27
    shodai 推論ですね、学習はまだnNVIDIA頼り。チップが完成した時点でtransformerが廃れている可能性もあったから賭けに勝った。他社が追いつく2年後もtransformer使っているかわからないから安易に手が出せない
  • 実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)

    こんにちは、漫画界の生き恥こと野火城と申します。 「画像AI使ってみた/AI漫画実験企画」第2回です! ■第1回はこちら 実録:AIで描く漫画の実際 ~体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。 だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。 「画像AI技術がすごいという賞賛記事はよく見るが、それは当に創作活動で実戦的に使えるものなのか? 『AI仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは? 実際はどっちなんだ?」「画像AIを試し

    実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)
    quwachy
    quwachy 2024/05/30
  • アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

    アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。 一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮 複数(30億、70億、300億)のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。 各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2(画像理解)、TextVQA(画像内のテキスト情報)、ScienceQA(科学知識)、MMBench(マルチモーダル)、MathVista(数学)などの

    アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表
    quwachy
    quwachy 2024/03/19
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
    quwachy
    quwachy 2024/03/18
    ひろゆきがゴミですねこんなものは絶対に流行らないって言ってたやつか
  • 画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

    2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について(素案)」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント(パブコメ)」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について(素案)令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。 文化文化審議会 著作権分科会 法制度小委員会(第7回) パブコメへの反応は「素案の内容周知」 発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

    画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)
    quwachy
    quwachy 2024/03/11
    裁判してくれが結論
  • “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)

    Midjourneyの生成画像。12月のアップデートv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

    “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)
    quwachy
    quwachy 2024/01/22
    実現したら発狂して死にそうな人知ってるけど大丈夫かな
  • 秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話 (1/3)

    美少女画像を生成しようと思い立ち7月にゲーミングPCを購入してからはや半年、当初の目標であった画像生成にはなんとか成功したものの、とにかくこのジャンルは進化が早い。苦労して新しい技術を使えるようになったと思ったらすぐに次のとんでもない技術が登場し、以前のものは古くなっていく。なんとか振り落とされないようについていくのがやっとだが、それでも猛烈におもしろく刺激的な半年間だった。 「Stream Diffusion」爆誕 StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました!! sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます! 多分これが一番速いと思います pic.twitter.com/4qleR2isW1 — あき先生 / Aki (@cumulo_autumn) December 6, 20

    秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話 (1/3)
    quwachy
    quwachy 2024/01/06
  • AIイラストは“著作物”!? 中国で画像生成AIブームが大爆発したわけ (1/4)

    11月27日、中国の北京インターネット裁判所で出された判決は衝撃的でした。なんと画像生成AI「Stable Diffusion」で作られたイラストの著作物性が認められたんです。「春風がそよ風を送る」と名付けられたAI画像につけられたウォーターマークを消して商売に使ったことは著作権を侵害しているとして、被告に対して500元(約1万円)の賠償金を払うよう命じています。 判決について、中国語の資料をジャック・ランランさんという方が翻訳して公開されているんですが、非常に驚くところもあれば、「ああなるほど」と理解できるところもありました。 AIイラストは「独創的」な「知的創造の成果」? まず、判決としてはかなり大胆なことを言っています。 「中華人民共和国著作権法 第3条は、『この法律にいう「著作物」とは、文学的、美術的、および学術の分野における独創性を有し、かつ、一定の形式をもって表現することができ

    AIイラストは“著作物”!? 中国で画像生成AIブームが大爆発したわけ (1/4)
    quwachy
    quwachy 2023/12/18
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
    quwachy
    quwachy 2023/12/11
    mizukemuri VTuberブームはスルーしたの?初音ミクは?
  • 生成AI、学習時の著作権使用料は“支払い義務なし”の可能性が有力に? (1/4)

    11月上旬、岸田首相の生成AIを使って作成されたフェイクニュース動画が問題になりました。 5日、日テレビは自社のニュース番組のロゴが使われてはまずいということで強めに注意を呼びかけましたが、6日、松野博一官房長官は「罪になる場合もあるのでくれぐれも慎んでほしい」と記者会見時に、やや抑制的な物言いをしました。もちろん、フェイクニュースを流すことは、生成AIに関係なく、現行法で刑事罰にも当たる可能性のある行為です。 その後、14日に、YouTubeからAI生成動画に関するガイドラインが出ましたが、そこでも公人のパロディは必ずしも規制対象にするわけではないという方針が出されていました。これはどちらかというと、来年に大統領選を控えたアメリカでフェイク動画拡散の可能性が高まってくるため、事前対策をしているという側面があると思います。 生成AIの登場でフェイクの作成が容易になったとも言われはじめてお

    生成AI、学習時の著作権使用料は“支払い義務なし”の可能性が有力に? (1/4)
    quwachy
    quwachy 2023/11/27
    現行法では合法、これを受けて法規制を訴えた議員がどれだけ当選するかで次の世代の法律ができる。