タグ

ブックマーク / ascii.jp (116)

  • AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? (1/5)

    グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグル画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。 ※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです フィルターはとても厳しく、女性を出すのは難しい ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に

    AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? (1/5)
  • 画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に (1/5)

    画像生成AI「Stable Diffusion」開発者たちが突然発表した新モデル「FLUX.1」、これが楽しすぎてはまりこんでいます。私の業はゲーム会社。出展を予定している東京ゲームショウまで1ヵ月で、やらないといけないことが山積みなのに、FLUX.1が面白すぎて魅力に抗えません。 わずか30分の学習で画風が安定 FLUX.1が決定的に変えてきそうなのはLoRAです。LoRAは学習済みのウェイトモデルを利用することで、少ない枚数であっても学習ができるということで、画像生成AIの分野では広く普及している手法です。FLUX.1は、Stable Diffusionで使われてきたLoRAの方法論を動かすことができることがわかっています。 そのため、FLUX.1のリリース後、ユーザーコミュニティーでさっそくLoRAの環境の整備が始まり、何ができるのかを試すフェーズに入っています。これまでの「Sta

    画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に (1/5)
  • 実録:AIで描く漫画の実際 ~AI漫画の集大成! 最新技術で挑む最終回 (1/6)

    こんにちは、漫画界の生き恥こと野火城と申します。 「画像AI使ってみた/AI漫画実験企画」第5回、ついに今回で最終回です! ■第1回はこちら 体験して見えた、その実力と課題!! ■第2回はこちら AIで今風の手描きっぽい漫画を作ってみる ■第3回はこちら 生成AIで少女漫画に挑戦! ■第4回はこちら 漫画制作を爆速化! 生成AIをフル活用して時短してみた その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年8月現在日の法律では使用が許可されており、存在を完全に無視することはできません。かといって全てを肯定して受け入れるのも難しい。 だからこそ、必要以上に恐れず、実際にどのようなことができるのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。 「画像AI技術がすごいという賞賛記事はよく見るが、それは当に創作活動で実戦的に使えるも

    実録:AIで描く漫画の実際 ~AI漫画の集大成! 最新技術で挑む最終回 (1/6)
  • 話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6)

    画像生成AI「Stable Diffusion」共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」が、8月1日(現地時間)に発表した話題の画像生成AIモデル「FLUX.1」。 前回の「画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した」では、「ComfyUI」による画像生成を試した。 今回は、この連載ではおなじみ「Fooocus」の作者lllyasviel氏によるStable Diffusion用の高性能なWebインターフェース「Stable Diffusion WebUI Forge」が8月11日頃にFLUX.1に対応したということで、さっそく動作確認してみる。 なお、筆者の環境は以下のとおりだ。 CPU

    話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) (1/6)
  • 画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)

    Stable Diffusionの共同開発者たちによって設立されたベンチャー企業「Black Forest Labs(BFL)」が8月1日(現地時間)に発表した最新の画像生成AIモデル「FLUX.1」。画像生成アプリ「ComfyUI」が対応を発表しているので、ローカル環境で動くかどうかを試してみた。 画像生成AIは「Midjourney」「Stable Diffusion」「DALL-E」の三つ巴 現在、画像生成AIの分野は主に「Midjourney」、「Stable Diffusion」、「DALL-E 3」の3つがそれぞれ独自のアプローチでユーザーを集めている。 Midjourneyは直感的なインターフェースと美しい芸術的な出力で知られ、主にクリエイティブな専門家やアーティストに人気がある。 一方、Stable Diffusionはオープンソースの柔軟性と強力なカスタマイズ能力で、技術

    画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した (1/7)
  • Windows Terminalで採用されたCascadia Codeフォントを使うとプログラムを書くとき断然見やすい (1/2)

    現在のWindowsフォントは、アウトラインフォント形式のOpenTypeをメインにしている。OpenTypeは、1997年にTrueTypeの拡張として発表された。TrueType形式のアウトラインデータに加え、CFF/Type2というPostScript用のアウトライン形式を含めることができる点がTrueTypeと異なる。 ここでは、OpenTypeフォントであるCascadia Codeを例に、フォントの概要やアプリケーションからのフォントfeature機能の利用について解説する。 そもそもCascadia Codeフォントとは? Cascadia Codeフォントとは、Windows Terminalと同時に開発されたオープンソースのフォントである。Windows Terminalと同時にインストールされるが、単体でもインストール可能だ。このフォントを例に持ち出したのは、オープン

    Windows Terminalで採用されたCascadia Codeフォントを使うとプログラムを書くとき断然見やすい (1/2)
  • 辞職覚悟の挑戦だった『ガールズバンドクライ』 ヒットへの道筋を平山Pに聞いた (1/5)

    〈前編はこちら〉 「誰も知らないCGアニメ」をいかに見てもらうか? 今の若者のリアルを反映し、少女たちの自活の苦労や怒りの感情も隠さず描いたバンドアニメ『ガールズバンドクライ』。指揮を執ったのはアニメ『ラブライブ!』を立ち上げた平山理志プロデューサーだ。 作は東映アニメーション内でもCG技術の進化を期待されたオリジナルTVシリーズ。「CGで誰も見たことがない映像を作りたい」という目標を持った平山氏だが、「イラストルック+フルコマ」という映像づくりの壁は予想以上に高かった。 ようやく映像の完成が見え始めたが、「お客様の認知がゼロの状態」からスタートするオリジナル作品を、1クール(3ヵ月)で人気作品に育て上げる必要がある。仕掛け、環境、覚悟。どれが欠けても成立しなかったプロジェクトを氏に語っていただいた。 『ガールズバンドクライ』ストーリー 高校2年、学校を中退して単身東京で大学を目指すこと

    辞職覚悟の挑戦だった『ガールズバンドクライ』 ヒットへの道筋を平山Pに聞いた (1/5)
  • なぜ『ガールズバンドクライ』は貧乏になった日本で怒り続ける女の子が主人公なのか?――平山理志Pに聞く (1/4)

    2024年の春アニメは大物作品が勢ぞろいする激戦区だった。そのなかにあって独自技術の3DCGかつ、重苦しい展開から逃げない『ガールズバンドクライ』がまさかの人気を獲得した理由は? 東映アニメーションの平山理志プロデューサーにたっぷり語っていただいた ©東映アニメーション 〈後編はこちら〉 暗い時代を生きる人々に寄り添うのは「地に足のついた」物語だ 人気作が並んだ2024年春番組で大きな話題となったオリジナル作品が『ガールズバンドクライ』だ。手がけたのは平山理志プロデューサー。2019年に東映アニメーションに入社した平山氏は、『ラブライブ!』シリーズを共に作ってきた監督・演出家の酒井和男氏にシリーズディレクターを、そして花田十輝氏に脚を依頼。新たなオリジナル作品を作り始めた。 コンセプトは「音楽もの×今の時代を反映した物語」。生きていくのが大変な時代にマッチする主人公と物語を数年かけて探っ

    なぜ『ガールズバンドクライ』は貧乏になった日本で怒り続ける女の子が主人公なのか?――平山理志Pに聞く (1/4)
  • 日本アニメの輸出産業化には“品質の向上よりも安定”が必要だ (1/4)

    アニメ『転生したら第七王子だったので、気ままに魔術を極めます』を手掛けた「つむぎ秋田アニメLab」の櫻井司社長ロングインタビュー後編。引き続き、ゲームエンジンを使ったアニメ制作の実際などについて語っていただいた (C)謙虚なサークル・講談社/「第七王子」製作委員会 〈前編はこちら〉 今こそ“クオリティーの安定”を目指すべき 「Unreal Engine」というゲームエンジンの採用によって、アニメ制作の工程を大きく変化させることに成功したつむぎ秋田アニメLab。これまで縦割りだった工程をさまざまな役職のスタッフが越境しながらこなすさまは、『転生したら第七王子だったので、気ままに魔術を極めます』(以下、『第七王子』)のエンドクレジット表記で垣間見ることができる。 だが、制作工程を大幅に見直した目的は、決してクオリティー向上のためではないという。今回は、日アニメが輸出産業として成り立つには、向

    日本アニメの輸出産業化には“品質の向上よりも安定”が必要だ (1/4)
  • 『第七王子』のEDクレジットを見ると、なぜ日本アニメの未来がわかるのか (1/4)

    アニメ『転生したら第七王子だったので、気ままに魔術を極めます』を制作したアニメスタジオ「つむぎ秋田アニメLab」櫻井司社長へのロングインタビューを前後編でお届けする (C)謙虚なサークル・講談社/「第七王子」製作委員会 〈後編はこちら〉 人気急上昇のなろう原作アニメが、他作品とひと味違う理由 たびたびX(Twitter)のトレンド入りを果たすなど、テレビアニメ『転生したら第七王子だったので、気ままに魔術を極めます』(以下、『第七王子』)が好評だ。 実はこの作品の制作スタジオ「つむぎ秋田アニメLab」の社は秋田県にあり、プロダクション成果物の多くを内製で生みだしている。2024年5月にはバンダイナムコフィルムワークスとの業務提携が発表されたことでも注目を集めた。 元請け・下請けの関係が複雑に絡み合い、海外への依存度も高い一般的なアニメ制作とはまったく異なるプロセスで生み出された作の舞台裏

    『第七王子』のEDクレジットを見ると、なぜ日本アニメの未来がわかるのか (1/4)
  • チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます (1/6)

    Anthropicは6月21日、同社の開発する大規模言語モデル「Claude」シリーズの最新版となる「Claude 3.5 Sonnet」を発表。利用制限はあるものの同社のチャット型AIサービス「Claude.ai」で無料で利用可能になった。 同時にユーザーがClaudeとやり取りしながらコンテンツを作成できる新機能「Artifacts」が、さらに25日にはプロジェクトごとに資料やプロンプトを集約できる「Project」が実装された。この記事では、新機能Artifactsを使うときに知っておきたいことをメインに紹介する。 なお、Claude 3.5 Sonnetの前の世代である大規模言語モデル「Claude 3」シリーズおよび「Claude.ai」については、こちらの記事に。Claude 3.5 Sonnetについての基的なスペックなどはこちらの記事に詳しい。 Artifactsのキモは

    チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます (1/6)
  • ソニー「PSP」はゲーム、映画、音楽、ネット対戦と俺たちの夢が詰まった携帯ゲーム機だった

    高画質のゲームが外で遊べる衝撃! 「PSP」はポータブルゲームの礎を築いた プレイステーションのゲームを持ち運んで、いつでもどこでも遊びたい! その願いは、当時のSCE(ソニー・コンピュータエンタテインメント)から2004年12月12日に登場したプレイステーション・ポータブル、PSP(ピーエスピー)の名前で親しまれた携帯型ゲーム機として叶うことになります。 PSPはプレイステーション10周年の年(2004年)に発売されたことを、ついこの前のように覚えていますが、まさか発売から20年の歳月が経っているとは……。 気を取り直して性能を見てみましょう! 4.3型の液晶ディスプレーに、PlayStation2に匹敵するほどのグラフィックを楽しめる脅威のハイスペック。無線LANを備えて、インターネットにつながることは当然として、そこからゲームコンテンツをダウンロードしたり、離れているプレイヤーたちと

    ソニー「PSP」はゲーム、映画、音楽、ネット対戦と俺たちの夢が詰まった携帯ゲーム機だった
  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
  • Windowsはなぜ再起動が必要になるのか? (1/2)

    Windowsでは、Windows Updateの直後やアプリケーションなどのインストール後に再起動が要求されることがある。以前に比べると、再起動にかかる時間は短縮されたものの、開いているプログラムを閉じてファイルを保存する必要があるなど、ちょっと面倒ではある。 なお、システムの再起動は、何もWindowsだけでなく、Linuxなど他のプラットフォームでも必要になることはある。とはいえ、ちょっとしたアプリケーションのインストールやアップデートの後に再起動が要求されるなど、頻度が高い気がしないでもない。今回は、この再起動について調べる。 Windows Updateが再起動を要求するとき Windows Updateの場合、再起動が必要になるのは大きく2つの理由がある。1つはWindows自体の更新で、このときにWindowsのインストールイメージが作られて再起動。Windowsの再インスト

    Windowsはなぜ再起動が必要になるのか? (1/2)
  • 「1億台の常時接続」を実現せよ! Nintendo Switchのプッシュ通知システム全面刷新の裏側 (1/3)

    アマゾン ウェブ サービス ジャパンは、2024年6月20日と21日、国内最大の年次イベントである「AWS Summit Japan」をハイブリッドで開催。150を超えるセッションが展開された。 記事では、ニンテンドーシステムズによるセッション「Nintendo Switch向けプッシュ通知システムのリプレイス事例」をレポートする。登壇したのは、同社 システム開発部の林愛美氏と坂東聖博氏だ。 2017年のNintendo Switchの発売とあわせてリリースされた「プッシュ通知システム」。同社は、長期運用を見据えて、よりクラウドネイティブなシステムへのリプレイスを決定するが、大量のTCP接続を維持するための様々な課題が立ちふさがった。 セッションでは、AWS FargateやNetwork Load Balancer(NLB)といったAWSのマネージドサービスを用いた、“最大1億台”級

    「1億台の常時接続」を実現せよ! Nintendo Switchのプッシュ通知システム全面刷新の裏側 (1/3)
  • 無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない

    Invoke、Comfy Org、Civitai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。 企業による技術の独占を防ぎ、アクセシビリティを確保 「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivitai、大規模な学習データセットを構築するLAIONだ。 彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープン

    無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない
  • 情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)

    最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、EvernoteMicrosoft OneNoteNotionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)

    情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)
  • 革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた

    中国SNS「快手(Kuaishou)」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵(Kling)」を開発。多数のサンプル動画を掲載するデモサイトを公開した。 テキストから最大2分間のフルHD動画を生成 A Chinese AI video generator just dropped before we got access to Sora Can generate 2-minute videos at 30fps, 1080p quality, available on the KWAI iOS app with a Chinese phone number A few generations from their site: 1. pic.twitter.com/NEmWiqKHiO — Rowan Cheung (@rowancheung) June 6, 20

    革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた
  • めちゃ便利になった 無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)

    OpenAIは5月30日、同社のチャット型AIChatGPT」無料版ユーザーに向け、制限付きながら最新の大規模言語モデル「GPT-4o」および、これまで有料版ユーザーしか利用できなかった多くの機能を公開した(発表時のニュース記事)。 情報がとても多いので、今回の変更で無料版ユーザーは「なにができるようになったか」、そして「なにができないのか」を使い方中心にまとめた。 1. GPT-4oは回数制限あり チャット型AIアプリの心臓とも言える大規模言語モデル(LLM)、これまで無料版ユーザーは「GPT-3.5」という旧世代モデルしか利用できなかったが、今回の変更で回数制限(具体的な回数は明記されていない)はあるものの、最新モデルのGPT-4oが使えるようになった。 GPT-4oの利用に特に設定などは必要なく、無料アカウントにログインして普通に質問すればOK(使い方はちょっとわかりにくいのでこち

    めちゃ便利になった 無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)
  • 実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)

    こんにちは、漫画界の生き恥こと野火城と申します。 「画像AI使ってみた/AI漫画実験企画」第2回です! ■第1回はこちら 実録:AIで描く漫画の実際 ~体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。 だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。 「画像AI技術がすごいという賞賛記事はよく見るが、それは当に創作活動で実戦的に使えるものなのか? 『AI仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは? 実際はどっちなんだ?」「画像AIを試し

    実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)