タグ

ブックマーク / ascii.jp (104)

  • チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます (1/6)

    Anthropicは6月21日、同社の開発する大規模言語モデル「Claude」シリーズの最新版となる「Claude 3.5 Sonnet」を発表。利用制限はあるものの同社のチャット型AIサービス「Claude.ai」で無料で利用可能になった。 同時にユーザーがClaudeとやり取りしながらコンテンツを作成できる新機能「Artifacts」が、さらに25日にはプロジェクトごとに資料やプロンプトを集約できる「Project」が実装された。この記事では、新機能Artifactsを使うときに知っておきたいことをメインに紹介する。 なお、Claude 3.5 Sonnetの前の世代である大規模言語モデル「Claude 3」シリーズおよび「Claude.ai」については、こちらの記事に。Claude 3.5 Sonnetについての基的なスペックなどはこちらの記事に詳しい。 Artifactsのキモは

    チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます (1/6)
  • AI動画の品質が仕事に使えるレベルになってきた (1/4)

    Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

    AI動画の品質が仕事に使えるレベルになってきた (1/4)
  • 「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」

    AIスタートアップ「Etched」は6月25日(現地時間)、ChatGPTなど最新のAI技術の基盤となっている「Transformer」アーキテクチャーに特化したチップ「Sohu」を発表した。この発表は、現在NVIDIAが支配的な地位を占めるAIチップ市場に、新たな競争をもたらす可能性がある。 Transformer処理に特化 AIチップ市場は現在NVIDIAが圧倒的なシェアを持つ。同社の汎用GPUは様々なAIモデルを効率的に処理できる柔軟性から市場の約80%を占めている。 多くの大手テクノロジー企業がAI開発のためにNVIDIAのチップに数十億ドルを投資しているのが現状だ。 Etchedの「Sohu」は、ASIC(Application-Specific Integrated Circuit:特定用途向け集積回路)と呼ばれる、特定の用途に最適化された集積回路だ。汎用性は低いものの、特定

    「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」
  • 画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

    画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。 画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

    画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)
  • 古い言語のプログラムを生成AIで統廃合 住友ゴムが“Gemini”で進める開発効率化

    Google Cloud は、2024年3月7日、生成AIをテーマとしたイベント「Generative AI Summit Tokyo '24」を開催。同イベントでは、生成AI活用を実践に移す、各業界のユーザー企業が登壇した。 記事では、設計におけるシミュレーションの現場で開発効率化に取り組む住友ゴム工業の「製造業における生成AIを使った業務効率化への取り組み」と題したセッションの様子をお届けする。 住友ゴムのシミュレーション手法開発部門が抱える悩み 住友ゴムは、タイヤ製品を中核に、ゴルフやテニスなどのスポーツ用品や、地震による建物の揺れを低減する制振ダンパーといった産業品も手掛けている。 このうちタイヤ製品の設計では、開発初期段階から車両メーカーとの間で設計データをやり取りするため、「デジタル化が重要だ」と住友ゴム工業の研究開発部 研究第一部長である角田昌也氏は言う。 加えて、タイヤ

    古い言語のプログラムを生成AIで統廃合 住友ゴムが“Gemini”で進める開発効率化
  • 「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)

    先日サイトで「めちゃくちゃ重いけど動くぞ!Excelで『GPT-2』を再現したスプレッドシート」というニュースを執筆したのだが、実際に触ってみたところ想像以上に素晴らしかったのでレポートする。 「Spreadsheets-are-all-you-need」とは 記事で紹介した「Spreadsheets are all you need」とは、Excelの標準的なスプレッドシート機能を使ってGPT2(ChatGPTの先祖)のフォワードパス(入力から出力までのプロセス)をExcelの中で完全に実装したものだ。 と言ってももちろんExcel内で「ChatGPT」的な会話ができるわけではない。ChatGPTの心臓である大規模言語モデル(LLM)のごくごく基的な機能をシミュレートできるだけだ。 シートの説明文には「開発者でない人でも物のLLMが内部でどのように機能しているのかを、最小限の抽象

    「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
  • 女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?

    ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られた いままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。 彼女は X(Twitter)の自分のアカウントで1日1のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな!」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。 目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

    女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか?
    ducky19999
    ducky19999 2024/02/26
    「自分の意思でやらないと分からない」とか、いいこと言ってるんだけどな
  • え、高級言語しか触ったことないのにCPUを自作するんですか!?

    今回は、高専5年次から趣味で学習していたRISC-Vを実装した、簡単なCPU作成をしていこうと思います。 完全に知識ゼロの状態から学び始めたので、間違った解釈をしている部分があるかもしれませんが、その時は優しく指摘していただけると嬉しいです 🙏 また、ブログはディジタル回路設計とコンピュータアーキテクチャ[RISC-V版]を基に書かれています。初心者でも理解しやすいように丁寧に解説されているので、興味があれば是非買ってみてください! RISC-Vってなんぞ RISC-V公式サイトには以下のように書かれています。 RISC-V is an open standard Instruction Set Architecture (ISA) enabling a new era of processor innovation through open collaboration. (RISC-

    え、高級言語しか触ったことないのにCPUを自作するんですか!?
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
    ducky19999
    ducky19999 2024/02/16
    あーやばい
  • 画像生成AI「Stable Diffusion」を使い倒す! モジュラーシンセみたいな「ComfyUI」をインストール (1/3)

    sponsored キャンペーン期間は2024年4月22日まで 14900K&RTX 4080 SUPERで2万円オフ!! サイコム春キャンペーンで得するオススメ構成はコイツ sponsored 三井デザインテックにkintoneを導入した富士通Japan 基幹システム連携と伴走に強み sponsored kintoneで営業システムを刷新 アサヒ飲料をコムチュアがサポート sponsored はじめて買ったパソコンを安心して使う!「セキュリティ初心者のための三原則」 sponsored JN-34VC165UQRをレビュー 3440×1440ドットで165Hz駆動!湾曲ウルトラワイドでFPSにも使えるオールラウンダー sponsored クリエイティブな作業にも活用できる広色域&高速応答 4KのRAPID IPSディスプレーはワンランク上のゲーミング環境を約束!MSI「MAG 322UP

    画像生成AI「Stable Diffusion」を使い倒す! モジュラーシンセみたいな「ComfyUI」をインストール (1/3)
  • 秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話 (1/3)

    美少女画像を生成しようと思い立ち7月にゲーミングPCを購入してからはや半年、当初の目標であった画像生成にはなんとか成功したものの、とにかくこのジャンルは進化が早い。苦労して新しい技術を使えるようになったと思ったらすぐに次のとんでもない技術が登場し、以前のものは古くなっていく。なんとか振り落とされないようについていくのがやっとだが、それでも猛烈におもしろく刺激的な半年間だった。 「Stream Diffusion」爆誕 StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました!! sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます! 多分これが一番速いと思います pic.twitter.com/4qleR2isW1 — あき先生 / Aki (@cumulo_autumn) December 6, 20

    秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話 (1/3)
  • 「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

    AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG

    「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
  • アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

    原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基原理です。生成できる時間は、16コマ/2秒

    アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)
  • さよならミズグチさん「水口幸広(カオスだもんね!)追悼原画展」レポート (1/4)

    パソコン情報誌「EYE・COM」「週刊アスキー」で「カオスだもんね!/カオスだもんね!PLUS」(1991~2020)を連載していた、故・漫画家/イラストレーター【水口幸広】氏の「水口幸広 追悼原画展」が7月21日~23日の3日間、東京・BookCafeヨミヤスミにて開催されました 元週刊アスキー編集者、現フリーライター兼プラモマニアのアカザーです。週刊アスキー(以下、週アス)で連載していたレポート漫画「カオスだもんね!」の3人のうちのひとり、ガンタンク担当アカザーが「水口幸広追悼原画展」の模様をレポートします! 全国からコアなミズグチファン カオスだもんね!ファンが集結 開催場所となった京王多摩川にあるBookCafe「ヨミヤスミ」は、カオスチームの顔の長いほう担当のシャクライさんのお店。カオス編でも何度か紹介しているのでご存じの方も多いかもしれません。 お店は1階がカフェスペース、追

    さよならミズグチさん「水口幸広(カオスだもんね!)追悼原画展」レポート (1/4)
  • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

    画像生成AIStableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

    画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
  • Blenderに挫折する前に見てほしい、日本語の解説動画を紹介

    みなさんBlenderやってますか?? 私は大好きです。 どうも花田です。前にもBlenderについて書きましたが、今回は挫折した、若しくはBlender分からんッッ! って人に話します。 Blender語で解説してくれている人いるよ~ います。 中でも、当に当に初期にお世話になった人たちを2人紹介します。 M design - YouTube 話してくれる声は少なめで、動画を止めてゆっくり進めていく方式です。 情報量が少なく、作っている動画なので見よう見まねでできました。 3D Bibi - YouTube 簡単なモデルを細かく教えてくれるため、モデルが挫折しない。 YouTubeでBlenderで検索すると他の動画も沢山出てきます。 作りたいものを作りたいんだ! 作りたいものを検索しても、日語版が出てこない… 英語版を見て、挫折してしまった人も多いのではないでしょうか。 Bl

    Blenderに挫折する前に見てほしい、日本語の解説動画を紹介
    ducky19999
    ducky19999 2023/05/08
    あとで見ない
  • COM(Component Object Model)は古い技術だが、いまだに現役 あらためて解説する (1/2)

    前回解説したプレビューハンドラなど(「エクスプローラーのプレビューウィンドウについて解説する」)、エクスプローラーの拡張機能は、COM(Component Object Model)を使って作られている。 COMは、すでにWindowsでは主流ではなく、後継として.NET Frameworkが登場している。しかし、COMは廃止されたわけではなく、いまだにWindowsのさまざまな場所で使われ続けている。というのも、Windows XPまでは、WindowsのOSの主要オブジェクト技術であり、Windows自身がCOMで構築されていたと言っていいほど利用されていたからである。 エクスプローラーや関連技術でいまだにCOMが使われているのは、その名残でもある。長らく続けてきた連載だが、COMについては解説するタイミングを失っていた。ちょうどいい機会なので、今回はCOMを簡単に解説してみたい。

    COM(Component Object Model)は古い技術だが、いまだに現役 あらためて解説する (1/2)
  • PowerShellのコマンドの並びにある典型的なパターン (1/2)

    PowerShellによるコマンドの並びには典型的なパターンがある 何かしたいときはパターンを考えることで見通しがたつ PowerShellの人気は今ひとつ。コマンドの数は多いし、プログラミング言語的な要素がありすぎて理解が困難という話も聞く。筆者も面倒になると、いまだにcmd.exeを起動することがある。しかし、仕事などで、どうしても使わざるを得ない人もいるだろう。ただ、PowerShellでないとできない作業もある。PowerShellを使うかどうかは個人の自由で、筆者としてもPowerShellを普及させようなどとは思っているわけではない。しかし、使わざるを得ない人を多少なりとも手助けできればと考えている。 これまで筆者がPowerShellを使ってきて、少しわかったことがある。基的な使い方としては、シェルであることを踏まえて、コマンドをパイプでつなげて並べ、プログラム(スクリプト

    PowerShellのコマンドの並びにある典型的なパターン (1/2)