PCローカル環境で実行する画像生成AIや動画生成AIにおいて、日本人コミュニティから新しい手法の開発が進んでいます。特に、4月に発表されたローカルPC環境向けの動画生成AI「Framepack」の技術を応用した方法論が次々に登場してきているのです。キャラクターの一貫性を維持しながらポーズを変更させる手法や、着せ替えを実現する「kisekaeichi(きせかえいち)」の登場は画期的な方法論です。世界的に見ても先端的な技術ですが、その開発を日本の“野良コミュニティ”が引っ張っています。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 動画生成AI技術で“着せ替え”画像を生成 動画生成AIツール「Framepack」は、伝説のAIツール開発者であるIllyasviel氏が開発した革新的な動画生成技術です。参考となる最終フレーム
アイコンが変わったerukitiです。最近はやりのgpt-4o image generationを使って、顔だけだったアイコンに全身が追加されました。2023年4月10日に初めてのLLMプロダクトの開発キックオフからもうすぐで二年です。rat yearなこの業界なんで、変化がめまぐるしすぎますね。 今回は、真に高速なAIコーディングのメソッドを確立するために、中規模くらいのコードをコーディングエージェントのみに書かせる実験をしています。コーディングエージェントはCline派生であるRoo Code(以後Rooと呼ぶ)を使っています。 ※完全に個人研究としてやっているため、会社のリソースは使っていません。 作っているものはコーディングエージェントのコアライブラリ + おまけのCLI 規模としては136ファイル・26410行(一時期30000行弱までいった) なぜコーディングエージェントを使っ
こんにちは、株式会社Renewerの堀内です。 昨年、『ChatGPTを徹底活用! ビジネスパーソンのためのプログラミング勉強法』(翔泳社)という本を出版しまして、その執筆にあたって 「生成AIを使った効率的な勉強法」について深く考える機会を得ました。 このAIの使い方は、「人の学習能力を高める」ことに繋がります。 これは、"AIに仕事を奪われる"といわれる現代において、時代をサバイブする重要なヒントになると感じています。 一方で、英語や資格の勉強をしている知人にインタビューすると、意外にも生成AIを使っている人は少なかったんです。 「こんな使い方ができるよ」と共有すると、「試してみます!」「思いつかなかった!」といったポジティブな反応をもらうことが多かったです。 年のはじめは新しい学びに挑戦する方は多いでしょう。 学び続ける人たちの目に留まり、生成AIを使った効率的な学習方法を見つけて欲
These AI Minecraft characters did weirdly human stuff all on their own マイクラ内に「AI文明」、 1000体のエージェントが 仕事、宗教、税制まで作った 最大1000体のAIエージェントが、ゲーム「マインクラフト」内で驚くべき社会を形成した。エージェントは自発的に役割を分担し、経済活動を始め、文化や宗教を作り上げたという。 by Niall Firth2024.12.03 25 この記事の3つのポイント マインクラフト上で1000体のAIエージェントが自律的にやり取りした エージェントは専門的な役割を担い人間らしい行動を示した 開発者は将来、AIと人間が日常的に交流する世界の実現を目指している summarized by Claude 3 放任された人工知能(AI)キャラクターの一群は、ただ生き延びるだけでなく、繁栄し
生成AIが好きな個人がなんでも出展できる「生成AIなんでも展示会」に参加したという玉置絢さんが、「AIの女の子たちに詰め寄られて買った馬券で大金を失うおじさん」を実演するべく、競馬予想システムの「GALLOPIA」を作成したところ、オッズ2275.3倍の馬券が当たった話を報告しています。 AIの女の子がわいわい競馬予想するシステムを個人展示したら倍率2000倍の馬券が当たってしまった (1)設計思想編 #LLM - Qiita https://qiita.com/oktamajun/items/34c2287a9f4d9ac9c298 玉置さんが作成したGALLOPIAは、「AIの女の子が8人住んでいるグループチャットがあり、そこにレースを指定して予想依頼を出すと、話し合いでおすすめの馬券を提案してくれる」というもの。このシステムの趣旨は「AI同士が何やら怪しい知識や主張で『この馬が来る!
生成AIの開発競争が激化し、高性能なサービスが次々と登場している。東京大学薬学部の池谷裕二教授は「私が毎日のように利用しているのはAI回答エンジンだ。従来型のインターネット検索では、表示されたホームページのリストから自分が求める情報を探さなくてはいけないが、回答エンジンならたった一回の検索で欲しい情報にたどり着くことができる」という――。 【写真を見る】ChatHubを用いてOpenAI(左)、Claude(中)、Gemini(右)に当時質問をしたときの回答 ※本稿は、池谷裕二『生成AIと脳 この二つのコラボで人生が変わる』(扶桑社)の一部を再編集したものです――。 ■仕事以外でも役立つ「回答エンジン」 「Perplexity」や「Genspark」や「Felo」を使っているでしょうか。 私は使わない日はないというほど、よく利用しています。これらは「回答エンジン」と呼ばれます。質問を投げか
「生成AI」はいよいよこれから“幻滅期”へ、ガートナーのハイプサイクル2024年版:製造マネジメントニュース 米国の調査会社Gartnerは「先進技術におけるハイプ・サイクル2024年版」を発表。「生成AI」は“過度の期待のピーク期”の末期となり“幻滅期”に入ろうとしていることなどを示した。 米国の調査会社Gartner(以下、ガートナー)は2024年8月21日(現地時間)、「先進技術におけるハイプ・サイクル2024年版」を発表した。 ガートナーのハイプ・サイクルは2000を超える技と応用フレームワークから先進テクノロジーとその成熟度を図で簡潔にまとめたものだ。先進的な技術が「大きな期待」から「幻滅」「最終的な安定普及」といった共通のパターンを経て定着することから、それぞれの技術がこのハイプ・サイクルのどこに位置するのかを示している。今回の「先進技術のハイプ・サイクル」は2000を超える技
Spring Sale: Lock in for lessSave 20% on Annual Pro and PremierSpring Sale: Lock in for lessSave 20% on Annual Pro and PremierSpring Sale: Lock in for lessSave 20% on Annual Pro and PremierSpring Sale: Lock in for lessSave 20% on Annual Pro and PremierSpring Sale: Lock in for lessSave 20% on Annual Pro and PremierSpring Sale: Lock in for lessSave 20% on Annual Pro and PremierSpring Sale: Lock in f
駅やオフィスビル、動物園・水族館、病院など、いつ、どこを訪れてもおよそキレイで、しかも無料。それが日本のトイレです。「きれいなトイレは日本の文化」とまでいわれ、訪日外国人客はその充実ぶりに驚き、日本に帰国した人は「ホッとする」といいます。ただ、空前の人手不足もあり、「いつでも・どこでも無料でキレイ」は、難しくなっているそう。こうしたトイレのお困りごとを、AIやDXで解決しようという試みが、LIXILではじまっています。その詳細を聞いてみました。 トイレ設計をDX化。みんなの意見でよりよいトイレ設計を「選べる」ように LIXILは家庭用をはじめ、さまざまな設備機器等を生産している住宅設備メーカーです。今回注目したのは、住まい用ではなく、誰もが利用するパブリックトイレ。駅や病院、商業施設など、住まい以外のすべての建物に設置されているトイレのことですが、現在、設計と維持清掃という面で課題を抱えて
Xから利用できるAI機能「Grok」の新バージョンでは、画像を生成する機能が加わったことが話題になっています。 AIによる画像生成は珍しいものではないものの、実写のような画像を簡単に作れるため、Xに新たな混乱をもたらすことが懸念されています。どのような画像を作れるのか試してみました。 Grok-2で実写のような画像生成が可能にGrokの機能はXの有料プランの契約者向けに提供されており、8月13日にはGrok-2のベータ版が登場しました。画像生成のモデルとしては、実写のような画像を作れることで話題の「FLUX.1」を採用しています。 使い方は簡単で、Grokに「引き出しを開ける猫の画像を作って」といった指示(プロンプト)を入力すると、5〜7秒程度で画像が出てきます。複雑な文章でなければ日本語にも対応しているようです。 キッチンの引き出しを開ける猫(Grokを用いて筆者作成) 雪景色が見えるリ
呪文(プロンプト)とは? 呪文(プロンプト)とはStable Diffusionをはじめとする画像生成AIに入力する文章のことです。呪文(プロンプト)は画像の特徴を表すようなキーワードや文章を,区切りで入力するのが一般的な呪文(プロンプト)です。呪文(プロンプト)は呪文と呼ばれることも多いです。 呪文(プロンプト)には次のようなキーワードが指定されることが多いです。 画像の品質、クオリティ(例: masterpiece, best quality) カメラフォーカス(例: sharp focus, depth of field, blur background, bokeh) ライト・ting) 構図(例: front view, full body) 人物(例: 20 years old woman, 15 years old actress) ポーズ(例: looking at vie
文化庁は7月31日、「AI著作権チェックリスト&ガイダンス」という資料をWebサイト上で公開した。文化庁や内閣府などの資料を全44ページにまとめたもの。著作権と生成AIの関係で生じるリスクを低減させるための取り組みや、著作権者の権利を保全・行使するための取り組みをさまざまな立場ごとに紹介している。 資料は2部構成。第1部が「AI開発・提供・利用のチェックリスト」(全24ぺージ)、第2部が「権利者のためのガイダンス」(全15ページ)となっている。なお、内容は文化庁が3月に公開した「AIと著作権に関する考え方について」と、内閣府が5月に公開した「AI時代の知的財産権検討会 中間とりまとめ」、総務省と経済産業省が4月に公開した「AI事業者ガイドライン(第1.0版)」から抜粋したものとなっている。
Cotomo(コトモ)は毎日のおしゃべりから、あなたのことを覚えてより身近な話し相手になってくれる音声会話型おしゃべりAIアプリです。
ドリ山田金之助がCursorというAI搭載テキストエディターを使って独自のビデオ編集をやってるという話を風の噂で聞いた。 ドリ山田くーん、遅い、遅いよー とか煽るのも可哀想だったので放置していたのだが、昨日(!!)もっとゴイスーなAIソフト開発環境を触って元に戻れなくなってしまったのでご紹介しておく。 その最新の開発環境とは、人呼んでAIder(エイダー) こいつの何がすごいかというと、gitをcloneしてくると、ソースコード読ませて「これにこういう機能を追加しろ」と言うと勝手に追加してgit commitしてしまう。良きところで/git push origin mainとやればやってくれる。 まあAI開発ものにありがちな、「自信満々で提出されたけどいざ動かすとポンコツ」なケースが多くて、使うには忍耐が必要だが、頭は使わなくていい。たまに頭を使ったふりをして「もしかしてこの関数がやばいん
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く