NHKのニュースや番組をつくっている私たちが取材に込めた思いや取材手法などをお話します。一緒に「取材ノート」をつくっていきましょう。サイトはhttps://www.nhk.or.jp/d-navi/note/ 利用規約はhttps://nhk.jp/rules
一応、StableDiffusionとははっきりまず言います…とにかくやばいです。 分かりやすく、他のDALL・E2、Midjourney、Disco Diffusion、他有象無象Text to image machine learning系サービスと比較しますと… クオリティがかなり高い。 制限がなくなり、かなり細かい調整ができるようになったDALL・E2のような感じです。 生成が早い。 設定なしで使えば正直体感DALLE2より早いです。6秒..くらい? 安い。 3円くらいだと思います。 DALL・E2は1生成17円。Midjourneyは月4000円。 オープンソース これからいろんなサービスにこのAIが搭載されます。 他AIではかけられている学習データのフィルターがない。 各国の代表者や、有名人、ポルノがデータに含まれています。 PC上で使用できる。( = その場合無料) いや、こ
ホーム ブログ 人工知能(AI)、ビッグデータ法務 Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権|知… はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決ま
こんばんは、座禅いぬです。 JAWS DAYS 2025に参戦してきました!会場前にいたコツメカワウソの赤ちゃんがとてもかわいかったです。 さて、Deep Researchのサービスが始まってから、たくさんの人が自分の使い方を編み出して解説していると思いますが、自分の使い方をまとめたかったのでここに載せておきます。これ、とんでもない機能ですよね。使ってみてすぐ、人類はもう生成AIに勝てないなと思いました。 一言でいうと、調べたいもの、考えたいことに対して「論文を書く」というフレームワークを構築します。論文の構造はいろいろあると思いますが、理系論文の流れをフレームワークととらえ、生成AIに思考しやすい形を作ります。 背景:なぜ論文という枠組みが良いのか 論文は次のような流れを持ちます。 背景 (Introduction) 目的 (Objective) 材料と方法 (Methods) 結果 (
タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの
マイクロソフト、初心者向け生成AI学習教材「生成AIアプリケーションの開発を始めるために必要な全知識を学べる12講座」を無償公開 コースの内容には、大規模言語モデル(LLM)がどのように動くかを理解する。「生成 AI と大規模言語モデルの紹介」、ユースケースに適したAIモデルを選択できるようにする「様々なLLMの調査と比較」、プロンプトの構造と使用法の理解のための「プロンプト・エンジニアリングの基礎」、埋め込み技術を利用したデータ検索アプリケーションを構築する「Vector Databasesを利用した検索アプリケーションの構築」、外部APIからデータを取得するためFunction Callingを設定する「Function Callingとの統合」など、入門的な内容から高度なアプリケーションの開発まで多岐にわたるレッスンが用意されています。 レッスン内容は日本語による説明と図で構成 各レ
10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンを食べる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です
なぜオジサンは一人でブツブツと喋るのか。 それは、音声入力こそが最強のプロンプトを生み出すからである。 両手をキーボードから解放する時が来た。 忙しい人向けの説明 さっそくChatGPTを開き、iOSのマイクから音声入力を起動したら、 これを使って入力 「本しゃぶりというブログにChatGPTの使い方について、面白そうな記事があったのでメモ。なんか音声入力を使うといいらしい。これまで話した内容について整理し、マークダウンで出力して」 と喋っておこう。誤字脱字などの修正をせずに投稿すればいい。 以上。 音声入力と生成AIの組み合わせが強い 生成AIをうまく使いたいならば、詳細なコンテキストを与えるのが良い。しかし、ここに大きな問題があった。 人間というものは楽をしたがる生き物である。特にAIに助けを求めるような人は、なおさらだ。文章を入力することに面倒くささを感じ、つい最小限の指示で済ませて
以下の記事などで既にかなり話題になっていますが、ぼくも触ってみました(使い方などの詳細はこちらの記事を参照してください)。 結論としては、マジすごくてかなり衝撃的です。すべてのホワイトカラーワーカーにとって、かなりディスラプティブなツールになるのではないでしょうか。 自分はコンサルタントでして、これまでにたくさんの資料を作ってきてスキルを磨いてきたつもりだったので、AIポン出しでここまでのものが出てきてしまうと、正直、人生について考えさせられちゃいますね。 この記事では、Napkinを使ってどういう資料ができたのか共有したいと思います。 ポストモーテムの勉強会をしたいなと思っていたので、まずはChatGPTで資料の骨子を出力し、それをNapkinに入力してみました。それで得られたのが、以下の資料です。 スライド1: タイトルスライド タイトル: ポストモーテムの教科書 副題: SREにおけ
今年開設されるZEN大学で、「生成AIでリサーチとか勉強を加速させるには?」的な授業をやることになったので、その前座的なまとめ。 生成AIでとりあえず「英語」を効率よく学ぶ。深津式のベータ版。 自分の好きな分野で学ぶまず英語そのものを学ぶのではなく、「好きなことのために英語を学ぶ」構造を作る。 ポケモンカードでも、音楽でもスポーツでも、何でもいいから「自分がメチャクチャ成長したい趣味分野」を定める。 で、ChatGPTの4o以降のモデルで下記のように聞く。 あなたは英語予備校の先生として、英語の長文読解を楽しく学ぶための教材を以下の条件に従って作ってください。 * トレーディングカードゲームのデッキ編成論を題材にする。 * 関係代名詞を題材にする。 * フォーマットは会話形式(or エッセイ形式)にする。 これで、自分の興味分野の英語長文がつくれる。毎回テーマを考えるのが難しい場合は、下記
最初にアカウントを作成する必要がありますが、メールアドレスを登録すれば数分で完了します。 メールの場合は認証作業が必要です。 1.2 シークレットキー作成 続いては、以下の画面から"create new secret key"をクリックすると自動で生成されます。 先ほどのこちらのリンクから以下のページへ飛べます。 https://beta.openai.com/account/api-keys シークレットキーをコピーして、別で保存しておきます。 一度OKで閉じると消えてしまうので、しっかりとメモにして残しておくことをおすすめします。 一応何度でも作成はできます。 1.3 料金体系 実は、OpenAIのAPIは無料ではありません。 なので、先ほどのシークレットキーは他人は教えないように!!! 言語モデルによって料金が異なります。 大体1記事書くのに分量にもよりますが、数円くらいです。 また
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
ChatGPTに「○○は将来どうなりますか?」と直接的に尋ねても、大抵は「確かなことは言えません」といった控えめな返答しか得られない。その背景には、未来の出来事を予測しないようChatGPTの頭脳であるLLM(大規模言語モデル)に調整が施されている可能性も指摘されている。ところが、プロンプトにある工夫を加えると、雄弁に未来を語り出すという。どういう工夫なのだろうか。(小林 啓倫:経営コンサルタント) 生成AIの予測力を上げるには 質問すれば何でも答えてくれる、便利な生成AI。いっそ未来のことも聞けないかというわけで、さまざまな形で生成AIを未来予測に活用する取り組みが行われてきたことは、この連載でも何度か取り上げた。 たとえば、専門家が編み出した「未来予測手法」に従うよう指示した生成AIは、予測精度が上がるという研究結果が出ている(参照記事)。 しかし、もっと簡単にChatGPTの予測精度
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi
小猫遊りょう(たかにゃし・りょう) @jaguring1 毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。 小猫遊りょう(たかにゃし・りょう) @jaguring1 うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた(DALL-EとCLIP)。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、大規模言語モデル(LLM)を活用して日本の国会議員のこれまでの発言を分析して政治的立場をまとめた研究「KOKKAI DOC: An LLM-driven framework for scaling parliamentary representatives」を取り上げます。 トロント大学に所属する研究者らが発表したこの研究では、議員の国会での発言から政治的立場を数値化し、視覚的に表現することで、有権者が選挙時に情報に基づいた判断をしやすくすることを目指しています。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。 生成AI論文ピックアップ複数の自律AIエージェントが過去の経験を共有して未知のタスクを処理するモデル「Experiential Co-Learning」> 画像から動く3Dシーンを生成する新モデル「DreamGaussian4D」 大規模言語モデルの返答が向上する「プロンプト26の原則」が公開。「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など 220以上の生成タスクが
(説明不足もあったのでちょい修正したよ) AI画像生成をやってみたいけど たくさんあってどれにしようか迷ってる人 色んなところで◯選とか言いつつ やたらといっぱい紹介して選択で困りませんか? 私は3選にギュッとしました。 しかもリアル1選、イラスト1選、将来性1選なので 実質2選です。 3つともサーバーはサービス側持ちなので低スペPCや低スペスマホでも生成できるのが最大の利点です!上級者以外はハイスペPCでのローカル生成なんて不要だと思ってる。 リアルならImageFXリアルならImageFXが良いです。 GoogleのサービスなのでGoogleの本アカウントでも 安心して出来るのも嬉しい。 1日あたりの回数制限はあります。たぶん50回前後 前からリアル系ではトップクラスの表現力でしたが この数ヶ月でさらに急激な進化を遂げて 顔パターンや動作パターンが激増しました。 今日は成人式なので成人
ふっく|AIと働く経営者🤖 @fukku_ai_BD Chat GPTとの壁打ちがビミョー、、、、って時は、「しっくりこないので話を戻します。フレームワーク〇〇〇〇を用いて、1つずつ丁寧に質問して。」と伝えると、一変するの知ってた? 敢えて壁打ちの途中で話を戻すことで、 「しっくりきてない現状」も理解してくれるので 経緯も読み取って精度の高い質問をしてくれます。 「その視点は無かった…」って人は ぜひコレを使い倒してください🙌 AIの活用法を学んでいても 特定の仕事の質や生産性しか向上しません。 賢いAIを賢いパートナーだと捉えるんです。 「AIとの働き方」を学ぶのが これからの時代で得する働き方ですよ。 2025-03-26 07:27:55
ひたすらタイトル通りの出来事なのですが、自分のなかでは黒船来航くらいの衝撃だったので記録しようと思います。 長文になりますので、あまりにも暇な方のみお読みになることをお勧めします。 私はアラサーの会社員で、「くしゃみに興奮する」という性的嗜好を持っています。 自己紹介もそこそこに性癖の話で恐縮です。 くしゃみをさせる対象は人間の女性キャラクターがベストですが、 男性はもちろん、人間ではない(動物などがデフォルメされた)キャラクターでも問題なく楽しめます。 小説など、文章にあらわれるくしゃみの描写にも非常に興奮します。 ただし、現実世界のくしゃみにはあまり惹かれません。 早朝の電車内で、ノーマスクの中年男性がかます爆裂ハクションには殺意に近いものを覚えます。 後で少し書きますが、なりふり構っていられないくらい供給が少ないくせに、注文や条件をつけてしまうわがままな性癖なのです。 くしゃみは一般
こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi
日本時間2025年3月26日、OpenAIはChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合し、一般提供を開始しました。 今回のアップデートは単なる画像生成機能の追加ではなく、言語モデルの中核的な機能として画像生成を位置づける、非常に重要なアップデートです。特にテキストのレンダリング精度や複雑な指示への対応力が飛躍的に向上し、従来難しかった実用的な表現が可能となりました。 AIによるクリエイティブな画像生成が新たな段階に進んだことを実感できる、画期的な進化を遂げています。 最新の画像生成機能で生成 GPT-4oによるネイティブ画像生成機能の詳細今回のアップデートで最も大きな特徴は、画像生成能力がGPT-4oモデル自体にネイティブに組み込まれた点です。テキストと画像の連携がよりスムーズになり、以下の機能向上が実現しています。 特徴: 高精度なテキストレンダリング:
テキストから画像を生成できるAIお絵描きアプリ「AIピカソ」を提供するAI Picasso株式会社(本社:東京都港区、代表者:冨平準喜)は、かわいいイラストで有名なフリーイラストサイト「いらすとや」(運営:みふねたかし)と提携し、いらすとや風のイラストを生成するAIモデル「AIいらすとや」をリリースしました。 AIいらすとやについて 「AIいらすとや」は、AIでいらすとや風のイラストを生成することができるAIモデルです。高品質な画像を自由に生成できるAIピカソの画像生成技術を活用し、いらすとやのかわいいキャラクターたちを学習した専用のAIモデルを開発することで、テキストを入力するだけで、誰でもほしいと思った状況のいらすとや風の画像を無料で生成できるAIモデルを実現しました。 いらすとやは、様々なシチュエーションのかわいいキャラクターが素材化されており、多岐にわたり利用されています。AI
呪文(プロンプト)とは? 呪文(プロンプト)とはStable Diffusionをはじめとする画像生成AIに入力する文章のことです。呪文(プロンプト)は画像の特徴を表すようなキーワードや文章を,区切りで入力するのが一般的な呪文(プロンプト)です。呪文(プロンプト)は呪文と呼ばれることも多いです。 呪文(プロンプト)には次のようなキーワードが指定されることが多いです。 画像の品質、クオリティ(例: masterpiece, best quality) カメラフォーカス(例: sharp focus, depth of field, blur background, bokeh) ライト・ting) 構図(例: front view, full body) 人物(例: 20 years old woman, 15 years old actress) ポーズ(例: looking at vie
前置き 毎週金曜日夕方に行われる社内勉強会にて、先日生成AIについて発表しました。折角なので少し加筆修正した資料を公開します。進化のスピードが早く、一時期食傷気味に陥ってましたが改めて昨今の生成AI関連の基本となるインプットを目指しました。 ※資料内冒頭に記載してますが、AIの専門家ではないので認識や説明に誤りがある可能性があります。 当方も勉強中なので、「ここ違うよ」や「これの説明もあるといいんじゃない」など様々なコメント大歓迎です! 資料 資料目次 AIの基本 機械学習について 深層学習について 機械学習の種類 教師あり学習の得意なこと 教師あり学習のイメージ 教師なし学習の得意なこと 教師なし学習のイメージ 強化学習の得意なこと 生成AIについて 生成AIとは 生成AIの位置付け 生成AI利用例 代表的なサービス例 日本における盛り上がり 生成AI市場規模 AGIとは AGIは近い?
ChatGPT の画像生成機能が刷新され、業界に再び激震が走っています。 今回のアップデートは簡単に見逃せるような単なる機能追加ではありません。 画像生成能力が GPT-4oモデル自体にネイティブ統合されたことで、ChatGPTとの自然な会話を通して、従来とは一線を画すレベルの実用的な画像を生成できるようになりました。 なんと、この画像生成機能のリリースからわずか1週間で1億3千万ユーザーが7億枚もの画像を生成したという報告もあり、その注目度の高さがうかがえます。 今までと何が違う?今までの画像生成AIとの明確な違いは、圧倒的な指示理解力、画像内のテキスト(日本語含む)の高い描画精度、そして会話による柔軟な画像編集能力です。 ChatGPTがユーザーの意図を汲み取ってくれるため、難しいプロンプト作成は基本的に不要になりました。これからは、AIとの対話を通じてイメージを具体化していくスキルが
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf
こんにちは、株式会社Renewerの堀内です。 昨年、『ChatGPTを徹底活用! ビジネスパーソンのためのプログラミング勉強法』(翔泳社)という本を出版しまして、その執筆にあたって 「生成AIを使った効率的な勉強法」について深く考える機会を得ました。 このAIの使い方は、「人の学習能力を高める」ことに繋がります。 これは、"AIに仕事を奪われる"といわれる現代において、時代をサバイブする重要なヒントになると感じています。 一方で、英語や資格の勉強をしている知人にインタビューすると、意外にも生成AIを使っている人は少なかったんです。 「こんな使い方ができるよ」と共有すると、「試してみます!」「思いつかなかった!」といったポジティブな反応をもらうことが多かったです。 年のはじめは新しい学びに挑戦する方は多いでしょう。 学び続ける人たちの目に留まり、生成AIを使った効率的な学習方法を見つけて欲
by Sincarnate 高精度な画像を生成できるAI「Stable Diffusion」などが登場し、人間と遜色ない絵が多数生み出される一方で、絵という芸術作品の著作権の概念が薄れつつあることも問題視されています。このほど、Stable Diffusionより一足先に登場していた画像生成AI「Midjourney」により生成された絵が、とある品評会で1位を獲得してしまったことが話題となっています。 An AI-Generated Artwork Won First Place at a State Fair Fine Arts Competition, and Artists Are Pissed https://www.vice.com/en/article/bvmvqm/an-ai-generated-artwork-won-first-place-at-a-state-fair-
sponsored ファーウェイの最新モデルから見えてくるそれぞれの魅力とは? スマートバンドとスマートウォッチ、どっちがいい? どっちを選ぶ? 最新モデルで考える sponsored MSIの23.6インチモニター「MAG 242C」をレビュー 物価高なのに性能アップで価格を下げるという、ありがたいゲーミングディスプレーを複数買いしたい sponsored CData Arcで基幹システムのデータをkintoneに取り出したら、業務が変わった 残業地獄終了 ERPとkintoneを連携させたら、見積もりも在庫管理も爆速に sponsored 基幹システムとkintoneとの連携、チャレンジしたらDXが見える 触れたら怖いERP なぜ重厚長大になってしまったのか? サイボウズとCDataが語る sponsored MSI「MAG B860M MORTAR WIFI」レビュー マイクロタワー
このnoteの収益を使ってStable Diffusionを使ったWebサービス https://memeplex.appを公開しました。誰でも無料で何枚でもAI作画をすることができます(そのかわり、混み合ってる時は時間がかかると思います)。 このnoteで学んだことをぜひ活用して、AIによる新しい時代の風を感じてください。 また、本文中にMidjourney、StableDiffusion、DreamStudio、Memeplexなどの言葉が頻出するため、全面的な修正を行うことにしました。StableDiffusionに統一しておきたいと思います。 現状(2022/8/28)は、StableDiffusion=DreamStudio/Memeplexと考えて構いません。Memeplexは将来的にStableDiffusion以外のアルゴリズムもサポートする予定だからです。
タスクによっては(もしかすると業務の大部分?)、生成AIにまかせたほうが自分でやるよりはるかに早くて質も高いのは認めざるを得ないところ。 いかにシームレスでマイクロに生成AIを活用できるかが業務効率化の肝になってきますよね。そうなると、日々使いまわすプロンプトの運用術は、重要な基本スキルといえそうです。 本記事では、「プロンプトづくり」「呼び出し」「管理」の3ステップでのプロンプト運用術を提案。テキスト入力効率化ツール「Text Blaze」の活用方法を中心にご紹介していきます。 プロンプトを考えたり呼び出したりがちょっと面倒……と考えている方、生成AIフレンドリーな環境づくりの一環としてぜひ参考にしてみてくださいね! ステップ1. プロンプトづくりScreenshot: 山田洋路 via Anthropicなにか生成AIに作業させたい……と思い立ったときには、とりあえずAnthropic
こんにちは!逆瀬川 ( https://x.com/gyakuse ) です! 生成AI Advent Calendar 2024の記事を書くの忘れていたので、現時点での生成等AIの進歩をまとめてみました!今日はAIがいまなにできんの?ってこと聞かれたときにこれできるよ!って教えるためのメモとして活用してください!また、生成AIプロダクト Advent Calendar 2024というのもソロでやっています。このカレンダーではLLMの基礎理論からModelのFine-Tuning、プロダクト開発等をまとめています。ぜひこちらも見てください! 未来を感じる技術の進歩 動画生成では、Veo2 や Sora が登場しました。 インタラクティブな動画生成では、Genie2 (WASDと方向キーで操作可能な世界モデル)が非常に革新的な進歩を遂げています (振り返っても一貫性を保つ長期性が本当にすごい
Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く