![【西川和久の不定期コラム】 Stable Diffusionで写真1枚から顔を似せるには?いろいろなFaceコントロールを試してみる](https://cdn-ak-scissors.b.st-hatena.com/image/square/470d81182d1efddfb558f5e4132f565d12a400c4/height=288;version=1;width=512/https%3A%2F%2Fpc.watch.impress.co.jp%2Fimg%2Fpcw%2Flist%2F1562%2F463%2FC01.jpg)
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第4回を開催します。講師は、人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんです。 高価なゲーミングPCがなくても自分で高速な画像生成ができるサービス「生成AI GO」を無料で使いながら、生成AIに関する知見とグラビアカメラマンとしての豊かな経験から得られた最新かつ実践的なテクニックを学べます。 なお、ワークショップ内で使用するプロンプトは、受講者向けにドキュメントとして公開し、その場でコピペするだけで画像生成を体験できる、非常に簡単な仕組み。生成した画像はその場で自分のパソコンに保存できます。 第4回は、1月23日、オンラインにて開催いたします。なお、今回お申し込みいただいた方は、第3回の動画アーカイブを視聴いただけます。 グラビアカメラマンが教える、生成AIグラビア実践ワークショップ 申
歌声合成ソフト、Synthesizer Vでは一体何ができるのか。自身でさまざまなクリエイターに声をかけ制作したコンピレーションアルバム『AIボーカルコンピVol.1 with Synthesizer V AI』をリリースするなど、Synthesizer Vに造詣が深い音楽プロデューサーの鈴木Daichi秀行氏に、その全貌を解説していただこう。 Text by 鈴木Daichi秀行 はじめに TOPIC 1|歌声を選んで歌詞を入力 TOPIC 2|外部からMIDIファイルを取り込む TOPIC 3|自動でテイクを作成するAIリテイク機能 TOPIC 4|好みに合わせて声色を調節 TOPIC 5|歌だけでなくラップにも対応 TOPIC 6|プラグインとしての活用とオーディオデータの書き出し TOPIC 7|直近のアップデートで追加された新機能 まとめ 【特集】夢ノ結唱 BanG Dream!
2023年秋の怪作、16bitセンセーションの第10話があまりにも良かった! けど第12話以降がダメすぎた! なんとか生産性のある方向に無理やり褒められないか考えてたけど無理だったので、せめて第10話が良かった話だけ書いて俺の16bitセンセーションを終わります。 中盤に着てたこの服マジで好き アベンジャーズのセイバー 別に悪くもないリアルな秋葉原 それでも暴れる老害たち シリーズ構成の人途中で死んだ? この記事の要約(ChatGPT) このテキストは、アニメ「16bitセンセーション」の第10話に特に焦点を当てています。 作者は第10話を非常に高く評価しており、特にアメリカ風に変化した「セイバー」というキャラクターや、オタク文化がグローバルに展開されたパラレルワールドの秋葉原の描写を称賛しています。 しかし、第12話以降の展開には失望し、特に生成AIの扱いやキャラクターの動機付けが不満足
過去の探求が未来への展望を切り拓く。アドベンチャーゲームの新たな展開は、過去を踏まえつつAIの進化によって次なる局面へと進化しようとしている。ゲーム史が刻む足跡のひとつひとつが、私たちを新たな時代へと導いている。 前編となる<過去探求編>では、往年の「コマンド入力式ADV」の経験談や洞察、そして問題提起といった興味深い対話に耳を傾けた。後編の<未来展望編>では、AIがもたらす可能性や課題、自然言語処理(NLP)を活用した次世代ADV「NLPアドベンチャー」の現状に焦点を当てていく。往年の「コマンド入力式ADV」が、AIによってNLPアドベンチャーとして生まれ変わり、どのようなゲームデザインが求められているのか。 引き続き『ポートピア連続殺人事件』、『ドラゴンクエスト』の堀井雄二氏、『倉庫番』、『道化師殺人事件』の今林宏行氏、『かまいたちの夜』の我孫子武丸氏に登場してもらおう。さらにスクウェ
2024年1月1日 株式会社スクウェア・エニックス・ホールディングス 代表取締役社長 桐生 隆司 謹んで新年のご挨拶を申し上げます。 2023年は、長きに亘り猛威を振るったコロナ禍がほぼ収束し種々の活動制限が撤廃されることで、人々の暮らしが好転する動きが各所で見られました。その一方、コロナ対応に追われた各国中央銀行の金融政策の影響等による急激な物価高や地政学的リスクのさらなる高まりなど、様々な混乱もまた顕在化しました。地域・国レベルはもとより、我々個人一人ひとりがコロナ後の新しいスタンダードを模索する過渡期的な一年であったと言えます。 このように社会全体の不確実性が増す中、我々の事業の中核を成すデジタルエンタテインメント分野に目を向けると、実用化・一般化までもう少し時間がかかるのでは、と思われていた複数の領域で人々の耳目を集める商品・サービスが登場し、その可能性がよりクローズアップされまし
現在の作戦設定を取得する ボス戦(つまり「逃走禁止」フラグが設定されている戦闘)においては、 プレイヤーによって設定された作戦が「みんながんばれ」か「ガンガン いこうぜ」の場合、隠し作戦である「対ボス」が代わりに使用される。 MP余裕量を計算する 呪文を使う仲間の場合、作戦や戦闘状況に応じて、行動評価(以下参照)に 影響を与えずに使えるMPの「余裕量」が設けられている。行動の消費MPが この余裕量以下の場合、消費MP「0」とみなされる。 具体的に、AIプログラムはまず、各仲間の「有用値」を計算する。256から、 マヌーサ・マホトーンの場合はキャラクター毎の値(以下参照)が引かれ、 さらに睡眠状態だと、その結果が半減される。 キャラ │マヌーサ│マホトーン 勇者 │ 85 │ 85 クリフト│ 100 │ 100 ミネア │ 100 │ 100 マーニャ│ 32 │ 192 ブライ │ 3
毎年、やねうら王プロジェクトでは、クリスマスシーズンになると何かしらのプレゼントを行ってきました。詰将棋問題集100万問であったり、やねうら王のメジャーバージョンのリリースであったり、教師用データセットの公開であったり。今年は、最新版であるやねうら王V8.00をクリスマスに公開しようと準備を粛々と進めてきました。 そんななか、とても心を抉られる記事を目にしました。羽生先生のインタビュー記事です。 将棋をこよなく愛する開発者のみなさんは、将棋ソフトの開発で稼ごうと思っている人たちが少ないのです。 そのため、開発したプログラムを自分のスキルを披露する場として捉えて公開し、私たちが将棋AIを使うためのアプリも無償で公開してくれています。 <a href="https://www.kumon.ne.jp/kumonnow/obog/100_1/" target="_blank" rel="noop
自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。 そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して
作家、神林長平さんは「言葉」「機械」などのテーマを重層的に組み合わせた独自の世界観を反映させた数々の作品で知られる。現代を代表するSF作家の一人として、急速に普及が進む人工知能(AI)をどう見ているのだろうか。寄稿してもらった。 2023年は、チャットGPTに代表される対話型AIが爆発的に普及し始めた年として記憶されるだろう。機械相手に自然な会話ができるというのは驚きを伴う楽しい体験に違いないが、それが実用面で使われると、他人の権利や人権を侵害する恐れがある。ここにきてそれが顕在し、対応策もいろいろ議論されているのは報道されているとおりだ。 対話型、すなわち言語を主体とする生成AIの利用がさまざまな方面で社会的な問題を引き起こすという現象は、社会というものを成立させ、支えているのが「言葉」であることを思えば、当然理解できる。<言葉>は社会を生み、文化や技術を発達させてきた。いつの頃からか人
Linuxの生みの親であるLinus Torvalds氏は、ここしばらく表舞台に顔を見せていなかった。しかし、Linux Foundationのが開催したOpen Source Summit Japanでは、久々に多くの聴衆がいる場に姿を見せ、同氏の友人であり、Verizonのオープンソース責任者を務めるDirk Hohndel氏を相手に対談を行い、Linuxの現状について語った。 2人はまず、次のLinuxカーネルリリースである「Linux 6.7」について話した。Torvalds氏は、日本に向かう直前に、Linux 6.7の4番目のリリース候補版をリリースしたところだった。順調に行けば、クリスマス頃にLinuxカーネルの次のバージョンがリリースされても不思議ではないペースだ。 このようなスケジュールになったのは、Torvalds氏が「マージウィンドウをクリスマスの時期に持ってきて、クリ
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi
生成AIのChatGPTを開発したアメリカのベンチャー企業「オープンAI」は21日、解任されたサム・アルトマン氏がCEOに復帰することで合意したとSNS上で明らかにしました。解任からわずか5日で復帰が決まり、混乱した会社経営が正常化するかが課題となります。 これは「オープンAI」が21日、旧ツイッターのXで明らかにしたものです。 アルトマン氏がCEOに復帰することやほかに3人の取締役を決めたことで合意したとしています。 SNSで会社は「詳細については協力して対応していく。今回のことではご迷惑をおかけした」としています。 「オープンAI」の取締役会は先週17日、CEOだったサム・アルトマン氏を解任しました。 生成AIのサービスを急速に拡大させようとするアルトマン氏と、AIの安全性を重視する取締役会のメンバーとのあいだで激しい議論があった可能性が指摘されていました。 IT大手のマイクロソフトが
先週末、サム・アルトマンは、11月17日に取締役会からCEOを解任されたOpenAIに、征服者としての英雄として戻ってくるかに見えた。 それは、すでに衝撃的な展開に満ちていた中で、また新たな衝撃的な展開をもたらすことになっただろう。アルトマンには大きな影響力があった。OpenAIの従業員はアルトマンの解雇以来同氏を支持し、OpenAIの投資家たちは同氏を復帰させるよう取締役会に働きかけていた。 数十億ドル、ひょっとするとAI業界全体の行く末が、取締役会の決断の行方にかかっており、多くの人が取締役会が圧力に屈し、決定を覆すと予想していた。 OpenAIの悲劇は終わっていない だが、取締役会はそれどころかアルトマンの復帰を拒否し、19日の深夜に従業員に宛てたメモの中で、アルトマンを解任することは、「取締役会の責任を遂行し、この組織の使命を推進する能力を維持するために必要である」と断言した。取締
昨日の朝起きたら目を疑いました。 11月18日、OpenAI創業者、サム・アルトマンは突如、取締役会により、OpenAIのCEOを解任されました。 後任の暫定CEOは、元CTOのミラ・ムラーティが務めます。 これは、以下の公式ブログによって発表されました: 情報が錯綜して、混乱している人も多いと思うので、なるべくわかりやすく、現在わかっていることをまとめます。 事実と予測などを分けて表示します。 公式ブログからわかることまず以下がサムアルトマン解任についてのOpenAI公式ブログの翻訳文です。 OpenAIのリーダーシップ移行に関する翻訳全文最高技術責任者ミラ・ムラーティがOpenAIを率いる暫定CEOに就任;サム・アルトマンが会社を去る。 恒久的な後任者を見つけるためのプロセスが進行中。 非営利団体501(c)(3)として活動するOpenAI, Inc.の取締役会は、本日、サム・アルトマ
構成 構成としては、下記の通りです。 Connectのフローの詳細は下記の通りです。 例として、発話で住所を認識させる処理の流れは以下のとおりです。 コンタクトフロー内で「メディアストリーミングの開始」ブロックを使って、Kinesis Video Stream(KVS)への音声のストリーミングを開始します。 顧客は、住所を含めた発話をします。 「顧客の入力を保存する」ブロックで、顧客が特定の番号を押すと、ストリーミングを終了します。 「AWS Lambda関数を呼び出す」ブロックを使い、LambdaでKVSからデータを取得します。取得したデータをWAV形式に変換し、Whisper APIで文字起こしします。文字起こし内容から、GPT-4 Turboで住所のみを抽出します。 プロンプト再生で、住所のみを音声出力します。 以下の図は、電話での対話の流れを示しています。 前提 2023年11月時
日本時間未明(午前三時)ものすごいスピードで語られたOpenAI初の開発者向けイベントDevDayで発表されたGPT-4-TurboとGPT-3.5-TurboによるJSONモード。 これはものすごく強力なんだけど、Python APIによる使い方がどこにも描いてないので試行錯誤の末見つけましたので共有いたします。 from openai import OpenAI import openai import os openai.api_key = "<APIキー>" client = OpenAI() def gpt(utterance): #response = openai.chat( response = client.chat.completions.create( #model="gpt-4-1106-preview", model="gpt-3.5-turbo-1106", r
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く