人気連載『生成AIウィークリー』で取り上げている注目論文を見ると、そこに中国IT企業の名前が頻繁に登場します。 EC大手のアリババ(Alibaba)、ゲーム大手のテンセント(Tencent)、TikTokの運営元であるBytedanceなどが常に顔を出しており、画像・音声・アニメーションと、生成AIのあらゆる分野で中国に勢いがあることがわかります。 そんな中、テンセントがなかなか衝撃的な技術を発表しました。「PhotoMaker」という画像生成AIです。これでなければできない、というものではないのですが、「ファインチューニングの事前作成不要」「元画像が少なくても良い」のに、人物のアイデンティティを維持した画像を生成できるというメリットがあります。 これまでは既存の画像AIモデルに多数の写真を読み込ませて本人性を学習させたものから新たなAIモデルやその簡易版であるLoRAモデルを作ってきまし
「生成AIイヤー」とも言える2023年も終わりに近づいてきたが、ここにきてグーグルがさらに新しい技術を投入すると発表した。 グーグルは12月7日(日本時間)、生成AI向けの新しい大規模言語モデル「Gemini(ジェミニ)」を発表した。 自社のチャットAI「Bard」はもちろん、「Pixel 8 Pro」をはじめとしたAndroidスマートフォンへの組み込みも進める。 グーグルのスンダー・ピチャイCEOはリリースの中で、Geminiをこう表現する。 「賢いソフトウェアというよりも、より便利で直感的な、相談できる専門家または仲間のように感じられるようになる」 グーグルが本気で取り組んだGeminiとは、どんな存在なのだろうか。
肥満体形の男性と、可愛らしい女性のツーショット写真──そんな画像広告をX(Twitter)上で見かけたことはないだろうか。これは「オタ恋」というオタク同士の出会いを支援する恋愛マッチングアプリが展開するAI画像を使った広告だ。「このオタクカップル、絵面が濃い」と思わずツッコミを入れてしまいそうな内容で、じわじわと話題になっている。 オタ恋は2022年11月にサービスを開始し、23年5月から画像生成AIを使った広告を展開している。この広告の効果について、運営会社であるエイチエムシステムズ(東京都新宿区)は「男性は1.5~2倍程度、女性は3~7倍程度、入会者が増加した」と反響を話す。入会者数が増加した理由について、同社は「AI広告素材がバズる事により認知度が上がり信用が増した可能性がある」と分析する。 「マッチングアプリで女性が利用する際、安全性や信頼性、知名度などを重視する声が上位にきており
[インタビュー]コーエーテクモという会社のAIへの向き合い方は,堅実かつ歴史に裏打ちされたものだった。AIの使い方から会社のポリシーに至るまで,普段は表に出ない人にあれこれ聞いてみよう 編集長:Kazuhisa カメラマン:永山 亘 1956年に,初めて「AI」という言葉が登場してから70年近く。2000年代に,ビッグデータや機械学習,ディープラーニングなどの登場により起きた「第三次AIブーム」は,2022年秋に突如として「生成AIブーム」として世間を騒がせることになった。 その最先端の話題をかっさらっていたのが,Stable DiffusionとChatGPTであることに疑いの余地はないだろう。昨今ではようやく少し落ち着きつつあるが,一般メディアも含め,その名を聞かない日はないというくらいには浸透してきている。 否定/肯定入り交じったさまざまな見解が聞かれるAIだが,ゲーム業界がその影響
東京都は8月23日、文章生成AI「ChatGPT」を、全局の職員5万人が利用できる体制を整えたと発表した。Microsoftの「Azure OpenAI Service」を導入した。 職員向けの「文章生成AI利活用ガイドライン」も一般公開。利用のルールやプロンプトのコツ、今後の展望などを、有識者に意見を求めながらまとめた。 都が導入したサービスは、入力データが学習目的で利用されず、サーバにも保存されないという。このためガイドラインでは、職員が業務で利用する場合は、庁内の共通基盤で利用するよう求めている。 また、個人情報など機密性の高い情報は入力しないこと、AIが生成した回答の根拠や裏付けを必ず自ら確認すること、著作権保護の観点から、既存の著作物に類似する文章の生成につながるようなプロンプトを入力しないことなどを推奨している。 都のデジタルサービス局で行ったアイデアソンをベースに、効果的な活
文章生成AI 利活用 ガイドライン Version 2.0 令和6年(2024年)4月 東京都デジタルサービス局 2 はじめに このガイドラインは、東京都で初めてとなる文章生成AI の利活用ガイドラインです。 ChatGPTをはじめとする文章生成AIは、都職員の業務 のあり方を大きく変革する可能性を秘めている一方、 様々なリスクも指摘されています。このため、業務での 活用にあたり期待する効果を得るためには、その特性を よく理解し、正しく利用することが重要です。 東京都では、デジタルサービス局に検討プロジェクト チームを設置して、文章生成AIの利活用について議論を 重ね、令和5年8月、検討の成果をガイドライン (Version 1.0)としてまとめ、文章生成AIの全庁利用 を開始しました。 その後、10月に利用状況についてアンケートを行った ところ、活用事例やプロンプト例を求める声が多かった
Googleは、都内で開催したイベント「Generative AI Summit Tokyo」で、コード生成や補完のためのAIモデル「Codey」が日本語に対応したと発表しました。 CodeyはGoogleの最新の大規模言語モデルPaLM 2をベースとした、コード生成や補完のための基盤モデルです。 Codeyは、自然言語による指示に基づいてコードを生成する機能、チャットで会話しつつコード関連の質問に回答する機能、コードの足りない部分を補完する機能などを備えています。 対応するプログラミング言語は、Java、JavaScript、TypeScript、PHP、Python、Ruby、Rust、C++、C#、Go、Kotlin、Scala、Swift、GoogleSQLなど。さらにGoogle Cloud CLIやKubernetes Resource Model(KRM)、Terraform
使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
こんにちは。一般クリエイターです。前回からlineart(AI着色)を利用したイラスト製作を色々と試していましたが、lineartを使用することでかなり細部に渡って生成物の形状を制御できることが分かってきました。3D背景と併用することで、統一性のある背景を様々なアングルから描写することができます。これによって「AIが生成する背景は描写毎に形が変わってしまうので、同一室内の複数カットを作成できない」という問題がある程度解決されてしまいました。されてしまいましたよ!ある程度! なので今回は3D背景モデルを使用して3カットほどシーンを生成させて何かアニメっぽいやつ作りたいと思います。作業手順はだいぶ複雑になりますので、「AIを活かしてなんか作品作りてえな~」と思ってる人向けの内容となっております。AI着色を使用したイラスト作成に関しては前回記事を参照してください。 まずは今回のアニメの舞台となる
集英社は6月7日、AI生成画像を使ったグラビア写真集「生まれたて。」の販売を終了すると発表した。発売後にさまざまな意見を受け、編集部内で検証したところ、AI生成物の販売は慎重に考えるべきと判断。販売終了を決めたという。 生成AIを使った作品の販売について、週刊プレイボーイ編集部はITmedia NEWSの取材に「法務部に確認しながら適法の範囲内でやっている」と回答していた。 販売終了を決めた経緯について「制作過程で、編集部で生成AIをとりまくさまざまな論点・問題点についての検討が十分ではなく、AI生成物の商品化については、世の中の議論の深まりを見据えつつ、より慎重に考えるべきであったと判断するに至った」と説明している。写真集の販売は各電子書店で7日以降、順次停止していく。
リアルタイムでおっさんから美女の映像を作り出すAI実験が、「す、すごすぎる!」「ライブでしたらだまされるレベル」と話題になっています。 す、すげーーー! 実験をしているのは、3DアーティストのHirokazu Yokoharaさん(@Yokohara_h)。Twitterに変換前後の映像を並べた動画を投稿しました。 その結果は驚くべきもの。動きが少々カクカクしているものの、Web会議を通じてであれば本物と信じてしまいそうなレベルです。 動作はもちろん、表情も追従。さらに顔だけでなく体形まで女性らしくなっています。髪形は、黒いTシャツをかぶることでロングヘアに変換させました。Tシャツの柄などがときどき変わってしまうので、よく見ていればおかしいと思えますが、ボーッと見ていたらわからないでしょう。ましてや、中身がおっさんなんて絶対に思えない! 黒いTシャツをかぶり、ロングヘアーを再現させました
皆さんはGoogleの「Gemini」を使ったことがありますか? Geminiはもともと「Bard」という名称のAIチャットサービスで、ChatGPTの対抗馬として開発されました。 2023年12月には搭載モデルが「Gemini Pro」へとアップデート。そして2024年2月、名前がGeminiに変わり、課金をするとGemini Advancedが使えるようになりました。 今や、テキストでのやり取りやコード生成はもちろん、画像認識や拡張機能によるGoogleアプリとの連携までできるんです!しかも誰でも無料で使い放題!! というわけで今回は、Geminiの概要や使い方、実際の活用事例などを紹介します。最後までご覧いただき、ぜひお手元のPCでGeminiを使ってみてください! Geminiとは Googleの「Gemini」はもともと、2023年2月にBardとして発表された、対話型AIツール
先日、データ解析のセミナーを開催しました。 未経験の方でも、2時間で予測モデルを作成することができるハンズオンセミナーでした。 好評だったので、その内容をYouTubeにまとめたのでご興味ある方はご覧ください。 このハンズオンセミナーで予測モデルの作り方を知った友人がchatGPTにアドバイスをもらって、データサイエンスのコンペティションサイトに応募したところ、上位6.5%に入ることができたという報告を受け、驚愕しました。 chatGPTを上手く使えば素人がプロに勝つことも十分できるのだなと実感しました。 友人が参加したデータサイエンスのコンペは、SIGNATEの糖尿病予測問題でした。 以下のような進め方をしたとのことでした。 まず、問題の概要を説明して、どのように進めていけば良いかを確認したそうです。 そうすると、chatGPTからデータサイエンスの問題を解くための手順を一覧化してくれて
元セクシー女優の上原亜衣さんが、AIを活用したプロジェクト「AI uehara project」を3月19日に発表しました。 「AI uehara project」は、上原亜衣さんの名前(=亜衣)とAIを掛け、「上原亜衣、AI化」を掲げて始動したプロジェクト。 上原亜衣さんの写真を画像生成AI「Stable Diffusion」に追加学習させるLoRAファイルが公開され、「上原亜衣AI画像コンテスト」と題したTwitter上でのコンテスト企画が行われています。 誰でも上原亜衣の顔を生成できるように 今回無料配布されているのは、NFT「Ai Uehara GM Collection」(外部リンク)として販売されている写真群を「Stable Diffusion」に追加学習させるLoRAファイル(外部リンク)。 このLoRaファイルを手元の「Stable Diffusion」に導入することで、誰
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く