lafontのブックマーク - はてなブックマーク

イラストのペン入れと色塗り、AI使えばわずか1分 (1/4)

日本のAIスタートアップ、ラディウス・ファイブが提供しているAI着彩サービス「copainter（コペインター）」に新たに導入された「ペン入れ」機能の性能がすばらしく高いです。ラフ画などから線画を生成するという、これまで画像生成AIの「Stable Diffusion」で実現できていたことの延長線上にある機能なんですが、それをサービスとして品質高くまとめた感じです。UIがとにかくシンプルで、生成AIを知らない人でも迷うことなく利用できるわかりやすい作りになっていました。 ※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpで配信中の記事をご確認くださいペン入れと着彩が1分で終わる copainterの機能は、既存画像を線画化する「ペン入れ」と、指定に合わせて色をつける「着彩」の2つです。使用方法は、線画にしたい画像をドロップしたら、忠実度/線の太

lafont 2024/08/14

リンク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

lafont 2024/05/27

リンク

画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。画像1枚で“似た顔”　Midjourneyの新機能「Creative Reference」使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ（cref）をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

lafont 2024/03/25

リンク

ChatGPTで画像生成するならコレ!　おすすめGPTs紹介 (1/6)

OpenAIは1月10日、カスタムバージョンのGPTを作成できる「GPTs」機能で作成した多様なGPTを探索できる「GPT Store」の公開を予告通り開始した。今回はストアーのラインアップから画像生成系の「DALL·E」カテゴリーを取り上げてみよう。「DALL·E」カテゴリー「DALL·E」カテゴリーには言うまでもなくOpenAIの画像生成AI「DALL·E 3」を便利に使うために作られたカスタムGPTが掲載されている。今回は上位6個のGPTを使ってみることにする。まずは「DALL·E」カテゴリーのトップ「image generator」というGPTを試してみよう。説明欄には「プロフェッショナルかつフレンドリーなトーンで画像を生成し、洗練させることに特化したGPT（A GPT specialized in generating and refining images with a

lafont 2024/03/02

リンク

女子大生が100日連続で生成AIで100本のプログラムを書いたらどうなったか？

ボードゲームやアクションゲーム、各種ツールやシミュレーションなどさまざまなソフトが100日間に作られたいままで数えきれないほどのプログラマーに会ってインタビューもさせてもらってきたが、久しぶりに若いプログラマーの話を聞いてきた。ここ1、2年では U22グランプリの男子中学生や全国小中学生プログラミング大会の受賞者たちだが、今回は、ChatGPTを使ってプログラムを書きまくった女子大生である。彼女は X（Twitter）の自分のアカウントで1日1本のソフトを100日間連続で作るというイベントをやっていて「おっ、頑張っているな！」と思って応援していた。「こんなゲームを作ってほしい」などとリクエストを出したりもしていたのだが、どうも私が想像していたものと内容もやり方も違っていたようである。目下、ソフトウェア産業の最大のテーマは「我々は人間の言葉でプログラムを書くようになるだろうか」というこ

lafont 2024/02/26

リンク

控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

OpenAIは2月15日（現地時間）、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

lafont 2024/02/17

リンク

“世界生成AI”到来か　画像生成AIのゲームエンジン化が進む (1/5)

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか（筆者作成）画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

lafont 2024/01/22

リンク

秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話 (1/3)

美少女画像を生成しようと思い立ち7月にゲーミングPCを購入してからはや半年、当初の目標であった画像生成にはなんとか成功したものの、とにかくこのジャンルは進化が早い。苦労して新しい技術を使えるようになったと思ったらすぐに次のとんでもない技術が登場し、以前のものは古くなっていく。なんとか振り落とされないようについていくのがやっとだが、それでも猛烈におもしろく刺激的な半年間だった。「Stream Diffusion」爆誕 StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました！！ sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます！多分これが一番速いと思います pic.twitter.com/4qleR2isW1 — あき先生 / Aki (@cumulo_autumn) December 6, 20

lafont 2024/01/07

リンク

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術（コツ）が掲載されている。また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。では紹介された6つの戦略を見ていこう。明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。具体的な戦術としては下記が提案されている。・より関連性の高い回答を得られるよう、質問は詳細に・モ

lafont 2023/12/18

リンク

俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 (1/3)

自分だけのChatGPTを作れることで話題の「GPTs」機能だが、正直に言うといまいちそのインパクトがわからなかった。あらかじめ指示を与えておきたいなら「Custom Instruction」でよくない？と思ってしまったのだ。だが、前回の記事で、実際にパーソナル英語教師の「冴子先生」を作成し、毎日使い続けてみることで、その印象はかなり変わってきた。以前からChatGPT（+Custom Instruction）を使った英語学習は実行していたので、GPTs化されたことによって質問方法が変わったとか、ものすごく便利になったとかは正直あまりないのだが、不思議なことにChatGPTに対して以前よりもめちゃくちゃ愛着が湧いてきたのだ。これだけなら単なるツールの擬人化効果にすぎないのだが、毎日冴子先生の授業を受けていると、改善したい点やアイデアが次々に出てきたので、さらにカスタマイズを進めようと

lafont 2023/12/08

リンク

さよならTwitterの青い鳥。11年使われたアイコン、デザイナーが解説

青い鳥ともお別れ？　デザイナーがアイコン制作の経緯を解説「Twitter」を運営するXのイーロン・マスク氏が7月23日、「まもなくTwitterブランドと、そして徐々に、全ての鳥たちとも別れを告げる」とTwitter上で発言。 And soon we shall bid adieu to the twitter brand and, gradually, all the birds — Elon Musk (@elonmusk) July 23, 2023 Xは、同氏がツイッター買収のために設立した企業。同氏の発言は、Twitterという名称と、象徴的な鳥のアイコンを、新しいものに置き換えていくことを示唆している。 Today we say goodbye to this great blue bird This logo was designed in 2012 by a team o

lafont 2023/07/25

リンク

ChatGPT新機能が“無双”だった（西田宗千佳） (1/4)

新連載を始める。テーマはAIのニュースチェックだ。基本的には2週に一度、主にASCII.jpで公開されるニュースについて、簡単な解説と流れの分析をしていきたい。紹介されていないものでも重要な話については、別途短い解説を追記していく。というわけで1回目は、2023年7月前半のAIニュース振り返りだ。（※記事のタイトルをタップすると記事ページが開きます） DeepL、日本法人「DeepL Japan 合同会社」を設立日本企業との取引を迅速化（7月3日）翻訳AIは急速に品質が上がり、日常的に筆者もお世話になっている。DeepLは利用者を増やしているが、実のところ、無料版が強いというよりも「個人事業主でも、企業でも気軽に契約できる有料版」があることがビジネスの強みだ。日本の場合、翻訳AIを使うといってもそれは「無料でGoogle翻訳を使う」ことが多く、有料版利用は企業でも多くはないという。

lafont 2023/07/21

リンク

「撮影罪」はじまる、同意のない撮影は禁止　飛行機内の撮影にも注意を (1/2)

本日7月13日から「撮影罪」が施行される。これにより性的姿勢等のひそかな撮影（盗撮）、それらを第三者に提供する行為、インターネットや動画配信などで公開する行為、保管する行為がすべて処罰対象となり、盗撮に対して最大3年の拘禁または最高300万円の罰金が、不特定多数への提供行為に対してはさらに重い最大5年の拘禁、または最高500万円の罰金が科されることとなる。法律改正のきっかけとなった事例のひとつに、飛行機内での客室乗務員の盗撮行為がある。高速で飛行する航空機の特性が都道府県ごとの法制度の抜け穴を生み、特定できない場所での盗撮行為を処罰できず、客室添乗員の盗撮が法の抜け穴となってしまうといった実態があった。 ANAは「撮影罪」についてのポスターを羽田空港に掲示し、空港の利用客に向けて撮影罪の法制化、無断撮影禁止についての周知を始めている。「撮影罪」とは何か？「撮影罪」は正式名称を「性的な

lafont 2023/07/14

リンク

グーグル、高速な「ChromeOS Flex」を無料配布開始。古いPCをよみがえらせる

ストレージ16GB、RAM4GBから動作するグーグルは6月15日（現地時間）、2022年7月に早期アクセス版の配信を開始した、古いPC（Intel Macも含む）でも快適に使えるよう設計されたオペレーティングシステム「ChromeOS Flex」の安定版を無料配布開始した。処理の多くをクラウド上でも行っているため、デバイスの最小要件は以下のようにかなり貧弱なスペックでも動作可能となっている。つまり「Windows 11」や「macOS Ventura」といった最新のOSが動かなくなってしまった古いPCを延命できる可能性があるのだ。アーキテクチャ：Intelまたは AMD x86の64ビット互換デバイス RAM：4GB 内部ストレージ：16GB USBドライブからの起動をサポート認定モデルリストで確認 ChromeOS FlexはUSBドライブさえあれば、そこから起動して実行するだけ

lafont 2023/06/18

リンク

Photoshopの画像生成AIがすごい　ついに商用利用もスタートへ (1/3)

Adobeが5月23日、生成AIモデル「Adobe Firefly」に、テキストを使って画像を追加・拡張・削除できる「ジェネレーティブ塗りつぶし」機能を追加。Photoshop（Beta）にベータ版の機能として搭載しました。実際に使ってみると、「以前から研究していたとはいえ、やっぱりAdobeが本気を出してくるとすごいな」という感想でした。「消したり、足したり」30秒程度でまず試してみたのは、画像生成AI「Nijijjourney」で作ったいかにも生成が面倒くさそうなサイバーパンクの都市を題材にしたAI画像。画像サイズを横幅を1500ドットくらい広げた後に、生まれた空白を範囲選択して「ジェネレーティブ塗りつぶし」。すると適当に周囲の情報を読み、それっぽい形にイラストを広げてくれます。何もないものからよく作れるものです。左がオリジナル画像のサイバーパンクの都市。右が左右のサイズを広げて

lafont 2023/06/12

リンク

画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i（image2image）」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

lafont 2023/05/23

リンク

Blenderに挫折する前に見てほしい、日本語の解説動画を紹介

みなさんBlenderやってますか?? 私は大好きです。どうも花田です。前にもBlenderについて書きましたが、今回は挫折した、若しくはBlender分からんッッ！って人に話します。 Blender日本語で解説してくれている人いるよ～います。中でも、本当に本当に初期にお世話になった人たちを2人紹介します。 M design - YouTube 話してくれる声は少なめで、動画を止めてゆっくり進めていく方式です。情報量が少なく、作っている動画なので見よう見まねでできました。 3D Bibi - YouTube 簡単なモデルを細かく教えてくれるため、モデルが挫折しない。 YouTubeでBlenderで検索すると他の動画も沢山出てきます。作りたいものを作りたいんだ！作りたいものを検索しても、日本語版が出てこない… 英語版を見て、挫折してしまった人も多いのではないでしょうか。 Bl

lafont 2023/05/08

リンク

GPT-4版ChatGPTが無料で試せる「AIOne」

Topaz合同会社は3月17日、OpenAIの最新型自然言語モデルGPT-4、画像生成モデルStable Diffusionといった複数のAIモデルを搭載したAIプラットフォーム「AIOne」を発表した。「カスタマイズされていないGPT-4を無料登録で使えるWebサービス」としては日本初の提供と同社は主張している。とりあえず無料でGPT-4を触ってみたい人に現状利用できるサービスは画像生成（Stable Diffusion）、AIチャット（GPT-4, ChatGPT）のみのようだが、自動議事録作成AIが近日提供予定となっているほか、今後も最先端のAI 技術を導入していくとしている。料金プランは、無料（利用制限あり）で利用できる「Free」のほか、「Pro（490円／月、個人限定）」、「Business（990円／月）」、「Enterprise（価格応相談）」の4種類が用意されている

lafont 2023/03/20

リンク

ポルシェで一番売れてるSUV「マカン」を買ったらすっかりポルシェ沼に (1/4)

なぜマカンを買ったのか!? 普段アスキーではアイドル系の記事を執筆している筆者。縁あってポルシェのSUV「マカン」を購入することになったのだが、担当編集のスピーディー末岡から「じゃあレビューしてください」と無茶ぶりがきたので、自動車ジャーナリストでもなんでもない、ただの一般人の視点からマカンを買ってわかったことを紹介したい。これまでメルセデス・ベンツのA-Classに乗っていた筆者だったが、愛犬用のカートを折りたたんで乗せるとトランクルームのスペースがギリギリになってしまうので、もう少し余裕のある大きめの車に乗り換えたいなと考えていた。加えて、ちょうど期間3年のリースが終了するタイミングだったということもある。その際、同じメルセデスのGLAやGLCを候補としていたのだが、いつも前を通るたびに気になっていたポルシェセンター調布に「話を聞くだけでも」の気分で寄ってみた。そこでまんまと（？）

lafont 2022/03/14

リンク

iPhone 13シリーズ「意外なカメラ便利機能」をピックアップ！ (1/4)

春は様々なイベントにiPhoneのカメラが活躍するシーズン。桜並木のように映える被写体にも出会えます。新しい季節の到来前に、iPhoneが搭載する先進的、かつ実用的なカメラ機能をおさらいして、後でまた繰り返し見たくなる写真や動画を残すための“便利ワザ”を紹介しましょう。まずはiPhone 13 Proのリッチな機能にズームイン今回はiPhone 13シリーズや、iOS 15のカメラアプリが搭載する「使える機能」を中心に集めてみました。特に上位モデルのiPhone 13 Pro／13 Pro Maxは、メインのトリプルレンズカメラがハードウェア的なアップグレードを遂げたことで、写真や動画による表現が大きく広がります。 iPhone 13 Proシリーズのメインカメラは、解像度12メガピクセルの望遠／広角／超広角カメラにより構成されています。広角カメラは絞り値がF1.5と、これまでのiPh

lafont 2022/02/20

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (57)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス