ブックマーク / ascii.jp (41)

  • 無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない

    Invoke、Comfy Org、Civitai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。 企業による技術の独占を防ぎ、アクセシビリティを確保 「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivitai、大規模な学習データセットを構築するLAIONだ。 彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープン

    無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない
    t-kuroki
    t-kuroki 2024/06/27
  • 体に付けて撮影できる小型ボディーカメラ「WE-CAM」がエアリアから発売! 7980円

    ウェアラブルスタイルでマウントできる小型ボディーカメラ「WE-CAM」がエアリアから発売。テクノハウス東映にて7980円で販売されている。 クリップ固定やマグネット固定、付属のマウンターによる自転車マウント、三脚固定に対応したバッテリー内蔵のウェアラブルカメラ。身に付けて歩きながらのハンズフリーで撮影可能なほか、マウンターを使って自転車用のドライブレコーダーのように活用できる。 180度回転が可能な100万画素CMOSセンサーカメラを内蔵し、フルHD動画(1920×1080/AVI)および4K静止画(4032×3024/JPG)を撮影可能。内蔵バッテリーにより約210分間の連続撮影が可能なほか、映像を撮らず音声だけを録音できるボイスレコーダーモードも搭載している。

    体に付けて撮影できる小型ボディーカメラ「WE-CAM」がエアリアから発売! 7980円
    t-kuroki
    t-kuroki 2024/06/23
  • 画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)

    この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール(lllyasviel)さんが発表した「ICライト(Imposing Consistent Light、印象的な一貫的なライト)」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。 画像生成AIで照明効果がつけられる「ICライト(IC-Light)」 発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

    画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 (1/3)
    t-kuroki
    t-kuroki 2024/05/27
  • ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)

    5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。

    ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)
    t-kuroki
    t-kuroki 2024/05/17
  • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

    画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

    画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
    t-kuroki
    t-kuroki 2024/05/10
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
    t-kuroki
    t-kuroki 2024/03/23
  • ChatGPTで画像生成するならコレ! おすすめGPTs紹介 (1/6)

    OpenAIは1月10日、カスタムバージョンのGPTを作成できる「GPTs」機能で作成した多様なGPTを探索できる「GPT Store」の公開を予告通り開始した。今回はストアーのラインアップから画像生成系の「DALL·E」カテゴリーを取り上げてみよう。 「DALL·E」カテゴリー 「DALL·E」カテゴリーには言うまでもなくOpenAI画像生成AI「DALL·E 3」を便利に使うために作られたカスタムGPTが掲載されている。今回は上位6個のGPTを使ってみることにする。 まずは「DALL·E」カテゴリーのトップ「image generator」というGPTを試してみよう。説明欄には「プロフェッショナルかつフレンドリーなトーンで画像を生成し、洗練させることに特化したGPT(A GPT specialized in generating and refining images with a

    ChatGPTで画像生成するならコレ! おすすめGPTs紹介 (1/6)
    t-kuroki
    t-kuroki 2024/03/02
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
    t-kuroki
    t-kuroki 2024/02/27
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
    t-kuroki
    t-kuroki 2023/12/18
  • これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

    Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

    これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)
    t-kuroki
    t-kuroki 2023/12/04
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
    t-kuroki
    t-kuroki 2023/10/16
  • 米国速報:Windows11が9月26日に「Copilot」を正式搭載で150を超える新機能&新Surfaceも!

    米マイクロソフトは、現地時間9月21日に発表会を開催し、26日にWindows11の最新アップデートをおこない、AIツール「Copilot」を正式に実装すると発表。同時にSurfaceの新モデルも公開した。 Copilotは、9月26日からWindows11への無料アップデートの一部として提供され、今秋には Bing、Edge、Microsoft 365 Copilot にも展開される。公開されるWindows11は150を超える新機能を備え、Copilotのパワーと、ペイント、フォト、ClipchampなどのアプリにAIを活用した新機能が加わる。 ○Copilotのプレビュー版は常にタスクバー上に表示されるか、Win+Cショートカットを使用して起動可能となる。 ○ペイントアプリでは、生成AIによるCocreatorのプレビューに加え、背景の削除とレイヤーが追加され、画像作成にAIが活用で

    米国速報:Windows11が9月26日に「Copilot」を正式搭載で150を超える新機能&新Surfaceも!
    t-kuroki
    t-kuroki 2023/09/22
  • ChatGPT新機能が“無双”だった(西田宗千佳) (1/4)

    新連載を始める。テーマはAIのニュースチェックだ。基的には2週に一度、主にASCII.jpで公開されるニュースについて、簡単な解説と流れの分析をしていきたい。紹介されていないものでも重要な話については、別途短い解説を追記していく。 というわけで1回目は、2023年7月前半のAIニュース振り返りだ。 (※記事のタイトルをタップすると記事ページが開きます) DeepL、日法人「DeepL Japan 合同会社」を設立 日企業との取引を迅速化(7月3日) 翻訳AIは急速に品質が上がり、日常的に筆者もお世話になっている。DeepLは利用者を増やしているが、実のところ、無料版が強いというよりも「個人事業主でも、企業でも気軽に契約できる有料版」があることがビジネスの強みだ。日の場合、翻訳AIを使うといってもそれは「無料でGoogle翻訳を使う」ことが多く、有料版利用は企業でも多くはないという。

    ChatGPT新機能が“無双”だった(西田宗千佳) (1/4)
    t-kuroki
    t-kuroki 2023/07/20
  • 世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)

    Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。 大きな違いは「2回生成する」こと SDXLがこれまで

    世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)
    t-kuroki
    t-kuroki 2023/07/17
  • 2800ページ超え!ChatGPT/生成AI本14冊を読み比べてみた

    生成AI(ジェネレーティブAI)が話題だ。日経済新聞社や日 芸能従事者協会など、生成AIに関するアンケートがあちこちで実施され、デジタル庁、経済産業省、農林水産省は生成AIを業務に利用することを決めた。AIは大きく機械学習とそれ以外のAI技術に分けられ、深層学習(ディープラーニング)は機械学習に属していると言われるが、もはや世間的には、AI=生成AIの様相を呈している。 ネットにも情報があふれているが、ChatGPTをはじめとする生成AIや、生成AIを特集した雑誌も多数出版されている。 それらのの帯や表紙には次のような宣伝文が書かれている。 「あなたの欲しい回答を導き出すベストプロンプトを大公開‼」 「誰でも使えるAIがやってきた!」 「可能性は無限大!」 「すべきことが1/1000になる異次元のスキル」 「実生活・ビジネスで即使える」 生成AI仕事でどのように役立つのか。思い通

    2800ページ超え!ChatGPT/生成AI本14冊を読み比べてみた
    t-kuroki
    t-kuroki 2023/06/28
  • 画像生成AI「Midjourney」でアニメ絵の似顔絵制作パート2ー生放送の宿題解決ー (1/3)

    GW中の連続企画として、画像生成AI「Midjourney」を使ったAIイラスト制作TIPS記事をお届けしています。また、5月2日には、これに関連した生放送企画も実施しましたが、ご覧いただけたでしょうか? こちらの放送では、連載企画の第1回と第2回で取り上げた、「Midjourney」の始め方の紹介と、「Midjourney」を使った似顔絵制作に実際にチャレンジしているのですが、放送時間の制約もあり、時間内にできあがったアスキー編集部つばさの似顔絵がちょっと微妙な感じでした。 そこで今回は、引き続き、あのとき例題として利用した写真を使って、もうちょっと人に似るまで試行錯誤を繰り返したら、どんな結果になるのか、を、その試行錯誤の過程と共にお届けしたいと思います。生放送を未視聴の方は、動画の後半部分、48分20秒ころからの映像を見てから、稿をお読みいただけるとさらに楽しめると思いますので

    画像生成AI「Midjourney」でアニメ絵の似顔絵制作パート2ー生放送の宿題解決ー (1/3)
    t-kuroki
    t-kuroki 2023/05/05
  • 画像生成AI「Midjourney」でLINEスタンプを作ろう (1/3)

    画像生成AIで好きなイラストを作るようになったら、ぜひやってみたいと思っていたのが今回取り上げるLINEスタンプの制作です。 そもそももっと以前からやってみたいと思ってはいたのですが、1枚、1枚絵を描いて、色を付けて、それをスタンプの形にして……と考えているうちに腰が重くなってチャレンジせずにいました。ですが、AIの力を借りれば、いとも簡単に制作できることが分かったので、今回は実際に私がスタンプを作って申請、公開に至るまでの過程をご紹介しましょう。 とはいっても、「Midjourney」を利用して作られたイラストは、現状、AIの学習素材の元となっているイラストや絵画データの取得先が開示されておらず、かなりグレーな状態になっています。稿では、Midjourneyで生成したイラストLINEスタンプの制作に利用しますが、あくまで個人利用を目的に制作していきたいと思います。 ※記事は、5月3

    画像生成AI「Midjourney」でLINEスタンプを作ろう (1/3)
    t-kuroki
    t-kuroki 2023/05/04
  • iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)

    アプリや専用デバイスを使った、日語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識テクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日語対応の自動文字起こしアプリ コミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records(シャムロック・レコード)の代表兼エンジニアである青木秀仁氏が開発を手がけている。 モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/

    iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)
    t-kuroki
    t-kuroki 2022/05/22
  • 格安SIMの中でも独自性が強いmineo 最大1.5Mbps使い放題は実用的かを実際に試す (1/2)

    MVNOの格安SIMとしては大手のmineoから、新プラン「マイそく」が3月7日に開始される。昼休み(平日12~13時)に32kbpsになるのと、それ以外の時間帯も最大1.5Mbps/3Mbpsになるものの月間通信量は無制限というプランで注目を集めている。 現在も主力プラン向けに、制限時の通信速度を最大1.5Mbpsに増速する「パケット放題 Plus」が提供されており、これを単独プラン化したものとも言える。筆者も実際に利用している「パケット放題 Plus」の実用性を紹介したい。 新登場の「マイそく」と 既存の「パケット放題 Plus」の違いは昼休み時間帯の制限 新たに登場する料金プラン「マイそく」は2種類あり、「スタンダード」が最大1.5Mbpsで月990円、「プレミアム」が最大3Mbpsで月2200円となる。料金が非常に安いが、その代わりにユーザーのアクセスが集中する平日(祝日含む月~金

    格安SIMの中でも独自性が強いmineo 最大1.5Mbps使い放題は実用的かを実際に試す (1/2)
    t-kuroki
    t-kuroki 2022/03/07
  • kintoneで受付業務の業務改善とペーパーレス化を実現! 愛媛の不動産会社が始めた不動産DX

    2021年6月16日、愛媛県松山市のWstudioREDにて「kintone hive matsuyama」が開催された。kintone hive(キントーンハイブ)は、kintoneを業務で活用しているユーザーがノウハウや経験を共有するイベントだ。全国6ヵ所で開催され、その優勝者がサイボウズの総合イベント「Cybozu Days」で開催される「kintone AWARD」に出場できる。 登壇したのは5社で、今回は4社目に登壇した株式会社日エイジェントの経営企画推進室 戸田昭仁氏のプレゼン「kintoneを活用したNo.1業務改善」の様子を紹介する。 愛媛県の不動産会社の悩みは受付と紙での管理 日エイジェントは愛媛県で1981年に創業した不動産会社。今年1月に創業40周年を迎えている。従業員は149名で、賃貸の仲介や管理業務を手がけ、松山周辺で1万3422戸を管理しており、愛媛エリアで

    kintoneで受付業務の業務改善とペーパーレス化を実現! 愛媛の不動産会社が始めた不動産DX
    t-kuroki
    t-kuroki 2021/08/09