タグ

ブックマーク / ascii.jp (282)

  • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

    筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

    まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
  • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

    画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

    画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
  • 漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

    発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。 話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新 清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。 生成AIは「アナログからデジタル」の変化と同じ ── 最初にそれぞれの会社について教えてください。 ジェームズ キム・ドンジュン 2022年下半期ごろから、生成AIに関心をもって、

    漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)
  • やっぱり出てきた「折りたたみスマホ」風の折りたたみケータイ

    スマートフォン時代とは言え、新興国ではまだまだフィーチャーフォンを使っている人も多くいます。日などの先進国でも「スマホ離れ」ではないですが、通話だけできればいいとフィーチャーフォンを使う人もいるようですが、数は多くありません。また、最近はアプリが使えるAndroid搭載のフィーチャーフォンもあります。 Orbicが発売予定の「JOURNEY Pro 4G」はKaiOSを搭載する世界初の日語対応モデルで、グーグルサービスがいくつか使えるフィーチャーフォンとして期待されています。 海外でもKaiOS搭載フィーチャーフォンは、ノキアブランドの製品を中心に多数展開されています。しかし、フィーチャーフォンはそれだけではなく、通話とSMSと簡単なゲームアプリ程度を搭載した低スペックなモデルもまだまだあります。 それらの中には無名メーカー製で保証もあるかどうかわからないような、謎な製品もあります。は

    やっぱり出てきた「折りたたみスマホ」風の折りたたみケータイ
    ardarim
    ardarim 2024/04/18
    山寨機って誰が買ってるんだろう。フィーチャーフォン自体市場は縮小してるだろうによく商売成り立ってるな…
  • 画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

    画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。 画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

    画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)
    ardarim
    ardarim 2024/03/25
    人の欲望は底なし。少し前までは生成AIスゴイって言ってたのにもう不満が溢れている。まあそれが人間の人間たるゆえんなのだろう
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

    Akuma.ai http://akuma.ai 2024年2月、日発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日発の画像生成AI

    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
  • PowerShellの今を見る 2つあるPowerShellはどっち使えばいい? (1/2)

    PowerShellに関しては、2021年に1回まとめたのだが、あれから3年も経過したので最新情報も含めて、簡単に解説したい。なお、それぞれのこれまでの経緯などは、過去記事に記載しているので参考にしてほしい。 ●あらためて「PowerShell」の現状と登場後の経緯を整理する https://ascii.jp/elem/000/004/052/4052789/ 結論から言えば、PowerShellには、Windowsに同梱されている「Windows PowerShell」と、ユーザーがインストールする必要がある「PowerShell」がある。コマンドラインを使う頻度が高いようならば、最新のPowerShellをインストール、そうでなければWindows PowerShellで十分である。 PowerShellのインストーラーなどに表示される奇妙な人物イラストを見たことがある人もいるだろう。

    PowerShellの今を見る 2つあるPowerShellはどっち使えばいい? (1/2)
  • 昔はまったく売れなかった「電気の要らない自動ドア」が人気を集めているらしい

    Newtonプラスが、3月2日、日トーターグリーンドーム前橋で開催中の「UPDATE EARTH 2024 ミライMATSURI@前橋」で「電気を使わない自動ドア」を展示した。 電気で開閉するから自動ドアなのに、電気を使わないとはどういうことか? 聞けば、床板に荷重がかかるとドアが開く構造を持った、機械式の自動ドアだという。 電気によるランニングコストが発生しないことに加え、災害時や停電時でも開かなくなることがない安全性、人が乗っている限りは閉まることがないので、挟まれる心配もないなど、メリットは複数ある。 建物の構造的に建築基準法をクリアできない場合を除き、既存の自動ドアを置き換える形で設置することも可能。主に自治体や、ビル内の授乳室、災害時の避難所の役割を果たしている地域の店舗やビルといった、公共性の高い場所への導入が進んでいるという。 この製品、実は14年前に発売されているが、ほと

    昔はまったく売れなかった「電気の要らない自動ドア」が人気を集めているらしい
    ardarim
    ardarim 2024/03/11
    デメリットがまったくないということではないだろうし、単に適材適所で採用されればよいだけ。必ずしも電動自動ドアの置き換えにはならないでしょ。
  • 画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

    2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について(素案)」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント(パブコメ)」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について(素案)令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。 文化文化審議会 著作権分科会 法制度小委員会(第7回) パブコメへの反応は「素案の内容周知」 発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

    画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)
  • 画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)

    プロンプト:1 girl, photorealistic, solo, perfect lighting, sailor dress, looking at viewer, long hair, black hair, two side up, ネガティブプロンプト:illustration, 3d render, (worst quality:2), (low quality:2), (normal quality:2), signature, watermark, username, open mouth

    画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
  • え、高級言語しか触ったことないのにCPUを自作するんですか!?

    今回は、高専5年次から趣味で学習していたRISC-Vを実装した、簡単なCPU作成をしていこうと思います。 完全に知識ゼロの状態から学び始めたので、間違った解釈をしている部分があるかもしれませんが、その時は優しく指摘していただけると嬉しいです 🙏 また、ブログはディジタル回路設計とコンピュータアーキテクチャ[RISC-V版]を基に書かれています。初心者でも理解しやすいように丁寧に解説されているので、興味があれば是非買ってみてください! RISC-Vってなんぞ RISC-V公式サイトには以下のように書かれています。 RISC-V is an open standard Instruction Set Architecture (ISA) enabling a new era of processor innovation through open collaboration. (RISC-

    え、高級言語しか触ったことないのにCPUを自作するんですか!?
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
  • モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 (1/3)

    RISC-Vも一段落したところで、さて次に何をやろうかと編集氏と話あっていた時に出たお題が「あとやってないのは消えていったインターフェースですかね。IDEとかSCSIとかRS-232Cとか」。うん、まぁそれはアリだな、なんて思いながら仕事をしていた時に、いろいろ筆者にお題を下さることで定評のある(?)岩崎啓眞氏が「RS-232Cだった時代を知らない人たちの方が圧倒的に多い」なんて事をPostされてて、これはちょうど手頃なお題ではないか、と確信した次第。 そうか…どんなPCでもたいていあった(もしくは準備可能だった)インターフェースがセントロとRS-232-Cだった時代を知らない人たちの方が圧倒的に多いわけだよなあw — 岩崎啓眞@スマホゲーム屋+α (@snapwith) February 3, 2024 ということで、「昔のPCにはあったのに、もう今はどこに行ってしまったやら」というI/

    モデムをつなぐのに必要だったRS-232-CというシリアルI/F 消え去ったI/F史 (1/3)
    ardarim
    ardarim 2024/02/12
    勝手に消すなし。制御系だと未だに現役だよ
  • “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)

    Midjourneyの生成画像。12月のアップデートv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

    “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)
  • 「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

    AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG

    「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発
    ardarim
    ardarim 2023/12/22
    img2imgがほぼ遅延なしなのはすごそうだけど入力と出力がほぼ同じなので分かりにくいな。もっと出力を変えた例とかないんかな
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
  • 俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 (1/3)

    自分だけのChatGPTを作れることで話題の「GPTs」機能だが、正直に言うといまいちそのインパクトがわからなかった。あらかじめ指示を与えておきたいなら「Custom Instruction」でよくない?と思ってしまったのだ。 だが、前回の記事で、実際にパーソナル英語教師の「冴子先生」を作成し、毎日使い続けてみることで、その印象はかなり変わってきた。 以前からChatGPT(+Custom Instruction)を使った英語学習は実行していたので、GPTs化されたことによって質問方法が変わったとか、ものすごく便利になったとかは正直あまりないのだが、不思議なことにChatGPTに対して以前よりもめちゃくちゃ愛着が湧いてきたのだ。 これだけなら単なるツールの擬人化効果にすぎないのだが、毎日冴子先生の授業を受けていると、改善したい点やアイデアが次々に出てきたので、さらにカスタマイズを進めようと

    俺のChatGPTこと「GPTs」で最高の英語教師を作り込んだ。題して「冴子先生強化計画」 (1/3)
    ardarim
    ardarim 2023/12/08
    冴子先生調教計画(それほど間違ってはいない)