タグ

ブックマーク / ascii.jp (15)

  • AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能

    AI企業のAnthropicは10月23日、大規模言語モデル「Claude 3.5 Sonnet」の刷新と、新モデル「Claude 3.5 Haiku」の導入を発表した。Claude 3.5 Sonnetには、AIモデルが人間のようにコンピューターを操作できるようになる新機能「コンピューター使用」が追加された。 アップデート版のClaude 3.5 Sonnetは、特にコーディング分野で大きく性能を伸ばし、業界ベンチマークで広範囲にわたる改善を示した。SWE-benchの検証済みタスクでは、前バージョンの33.4%から49.0%へと性能が向上し、他のすべての公開モデルを上回る結果となった。 新たに導入されるClaude 3.5 Haikuは、前世代の最大モデルであるClaude 3 Opusと同等の性能を持ちながら、コストと速度は前世代のHaikuと同等を維持している。特にコーディングタス

    AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能
    TETSUYA01
    TETSUYA01 2024/10/23
    あと数年でホワイトカラーの仕事の2割くらいAIに奪われるだろうな。10年後には5割くらい、20年後には8割くらい奪われそう。はやくベーシックインカム実現しないと失業した困窮者が社会に溢れてやばいことになる。
  • もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい (1/4)

    クラウド型の動画生成AI「Runway」がしばらく見ないうちに進化していました。7月に新世代となる「Gen 3 Alpha」をリリースしていましたが、その後、8月に高速版の「Gen 3 Alpha Turbo」をリリースし、劇的な生成速度の向上と、始点となる画像を指定できるようになりました。そして、9日に終点の画像も指定できるようになり、コントロールできる範囲が大きく広がりました。1月にこの連載に登場してから、何度も作例に使っているオリジナルキャラクターの「明日来子さん」が表情を変えて動き出すまでになりました。動画生成AIもこんなところまで来たのかと驚かされます。 ▲明日来子さんが、横を向き、上目遣いのあと、伏し目がちになり、またこちらに顔を向けるまでの30秒の動画。画像はMidjouneyで作った1枚しか使っておらず、残りの部分はすべてGen 3 Alphaで作っている ※記事配信先の設

    もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい (1/4)
    TETSUYA01
    TETSUYA01 2024/10/21
    上目遣いじゃなく、ただ上を見ているだけじゃねーか。日本語を勉強してくれ。
  • OpenAI「o1」は人間のような“想像力”を持ち、AGIへの重要な一歩となる (1/3)

    OpenAIは9月12日(現地時間)、新たなAIモデル「OpenAI o1(読みはオーワン)」を発表。ユーザーの入力に対してじっくり考えてから返答することで、より複雑なタスクを正確に解決できるようになったという。 噂の「Q*/Strawberry」がついに登場 今回発表されたモデルは、高性能な「o1-preview」および、より高速かつ80%安価、特定分野に特化した「o1-mini」の2種類。複雑なタスクで大きな進歩を遂げたとして、これまでの「GPT-○」からナンバリングをリセットし、新たにOpenAI o1シリーズとしてスタートを切った。 そもそもこのモデルは、2023年11月のOpenAI騒動の際に「Q*」という名前の先進的AIプロジェクトとして噂されていたもの。その後、このプロジェクトが「Strawberry」というコードネームで開発が継続されていると報じられ、9月に入ってから近々

    OpenAI「o1」は人間のような“想像力”を持ち、AGIへの重要な一歩となる (1/3)
    TETSUYA01
    TETSUYA01 2024/09/15
    AIはどんどん進化していくが、同時に情報処理に必要となるマシンパワーも上がっていく。AGIができたとしても費用面で一部の大企業や富裕層しか使えないのかもしれない。
  • 情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)

    最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、EvernoteMicrosoft OneNoteNotionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)

    情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)
  • めちゃ便利になった 無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)

    OpenAIは5月30日、同社のチャット型AIChatGPT」無料版ユーザーに向け、制限付きながら最新の大規模言語モデル「GPT-4o」および、これまで有料版ユーザーしか利用できなかった多くの機能を公開した(発表時のニュース記事)。 情報がとても多いので、今回の変更で無料版ユーザーは「なにができるようになったか」、そして「なにができないのか」を使い方中心にまとめた。 1. GPT-4oは回数制限あり チャット型AIアプリの心臓とも言える大規模言語モデル(LLM)、これまで無料版ユーザーは「GPT-3.5」という旧世代モデルしか利用できなかったが、今回の変更で回数制限(具体的な回数は明記されていない)はあるものの、最新モデルのGPT-4oが使えるようになった。 GPT-4oの利用に特に設定などは必要なく、無料アカウントにログインして普通に質問すればOK(使い方はちょっとわかりにくいのでこち

    めちゃ便利になった 無料版「ChatGPT」新機能の使い方まとめ【最新版】 (1/5)
  • 実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)

    こんにちは、漫画界の生き恥こと野火城と申します。 「画像AI使ってみた/AI漫画実験企画」第2回です! ■第1回はこちら 実録:AIで描く漫画の実際 ~体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。 だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。 「画像AI技術がすごいという賞賛記事はよく見るが、それは当に創作活動で実戦的に使えるものなのか? 『AI仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは? 実際はどっちなんだ?」「画像AIを試し

    実録:AIで描く漫画の実際 ~AIで今風の手描きっぽい漫画を作ってみる (1/6)
  • 漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

    発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。 話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新 清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。 生成AIは「アナログからデジタル」の変化と同じ ── 最初にそれぞれの会社について教えてください。 ジェームズ キム・ドンジュン 2022年下半期ごろから、生成AIに関心をもって、

    漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)
    TETSUYA01
    TETSUYA01 2024/04/29
    冨樫もやってくれ。
  • 画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)

    Stable Diffusion Forgeを表示した様子。基的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

    画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 (1/4)
  • 日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)

    「カクダイV1」でアップスケールした画像(左)、「Midjouney v6」で作成したオリジナル画像(右) 画像の描き込みを増やして高画質にする、日発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかった カクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

    日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 (1/4)
  • “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)

    Midjourneyの生成画像。12月のアップデートv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

    “世界生成AI”到来か 画像生成AIのゲームエンジン化が進む (1/5)
    TETSUYA01
    TETSUYA01 2024/01/22
    動画は認知症患者が見る世界のように不気味。
  • これ、かなり革命的。自分のChatGPTが作れる「GPTs」 (1/4)

    OpenAIは11月6日、開発者向けイベント「OpenAI DevDay 2023」を開催した。 開発者向けというだけあり、発表内容は「GPT-4 Turbo」をはじめとする新モデルやAPIについてが多かったが、ChatGPTに関するものもいくつか発表された。 中でも注目はオリジナルのチャットボットを作れる「GPTs」および、作ったものを販売できる「GPT Store」ではないだろうか。 「GPT-4 All Tools」とは? まずは「GPT-4 All Tools」について説明しておこう。 「DevDay」が終了した翌日、いつものように「ChatGPT Plus」にアクセスするとこのようなウィンドウが表示された。 「ChatGPTはウェブブラウズ、データ分析画像生成ができるようになりました。これらの機能はGPT-4に組み込まれており選択する必要はありません。Plusユーザーはご利用い

    これ、かなり革命的。自分のChatGPTが作れる「GPTs」 (1/4)
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
  • Photoshopの画像生成AIがすごい ついに商用利用もスタートへ (1/3)

    Adobeが5月23日、生成AIモデル「Adobe Firefly」に、テキストを使って画像を追加・拡張・削除できる「ジェネレーティブ塗りつぶし」機能を追加。Photoshop(Beta)にベータ版の機能として搭載しました。実際に使ってみると、「以前から研究していたとはいえ、やっぱりAdobeが気を出してくるとすごいな」という感想でした。 「消したり、足したり」30秒程度で まず試してみたのは、画像生成AI「Nijijjourney」で作ったいかにも生成が面倒くさそうなサイバーパンクの都市を題材にしたAI画像。画像サイズを横幅を1500ドットくらい広げた後に、生まれた空白を範囲選択して「ジェネレーティブ塗りつぶし」。すると適当に周囲の情報を読み、それっぽい形にイラストを広げてくれます。何もないものからよく作れるものです。 左がオリジナル画像のサイバーパンクの都市。右が左右のサイズを広げて

    Photoshopの画像生成AIがすごい ついに商用利用もスタートへ (1/3)
  • 画像生成AI「Midjourney」でLINEスタンプを作ろう (1/3)

    画像生成AIで好きなイラストを作るようになったら、ぜひやってみたいと思っていたのが今回取り上げるLINEスタンプの制作です。 そもそももっと以前からやってみたいと思ってはいたのですが、1枚、1枚絵を描いて、色を付けて、それをスタンプの形にして……と考えているうちに腰が重くなってチャレンジせずにいました。ですが、AIの力を借りれば、いとも簡単に制作できることが分かったので、今回は実際に私がスタンプを作って申請、公開に至るまでの過程をご紹介しましょう。 とはいっても、「Midjourney」を利用して作られたイラストは、現状、AIの学習素材の元となっているイラストや絵画データの取得先が開示されておらず、かなりグレーな状態になっています。稿では、Midjourneyで生成したイラストLINEスタンプの制作に利用しますが、あくまで個人利用を目的に制作していきたいと思います。 ※記事は、5月3

    画像生成AI「Midjourney」でLINEスタンプを作ろう (1/3)
  • グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表

    グーグルは1月2日、従来のモデルよりも大幅に効率的でありながら、最先端の画像生成性能をもつテキスト画像AI生成モデル「Muse」を発表した。 競合モデルと同クオリティかつ超高速化 近年「Stable Diffusion」やOpenAIの「DALL-E 2」など、テキストから画像を生成するAIは驚くべき進化を見せている。グーグルもすでに「Imagen」と「Parti」という画像生成AIを発表しているが、「Muse」はそのどれとも異なる新しいモデルだ。

    グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表
    TETSUYA01
    TETSUYA01 2023/01/06
    これは「世界中の情報を整理し、世界中の人々がアクセスできて使えるようにする」というGoogleのミッションに反しないのだろうか? 自らフェイクの情報を作って世界を乱しているじゃないか。
  • 1