タグ

ブックマーク / ascii.jp (48)

  • 新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)

    OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva

    新しい「ChatGPT」はココがすごい 解説「GPT-4o」 (1/3)
    hamamuratakuo
    hamamuratakuo 2024/05/16
    真にすごいのは、音声、画像を含めたマルチモーダルな理解力だ。
  • アップル、AI特化のM4チップで全Mac刷新か

    アップルはMacシリーズを2024年後半からM4チップにアップデートしていく予定だという。米メディアBloombergのMark Gurman記者が4月11日に報じた。 M4チップは生成AIなどの人工知能機能のパフォーマンス向上に重点を置いて開発が進められているという。 同氏によると、Macシリーズ全体が2024年後半から2025年前半にかけてM4チップに移行していく予定だという。 まずはiMac、14インチMacBook Proのローエンドモデルとハイエンドモデル、16インチMacBook Pro、Mac miniがM4チップにアップデートされ、2025年春に13インチと15インチのMacBook Airが、2025年半ばにMac Studioが、2025年後半にMac Proがアップデートされると予想されている。 なお、M4バージョンのMacデスクトップ機種に搭載されるユニファイドメ

    アップル、AI特化のM4チップで全Mac刷新か
  • Stable Diffusionの生成速度をビデオカード複数枚挿しで“実質的に”爆速にしてみた (1/3)

    Stable Diffusionを代表とする画像生成AIにおいて、生成スピードを上げるにはより強力なGPUが必要だ。GeForceならRTX 4090のような最強のGPUが使えればいいが、誰もが手にできる価格とは言い難い。 となればビデオカードを複数枚使用してStable Diffusionの生成スピードが向上しないだろうか? と考えるのは自然な流れだが、今のStable Diffusionは複数のGPUを協調させて処理する機能は搭載されていない。 しかし、Stable Diffusion(とAutomatic 1111)をGPUごとに紐付けて起動することで、ビデオカードの数だけ並行して作業を進めることができる。玄人志向の製品紹介ページには、まさにそういった記述が存在する。 玄人志向公式サイトの製品紹介ページには、複数のビデオカードを使うとStable Diffusionの生成速度がほぼ倍

    Stable Diffusionの生成速度をビデオカード複数枚挿しで“実質的に”爆速にしてみた (1/3)
    hamamuratakuo
    hamamuratakuo 2024/05/04
    今のStable Diffusionは複数のGPUを協調させて処理する機能は搭載されていない。しかし、Stable Diffusion(とAutomatic 1111)をGPUごとに紐付けて起動することで、ビデオカードの数だけ並行して作業を進めることができる。
  • 漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

    発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。 話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新 清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。 生成AIは「アナログからデジタル」の変化と同じ ── 最初にそれぞれの会社について教えてください。 ジェームズ キム・ドンジュン 2022年下半期ごろから、生成AIに関心をもって、

    漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)
    hamamuratakuo
    hamamuratakuo 2024/04/29
    エンドルフィン代表取締役 張 鉉洙(チャン・ヒョンス)社長 スーパーエンジン James Kim Dong jun(ジェームズ キム・ドンジュン)CEO 周回遅れになった日本を外国は待ってくれない。日本人もAI開発で頑張ろう!
  • AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

    ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。 そもそもChatGPTの心臓部である大規模言語モデル(LLM)は、膨大な知識を元にテキストを「生成」する仕組みだ。 逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。 だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚(ハルシネーション)を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。 結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。 今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

    AI検索「Perplexity」がかなり便利だったので紹介します (1/5)
  • 動画生成AIがすごすぎる 映画登場も遠くない (1/4)

    1枚の画像からAIが動画を生成する、ランウェイ(Runway)社のサービス「Gen-2」が大きな話題になっています。 ランウェイは2018年創業のスタートアップ。もともとStability AIと共同でStable Diffusion用のデータモデルの開発を進めていましたが、現在は完全に独自のサービスを展開しています。画像生成AIはStability AIが先に行ってしまったので、生成AIでの動画作成にフォーカスして、技術開発とサービス展開をしています。今年6月には、Google、NVIDIA、セールスフォースなどから1億4100万ドル(約200億円)の資金調達を受けるなど、生成AI企業のなかでも大きく注目を浴びています。 わずか2分で画像が動画に 今年2月に発表された第1世代の「Gen-1」は、動画をプロンプトに応じて別の動画へと変換する(video to video)サービスでしたが、

    動画生成AIがすごすぎる 映画登場も遠くない (1/4)
  • 最短15分! ChatGPTに自分の過去原稿を合体して“自分GPT”を作る

    藤子・A・不二雄、藤子・B・不二雄、藤子・C・不二雄、藤子・D・不二雄――とは誰か? 自分が何十年も前に書いた文章を読んでいると、「これは自分のなか?」と戸惑うことがある。そこで、自分の過去原稿をもとに会話するチャットBOTを作ることにした(前々回記事参照)。ChatGPTのプラグインで「PDFと対話する」なんてのがあるので同じようにできそうである。 30年前の自分と対話することのできる、私の場合は、《endoGPT》というプログラムである。 ハードディスクの中をさらってみると、月刊アスキーに連載した『近代プログラマの夕(ゆうべ)』(単行1、2に収録分で1987~1995年)、『朝日新聞』の連載(単行収録分で1996~2000年)、『先見日記』(2002~2005年)、それから2000年以降の原稿はもちろん残っている。古いものからみつくろうことにする。 これを言語処理の世界ではお馴染み

    最短15分! ChatGPTに自分の過去原稿を合体して“自分GPT”を作る
  • ゲームの“自動生成”技術がすごいことになっている (1/4)

    いま生成AIが話題になっていますが、AI技術の一つである「プロシージャル生成」の考えも重要です。プロシージャルというのは数式や関数にもとづき3Dコンテンツを生成する手法で、「手続き型」とも言われます。自動的にデータを作り出すという側面から、生成AIとプロシージャル生成は混同されることがありますが、実はまったく違う背景を持つ技術です。Epic Gamesが新たにゲームエンジン「Unreal Engine 5.2」に搭載したプロシージャルコンテンツ生成機能(PCG)は驚くべきものでした。3月のGDCで発表されていたデモマップ「Electric Dream」が6月21日に公開されています。今回はこのデモマップを使って技術を紹介しながら、生成AIとの違いを見ていきます。 お待たせしました! Electric Dreams 環境サンプル プロジェクトを無料公開しました!#UnrealEngine 5

    ゲームの“自動生成”技術がすごいことになっている (1/4)
  • パソコンが速く、軽くなる「Microsoft PC Manager」使い方

    Windowsの最適化ツール 「Microsoft PC Manager」の基機能を解説 マイクロソフトはWindows 10のバージョン1809以降で利用できるWindowsの最適化ツール「Microsoft PC Manager」(https://pcmanager.microsoft.com/en)を配布している。Beta版となっているが、2022年のリリースから着実にバージョンアップを重ね、現在はバージョン3.2.2.0にまでなっている。機能もいろいろと増えているので、まだ使っていない人はインストールしてみよう。 「Microsoft PC Manager」のホームページを開き、「Download」からインストールファイルをダウンロードする。ファイルを実行したら、「Install」をクリック。完了したら「Launch Now」をクリックしよう。 UI英語中国語のみ。中国マイク

    パソコンが速く、軽くなる「Microsoft PC Manager」使い方
  • 世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)

    Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。 大きな違いは「2回生成する」こと SDXLがこれまで

    世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 (1/4)
    hamamuratakuo
    hamamuratakuo 2023/07/17
    画像の基本サイズも512×512ドットから1024×1024ドットに大きくなりました。ただし、そのぶん生成のために要求するスペックが上がっていて、NVIDIA GeForce RTX 20シリーズ以上、ビデオメモリー8GB以上が環境として求められます。
  • ChatGPT(GPT-4)がすごすぎる シンギュラリティも近い? (1/3)

    毎日のようにOpenAIの対話AIChatGPT」を使いまくっています。チャット履歴が戻ってきてよかったなぁと(※3月20日、不具合によりチャット履歴が閉じていた件)。あれがなくなったら死んでしまうというくらいの気持ちでしたから……。 それにしても3月15日にリリースされたGPT-4モデルはすごいですね。パラメーター数で言えば、GPT-3は1756億でしたが、GPT-4は100兆程度になるとも言われています(※OpenAIは正確なパラメーター数を公開していない)。まだ機能としては入っていませんが、マルチモーダルなモデルとして画像や動画なども対応できるようになるとされています。リリースされる前までは「当にすごいの?」と疑いの目を受けてたんですが、いざ出てきてみたら、ものすごいものでした。応答のレベルの高さは驚くべきもので、「ついにシンギュラリティを迎えた?」という議論も出てきています。

    ChatGPT(GPT-4)がすごすぎる シンギュラリティも近い? (1/3)
  • すさまじい勢いで世界を変えている画像生成AI (1/2)

    普段メタバースのトレンドを時評的に解説する「メタバース・プレゼンス」を連載していますが、画像生成AIがすごいことになっているので、今回は番外編としてそれをお話させてください。今年8月、画像生成AI「Stable Diffusion」が公開された影響がすさまじい勢いで出てきているんです。いま起きているのはStable Diffusionの派生技術が大量に出てきていること。大きく分けて2つのポイントがあるなと感じています。 Windows向けソフトで誰でも使えるStable Diffusion 1つのポイントは、Windowsローカル環境で使える、GUI形式の扱いやすいソフトが出てきたことです。 NMKD Stable Diffusion GUI 作者:N00MKRAD OS:Windows 10/11 64bit 推奨環境:最新版NVIDIA GPU(RTXシリーズ推奨)、メモリ16GB以上

    すさまじい勢いで世界を変えている画像生成AI (1/2)
  • 1988年に発売された「世界標準キーボードの原器」を手に入れた (1/7)

    30余年前の5576-003キーボードはオークションでも滅多に出てこないが、偶然知人が所有していた。バックリングスプリング(座屈バネ機構)キーボードと呼ばれるメカは最高だ ハードウェアとしてのキーボードに、極めて強い思い入れや高度な技術的関心があるわけではないが、昔からコンピューターと人との関係をベースとした入力操作装置としてのキーボードには、強い興味がある。どちらかというとミーハーな筆者は、昔からキーボードの入力時のサウンドやクリックのフィーリングの方に強い関心があった。 まだまだパーソナルコンピューターが、非力でWindowsパソコンの画一的な世界になる以前の1980年代の日には、多くの設計思想の異なるパソコンやそれらに最適化されたユニークなレイアウトのキーボードが溢れていた。よく言えば多様性の世界、悪く言えば機種間のハードやソフトの互換性のない混沌とした時代でもあった。 しかし、当

    1988年に発売された「世界標準キーボードの原器」を手に入れた (1/7)
  • 画像生成AI「Midjourney」すごいところ、心配なところ

    アスキーの盛田 諒ですこんにちは。画像生成AIの勢いがすさまじいですね。DALL・E 2、Midjourney、Stable Diffusionの御三家をはじめとして、毎週のように新しいサービスが登場し、他分野に技術が派生。「AIが生成した画像を動画に組み込む」「波形を読み込ませて音楽を作る」など、新しい応用例も怒濤のように登場しています。近年まれに見るテクノロジーの大波です。 メタバース連載をやっていただいている新清士さんに刺激を受けたこともあり、画像生成AI「Midjourney」月額30ドル(約4100円)プランに加入してしまいました。契約しているサブスクの中では最高額です。日々呪文を唱えて画像を召喚している関係、せっかくなのでAI絵日記を書いてみます。今日の話はMidjourneyのすごいところ・不気味なところ。利点と課題が両方見えてきました。 あらためてMidjourneyという

    画像生成AI「Midjourney」すごいところ、心配なところ
    hamamuratakuo
    hamamuratakuo 2022/09/03
    固有名詞を入れてしまうと権利面で心配なところもあります。Midjourneyサイトのコミュニティフィードから生成された人気の画像を見られるのですが、最近上位はかなりストレートにハリウッド俳優が並んでいます。
  • 「Ryzen 7 5700X」〜「Ryzen 3 4100」まで、新たな廉価版Ryzenを現行/旧モデルと一斉比較 (1/4)

    AMDのRyzenを支えるSocket AM4は非常に長い期間使えることが売りであるが、その一方でコア数の少ない安価なモデルが実質選べないことが問題であった。過去にはRyzen 5 1600AFやRyzen 3 3100/3300Xといった“良い感じの廉価モデル”もあったが、1年も持たずに流通が枯渇しており、安く組むにはインテル製CPU一択という状況が続いていた。 AMDデスクトップCPU事業は世界的には好調だが、販売シェアではインテルに逆転を許している局面もあり、今回の廉価版はこれに(ある程度の)歯止めをかけることが期待されている。 今廉価版CPUで売れ筋のCore i5-12400F(2万4000円前後)やCore i3-12100F(1万4000円前後)に対抗するのがRyzen 5 5500やRyzen 3 4100になると考えればよいだろう。 製品の国内販売は15日だが、ベンチマ

    「Ryzen 7 5700X」〜「Ryzen 3 4100」まで、新たな廉価版Ryzenを現行/旧モデルと一斉比較 (1/4)
  • 第3世代EPYCは3次キャッシュを積層してもさほど原価率は上がらない AMD CPUロードマップ (1/3)

    価格については1KU(1000個発注時)のもので、今回の4製品以外は昨年3月15日に発表された際の価格そのままだが、この後価格を変更したという話は聞かないので、おそらくそのままである。 これを改めてみてみると、今回の4製品は、既存のFモデル(75F3/74F3/73F3)およびトップエンド(7763)の上位品という扱いになっている。実際、コア数とTDPは同じであり、その意味では差は3D V-Cacheの有無ということになる。そこで、3D V-Cacheあり(型番末尾X)となしをもう少し仔細に比較すると、以下の事実が浮かび上がる。 まず動作周波数だが、これは150~450MHzと、それなりに大きく減らされている。特にコア数が少ない分動作周波数の高めな7373Xは、73F3と比べてベースクロックが450MHz落ちているというのは象徴的である。またブーストクロックも4GHzに行かない(一番高い7

    第3世代EPYCは3次キャッシュを積層してもさほど原価率は上がらない AMD CPUロードマップ (1/3)
  • ISSCC 2022で明らかになったZen 3コアと3D V-Cacheの詳細 AMD CPUロードマップ (1/4)

    3月15日に報じられたように、Ryzen 7 5800X3Dの発売日が4月20日に決まった。それにあわせて、というわけでもないのだがZen 3コアに関する詳細が今年のISSCC(International Solid-State Circuits Conference)で発表になったので説明しよう。 といっても、Zen 3のプロセッサー・パイプラインの話はそれほど新しいものはないので、今回は主に3次キャッシュ周りとトランジスタ構成の話になる。 3次キャッシュの容量が倍になったZen 3 まずCCXのバリエーションについて。Zen 3では実は3種類の構成が当初から想定されていたそうだ。 画像の左がいわゆるMatisseの構成であり、Ryzen 5000シリーズとEPYCがこれを利用しており、中央は(厳密に言えばZen 3+ベースになったが)Rembrandtコアで、Ryzen 5000Gシリ

    ISSCC 2022で明らかになったZen 3コアと3D V-Cacheの詳細 AMD CPUロードマップ (1/4)
  • 約13年ぶりのテレビ購入、37型プラズマから50型4K液晶に買い換えたら世界が変わった

    自宅でテレビを見るというと、最近ではめっきりニュース番組しか出番がなく、あとはたまにPlayStation 5やNintendo Switchなどのゲーム機で遊ぶときだけしか電源を入れることはありませんでした。 しかも、2008年製のプラズマテレビという、何年も前にシェア争いから脱落したものを使い続けていたわけです。未だ現役で特別買い換えるほど不具合が起こっているわけではありませんでしたが、ちょうど東京2020オリンピックが開催中だということと、ゲームをやる機会も増えてきたので買い換えることにしました。

    約13年ぶりのテレビ購入、37型プラズマから50型4K液晶に買い換えたら世界が変わった
    hamamuratakuo
    hamamuratakuo 2021/08/15
    画素数は3840×2160ドットの4K対応、倍速駆動パネル(120Hz) iPhone/iPad/Macとの連携もバッチリ アップル「AirPlay」にも対応
  • 天才プログラマー・オードリーさんがたった200行で効果的なアプリを作れる秘訣

    天才プログラマー・オードリーさんがたった200行で効果的なアプリを作れる秘訣 オードリー・タン台湾デジタル大臣との対話 - 未曾有の危機に幅広く使える未来思考(後編) 2021年1月19日、『コロナ vs. AI 最新テクノロジーで感染症に挑む』(翔泳社刊)が発売されました。医師の起業家からAIの研究者・ITの先端技術コンサルタントによって執筆されており、コロナ対抗策としてのAIの社会実装事例・AI研究事例・医療研究事例をわかりやすくまとめられています。今回書の発売を記念して、収録されている台湾のデジタル大臣、オードリー・タンさんへの特別インタビューから、一部内容をご紹介します。株式会社キアラ 代表取締役の石井 大輔氏による寄稿です。(前編はこちら)。 石井:今回の私の質問は少し技術的なことです。オードリーさんは天才プログラマーとして有名です。GitLab Taiwanのエンジニア友人

    天才プログラマー・オードリーさんがたった200行で効果的なアプリを作れる秘訣
    hamamuratakuo
    hamamuratakuo 2021/02/03
    3つの秘訣 (1)コアとなる機能のみが書かれたコード → Clean Architectureのビジネスロジック (2)社会的に良さそうなプロジェクト=参加の動機付け (3)相手に活躍の場を与えること。「Radical Trust(徹底的な信頼)」と呼ぶ方法論
  • Ryzen 5000シリーズはなぜ高速なのか? 秘密はZen 3の内部構造にあり AMD CPUロードマップ (1/5)

    このところAMDを取り上げる機会が異様に多いが、新製品投入ということもあるのでご容赦いただきたい。ということで今回はRyzen 5000シリーズの話だ。海外では11月5日の朝6時(太平洋時間)に解禁となったので、さっそくKTU氏による速攻レビューが掲載されているのでもうお読みの方も多いと思う。 そのRyzen 5000シリーズがなぜこんなに高速になったのか、というところでZen 3アーキテクチャーの内部構造の詳細が、この情報解禁に合わせてもう少し明らかになったので、これを解説する。言ってみれば連載584回の答え合わせである。 Zen 2とほぼ変わらない構成とプロセスのまま IPCを20%近く向上させたZen 3 Zen 3の概要が下の画像だ。筆者の推定(ALU×5+AGU×3)はややハズレで、整数部はALU×4+AGU×3+BR(Branch Unit)という構成になった。 ALUの1つは

    Ryzen 5000シリーズはなぜ高速なのか? 秘密はZen 3の内部構造にあり AMD CPUロードマップ (1/5)
    hamamuratakuo
    hamamuratakuo 2020/11/10
    Zen 3の設計目標が「特に規模の大きなプログラム、あるいは分岐の多いプログラムにおけるフェッチの高速化」IEEE MICRO 2020で、AMDのJagadish B. Kotra氏が“Improving the Utilization of Micro-operation Caches in x86 Processors”という論文を発表