並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 212件

新着順 人気順

GPUの検索結果1 - 40 件 / 212件

  • 自分の認識をだらだら書くとこうなる。 結局のところ2003年から2011年頃まで..

    自分の認識をだらだら書くとこうなる。 結局のところ2003年から2011年頃までいちばん延べ計算量が必要だったのはリアルタイムの3Dグラフィックスのレンダリングだったんだ。そこではNVIDIAって会社がPCゲームのプラットフォームを握ってしまっていてそこで技術開発をめっちゃ進めてしまったんだ。 結果的にPlayStation2までは純日本設計だったグラフィックチップが、PlayStation3ではNVIDIAのGPUになってしまったんだ。そこで負けが確定してしまった感じだ。PlayStation3のCPU、CELLに内蔵されているSPUは、世代をどんどん進めていったら最終的にレンダリングもできるグラフィックチップに進化する可能性があったのかもしれないけど次世代が出せなかったのでそこで終わりになってしまった。 NVIDIAは先端を走っているユーザーが何を求めているかをめちゃくちゃちゃんと調査

      自分の認識をだらだら書くとこうなる。 結局のところ2003年から2011年頃まで..
    • [翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜

      この記事は "What We’ve Learned From A Year of Building with LLMs" という記事を著者の一人である Eugene Yan さんから許可を得て翻訳したものです。 https://applied-llms.org/ Thank you for giving me a permission to translate this wonderful article! 著者の方々 Eugene Yan Bryan Bischof Charles Frye Hamel Husain Jason Liu Shreya Shankar 原文の公開日 2024/6/8 今は大規模言語モデル(LLM)を使った開発がとってもエキサイティングな時期です。この1年間で、LLMは実世界のアプリケーションに対して「十分に良い」ものになりました。そして、年々良くなり、安く

        [翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜
      • 【大原雄介の半導体業界こぼれ話】 生成AIのバブルはいつ弾ける?

          【大原雄介の半導体業界こぼれ話】 生成AIのバブルはいつ弾ける?
        • 2位とはなんだったのか

          anond:20240625171138 2009年11月のいわいる事業仕分けから、もう13年も経った。「2位じゃダメなんですか?」の質問の発言で非常に曰く付きとなったアレだ。 ところが最近、13年も経ってまだなおナゼ「2位」という言葉が出てきたかが理解できてない人がかなりいる事を知った。 それどころか、事業仕分けによって日本のHPC分野が衰退したなどという認識まで飛び出す始末である。 ただ、資料もなしにどこが変だと言っても仕方あるまい。何がどうして「2位」なのか、少し語ろうじゃないか。 アーキテクチャ初期の次世代スーパーコンピュータ (この時点では名前が付いていなかったが、以下わかりやすく京と呼ぶ) 計画 は、補助金を投入してのHPC産業育成に目を向けられていた[1]。世界一の性能を出していた海洋研究開発機構の地球シミュレータが、NECのSXシリーズをベースにしたベクトル型であり、ベクト

            2位とはなんだったのか
          • 中島聡さん、NVIDIAのGPUが用済みになるって本当ですか?AI開発の行列乗算をなくす「MatMul-free LM」で気がかりなこと - まぐまぐニュース!

            エヌビディアの強みであるGPUの優位性を揺るがすかもしれないAI関連の注目論文とは?人気急上昇中のメルマガ『週刊 Life is beautiful』より読者Q&Aをご紹介。著者の中島さんは「Windows95の父」として知られる日本人エンジニア。メルマガでは毎号、読者からの質問に丁寧に回答しています。 ※本記事のタイトル・見出しはMAG2NEWS編集部によるものです プロフィール:中島聡(なかじま・さとし) ブロガー/起業家/ソフトウェア・エンジニア、工学修士(早稲田大学)/MBA(ワシントン大学)。NTT通信研究所/マイクロソフト日本法人/マイクロソフト本社勤務後、ソフトウェアベンチャーUIEvolution Inc.を米国シアトルで起業。現在は neu.Pen LLCでiPhone/iPadアプリの開発。 1ビットの高速推論AIチップ 米国より先に中国が開発する可能性も 読者からの質

              中島聡さん、NVIDIAのGPUが用済みになるって本当ですか?AI開発の行列乗算をなくす「MatMul-free LM」で気がかりなこと - まぐまぐニュース!
            • 「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」

              米AIスタートアップ「Etched」は6月25日(現地時間)、ChatGPTなど最新のAI技術の基盤となっている「Transformer」アーキテクチャーに特化したチップ「Sohu」を発表した。この発表は、現在NVIDIAが支配的な地位を占めるAIチップ市場に、新たな競争をもたらす可能性がある。 Transformer処理に特化 AIチップ市場は現在NVIDIAが圧倒的なシェアを持つ。同社の汎用GPUは様々なAIモデルを効率的に処理できる柔軟性から市場の約80%を占めている。 多くの大手テクノロジー企業がAI開発のためにNVIDIAのチップに数十億ドルを投資しているのが現状だ。 Etchedの「Sohu」は、ASIC(Application-Specific Integrated Circuit:特定用途向け集積回路)と呼ばれる、特定の用途に最適化された集積回路だ。汎用性は低いものの、特定

                「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」
              • Windowsが今更(?)開発者に優しくなろうとしている!? 「Dev Home」は開発者にとって使い物になる? (1/2)

                Dev Homeの起動画面。最初に「ダッシュボード」が表示される。ここには、登録したウィジェットが並び、ツールのアップデート状態やGitHubの通知などが表示できる。左側にあるのがページ切替のナビゲーション領域だ Build 2023で発表された開発者向けアプリ「Dev Home」 開発が進められているようだ 昨年5月に開催されたMicrosoftのイベント「Build 2023」で、「Dev Home」なるアプリケーションが発表された。しかし、Copilotと同じタイミングだったので、ほとんど話題になることはなかった。このとき、筆者もインストールして試してみたが、特筆するようなことは何もなく、ソフトウェアの開発には特に不要なものと判断していた。 それから1年、プレビュー版はバージョンアップしていた。まだまだ完成ではないが、将来を考えるとWindowsを開発マシンとして使うときの「入口」ぐ

                  Windowsが今更(?)開発者に優しくなろうとしている!? 「Dev Home」は開発者にとって使い物になる? (1/2)
                • tar(1) はなぜオプション引数にハイフンが不要なのか?

                  TL;DR tar(1)の引数はオプションではなくkeyだから 歴史 tar(1)は Unix v7 (1979) で導入されたが、その前身は Unix v4 (1973) の tp(1)、更にこれは Unix v1 (1971) の tap(1) に遡る。 80年代に入りSystemV v.s. BSDといったことが起きたりし、PWB/UNIX (Programmer's WorkBench)で導入された cpio(1)とtar(1)、どちらがUnixの標準アーカイバか争われた結果、IEEE Std. 1003.1-2001 (POSIX.1-2001) を以って tar(1)は規格から削除され、代わりに IEEE Std 1003.2-1992 で導入された折衷案のpax(1)が標準となった。よって、現在実装中立なtar(1)の仕様書がそもそも存在しない。最後の中立規格は1997―19

                  • スーパーコンピューターで日本がトップに立ち続けていたら今ブームのAIに繋..

                    スーパーコンピューターで日本がトップに立ち続けていたら今ブームのAIに繋がったのか? それともスパコンとAIは関係ない? 脱Android⁠⁠、Huaweiが独自OS「HarmonyOS NEXT」てのがニュースなったけど これもスパコン技術が応用されてそこから生まれてたりするの? スパコン予算をすべてに優先してたら日本産独自OSとか日本産AIに繋がってたんだろうか? つながらない OSはもうぜんぜんまったく完璧に関係ないのでAIについてだけ説明する まず2010年代に始まった第3次AIのブームはソフトウェアというかアルゴリズムのブレークスルーがきっかけ カナダのYoshua Bengio、Geoffrey Hinton、Yann LeCunの3人がディープニューラルネットワークに関する発見をしたこと 3人はこの業績で「ディープニューラルネットワークがコンピューティングの重要な要素となるた

                      スーパーコンピューターで日本がトップに立ち続けていたら今ブームのAIに繋..
                    • NVIDIAみたいに売れてれば間違いなく勝てた。売れる物を作らない、作った物..

                      NVIDIAみたいに売れてれば間違いなく勝てた。売れる物を作らない、作った物を売らないから負けた。当時の日本の常として外部要因や部外者、つまり売上と顧客を効率的に排除したから滅んだ。 当初はGPUとして開発され、事実上開発の失敗からオマケ程度までスケールダウンされたPS3のSPEは今のNVIDIA製GPUの原始的な形そのものだし、「ベクトル型とスカラー型のハイブリッド」とはGPUを複数機搭載したサーバーそのもの。つまりきわめて大ざっぱに言えば基本設計は十年以上先のトレンドを正しく捉えている。が、どちらも実際の開発や予算の都合に失敗しているし、NECのベクトル型スパコンなど需要はゼロだった。 いま「時価総額世界ナンバーワン」を標榜しているNVIDIAのスパコンと、NECが当時作っていたスパコンはまったく同じものなのに、00年代末期の日本が作ればそれは「失敗の象徴」にしかならない。そしてそのこ

                        NVIDIAみたいに売れてれば間違いなく勝てた。売れる物を作らない、作った物..
                      • Intelが光でデータ伝送の距離を100倍にする「光コンピューティング相互接続」チップレットを発表

                        Intelが、光学入出力チップレットをCPUに統合した「完全統合型光コンピューティング相互接続(OCI)」の実証デモを発表しました。銅線と電気でデータをやりとりする従来のチップよりも格段に長い距離のデータ伝送を高帯域幅かつ低消費電力で実現するOCIは、大規模なCPUクラスターやGPUクラスターで構築されたAIインフラに革命をもたらすとされています。 Intel Demonstrates First Fully Integrated Optical I/O Chiplet :: Intel Corporation (INTC) https://www.intc.com/news-events/press-releases/detail/1699/intel-demonstrates-first-fully-integrated-optical-io Intel® Shows OCI Opti

                          Intelが光でデータ伝送の距離を100倍にする「光コンピューティング相互接続」チップレットを発表
                        • iOS/Androidスマートフォンに装着可能なAI搭載MFTカメラ「Alice Camera」がまもなく出荷開始 | CineD

                          スマートフォンに取り付けて写真やビデオの機能を強化するデバイスの市場が加熱している。つい数日前、Kickstarterで登場したコンパクトなマイクロフォーサーズスマートフォン用カメラSwitchLensについてレポートした。そして今回、このプロジェクトを推進するPhotogram社が、待望のAlice Cameraの出荷を間もなく開始すると発表した。3年の開発期間とクラウドファンディング・キャンペーンを経て、iOSとAndroidスマートフォンに取り付けるAI搭載マイクロフォーサーズカメラは、2024年7月15日から予約受付を開始する。 Photogramは英国を拠点とするスタートアップで、2020年にAlice Cameraの開発に着手した。2021年、我々は同社のCEOであるヴィシャール・クマール氏にインタビューし、カメラのコンセプトとその背景について聞いた。その段階では、同社はまだプ

                            iOS/Androidスマートフォンに装着可能なAI搭載MFTカメラ「Alice Camera」がまもなく出荷開始 | CineD
                          • GitHub - karpathy/LLM101n: LLM101n: Let's build a Storyteller

                            What I cannot create, I do not understand. -Richard Feynman In this course we will build a Storyteller AI Large Language Model (LLM). Hand in hand, you'll be able create, refine and illustrate little stories with the AI. We are going to build everything end-to-end from basics to a functioning web app similar to ChatGPT, from scratch in Python, C and CUDA, and with minimal computer science prerequi

                              GitHub - karpathy/LLM101n: LLM101n: Let's build a Storyteller
                            • 【Hothotレビュー】 Core Ultra 7 165H搭載の最新NUC登場!高性能かつ静かなミニPC「ASUS NUC 14 Pro」

                                【Hothotレビュー】 Core Ultra 7 165H搭載の最新NUC登場!高性能かつ静かなミニPC「ASUS NUC 14 Pro」
                              • 「Beelink EQ13」レビュー、電源内蔵でさらに省スペースになったIntel N200搭載ミニPC

                                ミニPCを精力的に展開しているBeelinkから、Intel N200を搭載した小型デスクトップPC「Beelink EQ13」が登場しました。昨今注目されているN100搭載ミニPCに近いお手頃価格や省電力性能はそのままに、少しパワーアップした新作です。 今回はサンプルを試用する機会に恵まれたので、さっそく実機レビューをお届けします。 Intel N200搭載ミニPC「Beelink EQ13」。Amazonでは46,800円+3,000円引きクーポンで販売中(6月25日時点) スタイリッシュな新設計ボディは「電源内蔵」がうれしい Beelinkの同クラスの製品としてはN100搭載の「EQ12」が約1年前に発売されています。Amazon.co.jpにおける6月25日時点の販売価格はEQ12が30,800円、EQ13が43,800円(クーポン適用後)と価格差があるのですが(どちらもメモリ16

                                  「Beelink EQ13」レビュー、電源内蔵でさらに省スペースになったIntel N200搭載ミニPC
                                • GPUのモデル名やメモリ容量をサクッとチェックできる無料アプリ「GPU-Z」の使い方まとめ

                                  「GPU-Z」はPCに搭載しているGPUのモデル名やメモリ容量などを表示できる便利ツールです。GPU-Zの画面は英語だらけで初心者にとっては分かりにくいため、インストール手順や画面の見方をまとめてみました。 GPU-Z Graphics Card GPU Information Utility https://www.techpowerup.com/gpuz/ GPU-Zを使うには、まず以下のリンクをクリックしてダウンロードページにアクセスします。 TechPowerUp GPU-Z v2.59.0 Download | TechPowerUp https://www.techpowerup.com/download/techpowerup-gpu-z/ ダウンロードページにアクセスしたら「Download」と記された青色のボタンをクリック。 ダウンロードサーバー選択画面が表示されたら、ど

                                    GPUのモデル名やメモリ容量をサクッとチェックできる無料アプリ「GPU-Z」の使い方まとめ
                                  • OPPO Reno11 A 発売日が近いが汚名返上なるか - 格安ガジェットブログ

                                    オウガ・ジャパンから販売されているスマートフォン、OPPO Renoシリーズですが、現在の評判的には割と顧客を舐めてるんじゃないかというような微妙な評価と言わざるえません。というのも後継機の性能が据え置きでマイナーチェンジレベルの性能向上でしかなかったり、そもそも機能面で性能が低下していたりなど、決して手放しで喜べるような製品ではなかったからです。 ただ今回の製品に関しては、ある一点を除けば軒並み高性能化されているので、買ってもそこまで不満点はないかなという仕上がりになっています。 この記事ではRenoシリーズの新型スマートフォンである、OPPO Reno11 aについて解説していきたいと思います。 OPPO Reno11 Aの特徴 SoCが刷新され処理能力が向上 急速充電機能が大幅アップしたがケチくさい カメラは便利になった 防水性能は残念ながら低下 イヤホンジャックは無し その他の機能

                                      OPPO Reno11 A 発売日が近いが汚名返上なるか - 格安ガジェットブログ
                                    • ELYZA、「Llama 3」をベースとした日本語LLMを開発・公開 軽量な8Bモデルは商用利用可能 | Biz/Zine

                                      ELYZAは、同社が提供する大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメータの「Llama-3-ELYZA-JP-70B」と80億パラメータの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。 Llama-3-ELYZA-JP-70B:Metaの「Llama-3-70B」をベースに追加の学習(日本語追加事前学習・指示学習)を実施して開発したモデル。APIサービスや共同開発プロジェクトなどを通し、さまざまな形態で、企業向けに提供予定 Llama-3-ELYZA-JP-8B:Metaの「Llama-3-8B」をベースに事後学習(日本語追加事前学習・指示学習)を実施して開発したモデル。一般公開しており、研究および商業目的での利用が可能 【関連記事】 ・NEC、製造業のナレッジ継承に関わる

                                        ELYZA、「Llama 3」をベースとした日本語LLMを開発・公開 軽量な8Bモデルは商用利用可能 | Biz/Zine
                                      • 低価格ゲーミングPC自作の最適解が見えた!Ryzen 7 5700X3D/5700Xの10~13万円プランで徹底ベンチ 【第7戦】エントリー~ミドルGPUに3D V-Cacheは効くのか!? text by 芹澤 正芳

                                          低価格ゲーミングPC自作の最適解が見えた!Ryzen 7 5700X3D/5700Xの10~13万円プランで徹底ベンチ 【第7戦】エントリー~ミドルGPUに3D V-Cacheは効くのか!? text by 芹澤 正芳
                                        • ゲーミングノートパソコンがおすすめできない理由 - 格安ガジェットブログ

                                          ゲーミングパソコンはデスクトップが至高。ノートパソコンは論外という風潮は昔からあります。しかし、実際何故ノートパソコンはやめておいた方が良いのかという事までは、あまり知らない人は多いと思います。 そこで、この記事では何故ゲーミングパソコンにおいて、ノートが避けられる傾向にあるのかを纏めて行きたいと思います。 ゲーミングノートパソコンが忌避される理由 コストパフォーマンス的な観点 耐久性能の不安 爆音マシンの可能性 パーツ交換での修理が難しい まとめ ゲーミングノートパソコンが忌避される理由 コストパフォーマンス的な観点 まずゲーミングノートパソコンって、同じ性能を求めた場合は基本的にデスクトップよちも高く付いてしまいます。それは独自の排熱システムとか、金型を用意しなければならない問題もありますし、それらの設計や開発にどうしてもお金がかかってくるからです。 デスクトップに関しては、もうパーツ

                                            ゲーミングノートパソコンがおすすめできない理由 - 格安ガジェットブログ
                                          • プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                            2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 AnthropicがClaudeファミリーの新モデル「Claude 3.5 Sonnet」をリリースしました。このモデルは、各種ベンチマークで同ファミリーの旧最上位モデルClaude 3 OpusやOpenAIのGPT-4を上回る性能を示しています。ユーザーの間でも様々な使用事例が共有され、その高性能ぶりが話題となっています。 一方、GoogleやNVIDIAから資金調達を受けているAIベンチャー「Runway」は、新しい動画生成AIモデル「Gen-3 Alpha」を発表しました。前モデルGen-2と比較して、忠実度、一貫性、モーションの面で大幅な改善が見られるとのことです。公開されているサンプル動画からも、その高精度が確認できます。 国内では、カ

                                              プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                            • Microsoftの「Copilot+ PC」はこれまでのWindows PCと何が違うのか

                                              MicrosoftはAI処理をローカルで実行可能にする「Copilot+PC」の販売を開始した。Copilot+PCは一般的なWindows PCと何が違うのか。性能や機能から違いを見ていく。 2024年6月18日、AI処理専用NPU(Neural network Processing Unit)を搭載した「Copilot+PC」の発売が始まった。 発売されたのは「Surface Pro」第11世代の5モデルと「Surface Laptop」第7世代の13.8インチ画面5モデル、15インチ画面4モデルだ。同社はこれらを「新しいWindows PCカテゴリー」と位置付けている。同日にAcerやDell、日本HP、Lenovo 、ASUSからもCopilot+PCが発売された。Copilot+PCは一般的なWindows PCとどこが違い、どのような特徴があるのか。日本マイクロソフトの発表会の

                                                Microsoftの「Copilot+ PC」はこれまでのWindows PCと何が違うのか
                                              • 「S/4HANA」発表から9年、マイグレーションという難題に取り組み続けるSAP (1/3)

                                                今年(2024年)4月、新しい基幹システムへの切り替えでトラブルが発生し、チルド商品(冷蔵品)が出荷停止になるという大きな影響が出た江崎グリコ。同社は6月11日に一部商品の出荷再開を発表したが、いまだ全面解決には至っていないようだ。看板商品のひとつである「プッチンプリン」も出荷停止となり、一般消費者にも基幹システムの移行を巡る問題が“プッチンプリン問題”として広く知られる事態となっている。 このトラブルは、2027年末にサポート終了を迎える旧版のSAP ERPを、最新版の「SAP S/4HANA」に移行するプロジェクトにおいて発生したとされ、移行プロジェクトの規模や担当したSAPパートナー企業の名前も報じられている。図らずも、基幹システムの重要性とスムーズなマイグレーションの難しさが広く注目される結果となった。 もっとも、旧版SAP ERPからのマイグレーションが求められているのは、江崎グ

                                                  「S/4HANA」発表から9年、マイグレーションという難題に取り組み続けるSAP (1/3)
                                                • AMD、Google、Intel、Meta、Microsoftなどが「UALink」を発表 AIアクセラレータ間の高速、低遅延な通信を実現するオープン接続規格の開発を目指す

                                                  AMD、Broadcom、Cisco、Google、Hewlett Packard Enterprise(HPE)、Intel、Meta、Microsoftは2024年5月30日(米国時間)、「Ultra Accelerator Link(UALink)」の構築に向けて提携すると発表した。 各社は共同で、データセンターにおけるAI(人工知能)アクセラレータ間の高速かつ低遅延な通信を可能にするオープンな接続規格の策定、確立を目指す。UALinkによる相互接続の実現により、OEMメーカー、IT専門家、システムインテグレーター(SIer)が、AIワークロードを稼働するデータセンターにおける統合性、柔軟性、スケーラビリティを高めることが可能になるという。 AIワークロードのスケールアップを推進 関連記事 「Ultra Ethernet Consortium」設立 AMD、Cisco、Intel、H

                                                    AMD、Google、Intel、Meta、Microsoftなどが「UALink」を発表 AIアクセラレータ間の高速、低遅延な通信を実現するオープン接続規格の開発を目指す
                                                  • インデックス以外に持っている個別株トップ5 - FIRE: 投資でセミリタイアする九条日記

                                                    ぼくはインデックス投資家を自認していますが、実はインデックスは資産のうち35%で残りはいろいろな資産に分散されています。中でもボリュームが大きめなのが個別株。全体の10.6%を占めています。今回はこちらの紹介です。 番外 Microsoft 5位 NVIDIA 4位 Meta 3位 Amazon 2位 Google 1位 ARCC(エイリスキャピタル) 各社のファンダメンタルズ 個別株の株価推移 番外 Microsoft まずは番外編から。トップ5に漏れたのはMicrosoftでした。こちら2023年の11月20日あたりに購入し、円建てで29.6%も上昇しています。 ぼくの総資産に占める割合はわずかに0.45%ですが、世界トップクラスの時価総額を持つこの銘柄、S&P500の中では7.19%ものシェアを持っています。 Microsoftは今やクラウド(Azure)の会社であり、AIの会社です

                                                      インデックス以外に持っている個別株トップ5 - FIRE: 投資でセミリタイアする九条日記
                                                    • DeepSpeedはなぜ速いのか〜推論編〜

                                                      はじめに 昨今、ChatGPTに代表されるように、LLM(大規模言語モデル)が大きな盛り上がりを見せています。 本記事では、LLMの学習や推論を高速化するためのライブラリであるDeepSpeedが、どのようにしてその高速化を達成しているのかを解説します。 DeepSpeedの理論部分、特に推論について日本語で解説している記事があまりなかったため、今回執筆することにしました。 この記事を読んで欲しい人 DeepSpeedでなぜ推論が速くなるのかを知りたい人 DeepSpeedを使って手元の推論時間を短縮したい人 DeepSpeedとは DeepSpeedは、Microsoftから発表されている学習や推論の高速化、圧縮などを扱うライブラリです。本記事では、特に推論の高速化について解説します。推論高速化のためのサービスとしては、他にもvLLMやTGI、Together Inference Eng

                                                        DeepSpeedはなぜ速いのか〜推論編〜
                                                      • Optimizing AI Inference at Character.AI

                                                        At Character.AI, we're building toward AGI. In that future state, large language models (LLMs) will enhance daily life, providing business productivity and entertainment and helping people with everything from education to coaching, support, brainstorming, creative writing and more. To make that a reality globally, it's critical to achieve highly efficient “inference” – the process by which LLMs g

                                                          Optimizing AI Inference at Character.AI
                                                        • エヌビディアの急成長、アナリストは置き去りに-上方修正追いつかず

                                                          An Nvidia Cop. HGX B100 GPU server on display in Taipei, June 5, 2024. Photographer: Annabelle Chih/Bloomberg 米半導体大手エヌビディアの株式は向こう1年の売上高見通しに基づく株価売上高倍率(PSR)が23倍と、S&P500種株価指数構成銘柄で最も割高となっている。 しかし、その株価バリュエーションには問題がある。人工知能(AI)ブームの時代にあって、同社の売上高が実際にどうなるのかはウォール街のアナリストだけでなくエヌビディアの経営陣にも定かではないからだ。では、投資家はどうやって株価が高いかどうかを判断すべきなのだろうか。 ここ1年余り、AIブームを背景にしたエヌビディア製チップへの需要急増は、ウォール街の四半期業績予想を的外れなものにしてきた。アナリストは他の企業と同じように経

                                                            エヌビディアの急成長、アナリストは置き去りに-上方修正追いつかず
                                                          • さくらインターネット、NVIDIAのGPUを搭載した生成AI向けクラウドサービス「高火力」の第2弾「高火力 DOK」を提供開始 | さくらインターネット

                                                            さくらインターネット、NVIDIAのGPUを搭載した生成AI向けクラウドサービス「高火力」の第2弾「高火力 DOK」を提供開始 〜最長3か月の無償利用キャンペーンも開始〜 デジタルインフラサービスを提供するさくらインターネット株式会社(本社:大阪府大阪市、代表取締役社長:田中 邦裕、以下「さくらインターネット」)は、生成AI向けクラウドサービス「高火力」の第2弾としてコンテナシリーズ「高火力 DOK(ドック)」を2024年6月27日(木)より提供開始します。 このたび提供開始する「高火力 DOK」は、NVIDIAのGPUを使用してお客さまが事前に用意したDockerイメージの実行ができる、コンテナ型クラウドサービスです。イメージ内に実行環境をパッケージングすることで、毎回の環境構築の手間をかけずにサービス利用することができます。 また、利用時間に応じた時間課金制でコスト削減にもつながります

                                                              さくらインターネット、NVIDIAのGPUを搭載した生成AI向けクラウドサービス「高火力」の第2弾「高火力 DOK」を提供開始 | さくらインターネット
                                                            • エヌビディア一強が崩れる可能性も 米中共同で開発が進む「大規模言語モデル」の革命的な進化 | マネーポストWEB

                                                              米国財務省は6月21日、国家安全保障を脅かす可能性があるとして、半導体、量子コンピュータ、AIなどのハイテク分野に関して、米国企業による中国企業への投資を禁止、あるいは報告義務を課す規制案を公表した。8月4日までに意見公募を済ませ、年内にも実施される見通しだ。この政策は果たして米国に利益をもたらすだろうか。 この1年の間、大規模言語モデルに関して画期的な進歩をもたらす可能性のある研究論文が発表されており、それらが一部の有識者の間で話題となっている。エヌビディア一強時代を崩すきっかけになるかもしれないという点で注目度の高い論文だが、それらは米中共同開発の形で進められている。 マイクロソフト、中国科学院大学、清華大学の研究者は2023年10月、ニューラルネットで用いられるパラメーターについて、現在使われている16進法による高精度浮動小数点(4ビット)を量子化された3つの数字(-1、0、1)(1

                                                                エヌビディア一強が崩れる可能性も 米中共同で開発が進む「大規模言語モデル」の革命的な進化 | マネーポストWEB
                                                              • 画像生成AI「Stable Diffusion」を「Copilot+ PC」で動かしたらどうなる?(窓の杜) - Yahoo!ニュース

                                                                ■ AIに強い「Copilot+PC」なら「Stable Diffusion」も快適? 【画像】「Stability Matrix」。複数のUI環境を簡単に共存できる PCのAI機能を拡充する「Copilot+ PC」。弊誌でもAI機能を試す記事を掲載している。画像生成AIなどいくつかの機能が使えて、PCの未来を体感できる内容になっている。 とはいえAIは「Copilot+ PC」の専売特許ではない。今回は画像生成AIが広く知られるのに大きな役割を果たした「Stable Diffusion」を、6月に発売されたばかりの「Copilot+ PC」で動かしたらどうなるのかを試してみることにした。 使用するのはMicrosoftからお借りした「Surface Laptop 13.8インチ(第7世代)」だ。スペックは下記のとおり。 今回お借りした機材は、CPUがSnapdragon X Elite

                                                                  画像生成AI「Stable Diffusion」を「Copilot+ PC」で動かしたらどうなる?(窓の杜) - Yahoo!ニュース
                                                                • Azure Kubernetes Services (AKS) on Azure Stack HCI の AKS ネットワーク アーキテクチャ - Azure Example Scenarios

                                                                  このブラウザーはサポートされなくなりました。 Microsoft Edge にアップグレードすると、最新の機能、セキュリティ更新プログラム、およびテクニカル サポートを利用できます。 このシナリオでは、AKS クラスターに Azure Kubernetes Service (AKS) ノードをデプロイするためのネットワーク概念を設計し実装する方法を説明します。 この記事には、Kubernetes ノードと Kubernetes コンテナーのネットワーク設計に関する推奨事項が記載されています。 これは、2 つの記事から成るアーキテクチャ ベースライン ガイダンス セットの一部です。 ベースライン アーキテクチャに関する推奨事項については、こちらを参照してください。 アーキテクチャ 次の図は、Azure Stack HCI または Windows Server 2019/2022 Datace

                                                                    Azure Kubernetes Services (AKS) on Azure Stack HCI の AKS ネットワーク アーキテクチャ - Azure Example Scenarios
                                                                  • エヌビディアが時価総額「世界一」に、約527兆円 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

                                                                    米国の半導体メーカー大手、エヌビディアの時価総額は、米国時間6月18日の取引でマイクロソフトを僅差で上回り、世界で最も時価総額が高い公開企業となった。 エヌビディアの株価は18日、前日比3.51%高の135.58ドルで取引を終えた。これにより、エヌビディアの時価総額は3兆3400億ドル(約527兆円)となり、マイクロソフトの時価総額の3兆3200億ドル(約524兆円)を上回った。 エヌビディアの株価は、直近で行った10対1の株式分割によって1株あたりの株価が下がって以来、約12%上昇している。 同社の年初における時価総額は1兆2000億ドルだった。これは当時のマイクロソフトとアップルの時価総額の半分以下である。そこから、エヌビディアの株価はこれまでに約181%もの上昇を見せた。 フォーブスは同社のCEOを務めるジェンスン・フアンの純資産を1188億ドル(約18兆7000億円)と推定しており

                                                                      エヌビディアが時価総額「世界一」に、約527兆円 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
                                                                    • 液冷サーバーと液浸サーバー、デル・テクノロジーズが検証施設を初公開(アスキー) - Yahoo!ニュース

                                                                      デル・テクノロジーズが、メディア向け説明会において、CPUなど筐体内部のパーツを液体で冷却する液冷サーバーの実機を紹介したほか、東京・大手町の本社内にある「液浸冷却・水冷ラボ」で液浸サーバーおよび液冷サーバーを稼働させている様子を公開した。 【もっと写真を見る】 デル・テクノロジーズは2024年6月18日、メディア向け説明会において、CPUなど筐体内部のパーツを液体で冷却する液冷サーバーの実機を紹介したほか、東京・大手町の本社内にある「液浸冷却・水冷ラボ」で液浸サーバーおよび液冷サーバーを稼働させている様子を公開した。 なお液浸冷却・水冷ラボは、最先端の冷却ソリューションの実証を行い、顧客に最新冷却技術の価値を体験してもらうこと、ソリューション提案をすることを目的とした施設。メディア向けの公開は今回が初めてとなる。 空冷方式はGPUサーバーなどで限界、海外では液冷化が進む サーバーなどのデ

                                                                        液冷サーバーと液浸サーバー、デル・テクノロジーズが検証施設を初公開(アスキー) - Yahoo!ニュース
                                                                      • なぜLUUPは無免許運転できるのに、電動スーツケースはダメなのか

                                                                        sponsored AI向けのワークステーションやサーバーもズラリ ほかにない特徴や魅力が多数! COMPUTEXのSilverStoneブースをチェック sponsored クラウドストレージの使いやすさ、快適さのカギを握る「同期処理のスピード」 ファイルサーバーの「使い勝手」を変えずクラウドストレージへ引っ越すには? sponsored ゲームのスクショ、プレイ動画の編集におすすめ AMD Radeon、AIバッチリ使えます:Adobe PhotoshopやPremiere Proで検証 sponsored G-Master Spear FX7をレビュー 「FFXIV: 黄金のレガシー」が4Kでも遊べるゲーミングPC、「次の10年」にふさわしい仕上がり sponsored テクノロジーとデザインで“コンテンツを創造する力”を高める取り組み、ネットワークの役割 TBSのR&D拠点「Tec

                                                                          なぜLUUPは無免許運転できるのに、電動スーツケースはダメなのか
                                                                        • https://jp.wsj.com/articles/nvidias-ascent-to-most-valuable-company-has-echoes-of-dot-com-boom-59fd946f

                                                                          • ヤマダデンキ創業50周年記念限定商品は「1/12 ペヤングソースやきそば自販機プラモデル」

                                                                            sponsored クラウドストレージの使いやすさ、快適さのカギを握る「同期処理のスピード」 ファイルサーバーの「使い勝手」を変えずクラウドストレージへ引っ越すには? sponsored ゲームのスクショ、プレイ動画の編集におすすめ AMD Radeon、AIバッチリ使えます:Adobe PhotoshopやPremiere Proで検証 sponsored G-Master Spear FX7をレビュー 「FFXIV: 黄金のレガシー」が4Kでも遊べるゲーミングPC、「次の10年」にふさわしい仕上がり sponsored テクノロジーとデザインで“コンテンツを創造する力”を高める取り組み、ネットワークの役割 TBSのR&D拠点「Tech Design X」がネットギアProAVスイッチを導入した背景 sponsored VESA対応ディスプレーの裏に設置可能、TV横に置くリビングPCにも

                                                                              ヤマダデンキ創業50周年記念限定商品は「1/12 ペヤングソースやきそば自販機プラモデル」
                                                                            • USB-C接続の外付けGPU、試してみるとハイパワーで便利。Radeon RX 7600M XT搭載「GPD G1」レビュー

                                                                              レビュー USB-C接続の外付けGPU、試してみるとハイパワーで便利。Radeon RX 7600M XT搭載「GPD G1」レビュー この数年でパソコンの使い道として人気を集めているのがゲームです。もちろん以前から家庭用ゲーム機では体験できないような高画質なグラフィックを体験したり、オンラインでの協力プレイや対戦要素に富んだゲームをパソコンで遊んでいた人は多くいましたが、コロナ禍の巣ごもり需要以降はよりカジュアルに、パソコンでゲームを楽しむ人が増えています。 筆者自身も「以前からパソコンでゲームを楽しんでいた側」の一人ですが、自身の経験、体験として身の回りにパソコンでゲームを楽しんでいる友人が増え、これが局所的な流行りではなく世の中全体での流行りなんだと感じています。 ただその流行りに乗ろうにも、パソコンでゲームを遊ぼうにも今持っているパソコンの性能ではゲームが満足に動かないと悩んでいる

                                                                                USB-C接続の外付けGPU、試してみるとハイパワーで便利。Radeon RX 7600M XT搭載「GPD G1」レビュー
                                                                              • AKS on Azure Stack HCI 用の Azure Kubernetes Service (AKS) ベースライン アーキテクチャ - Azure Example Scenarios

                                                                                このシナリオでは、Azure Stack HCI で実行される Microsoft Azure Kubernetes Service (AKS) のベースライン アーキテクチャを設計して実装する方法について説明します。 この記事には、組織のビジネス要件に基づいたクラスターのネットワーク、セキュリティ、ID、管理、監視に関する推奨事項が記載されています。 これは、2 つの記事で構成されるアーキテクチャ ベースライン ガイダンス セットの一部です。 ネットワーク設計に関する推奨事項については、こちらを参照してください。 Architecture 次の図は、Azure Stack HCI または Windows Server 2019/2022 Datacenter フェールオーバー クラスターの Azure Kubernetes Service のベースライン アーキテクチャを示しています。

                                                                                  AKS on Azure Stack HCI 用の Azure Kubernetes Service (AKS) ベースライン アーキテクチャ - Azure Example Scenarios
                                                                                • AI時代に入り、中国独自の半導体による脱米国の可能性は少し出てきた!? (1/2)

                                                                                  中国独自のGPUを開発している「Moore Threads(摩尓線程)」による大規模コンピューティング向けのアクセラレーター「MTT S4000」。CUDAのエコシステムをそのまま活用できるとしている 中国産半導体のみでのPCの代替はこれまでも話題になったが なかなか難しい現実があったが、大分状況は変わった!? 米国によるファーウェイへの制裁以降、中国では西側諸国に対抗するためIT機器を自前で揃えようとする動きが加速している。 本連載ではこれまでも、「中国独自の命令セットのCPUとパーツを用いた「完全中国製PC」でWindowsアプリが動いたと話題に」「中国産CPUやGPUが続々発表、中国政府も力を入れる脱米国は現実化するか?」といった記事を書いてきたが、後者の記事からは2年が経過した。この2年の間に大規模データモデルと生成AIが大きなトレンドとなったのは中国でも同じ。自前のソフトとハード

                                                                                    AI時代に入り、中国独自の半導体による脱米国の可能性は少し出てきた!? (1/2)