並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 257件

新着順 人気順

https artificial analysis ai modelsの検索結果1 - 40 件 / 257件

  • みんなこれでいいAI。Googleの最新ローカルLLM「Gemma 4」は日本語うますぎ、でも無料

    Gemma 4シリーズは動作デバイスと性能の観点から、2種に分類できます。 ・E2B・E4B:普通のノートPCで動かせる軽量モデル ・26B-A4B:ハイエンドマシンで動かす高性能モデル いずれも非常に実用性が高いモデルとなっており、とりあえず動かせるものを選べばOKです。 Apache 2.0ライセンスで提供されており、個人利用はもちろんのこと、商用での利用も可能です。 専門サイトによる評価も高い「Gemini 3の研究・技術に基づいてローカルLLMの限界を引き上げるようにGemma 4を開発した」とGoogleは述べていますが、これは煽り文句ではありません。 AI評価サイト「Arena.ai」における一部ローカルLLMの性能評価グラフ。gemma-4-31B・gemma-4-26B-A4Bはサイズに対する評価が高くなっているImage: GoogleAI評価サイト「Arena.ai」で

      みんなこれでいいAI。Googleの最新ローカルLLM「Gemma 4」は日本語うますぎ、でも無料
    • ついにローカルLLMで安心して仕事が出来る!― Qwen3.5-27B 採用レポート (2026/02/27)

      ついにローカルLLMで安心して仕事が出来る!― Qwen3.5-27B 採用レポート (2026/02/27) TL;DR ・RTX 3090(VRAM 24GB)+5bit量子化で Qwen3.5-27B (Reasoning) を実用速度でローカル動作させた話。 ・Artificial Analysis の Intelligence Index 上では、 Qwen3.5-27B (42) > o3-pro (41) > Qwen3.5-35B-A3B (37) という並びになっている。 ・実際のコーディング体験でも、長めのタスクのやり切り/コードの一貫性/プロンプト耐性の3点で 27B が 35B-A3B を上回ると感じたため、「常用エンジン」は 27B を採用。 ・TypeScript + Canvas で Pong / Breakout / Tetris の3本をワンショット生成し

        ついにローカルLLMで安心して仕事が出来る!― Qwen3.5-27B 採用レポート (2026/02/27)
      • 歴代チャットボットと最近のLLMのまとめ - Qiita

        Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? LLMs The History of Chatbots ELIZA (1966) 初期の人工知能プログラムのひとつ。 ルールベースの簡単なパターンマッチングで返答していた。 心理療法士の会話を模したELIZA(DOCTOR)が有名。 PARRY (1972) PARRYは偏執病的統合失調症患者をシミュレートしようとしたもの。 ELIZA(DOCTOR)と通信し話題となった。 Jabberwacky (1982, 1988, 1997) ユーモラスな人間同士の自然な会話をシミュレートすることを目的としていた。 ユーザーとの会話の大規模な

          歴代チャットボットと最近のLLMのまとめ - Qiita
        • The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

          At Sakana AI, we have pioneered the use of nature-inspired methods to advance cutting-edge foundation models. Earlier this year, we developed methods to automatically merge the knowledge of multiple LLMs. In more recent work, we harnessed LLMs to discover new objective functions for tuning other LLMs. Throughout these projects, we have been continuously surprised by the creative capabilities of cu

            The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery
          • GitHub - modelcontextprotocol/servers: Model Context Protocol Servers

            Official integrations are maintained by companies building production ready MCP servers for their platforms. 21st.dev Magic - Create crafted UI components inspired by the best 21st.dev design engineers. 2slides - An MCP server that provides tools to convert content into slides/PPT/presentation or generate slides/PPT/presentation with user intention. ActionKit by Paragon - Connect to 130+ SaaS inte

              GitHub - modelcontextprotocol/servers: Model Context Protocol Servers
            • Gemini 3.0 ProやGPT-5.2に匹敵する中国製AI「GLM-5」が登場、Word文書作成などの事務作業も可能でモデルを自由にダウンロード可能

              北京に拠点を置くAI企業のZ.aiがAIモデル「GLM-5」を2026年2月12日に発表しました。GLM-5は複数のベンチマークでGemini 3.0 ProやGPT-5.2を超えるスコアを記録しており、エージェントとしてWord文書作成などの事務処理を実行することもできます。また、モデルを無料でダウンロード可能なオープンモデルとして公開されている点も特徴です。 GLM-5: From Vibe Coding to Agentic Engineering https://z.ai/blog/glm-5 GLM-5は総パラメーター数7440億、アクティブパラメーター数400億のAIモデルです。slimeと呼ばれる独自開発の強化学習フレームワークを用いることで学習効率が大幅に向上しており、2025年12月に登場したGLM-4.7と比べて推論やコーディングやエージェントタスクの能力を引き上げるこ

                Gemini 3.0 ProやGPT-5.2に匹敵する中国製AI「GLM-5」が登場、Word文書作成などの事務作業も可能でモデルを自由にダウンロード可能
              • Wake up, Remix!

                At React Conf last summer we announced that Remix was going to "take a nap". Remix v2 had become such a thin wrapper around React Router that an artificial separation developed between the two projects. We simplified the projects by moving the bundler and server runtime code from Remix directly into React Router v7, merging everything that made Remix great into React Router v7 “framework mode”. We

                  Wake up, Remix!
                • Agentic Software: How AI Agents Are Restructuring the Software Paradigm

                  Agentic Software: How AI Agents Are Restructuring the Software Paradigm Zhenfeng Cao Lingxi Intelligent Investment (Shenzhen) Development Co., Ltd. info@stellarsea.com June 11, 2026 Abstract For over half a century, software engineering has operated on a foundational premise: human engineers decompose problems, encode decision logic into static code, and manually adapt that code as requirements ev

                  • Gemini 3.1 Pro超えの中国製AIモデル「MiniMax M2.7」が無料公開される

                    中国に拠点を置くAI開発企業のMiniMaxが2290億パラメーターの自社製AIモデル「MiniMax M2.7」をHugging FaceやModelScopeで無料公開しました。当該モデルは2026年3月18日に発表されていたもので、エージェント性能の高さがアピールされています。 GitHub - MiniMax-AI/MiniMax-M2.7 · GitHub https://github.com/MiniMax-AI/MiniMax-M2.7 We're delighted to announce that MiniMax M2.7 is now officially open source. With SOTA performance in SWE-Pro (56.22%) and Terminal Bench 2 (57.0%). You can find it on Hugg

                      Gemini 3.1 Pro超えの中国製AIモデル「MiniMax M2.7」が無料公開される
                    • OpenAIがリアルタイム会話・通訳・文字起こしAIをリリース、「GPT-Realtime-2」「GPT-Realtime-Translate」「GPT-Realtime-Whisper」の3種

                      OpenAIがリアルタイム音声対話AI「GPT-Realtime-2」、リアルタイム音声翻訳AI「GPT-Realtime-Translate」、リアルタイム文字起こしAI「GPT-Realtime-Whisper」の3種を2026年5月7日にリリースしました。 Advancing voice intelligence with new models in the API | OpenAI https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/ GPT-Realtime-2はGPT-5シリーズと同等の推論能力を備えた音声モデルとしてアピールされています。リアルタイムで会話できるほどの処理速度を備えつつ、高度な会話を自然に進めることが可能。ベンチマークテストではGPT-Realtime

                        OpenAIがリアルタイム会話・通訳・文字起こしAIをリリース、「GPT-Realtime-2」「GPT-Realtime-Translate」「GPT-Realtime-Whisper」の3種
                      • The Human Only Public License

                        16 Oct 2025 Whether artificial intelligence systems will end up being a positive or a negative force for humanity is still an open question. But we might find ourselves one day with AI embedded at every layer of our existence, living lives of toned down and diluted humanity with only our dreams for escape. Although I am not yet convinced of this worst case scenario, I believe it is important that

                          The Human Only Public License
                        • 色々な生成AIモデルをColabで動かして今年を振り返る - ABEJA Tech Blog

                          こんにちは、ラボで研究開発をしたりプロトタイプを作っている藤本(X(Twitter))です。ABEJAアドベントカレンダー2023の21日目の記事です。ここ近年、生成AIの勢いが凄いです。最近は一夜明けたら世界が変わっているみたいなことがしょっちゅう起きています。そんな状況なので、なかなか世の中についていくのが難しいのではないかと思います。そこで今回は、これまでに色々と出てきた生成モデルを振り返りつつ、ひたすら思いつく限りColabで動かしまくってみる企画をやってみようかと思います。流石に全部Colabで動かすのは大変でした・・・。 まずは言語を対象として日本語モデルを含む様々なモデルを対象に推論実験を行います。続いて高速化の実験、更にSFTによるInstructionチューニングや、RLHFもやってみます。最後に、ソースコード生成もやってみましょう。次に、画像を対象として、言語同様に色々

                            色々な生成AIモデルをColabで動かして今年を振り返る - ABEJA Tech Blog
                          • Dario Amodei — Machines of Loving Grace

                            I think and talk a lot about the risks of powerful AI. The company I’m the CEO of, Anthropic, does a lot of research on how to reduce these risks. Because of this, people sometimes draw the conclusion that I’m a pessimist or “doomer” who thinks AI will be mostly bad or dangerous. I don’t think that at all. In fact, one of my main reasons for focusing on risks is that they’re the only thing standin

                              Dario Amodei — Machines of Loving Grace
                            • 「機械学習とビジネスを橋渡しするものこそ評価指標であり, "全てのビジネスは条件付期待値の最大化問題として書ける"」という話の問題点と代替案 - ill-identified diary

                              概要 はじめに I. 条件付き期待値が全てか? i 条件付き「期待値」だけでよいのか? ii 条件付き期待値の条件とはなにか? メディアミックスモデルを例に 外挿と選択バイアス 補足: 条件付き期待値の条件付けに関して II. 機械学習の性能評価 ≠ ビジネスモデル なのか? 分類モデルと確率の推定 確率推定の評価はできるのか III. こういう話の教科書・参考書はないのか? まとめ 参考文献 概要 『機械学習とビジネスを橋渡しするものこそ評価指標であり, ”全てのビジネスは条件付期待値の最大化問題として書ける”仮説についての一考察 - 株式会社ホクソエムのブログ』というブログ記事に対する私の昨日の twitter での連続投稿の話を書き改め, 説明不足な部分を補った. 昨日と同様に, (I) 条件付き期待値だけでよいか, (II) ビジネスモデルと機械学習の性能評価は一致しないのか, (

                                「機械学習とビジネスを橋渡しするものこそ評価指標であり, "全てのビジネスは条件付期待値の最大化問題として書ける"」という話の問題点と代替案 - ill-identified diary
                              • AWS Certified Machine Learning Engineer - Associate(MLA)の学習方法 - NRIネットコムBlog

                                小西秀和です。 この記事は「AWS認定全冠を維持し続ける理由と全取得までの学習方法・資格の難易度まとめ」で説明した学習方法を「AWS Certified Machine Learning Engineer - Associate(MLA)」に特化した形で紹介するものです。 重複する内容については省略していますので、併せて元記事も御覧ください。 また、現在投稿済の各AWS認定に特化した記事へのリンクを以下に掲載しましたので興味のあるAWS認定があれば読んでみてください。 ALL SAP DOP SCS ANS MLS SAA DVA SOA DEA MLA AIF CLF 「AWS Certified Machine Learning Engineer - Associate(MLA)」とは 「AWS Certified Machine Learning Engineer - Associa

                                  AWS Certified Machine Learning Engineer - Associate(MLA)の学習方法 - NRIネットコムBlog
                                • 「Gemini 3.1 Pro」が登場、Gemini 3 Proと比べて推論性能が2倍でOpenAIやAnthropicのモデルを上回る

                                  GoogleがAIモデル「Gemini 3.1 Pro」を2026年2月19日にリリースしました。Googleは「Gemini 3 Proと比べて推論機能が2倍以上に向上している」とアピールしています。 Gemini 3.1 Pro: Announcing our latest Gemini AI model https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/ 「Gemini 3.1 Pro」「Gemini 3 Pro」「Claude Sonnet 4.6」「Claude Opus 4.6」「GPT-5.2」「GPT-5.3-Codex」の各種ベンチマーク結果を並べた表が以下。Gemini 3.1 Proが多くのテストでトップスコアを記録しています。 Gemini 3

                                    「Gemini 3.1 Pro」が登場、Gemini 3 Proと比べて推論性能が2倍でOpenAIやAnthropicのモデルを上回る
                                  • Machine Learning Trends You Need to Know - Gradient Flow

                                    Insights and trends that will help you navigate the AI landscape. By Assaf Araki and Ben Lorica. Automation and democratization are on the rise AutoML tools are designed to automate the process of training and deploying machine learning. Such tools have progressed to the point where they can produce adequate models for many use cases. Moreover, in domains where model hubs and foundation models (e.

                                      Machine Learning Trends You Need to Know - Gradient Flow
                                    • 100+ Best GitHub Repositories For Machine Learning

                                      There are millions of GitHub repos and filtering them is an insane amount of work. It takes a huge time, effort, and a lot more. We have done this for you. In this article, we’ll share a curated list of 100+ widely-known, recommended, and most popular repositories and open source GitHub projects for Machine Learning and Deep Learning. So without further ado, Let’s see all the hubs created by exper

                                        100+ Best GitHub Repositories For Machine Learning
                                      • 2025: The year in LLMs

                                        31st December 2025 This is the third in my annual series reviewing everything that happened in the LLM space over the past 12 months. For previous years see Stuff we figured out about AI in 2023 and Things we learned about LLMs in 2024. It’s been a year filled with a lot of different trends. The year of “reasoning” The year of agents The year of coding agents and Claude Code The year of LLMs on th

                                          2025: The year in LLMs
                                        • こいつを待ってた!3万字以上自動的に書いてくれるオープンLLMが登場!三回回せば本一冊分に!

                                          なんか最近、いろんな会社が「おらが村のLLMが凄いだ」と言ってるが、実際には100万トークン読めても出力が8Kまでだったり、もっとひどいと4Kだったりと、LLMの価値はパラメータ数では決まらず、むしろどのくらい長い文章を出してくれるのかということの方が大事だ。僕がLLMで本を書いたのはもう一年前だが、このときは4Kくらいしか出力してくれなくて往生したものである。 ところがなんということでしょう。ついに出ました。原稿を代わりに書いてくれそうな素敵なオープンソースLLMが。その名も「LongWriter」 Apacheライセンス、しかも訓練コード付き。つまりご家庭で自分好みにファインチューニングもできちゃう。しかもこの言語モデル、なんと8Bしかないんですよ奥さん。24GBしかVRAMのない星飛雄馬のようなご家庭のPCでも動いちゃうというワケですよ。なんという不都合な真実。いいのかおい。 AIち

                                            こいつを待ってた!3万字以上自動的に書いてくれるオープンLLMが登場!三回回せば本一冊分に!
                                          • Things we learned about LLMs in 2024

                                            31st December 2024 A lot has happened in the world of Large Language Models over the course of 2024. Here’s a review of things we figured out about the field in the past twelve months, plus my attempt at identifying key themes and pivotal moments. This is a sequel to my review of 2023. In this article: The GPT-4 barrier was comprehensively broken Some of those GPT-4 models run on my laptop LLM pri

                                              Things we learned about LLMs in 2024
                                            • Notifications: why less is more — how Facebook has been increasing both user satisfaction and app…

                                              We are members of the Facebook Notifications Data Science team at Meta. We ran surveys on how users felt about on-site notifications (notifications that show up in the Facebook app when you open the app and create a red badge that counts the number of notifications you have) and found that many users prefer to receive only a few notifications. Based on this finding, we ran an experiment where we s

                                                Notifications: why less is more — how Facebook has been increasing both user satisfaction and app…
                                              • ついに「Grok 4」が登場、OpenAIなどの推論モデルを超える性能で「世界最強AIモデル」とアピールするも「イーロン・マスクの発言を参考にしまくる」という挙動も確認される

                                                イーロン・マスク氏が設立したAI開発企業「xAI」が新たなAIモデル「Grok 4」を2025年7月10日(木)に発表しました。xAIやマスク氏はGrok 4を「世界最強AIモデル」とアピールしており、独立機関による性能テストでも最高峰の性能を備えていることを裏付ける結果が示されています。一方で、意見に偏りがあることも報告されています。 Introducing Grok 4, the world's most powerful AI model. Watch the livestream now: https://t.co/59iDX5s2ck— xAI (@xai) July 10, 2025 Download the new @Grok 4 app and try out the world’s smartest artificial intelligence!— Elon Musk

                                                  ついに「Grok 4」が登場、OpenAIなどの推論モデルを超える性能で「世界最強AIモデル」とアピールするも「イーロン・マスクの発言を参考にしまくる」という挙動も確認される
                                                • 中国製高性能AI「DeepSeek-V4-Pro」の75%割引が永続化される、DeepSeek専用設計のコーディングエージェント「Reasonix」にも注目が集まる

                                                  中国のAI企業であるDeepSeekは2026年4月にDeepSeek-V4シリーズを発表し、期間限定でAPI料金の75%割引きキャンペーンを実施していました。この割引きが永遠に続くことが発表され、DeepSeek-V4-Proがコストパフォーマンスに優れたモデルとして注目を集めています。 Models & Pricing | DeepSeek API Docs https://api-docs.deepseek.com/quick_start/pricing DeepSeekは2026年4月24日に「DeepSeek-V4」を発表しました。DeepSeek-V4は総パラメーター数2840億・アクティブパラメーター数130億の「DeepSeek-V4-Flash」と、総パラメーター数1兆6000億・アクティブパラメーター数490億の「DeepSeek-V4-Pro」の2種類が存在。どちらも

                                                    中国製高性能AI「DeepSeek-V4-Pro」の75%割引が永続化される、DeepSeek専用設計のコーディングエージェント「Reasonix」にも注目が集まる
                                                  • Anthropic’s Claude 3.5 Sonnet model now available in Amazon Bedrock: Even more intelligence than Claude 3 Opus at one-fifth the cost | Amazon Web Services

                                                    AWS News Blog Anthropic’s Claude 3.5 Sonnet model now available in Amazon Bedrock: Even more intelligence than Claude 3 Opus at one-fifth the cost It’s been just 3 months since Anthropic launched Claude 3, a family of state-of-the-art artificial intelligence (AI) models that allows you to choose the right combination of intelligence, speed, and cost that suits your needs. Today, Anthropic introduc

                                                      Anthropic’s Claude 3.5 Sonnet model now available in Amazon Bedrock: Even more intelligence than Claude 3 Opus at one-fifth the cost | Amazon Web Services
                                                    • Vibe physics: The AI grad student

                                                      Can AI do theoretical physics? In this guest post, professor of physics Matthew Schwartz decided to find out by supervising Claude through a real research calculation, start to finish, without ever touching a file himself. His account of what happened is below. SummaryI guided Claude Opus 4.5 through a real theoretical physics calculation, encapsulating the complexity of code and computations behi

                                                        Vibe physics: The AI grad student
                                                      • Agents

                                                        Intelligent agents are considered by many to be the ultimate goal of AI. The classic book by Stuart Russell and Peter Norvig, Artificial Intelligence: A Modern Approach (Prentice Hall, 1995), defines the field of AI research as “the study and design of rational agents.” The unprecedented capabilities of foundation models have opened the door to agentic applications that were previously unimaginabl

                                                          Agents
                                                        • Googleが日本語対応の音声合成AI「Gemini 3.1 Flash TTS」をリリースしたので使ってみた、音声タグで感情を制御可能

                                                          Googleが合成音声AI「Gemini 3.1 Flash TTS」を2026年4月15日にリリースしました。Gemini 3.1 Flash TTSは日本語を70以上の言語に対応しており、感情を制御しつつ高品質な音声を出力することができます。無料で使えるデモアプリも用意されていたので実際に使ってみました。 Gemini 3.1 Flash TTS: New text-to-speech AI model https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-tts/ Gemini 3.1 Flash TTS(テキスト読み上げ)プレビュー  |  Gemini API  |  Google AI for Developers https://ai.google.de

                                                            Googleが日本語対応の音声合成AI「Gemini 3.1 Flash TTS」をリリースしたので使ってみた、音声タグで感情を制御可能
                                                          • 日本語対応&超高速コード生成も可能な拡散大規模言語モデル(dLLM)「Mercury」が登場

                                                            スタンフォード大学、カリフォルニア大学ロサンゼルス校、コーネル大学の教授陣により設立された新世代の大規模言語モデル(LLM)を開発するAIスタートアップのInception Labsが、拡散モデルを取り入れた次世代LLMの拡散大規模言語モデル(dLLM)となる「Mercury」を発表しました。Inception Labsによると、Mercuryは世界初の商用規模のdLLMとのことです。 Introducing Mercury, our General Chat Diffusion Large Language Model https://www.inceptionlabs.ai/introducing-mercury-our-general-chat-model [2506.17298] Mercury: Ultra-Fast Language Models Based on Diffus

                                                              日本語対応&超高速コード生成も可能な拡散大規模言語モデル(dLLM)「Mercury」が登場
                                                            • OpenAIが発表した新モデル「GPT-4.1」を試すも、“Gの影”がチラついてしまった

                                                              OpenAIが発表した新モデル「GPT-4.1」を試すも、“Gの影”がチラついてしまった2025.04.15 23:3049,103 かみやまたくみ 2025年4月15日、OpenAIが3つの新AIモデル「GPT-4.1」「GPT-4.1 mini」「GPT-4.1 nano」を発表しました。 ・いずれのモデルもこれまでの同系統モデルよりも性能向上。特にコーディングの能力とユーザーの指示に従う能力が伸びた ・コンテキストウィンドウが大幅に増加、最大100万トークンに。格段に長いコンテキスト(文脈)を理解できるように ・どのモデルも費用対効果の高さを意識。賢さはアップしつつ、価格感が調整された いずれのモデルもAPIのみで利用可(ChatGPT上で使えるわけではない)ですが、昨今、非エンジニアでもAPIを利用する方が増えてるような印象があります。自分もそうなっていて、今後OpenAI API

                                                                OpenAIが発表した新モデル「GPT-4.1」を試すも、“Gの影”がチラついてしまった
                                                              • Amazonが3nmの新AIチップ「Trainium3」を発表、「Trainium2」より4倍高速&コスト最大50%削減&さらに「Trainium4」も予告

                                                                Amazon Web Services(AWS)が、最新世代のTrainiumチップである「Trainium3」をUltraServerサービスを通じて提供開始しました。Trainium3は同社初の3nmというプロセスノードで製造されたAIチップであり、前世代と比較してさまざまな性能が向上しています。 Top announcements of AWS re:Invent 2025 | AWS News Blog https://aws.amazon.com/jp/blogs/aws/top-announcements-of-aws-reinvent-2025/ Trainium3 UltraServer delivers faster AI training at lower cost https://www.aboutamazon.com/news/aws/trainium-3-ultr

                                                                  Amazonが3nmの新AIチップ「Trainium3」を発表、「Trainium2」より4倍高速&コスト最大50%削減&さらに「Trainium4」も予告
                                                                • LLMの「創発」は幻影か

                                                                  3つの要点 ✔️ 大規模言語モデルで観察される創発を検証 ✔️ LLMの創発は評価指標が見せる幻影である可能性を示唆 ✔️ LLM以外のモデルにおいて特定の評価指標を用いることで意図的に実際には発生していない創発を再現することに成功 Are Emergent Abilities of Large Language Models a Mirage? written by Rylan Schaeffer, Brando Miranda, Sanmi Koyejo (Submitted on 28 Apr 2023 (v1), last revised 22 May 2023 (this version, v2)) Comments: Published on arxiv. Subjects: Artificial Intelligence (cs.AI); Machine Learning (

                                                                    LLMの「創発」は幻影か
                                                                  • PowerPoint Presentation

                                                                    Executive Perspectives The Future of Sales and Marketing Is Here February 2022 Executive Perspectives 1. Metaverse market proxied by 'extended reality' - a term referring to all real-and-virtual combined environments and human-machine interactions generated by computer technology and wearables. Note: Augmented reality (AR) adds digital elements to a live view often by using the camera on a smartph

                                                                    • 謎の動画生成AIモデル「HappyHorse-1.0」が匿名テストで世界最高性能を達成

                                                                      AI情報分析サイト「Artificial Analysis」の動画生成AI性能ランキングに「HappyHorse-1.0」という名前のモデルが登場し、GoogleやByteDanceなどの高性能モデルを抜いてランキング1位の座を獲得しました。 Text to Video Leaderboard - Top AI Video Models https://artificialanalysis.ai/video/leaderboard/text-to-video Image to Video Leaderboard - Top AI Video Models https://artificialanalysis.ai/video/leaderboard/image-to-video Artificial Analysisは「Video Arena」という動画生成AIランキングを運営しています。

                                                                        謎の動画生成AIモデル「HappyHorse-1.0」が匿名テストで世界最高性能を達成
                                                                      • Artificial Intelligence Risk Management Framework (AI RMF 1.0)

                                                                        NIST AI 100-1 Artificial Intelligence Risk Management Framework (AI RMF 1.0) NIST AI 100-1 Artificial Intelligence Risk Management Framework (AI RMF 1.0) This publication is available free of charge from: https://doi.org/10.6028/NIST.AI.100-1 January 2023 U.S. Department of Commerce Gina M. Raimondo, Secretary National Institute of Standards and Technology Laurie E. Locascio, NIST Director and Und

                                                                        • An Economy of AI Agents

                                                                          An Economy of AI Agents Gillian K. Hadfield* Johns Hopkins Andrew Koh† MIT This version: September 3, 2025 Prepared for the NBER Handbook on the Economics of Transformative AI Abstract In the coming decade, artificially intelligent agents with the ability to plan and ex- ecute complex tasks over long time horizons with little direct oversight from humans may be deployed across the economy. This ch

                                                                          • Magistral | Mistral AI

                                                                            Announcing Magistral — the first reasoning model by Mistral AI — excelling in domain-specific, transparent, and multilingual reasoning. The best human thinking isn’t linear — it weaves through logic, insight, uncertainty, and discovery. Reasoning language models have enabled us to augment and delegate complex thinking and deep understanding to AI, improving our ability to work through problems req

                                                                              Magistral | Mistral AI
                                                                            • Building AI Products In The Probabilistic Era

                                                                              I was recently trying to convince a friend of mine that ChatGPT hasn't memorized every possible medical record, and that when she was passing her blood work results the model was doing pattern matching in ways that even OpenAI couldn't really foresee. She couldn't believe me, and I totally understand why. It's hard to accept that we invented a technology that we don't fully comprehend, and that ex

                                                                              • How AI will disrupt BI as we know it | dbt Labs

                                                                                This post first appeared in The Analytics Engineering Roundup. Business intelligence is on a collision course with AI. The collision itself hasn’t happened yet, but it’s clearly coming. The inevitability of this has been clear roughly since the launch of ChatGPT, but no one knew exactly what shape that would take. Today I want to propose how that collision is going to happen and what will happen i

                                                                                  How AI will disrupt BI as we know it | dbt Labs
                                                                                • The path to ubiquitous AI | Taalas

                                                                                  {"v":"5.7.12","fr":30,"ip":0,"op":15,"w":14,"h":14,"nm":"Strelica","ddd":0,"assets":[],"layers":[{"ddd":0,"ind":1,"ty":4,"nm":"Layer 1 Outlines","sr":1,"ks":{"o":{"a":0,"k":100,"ix":11},"r":{"a":0,"k":0,"ix":10},"p":{"a":1,"k":[{"i":{"x":0.384,"y":1},"o":{"x":0.614,"y":0},"t":0,"s":[7,7,0],"to":[3.333,-3.333,0],"ti":[-3.333,3.333,0]},{"t":15,"s":[27,-13,0]}],"ix":2,"l":2},"a":{"a":0,"k":[7,7,0],"i

                                                                                    The path to ubiquitous AI | Taalas