並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 116件

新着順 人気順

SAKANAの検索結果1 - 40 件 / 116件

  • Sakana AI

    更新(2025年1月28日) 論文「Evolutionary Optimization of Model Merging Recipes」が論文誌「Nature Machine Intelligence」に採択され本日掲載されました。最新バージョンでは本アプローチをさらに実証する新たな実験結果を含んでいます。ぜひ以下からご覧ください。 https://www.nature.com/articles/s42256-024-00975-8 Sakana AIは2024年3月に「進化的モデルマージ」を公開し、大きな反響を呼びました。公開時には国内外の多くのメディアに取り上げられニュースになりました。進化的モデルマージはmergekitやOptuna Hubといった著名なOSSフレームワークにも実装され、多様なユーザーがそれを活用し、数々の個性的なモデルが作成・公開されてきました。また、社内外の複

      Sakana AI
    • Sakana AI

      新手法「TAID」によって学習された小規模日本語言語モデル「TinySwallow-1.5B」は、同規模のモデルの中で最高性能を達成しています。さらに、小規模のため、APIなどを介さずお手元のスマートフォンやPCで完結してチャットが可能です。ウェブアプリまたは、GitHubにてお試しいただけます。 本稿は、経済産業省とNEDOが推進するGENIACによって支援されたSakana AIの研究成果を紹介するブログシリーズの第3回目です。 概要 日常的な対話はもとより、数学やコーティングといった複雑なタスクまでも人間と遜色ないレベルでこなせるようになった大規模言語モデル(LLM)は、今後ますます多くの場面での利活用が期待されています。こうした大きな期待の一方で、LLMの開発・活用の現場では、莫大な計算資源の必要性が大きな壁として立ちはだかってます。まずLLMの開発現場では、「大規模データと巨大計

        Sakana AI
      • やはりSakanaは釣りだった!?Sakana.aiが発表した論文が海外のAI研究者コミュニティで炎上

        やはりSakanaは釣りだった!?Sakana.aiが発表した論文が海外のAI研究者コミュニティで炎上 2025.02.21 Updated by Ryo Shimizu on February 21, 2025, 15:59 pm JST ついにやらかしてしまったか。 数多くの日本企業から高い評価を受け、資金調達をしてきたSakana.aiは、登場した当時はヒーローだった。 まるで学術的な意味のない面白論文と面白実装を次々と発表する様は、「ロックだなー」と、ある種、ファンの目線で彼らをみていた。 「面白い論文」と「学術的に価値や評価が高い」論文というのは全く違って、最初、Sakana.aiが進化計算の論文を出した時は、クールなジョーク論文だと思っていた。 論文偏重主義に一石を投じ、中身の読めない人をからかうかのような姿勢はトリックスター的な面白さがあった。 唸るような大金を集めておきなが

          やはりSakanaは釣りだった!?Sakana.aiが発表した論文が海外のAI研究者コミュニティで炎上
        • GoogleのトップAI研究者2人、東京でAI企業Sakana.ai立ち上げ

          米Googleの著名な2人の元研究者、リオン・ジョーンズ氏とデビッド・ハー氏が8月17日、東京に拠点を置く新AI企業を設立したとX(旧Twitter)で発表した。 ジョーンズ氏は、Googleが2017年に発表した生成AI革命のきっかけとなったと評価されている論文「Attention Is All You Need」(PDF)の8人の著者の1人。この論文では、後にChatGPTなどの製品開発の基礎となった深層学習アーキテクチャー、Transformerを紹介している。ジョーンズ氏は8月に10年以上勤めたGoogleを退社した。これで論文を書いた著者全員がGoogleからいなくなった。 ハー氏は2016年にGoogle Brain入りし、機械学習などの研究に取り組んだ後、2017年にGoogle Brainが東京チームを設立した際、そのトップとして来日した。2022年にGoogleを辞め、S

            GoogleのトップAI研究者2人、東京でAI企業Sakana.ai立ち上げ
          • Sakana AI

            We are building a world class AI research lab in Tokyo. We want to develop AI solutions for Japan’s needs, and democratize AI in Japan. For more information, please visit our blog and careers page, or contact info@sakana.ai

              Sakana AI
            • 元Google植山 類の“実装力”の源をSakana AI・秋葉拓哉が探る「集団開発のしがらみに、個人開発で殴りこむ」 - エンジニアtype | 転職type

              moldを作ったのは「大学院の単位を取るため」だった 秋葉:植山さんと最初に接点を持ったのは、僕がマウンテンビューのMicrosoft Researchでインターンをしていた時だったと記憶しています。エンジニアならば誰が見ても驚くような開発を成し遂げ続けているので、ぜひ詳しくお話を聞きたいと思い対談のリクエストをさせていただきました。 植山:ありがとうございます。初めてお会いした当時から、秋葉さんはプログラミングコンテストの上位ランカーで実力があって、おまけに話も上手かった。なかなか直接関わる機会はなかったけど、時流に乗ってディープラーニングに着手して活躍しているという話はよく耳にしていました。 秋葉:確かに、植山さんと知り合った頃はまだディープラーニングには手を出していなかったですね。今ではAIへと専門領域を移して久しいので、振り返ると長い時間が経ちました。 今回は、個人の力で優れたプロ

                元Google植山 類の“実装力”の源をSakana AI・秋葉拓哉が探る「集団開発のしがらみに、個人開発で殴りこむ」 - エンジニアtype | 転職type
              • 生成AI開発に革新か “自律進化”で目的のAIを自動生成 超低コスト&短期間で高性能モデルも開発済 トップ研究者集団「Sakana AI」

                生成AIのトップ研究者らが東京で創業したAIベンチャー「Sakana AI」が、生成AI開発の新たな手法を開発したと3月21日に発表した。従来は人間が手動で設計し、多くの計算資源を使っていたが、同社の手法では設計を機械が自動で行い、“ほぼ無視できるレベル”の計算資源で開発が可能になるという。この手法で開発した日本語基盤モデルをGitHubで公開した。 同社が提案したのは「進化的モデルマージ」という手法。公開されているさまざまな基盤モデル(生成AIを含む、大規模なデータセットによる事前学習で各種タスクに対応できるモデルのこと)を組み合わせて新たなモデルを作る「マージ」に、進化的アルゴリズムを適用したものだ。 マージ自体は現在の基盤モデル開発で使われている手法で、モデルの“神経回路”(アーキテクチャ)の中に別のモデルの神経回路の一部を組み入れたり、入れ替えたり、神経同士のつながりやすさ(重み)

                  生成AI開発に革新か “自律進化”で目的のAIを自動生成 超低コスト&短期間で高性能モデルも開発済 トップ研究者集団「Sakana AI」
                • Sakana AI の間違いを徹底的に査読してみた (Colabコード付き)|しらいはかせ AI/Hacker/作家/編集者/AICU代表

                  なんかみんなSakana AIがやらかした間違いについてワイワイ言っているんで、徹底的に検証してみたら結構面白かったし、勉強にもなったよ!という7万字ぐらいあるブログです。 最後の方にGoogle Colabで動く検証コードを置いておきます。 <お気持ち背景> 昨年の11月に「AIバブル崩壊」の足音と「AI副業」のデメリット、という話を書きました。 いくつかのAIバブルの崩壊シナリオに警鐘を鳴らさせていただいたんだけど、長くてゴメン。 個々にすごいけど、「Kaggler節」であり、その文法で銀行がお金を出ような話になっているんだろうか?どこかの山でチャンピオンになるかもしれないけど、みんなが期待するような課題解決や課題発見、課題設定になっているんだっけ?という感想があります。 例えば画像生成AI「Stable Diffusion」に例えますが、画像生成モデルみたいに無償で公開していくんだけ

                    Sakana AI の間違いを徹底的に査読してみた (Colabコード付き)|しらいはかせ AI/Hacker/作家/編集者/AICU代表
                  • Sakana AI、科学論文の調査から作成、レビューまですべてAIが自動で実行するThe AI Scientistを発表 | gihyo.jp

                    Sakana AI⁠⁠、科学論文の調査から作成⁠⁠、レビューまですべてAIが自動で実行するThe AI Scientistを発表 Sakana AIは2024年8月13日、大規模言語モデル (LLM) を複数組み合わせてアイデアの生成、必要なコードの記述、実験の実行/結果の要約、視覚化、レビューまで、論文作成のライフサイクル全体を自動化するAI駆動型の論文作成システム「The AI Scientist」を発表した。 The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery 「AIサイエンティスト⁠」⁠: AIが自ら研究する時代へ(上記ブログの日本語訳) Introducing The AI Scientist: The world’s first AI system for automating sc

                      Sakana AI、科学論文の調査から作成、レビューまですべてAIが自動で実行するThe AI Scientistを発表 | gihyo.jp
                    • 日本の技術者はSakana AIのことを、よく見たほうがいい。【生成AIストリーム】

                        日本の技術者はSakana AIのことを、よく見たほうがいい。【生成AIストリーム】
                      • 有価証券報告書を用いた日本語金融LLMベンチマーク「EDINET-Bench」、Sakana AIが公開/高度な金融タスクにてAIがどの程度対応できるかを評価

                          有価証券報告書を用いた日本語金融LLMベンチマーク「EDINET-Bench」、Sakana AIが公開/高度な金融タスクにてAIがどの程度対応できるかを評価
                        • iPhone 14で高速動作する軽量AIモデル、Sakana AIが開発 知識蒸留の新手法「TAID」採用

                          iPhone 14で高速動作する軽量AIモデル、Sakana AIが開発 知識蒸留の新手法「TAID」採用 AIベンチャーのSakana AI(東京都港区)は1月30日、小規模言語モデル(SLM)「TinySwallow-1.5B」を開発したと発表した。大規模言語モデル(LLM)の知識を効率的にSLMに転移できる新技術「TAID」(Temporally Adaptive Interpolated Distillation)を利用し作成したSLMで、デモ動画ではiPhone 14上で高速動作する様子を確認できる。 SLMとは「Small Language Model」の略称で、小さいパラメータ数を持つAIモデルを指す。消費する計算リソースが少ないため、スマートフォンなどの端末上でも動かせる他、特定のタスクに特化したファインチューニングを施しやすいのも特徴だ。 TinySwallow-1.5B

                            iPhone 14で高速動作する軽量AIモデル、Sakana AIが開発 知識蒸留の新手法「TAID」採用
                          • AIを“AIで”改善 Sakana AIが新技術「AI CUDA Engineer」発表 目指すは100万倍の効率化

                            AIモデルの開発や利用を“AIによって”効率化する──Sakana AIは2月20日、新たな技術「AI CUDA Engineer」を発表した。AIモデルの開発や利用時にかかる計算処理を10~100倍高速化できるエージェントシステム。同社は「AI技術は必ず100万倍は効率化される」と展望を示しており、この技術はそのための重要なステップだという。 米NVIDIA製のGPUハードウェアには、その並立計算を制御するためのプラットフォーム「CUDA」が用意されている。そこで肝となっているのは、ハードウェアに直接指示を行う「CUDAカーネル」という関数だ。この関数のレベルで、直接命令を記述できれば、AIアルゴリズムのパフォーマンスを向上させることが可能という。 そこで同社は、CUDAカーネルの生成を自動化する技術として、AI CUDA Engineerを開発。最新の大規模言語モデル(LLM)を活用し

                              AIを“AIで”改善 Sakana AIが新技術「AI CUDA Engineer」発表 目指すは100万倍の効率化
                            • 東京発・AIドリームチーム「Sakana.ai」が45億円調達 元Googleトップ研究者らが設立 AI業界の著名人や日本の大手IT企業も出資

                              元米Googleの著名な研究者、リオン・ジョーンズ氏とデビッド・ハー氏が東京で立ち上げたAI企業Sakana.ai(東京都港区)は1月16日、シリコンバレーのベンチャーキャピタルやNTTグループ、KDDI、ソニーグループなどから45億円の資金を調達したと発表した。 調達元はシリコンバレーのベンチャーキャピタル米Lux Capitalや米Khosla Venturesに加え、日本ではNTTグループ、KDDI、ソニーグループ、ベンチャーキャピタルのみやこキャピタルやジャフコグループなども出資した。Googleで最高AI責任者を務めるジェフ・ディーン氏や、米Hugging Face創業者CEOのクレム・デラング氏、米Scale AI創業者CEOのアレックス・ワン氏といった個人からも出資を受けた。 調達した資金は人材採用に充てる。国内外から優秀なITエンジニア人材を集め、日本に招致するという。さら

                                東京発・AIドリームチーム「Sakana.ai」が45億円調達 元Googleトップ研究者らが設立 AI業界の著名人や日本の大手IT企業も出資
                              • Sakana.ai、浮世絵風イラスト生成AIを公開 浮世絵をカラー化するAIも

                                元米Googleの著名な研究者、リオン・ジョーンズ氏とデビッド・ハー氏らが東京で立ち上げたAIスタートアップSakana.ai(東京都港区)は7月21日、浮世絵風イラストを生成できるAIモデル「Evo-Ukiyoe」と、浮世絵をカラー化できるモデル「Evo-Nishikie」(錦絵)を発表した。各モデルとそのデモをHugging Faceで公開している。 各モデルは、同社が4月に公開した画像生成AI「EvoSDXL-JP」をベースに開発。いずれも、芸術品を研究・保管する立命館大学アート・リサーチセンターから提供を受けた浮世絵の画像2万4038点を活用したという。どちらも日本語の入力に対応する。

                                  Sakana.ai、浮世絵風イラスト生成AIを公開 浮世絵をカラー化するAIも
                                • 世界初、“100%”AI生成の論文が査読通過 Sakana AIの「The AI Scientist」が達成

                                  Sakana AIは3月12日、AIシステム「The AI Scientist」の改良版「v2」が書いた論文が、AIに関する国際カンファレンス「ICLR 2025」(International Conference on Learning Representations)のワークショップで査読を通過したと発表した。AI生成の論文が査読をクリアするのは世界初という。 The AI Scientistでは、人間が介入することなく、研究アイデアの立案から実験、論文執筆などを全自動で行う。今回の論文は、The AI Scientistの改良版である「The AI Scientist-v2」(v2)が生成した。なおv2の詳細は今後リリース予定。 検証はICLRの主催者と協力して行った。v2が一貫して生成した論文を3本用意。査読者にAIが生成したものと伝えず、査読を実施したところ、3本のうち1本の論文

                                    世界初、“100%”AI生成の論文が査読通過 Sakana AIの「The AI Scientist」が達成
                                  • Sakana AI

                                    今回公開するモデルは、プロンプトから画像を生成するEvo-Ukiyoeと、古典籍の挿絵をカラー化するEvo-Nishikieモデルです。これらのモデルが、歴史や文化を学ぶための新たなコンテンツ作成に利用され、浮世絵に関する興味を増すことにつながり、日本や世界の人々が浮世絵や日本文化に興味を持つきっかけを生み出すことを期待しています。 概要 Sakana AIは、日本の美を学んだAIとして、浮世絵風画像生成モデルEvo-Ukiyoeと、浮世絵カラー化モデルEvo-Nishikieを公開します。Sakana AIが進化的モデルマージによって構築した日本語対応画像生成モデルEvo-SDXL-JPを基盤とし、浮世絵画像を大規模に学習することで、日本語に対応し、かつ浮世絵の特徴を学んだ画像生成モデルができました。 このリリースの要点は以下の通りです。 Evo-Ukiyoeは、日本語のプロンプトを入力

                                      Sakana AI
                                    • 江戸時代の言葉を話すAIチャット「からまる」 Sakana AIが公開 古文書の2500万文字を学習

                                      AIベンチャーのSakana AI(東京都港区)は4月1日、江戸時代の古文風テキストで会話できるAIチャットbot「からまる」を公開した。約2500万文字に及ぶ、江戸時代の文章で構成したデータセットを学習している。研究と教育を目的に、HuggingFaceで公開している。 例えば、からまるに「あなたの名前はなんですか」と聞くと「某が名はからまるにて候」と返答。「AIにとって大事なものはなんですか」と尋ねると「AIにとりて大切なるものはデータなりこれによりて己か身を成長せしむる所以也」と返し、「スマホはなんですか」という問いには「携帯する小箱にて候則ち其中に文字や画図をもつて遠所に在る人々へ伝達する道具也」と回答する。 からまるのベースモデルには、AIベンチャー・ELYZAのオープンモデル「Llama-3-ELYZA-JP-8B」を利用。江戸時代の書物などをAIくずし字OCRで楷書体に直した

                                        江戸時代の言葉を話すAIチャット「からまる」 Sakana AIが公開 古文書の2500万文字を学習
                                      • LLMが別のLLMを何度も改善 より良い回答を出す最適化手法をAIが発見する技術 Sakana AIなどが開発

                                        このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 AIベンチャーのSakana AI(東京都港区)やFLAIR、英ケンブリッジ大学、オックスフォード大学に所属する研究者らが発表した論文「Discovering Preference Optimization Algorithms with and for Large Language Models」は、人間の介入を最小限に抑えて新しい最適化アルゴリズムをAIによって発見する手法を提案した研究報告である。 この手法では大規模言語モデル(LLM)がLLMを利用して自己改善し進化していくことを提案しており、研究者らは「LLM^2」(「LLMの2乗」

                                          LLMが別のLLMを何度も改善 より良い回答を出す最適化手法をAIが発見する技術 Sakana AIなどが開発
                                        • iPhoneでも動作する日本語AIモデル「TinySwallow-1.5B」を日本に拠点を置くSakana AIがリリース、大規模言語モデルから知識蒸留して小規模かつ高性能なAIモデルを実現

                                          日本に拠点を置くAI企業の「Sakana AI」が小規模日本語言語モデル「TinySwallow-1.5B」を2025年1月30日(木)に発表しました。TinySwallow-1.5Bは小規模かつ高性能なAIモデルを実現する知識蒸留手法「Temporally Adaptive Interpolated Distillation(TAID)」を用いて開発されており、iPhone 14でのローカル実行も可能です。 新手法「TAID」を用いた小規模日本語言語モデル「TinySwallow-1.5B」の公開 https://sakana.ai/taid-jp/ TinySwallow-1.5Bはパラメーター数320億の大規模言語モデルから知識蒸留することで開発されたパラメーター数15億の小規模言語モデルです。知識蒸留には新たに開発されたTAIDと呼ばれる手法を用いており、日本語性能を評価するベンチ

                                            iPhoneでも動作する日本語AIモデル「TinySwallow-1.5B」を日本に拠点を置くSakana AIがリリース、大規模言語モデルから知識蒸留して小規模かつ高性能なAIモデルを実現
                                          • 東京発のSakana AI、45億円資金調達 NTTが日本での筆頭株主に

                                              東京発のSakana AI、45億円資金調達 NTTが日本での筆頭株主に
                                            • Sakana AI

                                              日本語プロンプト対応の高速画像生成モデルEvoSDXL-JPで生成した画像の例。プロンプトは「可愛いゾウの編みぐるみ」、「ラーメン、浮世絵、葛飾北斎」、「折り紙弁当」、「(下町ロケット、東京サラリーマン)、浮世絵」など 概要 Sakana AIは先日、進化的アルゴリズムを用いた基盤モデル構築の手法「進化的モデルマージ」を提案しました。また、進化的モデルマージにより構築された日本語の大規模言語モデルEvoLLM-JPと画像言語モデルEvoVLM-JPを公開しました。これらのモデルは、言語生成を目的とした自己回帰型Transformerモデルでした。今回私たちは、進化的モデルマージの可能性をさらに示すために、画像生成タスクで広く用いられる拡散モデルへの適用を行いました。 このリリースの要点は以下の通りです。 画像生成で昨今用いられている拡散モデルに進化的モデルマージを適用しました。言語生成モデ

                                                Sakana AI
                                              • 科学研究をAIで全自動化──論文執筆や査読ができる「The AI Scientist」 Sakana AIが発表

                                                The AI Scientistの概念図 まず一連のアイデアをブレインストーミングし、その新規性を評価 次に自動コード生成の最新の進歩を活用したコードベースを編集し、新規アルゴリズムを実装する その後実験を行い、数値データと視覚的な要約などを収集する その結果を説明し、文脈化する科学論文を作成 最後に査読を行う 一方で同社は、The AI Scientistが悪用される可能性についても言及。論文作成が自動化が進むと、査読する人の作業量が増え、科学論文の品質管理を妨害する可能性があるとしている。このため「AIが作成した論文などにはその旨を表示し、透明性を確保する必要がある」と考えを述べている。 ただし、The AI Scientistによって人間の科学者の役割が減少するとは考えていないと同社。「むしろ、科学者の役割は変化し、新しいテクノロジーに適応し、より上位の階層に立つことになるだろう」と

                                                  科学研究をAIで全自動化──論文執筆や査読ができる「The AI Scientist」 Sakana AIが発表
                                                • Sakana.aiが公開した「Evolutionary Model Merge」手法を「mergekit」で実施してみる - Taste of Tech Topics

                                                  皆さんこんにちは 機械学習チームYAMALEXの@tereka114です。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) 日々、LLMが進化していて、画像が本職(のはず)の私ですら、ここ数年LLMの勉強をはじめています。 学習してモデル公開しましたといった記事はよく見ますが、今回は今、非常に注目されている日本に拠点があるAIスタートアップである「Sakana.ai」が公開した「Evolutionary Model Merge」を使う話をします。 Evolutionary Model Merge 「Evolutionary Model Merge」は「Sakana.ai」から発表された進化的モデルマージと呼ばれる技術です。 端的に言ってしまえば、複数のモデルを利用して新し

                                                    Sakana.aiが公開した「Evolutionary Model Merge」手法を「mergekit」で実施してみる - Taste of Tech Topics
                                                  • Sakana AI、“査読通過”した論文執筆AIシステムをオープンソース化 機能を解説する資料も公開

                                                    Sakana AIは4月7日、論文執筆AIシステム「The AI Scientist-v2」(v2)をオープンソース化し、その機能を解説した資料を公開した。同社は3月、v2が書いた論文が、AI研究の国際カンファレンス「ICLR 2025」(International Conference on Learning Representations)のワークショップで、査読を通過したと報告していた。 v2は、同社が2024年8月に発表したAIシステム「The AI Scientist」の改良版。研究アイデアの立案や、実験、執筆などを自動で行う基本の機能はそのまま、ある要素を特定するため、木の形で示した場合分けを用いる「ツリー探索」と、LLMを活用したワークフローを組み合わせた探索システム「エージェンティック・ツリーサーチ」を新しく搭載。これにより、複雑な科学的仮説をより深く体系的に調べられるよう

                                                      Sakana AI、“査読通過”した論文執筆AIシステムをオープンソース化 機能を解説する資料も公開
                                                    • WSL2でSakana AIを試してみる|noguchi-shoji

                                                      「進化的モデルマージにより日本語数学LLMとして構築したEvoLLM-JPは、数学のみならず、日本語の全般的な能力に長けている」らしいEvoLLM-JPを試してみます。 追記(2024/3/22) 10Bのモデルですが、torch_dtypeを"auto"からtorch.bfloat16に変更すると、推論のスピードが改善しました。 モデルEvoLLM-JPは、3種提供されています。今回は3つとも試します。 - 大規模言語モデル SakanaAI/EvoLLM-JP-v1-10B : MICROSOFT RESEARCH LICENSE TERMS SakanaAI/EvoLLM-JP-v1-7B :  MICROSOFT RESEARCH LICENSE TERMS SakanaAI/EvoLLM-JP-A-v1-7B : Apache License, Version 2.0 ※画像言語

                                                        WSL2でSakana AIを試してみる|noguchi-shoji
                                                      • あの有名エンジニアが思う「もっと早く出会いたかった」技術書って? 【Sakana AI・秋葉拓哉、青木俊介、牛久祥孝、尾藤正人】 - エンジニアtype | 転職type

                                                        転職・求人情報サイトのtype エンジニアtype ITニュース あの有名エンジニアが思う「もっと早く出会いたかった」技術書って? 【Sakana AI・秋葉拓哉、青木俊介、牛久祥孝、尾藤正人】 2024.06.25 ITニュース 秋葉拓哉青木俊介本 エンジニアとしてのキャリアを加速させる20代のうちに、どんな技術書を読むかはその後の成長に大きな影響を与えます。しかし、多くの選択肢がある中で、本当に価値のある本を見つけるのは難しいものです。 業界で活躍するあの有名エンジニアたちが「もっと早く出会いたかった」と思うような技術書であれば、きっとあなたのキャリアに役立つ知識や新しい視点を与えてくれるはず。 そこで、Sakana AIの秋葉拓哉さん、Turing・CTOの青木俊介さん、オムロン サイニックエックスの牛久祥孝さん、そしてオープンロジ・CTOの尾藤正人さんの計4名に、「珠玉の一冊」を聞

                                                          あの有名エンジニアが思う「もっと早く出会いたかった」技術書って? 【Sakana AI・秋葉拓哉、青木俊介、牛久祥孝、尾藤正人】 - エンジニアtype | 転職type
                                                        • オードリー・タン×Sakana AIデビッド・ハーCEO対談 シンギュラリティに立ち向かう 「プルラリティ」がもたらすものは

                                                          オードリー・タン×Sakana AIデビッド・ハーCEO対談 シンギュラリティに立ち向かう 「プルラリティ」がもたらすものは:SusHi Tech Tokyo 2025 東京都や経団連からなる実行委員会が5月8~10日に東京ビッグサイトで開催したスタートアップイベント「SusHi Tech Tokyo 2025」で、台湾の前デジタル担当大臣オードリー・タン氏と、AIスタートアップ・Sakana AIのデビッド・ハーCEOが対談した。 「デジタル公共財とAI」とテーマの基、AIの発展について議論が交わされたが、中でも重点的に触れられたのがシンギュラリティに対する「プルラリティ」(plurality:多元性)という概念だ。 どう違う、プルラリティとシンギュラリティ シンギュラリティとは、人工知能が人間の知能を超え、自己改良を繰り返して急速に進化し、最終的に人間の理解や制御を超えた「超知能」が生

                                                            オードリー・タン×Sakana AIデビッド・ハーCEO対談 シンギュラリティに立ち向かう 「プルラリティ」がもたらすものは
                                                          • Sakana AI

                                                            July 01, 2025 概要 Sakana AIは進化や集合知などの自然界の原理を応用してAIシステムを開発しています。2024年に発表した進化的モデルマージの研究では既存のオープンモデルの膨大な集合知を進化計算とモデルマージを通じて活用することに挑戦しました。一方、モデルを「混ぜてつくる」だけでなく、ChatGPTやGemini、DeepSeekのような日進月歩するフロンティアモデルを「混ぜて使う」、つまり「集合知」として活用することは考えられないでしょうか。Sakana AIはこの度、AIが効果的に「試行錯誤」し、かつ複数のフロンティアAIモデルが「互いに協力」する推論時スケーリングの新アルゴリズム「AB-MCTS(Adaptive Branching Monte Carlo Tree Search)」を開発しました。ARC-AGI-2ベンチマークを用いて評価を行ったところ、本稿執

                                                              Sakana AI
                                                            • 日本に拠点を置くAI企業「Sakana AI」がキャッシュメモリの使用量を最大75%削減する技術「NAMM」を開発

                                                              Sakana AIが「進化したユニバーサルトランスフォーマーメモリ」という論文を発表しました。論文によると、ニューラルアテンションメモリーモデル(NAMM)という新たな仕組みを導入することでコンテキストにおいて冗長な情報を削減でき、推論時のメモリ効率を高めることができたとのことです。 An Evolved Universal Transformer Memory https://sakana.ai/namm/ [2410.13166] An Evolved Universal Transformer Memory https://arxiv.org/abs/2410.13166 AIの本体である大規模言語モデル(LLM)では、ユーザーからの入力であるプロンプトをコンテキストとして受け取り、新たな返答を生成しています。現在主流のモデルは数十万から数百万トークンという非常に長いコンテキストを受

                                                                日本に拠点を置くAI企業「Sakana AI」がキャッシュメモリの使用量を最大75%削減する技術「NAMM」を開発
                                                              • 自身のコードを書き換え“成長するAI”――Sakana AI、新たなAIエージェント「DGM」発表

                                                                Sakana AIは5月30日、自身のコードを書き換えて性能を高めるコーディング向けAIエージェント「ダーウィン・ゲーデル・マシン」(DGM)を発表した。ダーウィンの進化論に着想を得たアルゴリズムを活用。自身のコードを読み取り、修正することで、コーディング性能を高められるという。 一般的なAIモデルは、事前学習などによって性能を高めるが、学習の完了後に自動的に性能が向上することはない。一方DGMでは、自身のPythonコードを読み取り、AIエージェント機能を構成するWeb検索ツールやワークフローなどを、自ら修正できる仕組みを採用。修正後のコーディング性能を自ら評価する機能も備え、継続的に自身の性能を改善できるようにした。

                                                                  自身のコードを書き換え“成長するAI”――Sakana AI、新たなAIエージェント「DGM」発表
                                                                • Sakana AI

                                                                  Summary Adaptation is one of the most remarkable phenomena in nature. From the way an octopus can change their skin color to blend into its surroundings, to how the human brain rewires itself after an injury, allowing individuals to recover lost functions and adapt to new ways of thinking or moving. Living organisms exhibit adaptability that allows life to flourish in diverse and ever-changing env

                                                                    Sakana AI
                                                                  • Sakana AI、複数の画像を扱える“日本語視覚言語モデル”公開 非英語圏での先駆けに

                                                                    AIスタートアップのSakana AI(東京都港区)は8月2日、複数の画像について日本語で質疑応答できるAIモデル「Llama-3-EvoVLM-JP-v2」を発表した。このモデルは、同社が提案する生成AIの開発手法「進化的モデルマージ」で開発した視覚言語モデル(VLM)。作成したAIモデルなどはHugging Faceで公開中。 「Llama-3-EvoVLM-JP-v2」の特徴は、複数の画像を扱えること、日本語で応答できることだ。例えばこのAIモデルに、2枚の犬の画像を見せて「それぞれを簡単に説明してください」と質問すると、犬種や身に着けている装飾品など、質問に対する回答を日本語で返してくれる。米Metaが公開しているAIモデル「Llama-3」をベースにしており、同社が過去に公開したAIモデルよりも性能が向上しているという。 これまでも、画像に対する説明や質疑応答のできるVLMが多く

                                                                      Sakana AI、複数の画像を扱える“日本語視覚言語モデル”公開 非英語圏での先駆けに
                                                                    • sakana biography 番外編 1997~2009

                                                                      1997年のある日、エマーソン北村さんから連絡があり「音楽評論家の高橋健太郎さんって知ってるすか?最近グリーディグリーンってバンドとか朝日美穂さんのプロデュースもやってる人ですが、その高橋氏が先日リリースされたsakanaの「My Dear」を聴いて興味を持ったらしくて、会いたいと云ってるんすけど、近々下北辺りで会えねぇっすかね?」と云われる。高橋健太郎氏の事は知らなかったけど、ポコペンさんと話し合い、北村さんが云うならって事で会ってみる事にした。日にちは覚えてないけど秋頃だったかな、ある日の夕方、下北沢のイタリアントマトで高橋氏と北村さんと僕ら二人で話をした。「こちらが音楽評論家で知られる健太郎さんです」と紹介されて開口一番「君たちの作品聴かせてもらいました。ボーカルは素晴らしいですね。歌詞も面白いし。歌詞はポコペンさんが書いているの?」「はい」「曲やアレンジは僕にはあまりピンと来なかっ

                                                                        sakana biography 番外編 1997~2009
                                                                      • 東京発Sakana AIが新たな「Transformer」を提案、12月から1月のAI最新論文

                                                                        生成AI(人工知能)を含む最新のAI研究動向を知るため、世界中の研究者やエンジニアが参照しているのが、論文速報サイト「arXiv(アーカイブ)」である。そんなarXivの投稿論文から、2024年12月15日から2025年1月19日にSNSのX(旧Twitter)で多く言及されたAI分野の注目論文を紹介する。調査には米Meltwater(メルトウォーター)のSNS分析ツールを利用した。対象はXの全世界のオリジナル投稿、コメント、再投稿、引用投稿である。 東京を拠点とするSakana AIと東京科学大学の研究チームは2025年1月9日、大規模言語モデル(LLM)が自律的にタスクを理解し、リアルタイムに適応する新しいフレームワーク「Transformer2」を発表した。このフレームワークを解説した論文「Transformer2: Self-adaptive LLMs」は、世界のSNS言及数ランキ

                                                                          東京発Sakana AIが新たな「Transformer」を提案、12月から1月のAI最新論文
                                                                        • Sakana AI、お題を与えるだけで学術論文を書いて査読までしちゃうAIを発表!!(アスキー) - Yahoo!ニュース

                                                                          Sakana AIは8月13日、LLMを組み合わせ、アイディア出しから実験の実施、論文執筆、査読までをAIが自動化する世界初のシステム「The AI Scientist」を発表。 【もっと写真を見る】 Sakana AIは8月13日、LLMを組み合わせ、アイディア出しから実験の実施、論文執筆、査読までをAIが自動化する世界初のシステム「The AI Scientist」を発表した。 テーマを与えるだけで実験・論文執筆・査読まで自動化 「The AI Scientist」は、大規模言語モデル(LLM)を活用し、アイデアの創出からプログラミング、実験、統計処理、論文執筆、さらには査読までを一貫して行う科学研究のプロセス全体を自動化するシステムだ。 まず、与えられた研究テーマに基づいて新しいアイデアを生成する。このアイデアの新規性は、自動的な文献検索によって確認される。 次に、提案されたアイデア

                                                                            Sakana AI、お題を与えるだけで学術論文を書いて査読までしちゃうAIを発表!!(アスキー) - Yahoo!ニュース
                                                                          • 既存のAIモデルを組み合わせて超高性能モデルを作る手法を日本のAI企業「Sakana AI」が開発、進化的アルゴリズムで膨大な組み合わせを試行し人間には発想困難な高性能LLMや画像生成モデルを作成可能

                                                                            東京に拠点を置くAI企業「Sakana AI」が、複数の生成AIモデルを進化的アルゴリズムを用いて組み合わせて新たなモデルを作り出す手法を開発しました。Sakana AIはすでに大規模言語モデルや画像生成モデルの作成に成功しており、各モデルは既存のモデルよりも高い性能を備えていることが確かめられています。 進化的アルゴリズムによる基盤モデルの構築 https://sakana.ai/evolutionary-model-merge-jp/ [2403.13187] Evolutionary Optimization of Model Merging Recipes https://arxiv.org/abs/2403.13187 ◆技術の概要 生成AIモデルをゼロから作成するには、高性能なGPUを大量に用意して膨大な計算処理を実行する必要があります。一方で、既存のモデル同士を組み合わせて新

                                                                              既存のAIモデルを組み合わせて超高性能モデルを作る手法を日本のAI企業「Sakana AI」が開発、進化的アルゴリズムで膨大な組み合わせを試行し人間には発想困難な高性能LLMや画像生成モデルを作成可能
                                                                            • Sakana AI「AI CUDA Engineer」炎上??|ハヤシ シュンスケ

                                                                              東京を拠点とするAIスタートアップSakana AIが発表した「AI CUDA Engineer」。GPUコードの自動最適化を謳うこの技術は、当初大きな期待を集めたが、その性能主張を巡り、研究者コミュニティから厳しい批判が相次いだ。誇張されたデータ、不正確な計算結果…何が問題だったのか。事実と反響を詳細にレポートする。 Introducing The AI CUDA Engineer: An agentic AI system that automates the production of highly optimized CUDA kernels.https://t.co/28vPHBOAX6 The AI CUDA Engineer can produce highly optimized CUDA kernels, reaching 10-100x speedup over com

                                                                                Sakana AI「AI CUDA Engineer」炎上??|ハヤシ シュンスケ
                                                                              • Sakana AIの「100倍高速化できる」という発表がネット上で検証され逆に「3倍遅くなる」と指摘される

                                                                                日本のAI企業・Sakana AIは、PyTorchで記述された処理をより高速に実行するためのCUDAカーネルに自動最適化する「AI CUDA Engineer」を2025年2月20日に発表しました。しかし、実際にAI CUDA Engineerを検証したところ、高速化どころか速度が3分の1に低下したという報告がX(旧Twitter)に挙がっています。 Sakana walks back claims that its AI can dramatically speed up model training | TechCrunch https://techcrunch.com/2025/02/21/sakana-walks-back-claims-that-its-ai-can-dramatically-speed-up-model-training/ 検証したユーザーは「Sakana A

                                                                                  Sakana AIの「100倍高速化できる」という発表がネット上で検証され逆に「3倍遅くなる」と指摘される
                                                                                • 「だし廊-SaKaNa-」塩釜水産物仲卸市場!人気ラーメン店が新規出店! #食活 #旅活! - #楽活!収入増やして人生を楽しく!

                                                                                  【新店舗のお知らせ】 今回、塩竈に「だし廊」の7号店を出店させていただきます。 場所は「塩釜水産物仲卸市場」の場内7号売り場(セブンストリート)です。 https://nakaoroshi.or.jp/archives/4086 「海の幸」の【だし】で美味しいラーメンを -公式Twitterより- 塩釜水産物仲卸市場(しおがますいさんぶつなかおろしいちば)は、塩釜港の塩釜魚市場の近くにある市場のこと。東北一の規模を誇る。一般の買い物客にも、漁獲高日本有数のマグロをはじめとする海産物を販売している。 -Wikipediaより- にほんブログ村 アドセンス広告 写真 一言 予告人「シンガク」からの挑戦状~ヒントクイズ~ 写真 一言 ・宮城県で有名な「だし廊」塩釜市場に出店しました! ・醤油と塩をいただきました。醤油はだしが食べた瞬間からガツンとくる系、塩は深いだしが後からじわじわとくる系で、ど

                                                                                    「だし廊-SaKaNa-」塩釜水産物仲卸市場!人気ラーメン店が新規出店! #食活 #旅活! - #楽活!収入増やして人生を楽しく!