タグ

2025年1月31日のブックマーク (11件)

  • RAGで「AIエージェント」を使う手法まとめ

    記事では、RAGの性能を高めるための「Agentic RAG」という手法について、ざっくり理解します。株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。 この記事は何 この記事は、「AIエージェント」をRAGに取り入れた手法である「Agentic RAG」のサーベイ論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合はこちらの記事もご参考下さい。 題 ざっくりサマリー Agentic RAG は、RAGの新しい手法です。この論文では、「RAGにAIエージェントを使っている」とはどういう状態なのか、どんなパターンがあるのかまとめられています。クリーブランド・ステート大学の研究者らによって、2025年1月に発表された論文です。 最近、「AIエージェント」が注目されてい

    RAGで「AIエージェント」を使う手法まとめ
    naggg
    naggg 2025/01/31
    たしかに2023年頃からある手法っちゃ手法
  • Google、Geminiアプリで推論AI「Gemini 2.0 Flash」の提供開始

    Googleは1月30日(現地時間)、Gemini(Webおよびモバイルアプリ)で「Gemini 2.0 Flash」の提供を開始したと発表した。これまで有料版の「Gemini Advanced」でのみ利用可能だったプレビュー版が、無料版を含むすべてのGeminiアプリで正式版として選択できるようになった。 Gemini 2.0 Flashは、「いくつかの主要なベンチマークで高速な応答と強力なパフォーマンスを示し、ブレインストーミング、学習、執筆などのタスクを日常的にサポートする」。

    Google、Geminiアプリで推論AI「Gemini 2.0 Flash」の提供開始
  • iPhoneでも動作する日本語AIモデル「TinySwallow-1.5B」を日本に拠点を置くSakana AIがリリース、大規模言語モデルから知識蒸留して小規模かつ高性能なAIモデルを実現

    に拠点を置くAI企業の「Sakana AI」が小規模日語言語モデル「TinySwallow-1.5B」を2025年1月30日(木)に発表しました。TinySwallow-1.5Bは小規模かつ高性能なAIモデルを実現する知識蒸留手法「Temporally Adaptive Interpolated Distillation(TAID)」を用いて開発されており、iPhone 14でのローカル実行も可能です。 新手法「TAID」を用いた小規模日語言語モデル「TinySwallow-1.5B」の公開 https://sakana.ai/taid-jp/ TinySwallow-1.5Bはパラメーター数320億の大規模言語モデルから知識蒸留することで開発されたパラメーター数15億の小規模言語モデルです。知識蒸留には新たに開発されたTAIDと呼ばれる手法を用いており、日語性能を評価するベンチ

    iPhoneでも動作する日本語AIモデル「TinySwallow-1.5B」を日本に拠点を置くSakana AIがリリース、大規模言語モデルから知識蒸留して小規模かつ高性能なAIモデルを実現
    naggg
    naggg 2025/01/31
    "TinySwallow-1.5Bの開発に使われた蒸留手法のTAIDは、「生徒モデルの学習進度に合わせて、教師モデルを段階的に変える」というアプローチを採用しているとのこと"
  • iPhone SE第4世代、予想される発売日・仕様・価格を確認 - こぼねみ

    AppleのフラッグシップiPhone 16シリーズは、Apple Intelligenceにフォーカスして昨年秋に発売されました。 一方、それとは別の新しいモデルとしてiPhone SE第4世代(iPhone SE 4)の登場が間近に迫っています。フラッグシップモデルに引けを取らない性能と、遥かに安い価格での発売が期待されていますが、予想される発売日やスペック、価格について9to5Macが伝えています。 発売は3月の見込み 新モデルのスペックと価格 新しいiPhoneのイメージ:9to5Mac 発売は3月の見込み 多くの報道によると、AppleiPhone SE 4の発売日を今年の早い時期に設定しています。具体的には、2025年3月が発売月として確実視されています。 Appleが1月や2月に主要な新製品を発売するのは稀です(昨年Vision Proがそのパターンを破っていましたが)。A

    iPhone SE第4世代、予想される発売日・仕様・価格を確認 - こぼねみ
  • Apple、期待の「AI iPhone」不発 中国でも販売低迷 - 日本経済新聞

    【シリコンバレー=中藤玲】米アップルが、人工知能AI)を搭載した新型iPhoneの不振に直面している。世界最大のスマートフォン市場である中国では、自社AIを提供できないこともあって販売が低迷。かつて業績をけん引したiPhone中国事業が、いずれも停滞している。アップルが30日発表した2024年10〜12月期決算は、売上高が四半期ベースで過去最高となり、2四半期ぶりに増収増益だった。ただ主力

    Apple、期待の「AI iPhone」不発 中国でも販売低迷 - 日本経済新聞
  • iPhone 14で高速動作する軽量AIモデル、Sakana AIが開発 知識蒸留の新手法「TAID」採用

    iPhone 14で高速動作する軽量AIモデル、Sakana AIが開発 知識蒸留の新手法「TAID」採用 AIベンチャーのSakana AI(東京都港区)は1月30日、小規模言語モデル(SLM)「TinySwallow-1.5B」を開発したと発表した。大規模言語モデル(LLM)の知識を効率的にSLMに転移できる新技術「TAID」(Temporally Adaptive Interpolated Distillation)を利用し作成したSLMで、デモ動画ではiPhone 14上で高速動作する様子を確認できる。 SLMとは「Small Language Model」の略称で、小さいパラメータ数を持つAIモデルを指す。消費する計算リソースが少ないため、スマートフォンなどの端末上でも動かせる他、特定のタスクに特化したファインチューニングを施しやすいのも特徴だ。 TinySwallow-1.5B

    iPhone 14で高速動作する軽量AIモデル、Sakana AIが開発 知識蒸留の新手法「TAID」採用
  • 日本からAIで挑むスタートアップ50選、その勝算 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

    2025年1月24日発売の「Forbes JAPAN3月号」は、「インパクト100」「AI50」「CIOアワード」「SVJP」の4大特集号だ。表紙は、日最速でユニコーン企業になったSakana AIの3人。そして第1特集では、日経済を進展させる「新しい主役」になるであろう「インパクト・エコノミー」にフォーカス。「『日のインパクト・エコノミーの未来』を創る100人」や元ユニリーバCEOのポール・ポルマンの独占インタビューなどを掲載している。第2特集では「JAPAN’S AI 50」と称して、日AIスタートアップ50選を公開。第3特集では、「CIO AWARD 2024-25」を発表!。第4特集では日とシリコンバレーのトップが集う会員制プラットフォーム「SVJP」を紹介している。 第2特集では「日AIスタートアップ50選」を初公開!AI分野へ投資しているベンチャーキャピタルから

    日本からAIで挑むスタートアップ50選、その勝算 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
  • DeepSeekの低コスト化手法を徹底解説、MoE・H800活用・GRPOの効果

    米NVIDIA(エヌビディア)の株価の暴落させた中国DeepSeek(深度求索)の新AI人工知能)モデル「DeepSeek-R1」と「DeepSeek-V3」。中国から突然現れたかのようにみえるこれらのAIモデルは、AIモデルのアーキテクチャーという観点からみれば、これまで世界中で連綿と続いてきたAI研究の延長線上にある。 DeepSeekがAIモデルの計算コストを削減するために採用した最新の手法も、既存のAI研究に同社ならではの工夫を加えたものだ。 今回は同社が発表した論文・ホワイトペーパーの内容に基づき、DeepSeekの低コスト化手法を3つ解説しよう。(1)同社が「究極の専門家の専門化(Ultimate Expert Specialization)」と呼ぶ「MoE(Mixture of Expert、混合ネットワーク)」の改良、(2)中国向けモデルであり性能に制約がある「NVIDI

    DeepSeekの低コスト化手法を徹底解説、MoE・H800活用・GRPOの効果
  • Sakana AI

    新手法「TAID」によって学習された小規模日語言語モデル「TinySwallow-1.5B」は、同規模のモデルの中で最高性能を達成しています。さらに、小規模のため、APIなどを介さずお手元のスマートフォンやPCで完結してチャットが可能です。ウェブアプリまたは、GitHubにてお試しいただけます。 稿は、経済産業省とNEDOが推進するGENIACによって支援されたSakana AIの研究成果を紹介するブログシリーズの第3回目です。 概要 日常的な対話はもとより、数学やコーティングといった複雑なタスクまでも人間と遜色ないレベルでこなせるようになった大規模言語モデル(LLM)は、今後ますます多くの場面での利活用が期待されています。こうした大きな期待の一方で、LLMの開発・活用の現場では、莫大な計算資源の必要性が大きな壁として立ちはだかってます。まずLLMの開発現場では、「大規模データと巨大計

    Sakana AI
    naggg
    naggg 2025/01/31
    "新手法「TAID」を用いた小規模日本語言語モデル「TinySwallow-1.5B」の公開" "知識蒸留の面白い点は、単に「正解」を教えるだけでなく、教師モデルの「考え方」も生徒モデルへ教示できる点"
  • リクルタAI | 現場の声から生まれた、 採用活動を支援するAIエージェント

    「リクルタAI」は、採用業務をトータルサポートするAIエージェントです。スカウト、書類選考、日程調整を自動化し、候補者体験を向上。企業と最適な人材を迅速にマッチングし、採用のスピードと精度を最大化します。

    リクルタAI | 現場の声から生まれた、 採用活動を支援するAIエージェント
  • DeepSeek推しのローカルLLM勢から見るDeepSeek|Holy_fox

    はじめに初めまして、ほーりふぉっくすと申します。 この記事ではDeepSeekがなぜここまで流行り、選べられているのかを大規模言語モデル(LLM)の開発を生業としてる人がローカルLLM勢の視点から説明します。 ※ローカルLLMとは自分のデバイス上で動く大規模言語モデルのことです。 自己紹介ローカルLLM開発をしているほーりふぉっくす(https://x.com/Holy_fox_LLM)と申します。 DeepSeekを去年の8月よりデータ生成・コード生成に使っており、日人の中では多分結構早く触っていた方だと思います。 そんな私から見るDeepSeek社、DeepSeek v3 DeepSeek R1について書いていこうと思います。 DeepSeekの概要2023年に中国の浙江省杭州市で設立されたAI開発を専門とする企業です。 そしてそのDeepSeekが出したモデルがDeepSeek-v

    DeepSeek推しのローカルLLM勢から見るDeepSeek|Holy_fox
    naggg
    naggg 2025/01/31
    高校生!