deejayrokaのブックマーク / 2024年6月6日

「GPT-4o」の新たなボイスモードに衝撃走る、異なるキャラクターの声で演技が可能に／今後数週間以内にユーザーへ展開予定【やじうまの杜】

deejayroka 2024/06/06

リンク

日本語LLM の学習に関する技術記事まとめ｜npaka

日本語LLM の学習に関する技術記事をまとめました。日本語LLMの開発元の技術記事およびプレゼン資料が中心になります。 2023年5月9日 wandb - LLMをゼロからトレーニングするためのベストプラクティス

deejayroka 2024/06/06

“日本語LLM の学習に関する技術記事をまとめました”

LLM

リンク

以下の記事が面白かったので、簡単にまとめました。・Welcome Gemma - Google’s new open LLM 1. Gemma1-1. Gemma「Gemma」は、「Gemini」をベースとしたGoogleの4つの新しいLLMモデルのファミリーです。2Bと7Bの2つのサイズがあり、それぞれにベースモデルと指示モデルがあります。すべてのバリアントは、量子化なしでもさまざまなタイプのコンシューマハードウェアで実行でき、コンテキスト長は8Kトークンです。・google/gemma-7b : ベースモデル・google/gemma-7b-it : 指示モデル・google/gemma-2b : ベースモデル・google/gemma-2b-it : 指示モデル以下は、ベースモデルの概要と、LLM Leaderboard の他のオープンモデルと比較したパフォーマンスです

deejayroka 2024/06/06

“「Gemma」は、「Gemini」をベースとしたGoogleの4つの新しいLLMモデルのファミリーです”

リンク

ロングコンテキストLLMに対応したRAGの新アーキテクチャ｜npaka

以下の記事が面白かったので、簡単にまとめました。・Towards Long Context RAG - LlamaIndex 1. はじめにGoogleは、1Mコンテキストウィンドウを持つ「Gemini 1.5 Pro」をリリースしました。初期ユーザーは、数十もの研究論文や財務報告書を一度に入力した結果を共有しており、膨大な情報を理解する能力という点で印象的な結果を報告しています。当然のことながら、ここで疑問が生じます。「RAG」は死んだのでしょうか？そう考える人もいますが、そうではない人もいます。幸運にも「Gemini 1.5 Pro」の機能をプレビューすることができ、それを試してみることで、ロングコンテキストLLMを適切に使用するには、RAGがどのように進化するのかについてのまとめました。 2. Gemini 1.5 Pro の初期観察「Gemini」の結果は印象的で、テクニカ

deejayroka 2024/06/06

“ロングコンテキストLLMを適切に使用するには、残りの制約を回避しながら、その機能を最大限に活用するために、RAGの新アーキテクチャが必要になります。”

リンク

0518LLMmeetup_LLMシステムの非機能要件対応_現場レポート.pdf

運用保守ログの保存と活用 API監視ライブラリ管理速度性能 GPT-3.5, GPT-4の速度性能の例(Azure) イベントストリームでの対処可用性 APIの稼働率クォータ制限 APIの負荷分散による対処セキュリティ Azure OpenAIのネッ…

deejayroka 2024/06/06

“LLMシステムの非機能要件対応”

リンク

ローカルでLLMの推論を実行するのにOllamaがかわいい

ローカルでLLMを動かそうとなったら transf ormers ライブラリ、llama.cpp、text generation webuiなどいくつかの選択肢があると思いますが、どれもめちゃくちゃハードルが高いというほどではないですが、動かすまでの手続が若干いかつい印象があります。そんな中で Ollama というツールを試してみたところインターフェイスがシンプル、ついでにキャラクターのラマが可愛いのでご紹介していこうと思います。ちなみにですが、日本語での言及はあまり見かけなかったですが、LangChain が出してるレポートでは OSS モデルを動かすのに使われているものとしては3番目に多く使われており、出典: LangChain State of AI 2023 GitHub のスター数も現在約33700とかなり人気を集めていそうです。 Ollama で CLI から推論では早速

deejayroka 2024/06/06

“Ollama”

リンク

Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンターコラム

こんにちは、AI製品開発グループのファイサルです。この記事では、Know Narrator Searchで使用されている文章参照手法、Retrieval-Augmented Generation（RAG）の精度向上方法について紹介します。はじめに ChatGPTを始めとした大規模言語モデル（LLM）の登場により、AI業界、特に自然言語処理分野で多くの素晴らしい応用先が提案されるようになりました。 LLMは素晴らしい技術であることは間違いないですが、同時に幻覚（Hallucination）という問題を抱えています。このHallucinationという問題は、LLMが事実と異なる情報をあたかも真実であるように回答するというもので、LLMの発表当初から指摘されていました。この問題を解決するために、さまざまな手法が存在しますが、よく用いられるのが「Retrieval-Augmented G

deejayroka 2024/06/06

“Retrieval-Augmented Generationシステムの改善方法の紹介 ”

リンク

Gemini 1.5 Proに備えてGoogle AI Studioを調べておいた。時代は「インラインRAG」時代へ？｜平岡憲人（ノーリー）

こんにちは！ノリトです。ChatGPT使ってますか？ 2月16日にGemini Pro 1.5の発表がありました。プロンプトに１００万トークン使え、料金もGemini 1.0と同じならChatGPT 4の２４０分の１で、性能はChatGPT 4以上というのが売り文句です。 Gemini 1.0については、残念ながら使うのは時期尚早と思っています。しかし、Googleが自信満々で出してくる以上、構えは必要です。リリースに備えて、Google AI Studioについて調べましたので、共有いたします。この記事は、大阪のIT専門学校「清風情報工科学院」の校長・平岡憲人（ノリト）がお送りします。ノリトについては、こちらの記事を。１．Gemini 1.5 ProとはGoogleによれば、Gemini 1.5 Proは次のような生成AIサービスです。巨大な処理能力: 最大100万トーク

deejayroka 2024/06/06

“Google AI Studioは、Google DocumentやGoogle SpreadSheetなどのGoogleアプリの一つです”

リンク

M5Burner v3の使いかた

1. 概要 M5Burner は M5Stack 製品のファームウェアを扱うツールです。主な機能は以下の通りです。ファームウェアの入手ファームウェアの書き込み・消去独自ファームウェアの公開・配布シリアルモニタ

deejayroka 2024/06/06

“M5Burner”

リンク

《日経Robotics》ロボット向け基盤モデルが驚愕の商用化へ、ロボAI権威Abbeel氏創業の米Covariantが快挙

大規模言語モデル（LLM）をマルチモーダル化し、ロボットの行動生成AIとして応用しようとする動きがここ1～2年相次いでいるが、驚くべきことにその商用化が突然やってきた。この領域では米Google（グーグル）が活発な取り組みを見せており、世界の中でトップランナー的な立ち位置にあったが、今回、商用化一番乗りを遂げたのはこのグーグルではない。ロボット機械学習の世界的な権威で、本誌でも度々解説しているスター研究者、Pieter Abbeel氏が創業したロボットAIスタートアップ、米Covariantだ（図1）。

deejayroka 2024/06/06

リンク

granite-tsfm/wiki.md at main · ibm-granite/granite-tsfm

deejayroka 2024/06/06

“Time-Series Foundation Models (TSFM) ”

リンク

ragasを使ってRAGシステムを定量的に評価する - Taste of Tech Topics

皆さんこんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 Acroquestでは検索とAzure OpenAI Serviceを組み合わせたQAシステムを提供中です。こういったシステムを運用していく中で課題になるのが精度評価と改善の仕組みです。今年7月の記事でPrompt Flowを使った回答評価を検証してみましたが、今回はOSSのragasというツールを使って検証してみます。 ragasとは ragasはRAG（Retrieval Augumented Generation）の仕組みの良し悪しを評価するためにOSSで作成されたライブラリです。以下のリポジトリがあり、Pythonのライブラリとして使用することができ

deejayroka 2024/06/06

リンク

Copilotが「生成AIエージェント」に進化、Microsoftが業務自動化機能を発表

米Microsoft（マイクロソフト）は米国時間2024年5月21日、年次イベント「Microsoft Build」で、生成AI（人工知能）によるユーザー支援機能「Copilot」の機能強化を発表した。複数の外部プログラムをつないで実行する「生成AIエージェント」を開発する機能や、個人だけでなくチームをサポートする「Team Copilot」を新たに追加。Copilotはユーザーをチャットで支援する機能から、業務を自動化する存在に進化しようとしている。ユーザーがCopilotをカスタマイズできるローコードツール「Microsoft Copilot Studio」に、エージェントを開発する機能を新たに追加した。複雑なプロセスを自動化し、人の介入を最小限に抑えた自律的なエージェントを作成できるという。早期アクセスプログラムで限定的に公開されており、2024年後半にプレビュー版が提供される予定

deejayroka 2024/06/06

リンク

LLMエージェントのデザインパターン、Agentic Design Patternsを理解する

「Agentic Design Patterns」と呼ばれるLLMベースのAIエージェント（以下、LLMエージェント）の4つのデザインパターンについて紹介します。まず、「Agenticワークフロー」について説明し、続いて4つのデザインパターンを説明します Agentic Design Patterns Part 1 Agentic Design Patterns Part 2, Reflection Agentic Design Patterns Part 3, Tool Use Agentic Design Patterns Part 4, Planning Agentic Design Patterns Part 5, Multi-Agent Collaboration 動画もあります。 LLMエージェントについての説明は省略しているため、エージェントについて初見の方は以下記事をお勧

deejayroka 2024/06/06

LLM

リンク

はてなブックマーク

タグ

2024年6月6日のブックマーク (14件)

「GPT-4o」の新たなボイスモードに衝撃走る、異なるキャラクターの声で演技が可能に／今後数週間以内にユーザーへ展開予定【やじうまの杜】

日本語LLM の学習に関する技術記事まとめ｜npaka

HuggingFace の Gemma 統合｜npaka

ロングコンテキストLLMに対応したRAGの新アーキテクチャ｜npaka

0518LLMmeetup_LLMシステムの非機能要件対応_現場レポート.pdf

ローカルでLLMの推論を実行するのにOllamaがかわいい

Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンターコラム

Gemini 1.5 Proに備えてGoogle AI Studioを調べておいた。時代は「インラインRAG」時代へ？｜平岡憲人（ノーリー）

M5Burner v3の使いかた

《日経Robotics》ロボット向け基盤モデルが驚愕の商用化へ、ロボAI権威Abbeel氏創業の米Covariantが快挙

granite-tsfm/wiki.md at main · ibm-granite/granite-tsfm

ragasを使ってRAGシステムを定量的に評価する - Taste of Tech Topics

Copilotが「生成AIエージェント」に進化、Microsoftが業務自動化機能を発表

LLMエージェントのデザインパターン、Agentic Design Patternsを理解する

お知らせ

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス