[B! LLM] [6ページ] akishin999のブックマーク

饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました｜Baku

最近LLMコミュニティから生まれた小型MoEモデル「LightChatAssistant-2x7B」の日本語チャット性能がとても良いため、モデル作者さんが用いた手法（Chat Vector+MoEマージ）を後追いで勝手に検証しています。その過程で複数のモデルを試作したところ、7Bクラスとしてはベンチマークスコアがやたら高いモデルが出てきたので「Japanese-Starling-ChatV-7B」として公開してみました。以下はこのモデルの簡単な説明です。簡易評価日本語によるinstruction-tuningを行ったモデルの評価用データセットとして知られる「ELYZA-tasks-100」を用いて、ほかの有力な7Bクラスの日本語モデルとスコアを比較しました。その結果、GPT-4による評価において既存の日本語7Bモデルより大幅に高いスコア（3.42）を示すことが確認できました。単純に

akishin999 2024/04/18

リンク

LLM校正CIを自社のブログに導入してみた - NTT Communications Engineers' Blog

マネージド&セキュリティサービス部サービスプラットフォーム部門の田中です。 2023年度の下期にダブルワークという社内施策で、イノベーションセンター生成AIチームに参加しました。その取り組みとして、本ブログの記事データを管理している GitHub リポジトリに LLM (大規模言語モデル) の1つである GPT-4 を用いた校正CIを導入してみました。適切なプロンプトを得るための試行錯誤や、この記事自体を校正させてみた結果をお伝えします。目次目次背景 LLM校正CIの詳細プロンプトの試行錯誤この記事の校正結果おわりに背景本ブログ記事のデータ管理やレビューには GitHub を利用しています。投稿者は記事を執筆した後 PR (Pull Request) を出し、レビュアーが PRコメントで記事の修正を提案し、推敲していきます (なお、GitHubを活用した記事公開プロセ

akishin999 2024/04/18

LLM
ai

リンク

OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics

はじめにこんにちは。データサイエンスチームYAMALEXのSsk1029Takashiです。最近はOpenAIに日本支社が出来て、日本語対応が加速するというニュースにわくわくしています。今回はそんなOpenAIから発表されたBatch APIという機能が便利、かつお得な機能だったのでどのように使えるのか試してみます。 Introducing the Batch API: save costs and get higher rate limits on async tasks (such as summarization, translation, and image classification). Just upload a file of bulk requests, receive results within 24 hours, and get 50% off API pri

akishin999 2024/04/18

リンク

生成AIによるプロダクトと生産性向上の舞台裏@2024.04.16

2024.04.16「先達エンジニアに学ぶ思考の現在地 Online Conference」での登壇スライドです event link: https://findy.connpass.com/event/313119/ 生成AIを使ってプロダクト作りをしていたり、社内の生産性向上をチャレンジし…

akishin999 2024/04/18

ai
LLM

リンク

【業務効率革命】GAS Interpreter の衝撃｜ChatGPT研究所

今までで最もインパクトのあるGPTsが完成しました。その名も、「GAS Interpreter」です。このGPTは名前の通り、Code Interpreter のように Google Apps Script コードを生成し、その実行までを行います。他者に使ってもらうものではなく、自分専用のプライベートGPTです。人によっては、Code Interpreter よりも便利です。なぜかというと、インターネットアクセスができることに加えて、GAS の便利で豊富なライブラリやリソースが活用できるためです。例を示します。 GAS Interpreter の可能性以下に示す、いくつかの業務フローの実例をGAS Interpreterで行い、業務活用への可能性を示します。今日の予定を聞きます今日の予定を教えて下さい正確に今日の予定を教えてくれました。会議参加者の相手に連絡したいので、その

akishin999 2024/04/16

リンク

LLMエージェントのデザインパターン、Agentic Design Patternsを理解する

「Agentic Design Patterns」と呼ばれるLLMベースのAIエージェント（以下、LLMエージェント）の4つのデザインパターンについて紹介します。まず、「Agenticワークフロー」について説明し、続いて4つのデザインパターンを説明します Agentic Design Patterns Part 1 Agentic Design Patterns Part 2, Reflection Agentic Design Patterns Part 3, Tool Use Agentic Design Patterns Part 4, Planning Agentic Design Patterns Part 5, Multi-Agent Collaboration 動画もあります。 LLMエージェントについての説明は省略しているため、エージェントについて初見の方は以下記事をお勧

akishin999 2024/04/16

ai
LLM

リンク

なぜ我々は GitHub Copilot Enterprise の導入を見送ったのか - 一休.com Developers Blog

CTO 室の恩田です。今回は GitHub Copilot Enterprise を評価してみて、現時点ではまだ採用しないことを決めた、というお話をご紹介したいと思います。きっかけとあるエンジニアが Slack で自身の times チャネルに時雨堂さんの GitHub Copilot Enterprise のススメという記事を投稿したことが発端でした。特に感想はなく URL に 👀 だけが添えられていたので、後で見るぐらいのメモだったんだと思います。それを見かけた別のエンジニアが技術雑談チャネルにその投稿を共有して、これは凄そうと話題を向けたところ、CTO の「評価してみる？」の一言で、有志が集って評価プロジェクトが始まりました。雑談チャネルできっかけとなる投稿が共有されてから、30分足らずの出来事でした（笑）。この話題が出たのは金曜日でしたが、週明け早々に稟議を終え、火曜

akishin999 2024/04/15

github
LLM

リンク

優秀と噂なCohere社のCommand R+でRAGチャットボットを簡単に構築して体験しよう！ - Qiita

1. はじめに Cohere社が最近リリースしたLLMのCommand R+がGPT4に迫る性能を発揮していたり、RAG利用での性能で話題となっています。そのCommand R+でRAGを体験できるチャットアプリの実装がLightningAIにてチュートリアルが公開されています。これを身近な環境で動かしてみたいと思います。このチャットボットでCohere社の以下のモデルが使われています LLM: Command R+ Embed: embed-english-v3.0 / embed-multilingual-v3.0 Reranker: rerank-english-v3.0 / rerank-multilingual-v3.0 以下の動画のようにブラウザでPDFファイルをアップロードしてチャットで問い合わせができます。 2. 必要なもの以下の2つを準備しましょう。 Cohere

akishin999 2024/04/15

LLM

リンク

Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も

Appleの研究者が、スマートフォンのアプリUIを理解するために設計したマルチモーダル大規模言語モデル(MLLM)の「Ferret-UI」を開発したという論文を、未査読論文リポジトリであるarXivで公開しました。 [2404.05719] Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs https://arxiv.org/abs/2404.05719 Apple teaching an AI system to use apps; maybe for advanced Siri https://9to5mac.com/2024/04/09/ferret-ui-advanced-siri/ ChatGPTのようなチャットボットAIシステムのベースとなっている大規模言語モデル(LLM)は、主にウェブサイトから収

akishin999 2024/04/11

リンク

⼤規模⾔語モデルの拡張（RAG）が終わったかも知れない件について

Constrained K-means Clustering (クラスタサイズの制限をしたK-means法) を調べてみた

akishin999 2024/04/10

LLM
ai

リンク

GPT-4より賢いと言われる「Claude 3」でいろいろ試した

akishin999 2024/04/10

ai
LLM

リンク

OpenAIのライバル:Cohereが最高にイケている件 - Qiita

はじめに Cohere(コーヒア)とは、生成AI関連のスタートアップ企業であり、オラクル、エヌビディア（NVIDIA）、セールスフォース・ベンチャーズ（Salesforce Ventures）、センチネルワン（SentinelOne）などが支援しています。これまでにCommand-R+などのモデルを公開しています。今回はCohereのイケている部分について紹介させていただきます。 UIがイケているこちらCohereのダッシュボードです。実際に使ってみるとわかるのですが、全ての画面がわかりやすいです。この画面だけでもやりたいことがすぐ見つけられますし、サイドバー、ヘッダーの選択肢も適切です。（筆者の感想ですが） PlayGroundはChatだけではなく、ClassifyとEmbedも選択できます。さらにConnectorsでWeb検索を有無を選択できます。このUIの偉いところは、

akishin999 2024/04/10

ai
LLM

リンク

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

カナダのAIスタートアップCohereは4月4日（現地時間）、ビジネス向けに最適化された最新の大規模言語モデル（LLM）「Command R+」を発表した。高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransf ormerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aidan Gomez氏らによって2019年に設立されたカナダのAIスタートアップ。 OpenAIと同様、LLMの開発に特化しており、企業向けにチャットボット、検索エンジンの最適化、要約サービス、自社AIモデルのAPIなどを提供している。 Command R+は、同社が3月に発表した「Command R」の後継となるモデルであり、Cohereが得意とする高い効率性と精度のバランスを重視したRシリーズの一部となる。 128K（12万

akishin999 2024/04/09

LLM
ai

リンク

AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。そもそもChatGPTの心臓部である大規模言語モデル（LLM）は、膨大な知識を元にテキストを「生成」する仕組みだ。逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚（ハルシネーション）を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

akishin999 2024/04/06

リンク

1bit LLM の時代は来るのか，来ないのか，どっちなんだい？｜情報処理学会・学会誌「情報処理」

徳永拓之（LeapMind（株）） 1bit LLMの時代が来る？　2024 年2 月，The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits¹⁾ というタイトルの論文がarXiv上で公開され，にわかに話題となりました．“1.58 Bits” という表現はあまりなじみがありませんが，log₂(3) = 1.58 . . . ということで，パラメーターを三値にした場合の情報量を示しているようです．この論文（以下b1.58 論文とする）は，同じ著者グループによる文献2）を少し拡張したもので，大規模言語モデル（LLM）の効率化についての研究です．本稿の前半ではこれらの論文の主張を解説し，後半ではその主張の妥当性について検討します．なお，これらの2本の論文は，本稿執筆時点では，査読を経たものではありませんのでご注意くだ

akishin999 2024/04/05

LLM
ai

リンク

LLMはOS、エージェントはアプリ

＜モバイル時代のアプリに相当するものがAI時代にはエージェントになる＞＊エクサウィザーズ AI新聞から転載 AI時代の業界勢力図を理解する方法として、大規模言語モデル（LLM）を基本ソフト（OS）としてとらえる考え方が一部で広まっている。米シリコンバレーの著名ベンチャー・キャピタルのSequoia Capitalのイベントに登壇したOpenAI共同創業者Andrej Karpathyがその考え方をベースにAI業界の現状を解説している。パソコン時代のOSと言えば、MicrosoftのWindowsが圧倒的勝者。AppleのMacOS、オープンソースのLinuxは及ばずも健闘している。モバイル時代のOSは、AppleのiOSとGoogleのAndroidの２強。一方AI時代はというと、Karpathy氏の言うようにAI時代のOSがLLMだとすれば、2024年３月現在ではAnthropic

akishin999 2024/04/05

LLM
ai

リンク

“生成AI元年”が終わり、ビジネスへの実装段階になってきた (1/3)

Adobe Summit 2024で、生成AI「Adobe Firefly」新機能や「GenStudio」などを発表する、アドビのシャンタヌ・ナラヤンCEO 本連載もいったん今回で最終回。劇的な速度で変化する生成AI関係だが、そろそろ本格的な社会実装の時期に入った。技術の進化自体も継続しているが、「ビジネスの現場に対し、いかに生成AIを機能として実装するか」という点こそが重要となってくる。そこでは、LLMの違いによる特性をどう使うか、ローカルとクラウド、オンプレミスでの使い分けをどうするのか、生成したコンテンツの管理と効果計測をどうするのか、といった点が求められる。LLM自体の性能だけでなく、そうした部分をどの企業がどのような形で手掛けるのか、という話につながってくる部分だ。 NTTやKDDIといった国内企業はもちろん、アドビなどもそこでの姿勢をはっきりとさせつつある。まさに「生成AI

akishin999 2024/04/05

ai
LLM

リンク

Devin を含むAIソフトウェアエンジニアと周辺技術のざっくり紹介 - Algomatic Tech Blog

こんにちは。LLM STUDIO 機械学習エンジニアの宮脇（@catshun_）です。本記事では最近注目を集めている AI ソフトウェアエンジニアに関するプロダクトについてざっくりと紹介します。社内勉強会に向けたキャッチアップ資料として作成しており、加筆修正する可能性がありますが、本記事を読んだ方の議論のネタ程度になってくれれば幸いです。おことわり本記事では AI ソフトウェアエンジニアに関する詳細な解説は含みません。 Devin を参考に AI ソフトウェアエンジニアと呼称していますが、主語が大きく曖昧性の高い表現を使用しています。詳細については参照元をご確認ください。不十分また不適切な言及内容がございましたらご指摘いただけますと幸いです。プロダクト等の利用時は必ずライセンスや利用規約を参照して下さい。本記事の目次プログラム生成を伴う推論 Self-Refine (

akishin999 2024/04/05

ai
LLM

リンク

「数千万円かかるコスト」と「山のような技術的課題」　開発者たちが語る、日本語LLMの現在地

基盤モデルの開発をしている中で苦労することは？南野充則氏（以下、南野）：では、ここからパネルディスカッションに移っていきたいと思います。最初は、こちら側でお題を用意しています。大きなトピックとしては、基盤モデルの開発とコスト、基盤モデルにおけるアカデミアとビジネスの観点でどのような考え方をされているのかというところ。あとは、日本語特化LLMの意義と展望といったところですね。大きなトピックとして揃えていますが、今「Slido」でのご質問もいただいていますので、適宜Slidoも拾いながらやっていければと思います。Slidoは、このQRコードからみなさんに質問していただければと思います。さっそくですが、トピック1に移っていきたいと思います。「基盤モデルの開発をしている中で苦労されることは？」というところで、これはまず垣内さんからお願いしたいです。この基盤モデルを作っている中でどんな苦労があ

akishin999 2024/04/03

LLM

リンク

【LLMの研究者向け】400本を超えるLLMに関する論文のリストを公開・更新しています - Qiita

自身の研究のためにLLMに関する論文を表形式でまとめています。このレポジトリでは特にさまざまな分野の論文を表にする(Comprehensive)ことを目的としています。具体的には以下のキーワードに注目しています。 CoT / VLM / Quantization / Grounding / Text2IMG&VID / Prompt / Reasoning / Robot / Agent / Planning / RL / Feedback / InContextLearning / InstructionTuning / PEFT / RLHF / RAG / Embodied / VQA / Hallucination / Diffusion / Scaling / ContextWindow / WorldModel / Memory / ZeroShot / RoPE / Spe

akishin999 2024/04/03

LLM
論文

リンク

はてなブックマーク

タグ

関連タグで絞り込む (43)

LLMに関するakishin999のブックマーク (238)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス