[B! deeplearning] kyo_agoのブックマーク

kyo_ago id:kyo_ago

deeplearningに関するkyo_agoのブックマーク (87)

GitHub - microsoft/markitdown: Python tool for converting files and office documents to Markdown.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
kyo_ago 2026/04/13
microsoft

markdown

deeplearning

github

python

tool

AI

pdf

ツール

仕事
リンク
LLM のアテンションと外挿 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ
LLM の注意機構には色んな機能があることが分かっています。注意機構を分析することで、なぜ LLM は文脈内学習や思考の連鎖に成功し、ひいてはなぜ LLM が外挿に成功することがあるのかについての理解が得られます。本稿ではさまざまな種類の注意機構を観察することでこの問題をひも解きたいと思います。目次目次基本的な考え方文法ヘッド注意の受け皿とレジスタトークン逐次ヘッドと検索ヘッド帰納ヘッド関数ベクトル反復ヘッドまとめ基本的な考え方 LLM の多くは注意機構と多層パーセプトロン (MLP) を交互に積み上げたアーキテクチャを持ちます。各層は複数の注意機構をもち、それぞれの機構を注意ヘッドと呼びます。注意機構の役割は文脈内の検索ルール・アルゴリズムの実現です。文脈とはプロンプトと今までの出力のことで、これを踏まえて次トークン予測を行います。注意機構は文脈から次トーク
kyo_ago 2025/10/13
機械学習

AI

deeplearning

人工知能

開発
リンク
Inception Labs
Introducing Mercury, the first commercial-scale diffusion large language model We trained diffusion large language models that are up to 10x faster and cheaper than current LLMs, pushing the frontier of intelligence and speed for language models. We trained diffusion large language models that are up to 10x faster and cheaper than current LLMs, pushing the frontier of intelligence and speed for la
kyo_ago 2025/03/04
language

言語

deeplearning

LLM
リンク
Clineに自分をエミュレートさせて技術記事を代筆させてみたらビビった
なんか驚き屋っぽくてアレなんだけど、今回はさすがに驚く権利があると思うので、至急記事を書く。やろうとしたこと毎回手元の検証結果から技術記事を構成するのがだるい自分のブログを適当に読ませておいて、その構成と文体を真似させればいいのでは手元に mizchi/zenn というリポジトリがあり、ここに zennにポストする原稿を管理している。 $ tree ./articles ./articles ├── 1c35fdcc77065c02f631.md ├── 3e4742e24f2ca0118f70.md ├── 8a017097d3994ddc0a85.md ├── ai-code-generation.md ├── ai-programmer.md ├── ai-team-mate.md ├── antipattern-of-tournament-score-sheet.md ├─
kyo_ago 2025/02/25
技術

AI

ドキュメント

考察

deeplearning

コード

technology

文章

機械学習

developer
リンク
LLMがオワコン化した2024年
当ニュースレターは2023年を「SaaSがオワコン化した年」と位置づけたが、2024年は早くもAIが終わった一年であった。少なくとも大規模言語モデル（LLM）そのものの発展を、物珍しそうに追いかける時期は過ぎた。生成AIが今後どこまで賢くなるかはもちろん未知数である。しかし、既に業務で十分に役立つレベルにある現行モデルのコストが今後も下がっていくことは確実だ。 The cost of GPT-4 APIs at launch in Mar 2023 was roughly ~$30 per 1m tokens. Seeing Deepseek V-3 APIs at ~$1 per 1m tokens today. For AI application companies, cost of "intelligence" is falling significantly faster tha
kyo_ago 2025/01/06
AI

ビジネス

business

人工知能

技術

it

deeplearning

社会

tech

仕事
リンク
自然言語処理を役立てるのはなぜ難しいのか
PFNの海野裕也が2024/10/15に東大大学院「自然言語処理応用」にゲスト講師として登壇した際の講義資料です。
kyo_ago 2024/11/05
言語

資料

研究

技術

language

機械学習

deeplearning

AI

マネジメント

python
リンク
自動プロンプト最適化をやってみた - Algomatic Tech Blog
はじめまして！データサイエンティストの山内(@jof_5)です。本記事では、日々、プロンプト開発されている皆様に向けて、プロンプトを効率的に開発する手法の一つである「自動プロンプト最適化」について記載いたします。 1. プロンプトエンジニアリングの必要性と課題 2. 自動プロンプト最適化について 2-0. 最適なプロンプトとは何か？☕ 2-1. 自動プロンプトの概要 2-2. 自動プロンプト最適化のアーキテクチャ ①Task Executor: LLMによるタスクの実行 ②Output Evaluator: 出力の評価 ③ Prompt Improver: 最適なプロンプトの生成 3. 実験結果と考察 3-1. 自動プロンプト最適化の有効性の検証 3-2. 最適化プロンプトの生成過程 3-3. 最適化されたプロンプトの特徴 3-4. プロンプト生成用LLM(Prompt Improver
kyo_ago 2024/06/18
文

blog

tech

deeplearning

AI

技術

LLM

ChatGPT
リンク
RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
はじめに新規事業部生成AIチーム山本です。 ChatGPT（OpenAI API）をはじめとしたAIの言語モデル（Large Language Model：以下、LLM）を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が（当然ながら）得られてしまいます。この問題を解決する方法として、Retrieval Augmented Generation（以下、RAG）という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力（プロンプト）に付け加えて渡すことで、ユーザが欲しい
kyo_ago 2024/04/23
情報

検索

人工知能

developer

dev

ドキュメント

システム

AI

機械学習

deeplearning
リンク
Sakana AI
更新（2025年1月28日）論文「Evolutionary Optimization of Model Merging Recipes」が論文誌「Nature Machine Intelligence」に採択され本日掲載されました。最新バージョンでは本アプローチをさらに実証する新たな実験結果を含んでいます。ぜひ以下からご覧ください。 https://www.nature.com/articles/s42256-024-00975-8 Sakana AIは2024年3月に「進化的モデルマージ」を公開し、大きな反響を呼びました。公開時には国内外の多くのメディアに取り上げられニュースになりました。進化的モデルマージはmergekitやOptuna Hubといった著名なOSSフレームワークにも実装され、多様なユーザーがそれを活用し、数々の個性的なモデルが作成・公開されてきました。また、社内外の複
kyo_ago 2024/03/25
AI

日本語

technology

研究

開発

設計

アルゴリズム

人工知能

機械学習

deeplearning
リンク
1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も
清水亮 ryo_shimizu 新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。 2月は中国では春節というお正月があり、春節にはみんな休む。それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリースした。それが「Bit Net
kyo_ago 2024/02/29
AI

人工知能

機械学習

microsoft

研究

技術

deeplearning

中国

it
リンク
マネフォ出身者創業の生成AIスタートアップStarley、雑談や悩み相談できるアプリ「Cotomo」をローンチ
マネフォ出身者創業の生成AIスタートアップStarley、雑談や悩み相談できるアプリ「Cotomo」をローンチ＜21日15時更新＞アプリに搭載されている基本音声の数を修正。マネーフォワード（東証：3994）出身の丸橋得真氏や内波生一氏らが生成 AI スタートアップ Starley を創業し、プレシードラウンドで古巣であるマネ […] Image credit: Starley ＜21日15時更新＞アプリに搭載されている基本音声の数を修正。マネーフォワード（東証：3994）出身の丸橋得真氏や内波生一氏らが生成 AI スタートアップ Starley を創業し、プレシードラウンドで古巣であるマネーフォワードから1億円を調達したことは、昨年6月にお伝えした。あれから8ヶ月を経過した21日、同社は AI アプリの「Cotomo」をローンチした。iOS 向けに提供され、アプリストアからダウン
kyo_ago 2024/02/25
AI

アプリ

情報

app

deeplearning

ChatGPT

LLM
リンク
AIの民主化が進む時代におけるバクラクのAI-OCR機能の開発戦略 #LayerXテックアドカレ - LayerX エンジニアブログ
LayerX バクラク事業部機械学習チームの機械学習エンジニア兼マネージャーの松村（@yu-ya4）です。半年間に結婚祝いでいただいたたくさんのお酒が順調に減ってきているのですが、サントリーウイスキー角瓶 4Lペットだけはなくなる気配がありません。この記事はLayerXテックアドカレ2023の16日目の記事のはずです。前回はosukeさんの『Azure AI SearchのSemantic Ranker』という記事でした。次回はminako-phさんによるタメになる記事、『Notionでスプリントのあれこれをダッシュボードで可視化する』が公開予定ですされました。昨今のAIの進化には目を見張るものがあります。先日のOpenAI DevDayやMicrosoft Igniteでも様々な衝撃的な発表がなされました。今週は違う意味で衝撃的なニュースが多かったですが。そのような時代です
kyo_ago 2023/12/08
AI

ocr

api

開発

学習

データ

deeplearning

人工知能

development
リンク
Copilot Studioを使ってみた。注意点と実際にかかるお金の話など｜shi3z
Copilot StudioはMicrosoft 365 E5というお高いパッケージに入らないとプレビュー版すら使えないらしい。仕方ないので会社で入りましたよ。会社に所属してるのは3人だけど、E5だと25人分のアカウントがついてくる。しかし!!! 金さえ払えば使えるというほどイージーなものではなかったので皆さんにお伝えします。ちなみにE5に入っただけで月額45000円(1800円x25で)になりました(ただし七日間の試用期間中にキャンセルすれば無料に)。まずMicrosoft365で企業アカウントを作り、会社のメンバー的な人に個人アカウントを発行します(この時点でかなりハードルが高い)。そしてCopilot Studioのページからリンクに飛べば、企業の個人アカウントでログインできた。やったぜ! しかしログインしても、様子がおかしい。なんかフローチャートが出てきて、フローチャート
kyo_ago 2023/11/20
お金

bot

AI

会社

ソフトウェア

環境

money

microsoft

人工知能

deeplearning
リンク
Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality - LMSYS Blog
Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality We introduce Vicuna-13B, an open-source chatbot trained by fine-tuning LLaMA on user-shared conversations collected from ShareGPT. Preliminary evaluation using GPT-4 as a judge shows Vicuna-13B achieves more than 90%* quality of OpenAI ChatGPT and Google Bard while outperforming other models like LLaMA and Stanford Alpaca in
kyo_ago 2023/04/05
deeplearning

AI

LLM

ChatGPT

*機械学習
リンク
ChatGPT API の使い方｜npaka
「OpenAI」の記事「Chat completions」が面白かったので、軽くまとめました。 1. ChatGPT API「ChatGPT」は、OpenAIの最も先進的な言語モデルである「gpt-3.5-turbo」を搭載しています。「OpenAI API」から「gpt-3.5-turbo」を使用して独自アプリケーションを作成できます。・メールや文章のドラフト・Pythonコードの生成・一連の文書に関する質問応答・会話型エージェントの作成・ソフトウェアへの自然言語インターフェースの追加・さまざまな科目の家庭教師・言語の翻訳・ビデオゲームのキャラクターのシミュレート 2. 使用料金使用料金は、以下で確認できます。 3. Colab での実行「gpt-3.5-turbo」は、マルチターンの会話を簡単にするように設計されていますが、会話のないシングルターンタスクでも役立ちます
kyo_ago 2023/03/02
api

note

機械学習

content

u

AI

人工知能

ドキュメント

deeplearning

文章
リンク
Interpretable Machine Learning
Interpretable Machine Learning A Guide for Making Black Box Models Explainable. Christoph Molnar 2021-05-31 要約機械学習は、製品や処理、研究を改善するための大きな可能性を秘めています。しかし、コンピュータは通常、予測の説明をしません。これが機械学習を採用する障壁となっています。本書は、機械学習モデルや、その判断を解釈可能なものにすることについて書かれています。解釈可能性とは何かを説明した後、決定木、決定規則、線形回帰などの単純で解釈可能なモデルについて学びます。その後の章では、特徴量の重要度 (feature importance)やALE(accumulated local effects)や、個々の予測を説明するLIMEやシャープレイ値のようなモデルに非依存な手法(mo
kyo_ago 2021/05/19
学習

統計

データ

勉強

機械学習

AI

book

書籍

books

deeplearning
リンク
Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。概要Dwango Media Villageの廣芝です。誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。声変換声の変換技術には、リアルタイム性と品質のトレードオフがあります。既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。品質を優先した声変換システムがあると応用の幅が広がると思い、研究開発に挑戦しました。声変換を含む音声合成の品質は、
kyo_ago 2021/05/12
システム

人

deeplearning

学習

media

データ

勉強

機械学習

technology

技術
リンク
エヌビディアがCPU参入　アームと組みAI計算10倍速く - 日本経済新聞
【シリコンバレー=佐藤浩実】米半導体大手のエヌビディアは12日、CPU（中央演算処理装置）に参入すると発表した。英アームの基本設計を利用し、2023年に米欧のスーパーコンピューターに搭載する。人工知能（AI）計算を10倍速くできる見通しで、米インテルの主戦場に切り込む。AIの進化を左右する「頭脳」を巡り競争が激しくなる。12日に開いたAIイベントでCPU「Grace（グレース）」を発表した。エ
kyo_ago 2021/04/13
CPU

AI

日本

経済

PC

技術

technology

企業

business

deeplearning
リンク
GPUに比べて最大15倍高速な市販CPU向けのディープラーニングアルゴリズムが開発される
近年のAIは、人間が手を加えなくてもコンピューターが自動的に大量のデータからそのデータの特徴を発見する「ディープラーニング(深層学習)」という学習手法で動いています。このディープラーニングは、コンピューターゲームに代表されるリアルタイム画像処理に特化した演算装置・プロセッサであるGPUで処理されるというのが通例ですが、ライス大学のコンピューター科学者がIntelと共同で「GPUに比べて最大15倍も高速にディープラーニングできるCPU向けソフトウェア」を開発しました。 ACCELERATING SLIDE DEEP LEARNING ON MODERN CPUS:VECTORIZATION, QUANTIZATIONS, MEMORY OPTIMIZATIONS, AND MORE (PDFファイル)https://proceedings.mlsys.org/paper/2021/file/
kyo_ago 2021/04/09
CPU

学習

deeplearning

人工知能

アルゴリズム

開発

development

slide

algorithm

勉強
リンク
Self-Attentionを全面的に使った新時代の画像認識モデルを解説！ - Qiita
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします！(ツイッター:@omiita_atiimo) Self-Attentionを全面的に使った新時代の画像認識モデルを解説！近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransf ormerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchm
kyo_ago 2020/09/06
画像

qiita

機械学習

アルゴリズム

deeplearning

tech

AI

it

algorithm
リンク
1 2 3 4 5 次のページ