[B! *algorithm][prompt] sh19910711のブックマーク

sh19910711 id:sh19910711

*algorithmとpromptに関するsh19910711のブックマーク (8)

Evolutionary Optimization of Model Merging Recipesを理解する(論文編)
Evolutionary Optimization of Model Merging Recipesについて先日、sakana.aiが発表した論文になっています。大規模言語モデル(LLM)のパラメータと下流タスクでの性能の関係は、Task Arithmeticなどで研究されてきました。そこから、複数のLLMのレイヤーをパラメータを混ぜて一つにする方法が提案されてきました。この論文では、パラメータの混ぜ方だけでなく、レイヤーのマッチングまで一本化して最適化する手法を提案しています。個人的に、この手法の発展が楽しみです。行く末は、ビッグテックが要するクローズドな大きなモデル(GPT4, Geminiなど)を、オープンソースの複数のモデルが超えていく未来が来るかもしれません(スイミーのように)。この論文が扱う問題の理解この論文が解く問題は、モデルの合体(model merging)の最適
sh19910711 2025/10/06
2024 / "Task Arithmetic: パラメータと下流タスクでの性能の関係 / 学習で使われたデータの違いから、モデルAのレイヤーの出力を、モデルBのレイヤーへ入力すると分布違いから、最終的な生成結果がおかしくなってしまう"

*program

prompt

rep

*algorithm

最適化
リンク
Claude Codeと数理最適化をやってみる
こんにちは、ペルソナ4 リバイバルを楽しみにしているデータサイエンティストのoddgaiです。先日、Claude CodeでKaggleをやってみた記事を書いたのですが、数理最適化もできるの？と思ったのでやってみました。結論単純な問題ならざっくり指示しても割とちゃんと解いてくれる OR-tools, PuLPなどのライブラリも使える他分野よりネットに情報が落ちてない印象があったので心配してたけど意外と大丈夫だった数秒で数百行のコードを書いてくるので人間による確認＆精度担保が大変今回はテストデータなので甘めにやってしまった・・・ C++やらRustやらでヒューリスティックをゴリゴリ書いてもらうとかは未調査だが、こちらも強そう参考：AI vs 人間まとめ【AtCoder World Tour Finals 2025 Heuristic エキシビジョン】 - chokudaiのブロ
sh19910711 2025/09/27
"Python-MIPを使ってと指示したのにPuLPを使う / 最適解です！と言いつつ微妙に違う解を出してくる / 人間がAIの出力を確認しやすい仕組みを作るのが大切"

*program

prompt

coding

*algorithm

最適化
リンク
アノテーションツールをClaudeに作らせて、自分の設計力を見直してみた
イントロ ELEMENTS開発部AiQグループの森本です。私は、AiQ PERMISSIONというプロダクトの開発を担当しております。AiQ PERMISSIONは、セルフガソリンスタンドで義務化されている給油者の行動監視をAIが代替し、人手不足の解消や業務効率化、安全性の向上を目的としています。 AiQ PERMISSIONでは、設置しているカメラ映像から行動を検知して、給油者が不審な行動を対象のレーンに許可を出したり、給油を緊急停止したりします。この処理を行う際に、ガソリンスタンドのカメラの映像情報と各レーンの番号の対応、並びに監視する範囲を指定するために、下記のオレンジ色や赤紫色の枠を設定し、アノテーション情報を付加する必要があります。問題/課題ツールを作成したのは2025年3月時点で、Vibe Codingで簡単なLPなどは作れるような状況でした。が、実際に業務をしていたら「
sh19910711 2025/09/06
"「なんか違う」出来のものができる / 動くものでフィードバックを得て自分の言語化力の不足している点に気づく、というのが特に良かった"

*program

prompt

coding

*algorithm

label
リンク
ナレッジグラフでスターウォーズファンに映画を推薦する｜kiha
人間の持つ知識を形式的に表現する、知識表現の研究は古くからなされてきており、例えば一つの形としてWebシステムではよくつかわれるリレーショナルモデルなどがある。近年よく着目されているのがナレッジグラフであり、先端的な研究を超えて、実産業での活用事例（例えばGoogleのナレッジグラフサーチ）も多くみられるようになった。本記事では、noteのレコメンドシステムも手がけている筆者がWikidataのエンドポイントを利用して、ナレッジグラフを探索し、スターウォーズファンにおすすめできそうな映画をリストアップしてみる。最終的にこんな感じのリストが得られる。スターウォーズファンのみなさまには、興味が惹かれるタイトルがあっただろうか？ナイトミュージアム2 インディ・ジョーンズ／クリスタル・スカルの王国地獄の黙示録チャーリーズ・エンジェルフルスロットルブレードランナー 2049 ジャッジ・ド
sh19910711 2024/06/07
"RDF: リレーショナルモデルとは異なり、主語・述語・目的語からなる / RDFにおいては、主語と目的語はURLのように唯一固有のIDをもち / SPARQLというSQLのようなSyntaxの問い合わせ言語がW3Cで定義"

*algorithm

search

prompt
リンク
LLMを活用した深層学習モデルの改善 - TadaoYamaokaの開発日記
前回の記事で、LLMを使用して数学的発見を行うFunSearchの論文を紹介した。 FunSearchは、LLMを使用してプログラムの変更を行い、進化的アルゴリズムでスコアの高いプログラムを選別することで、最適な解を出力するプログラムを生成する。この仕組みは、深層学習のモデル構造の改良にも使えないかと思い試してみた。進化的アルゴリズムを行うには評価に時間がかかるため、今回はLLMにより、モデル構造を変更する部分を試した。対象 dlshogiで使用しているResNetブロックを初期バージョンとして、改善したバージョンをLLMに出力させる。 class ResNet Block(nn.Module): def __init__(self, channels, activation): super(ResNet Block, self).__init__() self.conv1 = nn.C
sh19910711 2024/05/24
"FunSearch: 進化的アルゴリズムでスコアの高いプログラムを選別 / Codey for Code Generationでは良い結果が得られなかったが、ChatGPT4では深層学習の知識を活かしたモデル構造のバリエーションを出力でき" 2023

*algorithm

機械学習

prompt
リンク
LLM 向け MinHash でテキストの重複除去のメモ
LLM 向けデータセットでは, 重複や繰り返し(repeatation)が少ないことが重要となります. Scaling Laws and Interpretability of Learning from Repeated Data Deduplicating Training Data Makes Language Models Better CCNet(LLaMa などで使われた), RefinedWeb(Falcon)でも dedup は重要な役割を果たしています. 情報基本は Suffix Array で exact match と MinHash(LSH, Locally Sensitive Hash)で fuzzy match でテキストの重複除去を行うのが昨今(2023/07 時点)での主流のようです. (SimHash は遅いので大規模では使わないっぽ?) Shingle
sh19910711 2024/05/22
"dedup: LLM 向けデータセットでは重複や繰り返しが少ないことが重要 / Suffix Array で exact match と MinHash(LSH, Locally Sensitive Hash)で fuzzy match でテキストの重複除去を行うのが昨今(2023/07 時点)での主流" 2023

*algorithm

hash

prompt
リンク
Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
複数のLLM（GPT/Claude3）とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題（TSP）が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。できたもの Arxivの検索APIを使って検索拡張生成（RAG）したらサーベイを自動生成できたやっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題（TSP）を解いてソートをかける論文の要旨をGPT-3.5-Turboで要約ソートした要約結果をClaude3 Sonnet
sh19910711 2024/04/28
"GPT-4-TurboのJSONモードを使い、検索ワードを生成 + 「Arxiv検索で」と明示させればそれっぽい / Embeddingに対してTSPを解いてソート + テーマ内での近しい内容同士が数珠つなぎで並べ替えた上で与えられたほうが良い"

*algorithm

search

prompt

*reading

研究

--

rep
リンク
大規模言語モデル入門 / LLM introduction (SES2023)
ソフトウェアエンジニアリングシンポジウム2023 (SES 2023)
sh19910711 2023/09/03
"phi-1 [Gunasekar+, 2023/06]: GPT-4を活用してフィルタリングした高品質Githubコード + 教科書品質のデータCodeTextBook, CodeExcersizeを利用 / パラメータ数1.3Bにも関わらず、WizardoCoderやGPT-3.5に匹敵する性能を実現"

#

*algorithm

NLP

*program

prompt
リンク
1