stealthinuのブックマーク - はてなブックマーク

SliceGPTを使って日本語LLMをPruningしてみる | 株式会社AI Shift

こんにちは AIチームの戸田です今回はLLMを軽量化するPruningを行うライブラリ、SliceGPTを使って日本語LLMのPruningを試してみたいと思います。 SliceGPT LLMに限らず、大規模なニューラルネットワークのパラメータを圧縮する手法の一つにPruningがあります。日本語では「枝刈り」や「剪定」とも訳されており、重要ではないと思われるノード間の重みを削除することでパラメータ数を削減する手法です。こちらの論文などが有名です。 Pruningのイメージ PruningはLLMの圧縮手法として有効な手段なのですが、性能を維持するためにPruning後にRecovery fine-tuningという学習を行わなければならず、これがコストになるという課題がありました。SliceGPTはこのRecovery fine-tuning無しで90%以上の性能を維持したまま、最大2

stealthinu 2024/06/03

GPTのPruningで枝刈りで15%削減できたのに対しベンチ性能が0.74->0.68と90%に低下。うーむ。枝刈りはあんまり得策じゃないというか、知識はニューラルネット内に広く浅く分布してる感じ。

リンク

大規模言語モデルの開発

2024年度人工知能学会全国大会（第38回）チュートリアル講演１本講演では、大規模言語モデルの開発に必要な基礎および最新動向を概観する。その後、東京工業大学情報理工学院の岡崎…

stealthinu 2024/06/03

現時点でLLMを開発するうえでの色々な情報がすごいまとまってる。学習データの作り方だったり検証の仕方だったり単に計算機力を揃えるだけでなくいろんな課題があることがわかる。

リンク

GitHub - uezo/aiavatarkit: 🥰 Building AI-based conversational avatars lightning fast ⚡️💬

import logging from aiavatar import AIAvatar, WakewordListener GOOGLE_API_KEY = "YOUR_API_KEY" OPENAI_API_KEY = "YOUR_API_KEY" VV_URL = "http://127.0.0.1:50021" VV_SPEAKER = 46 # Configure root logger logger = logging.getLogger() logger.setLevel(logging.INFO) log_format = logging.Formatter("[%(levelname)s] %(asctime)s : %(message)s") streamHandler = logging.StreamHandler() streamHandler.setF ormatt

stealthinu 2024/06/03

AIAvatarKit 音声認識、LLM、音声合成を組み合わせてAIアバターを作るためのフレームワーク的なもの。

リンク

Stable Diffusionでプロンプトを抽出できる「tagger」の導入方法・使い方

どんな呪文(プロンプト)を入力したらいいか分からない画像から呪文(プロンプト)を出力したい Tagger（タガー）って何？ Taggerの使い方は？今回は、「Tagger」を使って画像から呪文(プロンプト)を一瞬で抽出し、画像生成がスムーズに行える方法をご紹介します。この記事を最後まで読んでいただくと、呪文(プロンプト)に悩むことなく自分好みの画像を簡単に生成することができるようになりますので、是非参考にしてください！

stealthinu 2024/06/03

SDでtaggerっていう拡張でその画像からプロンプトを抽出（というか認識？）してくれるツールがある

リンク

FineWeb: decanting the web for the finest text data at scale - a Hugging Face Space by HuggingFaceFW

Discover amazing ML apps made by the community

stealthinu 2024/06/03

FineWeb-Eduという非常に「綺麗」な学習データセット。FineWebからさらに絞り込んでありこのデータセットで学習すると大きく性能が上がることが示されている。

リンク

Direct Preference Optimization: Your Language Model is Secretly a Reward Model

While large-scale unsupervised language models (LMs) learn broad world knowledge and some reasoning skills, achieving precise control of their behavior is difficult due to the completely unsupervised nature of their training. Existing methods for gaining such steerability collect human labels of the relative quality of model generations and fine-tune the unsupervised LM to align with these prefere

stealthinu 2024/06/03

RLHFを強化学習しなくても直接学習できてしまうというDPOという手法。魔法のような数学。

リンク

Attention as an RNN

stealthinu 2024/06/03

AttentionをRNNとして再定義して少ないメモリと計算力で動くようになるという論文。すげえけどほんと？と思ったがBengio先生が入ってるから間違いなさそう。

リンク

最近の7B小型日本語LLMはエージェントになれるのか？

あれから進化的マージの試行錯誤を繰り返していたが、ついに相当性能が高そうなモデルが生まれた。 Umievo-itr012-Gleipnir-7Bである。 umiyuki/Umievo-itr012-Gleipnir-7B · Hugging Face ElyzaTasks100の平均スコアは3.91に達して、ついにGPT-3.5Turboのスコア（3.88）を上回ってしまった。ただし、スコアが上回ってるからと言って性能が勝ってるというわけではない事に注意して欲しい。例えるなら、身長が高いからと言って強いわけではないみたいな話である。前回の記事では少し誤解を招く書き方だったかもしれないが、そもそも7Bの小型日本語LLMなんてのは基本的にドアホである。間違ってもChatGPTの代わりに使えるなんて考えてはいけない。とは言うものの、単なるドアホではスコア3.91なんて取れないという事もまた

stealthinu 2024/06/01

ローカルLLMでエージェント的な動作をさせるllama-cpp-agentというツールがある。7Bでもそこそこうごく。しかしベンチではGPT3.5越えてても実際の性能的には3.5にもぜんぜん足らない。もっと正確なベンチ欲しい。

リンク

「行政デジタル人材育成ヒアリング見聞録第一. 地方自治体編」

stealthinu 2024/06/01

1996年に塩尻市営のISPを作った話で「インターネットに詳しい白馬村の人」という人物が出てくるんだけどだれだろ？当時僕以外にそんな人というとプチホテルモンベルのオーナー？

net
白馬

リンク

「Google 検索」でキャッシュ機能終了

stealthinu 2024/06/01

Googleのキャッシュ機能ってなくなったのか…　今後はWayback使う方法しかなくなる。

リンク

『肉駅停車』

はちこのブンブン日記in白馬食いしん坊な私(っ‎‎´‎‎༥`⊂)ŧ‹"ŧ‹"何を食べたか日記として、　書き留めてるよ！主に白馬、大町、安曇野、長野市グルメのブログ⭐︎ その他スノーボード、ヲタ活、ゴルフeat..

stealthinu 2024/06/01

白馬駅前にこんな店が出来てたのか。知らんかった。外国人向けではない感じにみえるので行ってみたい。

白馬

リンク

商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生｜DTMステーション

ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS＝Text to Speech（音声読み上げソフト）の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。さらにStoryblocksという音素

stealthinu 2024/06/01

SOUND FORGE Pro18が19,800円で。しかもiZoTope Ozone 11 ElementsとRX10 Elementsが付いてくる。RX10 Elements持ってるのだよなあ。でもTTS部分だけ試したいのだよなあ…

リンク

生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ

かなり前から「ChatGPTに学術論文を（英語で）書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告！📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。（限界助教先生の記事

stealthinu 2024/06/01

『ChatGPTのRLHFプロセスの多くがアウトソースされたナイジェリアのオペレーターたちによって行われた結果』『"delve"という単語はナイジェリア英語では比較的頻繁に用いられる』なるほど

リンク

GitHub - ToonCrafter/ToonCrafter: a research paper for generative cartoon interpolation

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

stealthinu 2024/06/01

2枚の画像から中割アニメを生成してくれる。一旦スケッチにしてから中割作って彩色。手袋はめるところとか中割というよりシーン生成という感じまでできる感じ。

リンク

もう初回コードレビューはAIに任せる時代になった - CodeRabbit -

どんな人向けの記事？レビューによって心理的なダメージを受けやすい方非エンジニアだが、エンジニアチームがどんな機能を作っているか知りたい方業務が溜まっていて、レビューに割く時間を捻出するのに苦労している方コピペできるコードも公開します初回レビューをAIに任せると、いろんなロールの人の役に立つレビューは得意ですか？優秀なエンジニアしかいないチームであれば、PRは1トピックに絞って小さく明確なコミットによって作成され、適切な要約とともに提供されることでしょう。しかし、実際にはいろいろな制約から、PRが想定よりずっと大きくなってしまったり、関連トピックと異なるコードが混じってしまうこともあります。実際のところ、大きなPRを適切にレビューするのは難しいことです。また、自分が詳しくない領域のレビューを行わなければいけない機会もあります。今回の記事は、レビューを作成してくれるAI C

stealthinu 2024/05/31

github actionsで自動でPRにコードレビューしてくれるサービス。OpenAI APIのみ自前で基本は無料。ブコメではクラウドサービスへコードを投げることへの反発が結構でている。

リンク

ChatGPT-4oを専属マネージャーにしてサボり癖を直してもらった | ライフハッカー・ジャパン

2024年11月発売のPS5新作『ドラゴンクエストIII そして伝説へ...』が14%OFFはアツい #Amazonセール

stealthinu 2024/05/31

なんと！！GPT-4oの音声インターフェイスだと（古いほうでも）タイマー機能として使えるの？！全く知らんかった。もう時間の感覚持ってるんだ。

LLM
ChatGPT

リンク

2日でファン限定支援サイトを作った話

はじめまして。新時代IP創出事業を手掛けるsaipと申します。普段は社員3人のスタートアップ株式会社TrippyでCCO兼CTOを務め、生成I受託事業の傍ら、AIキャラクターとのゲーミフィケーションされたコミュニケーションが楽しめるアプリ「Oz-オズ-」を開発・運営しています。最近、「Oz-オズ-」のキャラクターのプロモーションのためにXで発信し始めた漫画の後日譚的コンテンツがメンバーシップ制で楽しめる「Oz Fanz」というWebサイトを思い立って2日で公開しました。この記事では、どのような技術スタックを用いてそのような高速開発が可能になったかを公開し、皆様からのご鞭撻をもとに、粗いシステムを改善していこうという魂胆です。私のWeb開発歴は1～2年くらいなので、かなり考慮漏れが存在しています。テストを一切書いていないなど…。選定の方針あまり資金に余裕がないので、コストを極力抑え

stealthinu 2024/05/31

今すばやくサービス作ろうと思うとこういう設計になるんだなという学びがあった。外部サービスをうまく使ってLLM使ってNextjsで書く。

web制作

リンク

NHK「魔改造の夜」“電動マッサージ器 25mドラッグレース”今夜19時30分から

stealthinu 2024/05/31

おお！豊橋技科大がこんなところでも。すっかりロボコンでだけ有名な大学になったな… 今でも雨が降る前は鶏糞の匂いがしてウシガエルがヴォーヴォー鳴いてるんだろうか。

ネタ

リンク

性格重視で結婚した夫婦の末路

5年ほど前、「顔もファッションも微妙、実家も微妙、学歴も収入も何もかも微妙だけど性格がいいんだよな〜性格が一番大事…性格が大事なんだ…」といい聞かせて、もっといい人いるかもなぁ、この人と結婚かぁ〜…とあまり盛り上がらず結婚したいちおう恋愛結婚ではあるそしてなんとこの度、配偶者もまったく同じことに悩んでおり、不満タラタラながらも性格のよさ一点重視で結婚相手を選んでいたことが判明運命だネ普通に仲良いです性格が気に入ってるから外見もなんだかかわいく見えてきたし、こちらの好みにも寄せてくれてる結婚前にあれだけ悩んだ微妙感は払拭されて日常になった学歴やら年収も見栄張れるほどはないけど、実際対外的に自慢することもないしこれで十分でした思いやりがあって基本的に少しご機嫌な人間と住むのは最高です自分で金を稼ぎ家事を分担してくれる犬が居たらこんな感じかなぁ

stealthinu 2024/05/30

『自分で金を稼ぎ家事を分担してくれる犬が居たらこんな感じかなぁ』この表現がよすぎた

リンク

GitHub - DwangoMediaVillage/pydomino: 日本語音声に対して音素ラベルをアラインメントするためのツールです

stealthinu 2024/05/28

pydominoのgithubページ。C++で書いてある！そんでGPU不要！？onnxモデルちょうちっさい。なんというか完成されたプロダクトだわ。

リンク

はてなブックマーク

タグ

stealthinuのブックマーク (25,758)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス