“再トレーニングなしでLLMの検閲を解除できる「アブリタレーション」と呼ばれる手法について説明。モデルに組み込まれた拒否メカニズムを効果的に削除し、あらゆる種類のプロンプトに応答できるようにします。”

misshikimisshiki のブックマーク 2024/06/14 15:13

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

Uncensor any LLM with abliteration

    The third generation of Llama models provided fine-tunes (Instruct) versions that excel in understanding and following instructions. However, these models are heavily censored, designed to refuse r...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう