並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 10 件 / 10件

新着順 人気順

GPT-2の検索結果1 - 10 件 / 10件

  • プログラマ視点での生成AIとの付き合い方

    プログラミングについて、最近考えてることについてのポエム。 基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。 生成AIの進化速度を予測しておく 今大事なことは、今AIがどの程度の性能かという定点の話ではなく、その進化の速度を認識すること。 コード生成というタスクにおいて、生成AIモデルを人間に当てはめると、こんな感じの人物像を自分は持っている。 GPT-4: プログラミング経験2年目の大学2年生 Claude-3-Opus: プログラミング経験3年目の大学3年生 ここでいうn年目は、業務経験ではなく、プログラミングの単位がある大学での、教育課程としての経験年数。今のひたすら学習量を増やす方式だと、単に1年に1年分ぐらい賢くなっ

      プログラマ視点での生成AIとの付き合い方
    • OpenAI元社員リーク文書から読み解くAGIと人類の未来|遠藤太一郎

      はじめにOpenAIの元社員がリークした文書が話題になっています。「Situational Awareness: The Decade Ahead」と題されたこの文書は、AGI(汎用人工知能)や超知能の開発と、それがもたらす影響について詳細に分析している内容です。 この元社員はOpenAIのスーパーアラインメントチームに所属ということで、まさにこの文書の内容を専門として扱っていた方です。 AGIやその先の超知能への道筋、そして超知能時代に何が起こるのかとその対策に関して、ここまでまとまった文書をみたのは初めてでした。 そこで、この文書の内容を解説するスライドを作成してみました。元の文書は英語で165ページ程あるため、元々は私自身が素早く概要を掴むために、AI(Gemini 1.5 Pro)で要約したものがベースになっています。 AIの要約は間違う可能性があるので、全ての内容に引用元を記載し

        OpenAI元社員リーク文書から読み解くAGIと人類の未来|遠藤太一郎
      • OpenAIがGPT-4の思考を1600万個の解釈可能なパターンに分解できたと発表

        GPT-4などの大規模言語モデルは非常に高い性能を有していますが、各モデルがどのような思考を経て応答を出力しているのかは開発者ですら把握できていません。新たに、OpenAIが大規模言語モデルの思考を読み取る手法を開発し、GPT-4の思考を1600万個の解釈可能なパターンに分解できたことを発表しました。 Extracting Concepts from GPT-4 | OpenAI https://openai.com/index/extracting-concepts-from-gpt-4/ Scaling and evaluating sparse autoencoders https://cdn.openai.com/papers/sparse-autoencoders.pdf 一般的なソフトウェアは人間の設計に基づいて開発されているため、各機能の仕組みを理解した上で機能を修正したり安

          OpenAIがGPT-4の思考を1600万個の解釈可能なパターンに分解できたと発表
        • OpenAIの共同設立者が「GPT-2」をわずか90分の時間と3100円の費用で再現するレポートを公開

          2019年に公開されるやいなや「危険すぎる」と話題になったOpenAIの「GPT-2」を、ゼロから作成したレポートが公開されました。作成にかかった時間は、1時間14ドル(約2200円)のクラウドコンピューティングサービスで1時間半だったため、総コストは約20ドル(約3100円)に収まっています。 Reproducing GPT-2 (124M) in llm.c in 90 minutes for $20 · karpathy/llm.c · Discussion #481 · GitHub https://github.com/karpathy/llm.c/discussions/481 # Reproduce GPT-2 (124M) in llm.c in 90 minutes for $20 ✨ The GPT-2 (124M) is the smallest model in t

            OpenAIの共同設立者が「GPT-2」をわずか90分の時間と3100円の費用で再現するレポートを公開
          • Introduction - SITUATIONAL AWARENESS: The Decade Ahead

            Leopold Aschenbrenner, June 2024 You can see the future first in San Francisco. Over the past year, the talk of the town has shifted from $10 billion compute clusters to $100 billion clusters to trillion-dollar clusters. Every six months another zero is added to the boardroom plans. Behind the scenes, there’s a fierce scramble to secure every power contract still available for the rest of the deca

              Introduction - SITUATIONAL AWARENESS: The Decade Ahead
            • GitHub - karpathy/LLM101n: LLM101n: Let's build a Storyteller

              What I cannot create, I do not understand. -Richard Feynman In this course we will build a Storyteller AI Large Language Model (LLM). Hand in hand, you'll be able create, refine and illustrate little stories with the AI. We are going to build everything end-to-end from basics to a functioning web app similar to ChatGPT, from scratch in Python, C and CUDA, and with minimal computer science prerequi

                GitHub - karpathy/LLM101n: LLM101n: Let's build a Storyteller
              • Firefox、オンデバイスAIで画像のAltテキストを自動生成する実験的機能を導入、スクリーンリーダーのユーザーに利便性

                Firefoxの開発元であるMozillaは、Webページ上の画像のAltテキストをオンデバイスAIモデルを使用して自動的に生成する実験的な機能を、9月にリリースされる予定のFirefox 130で導入することを明らかにしました。 この機能は、Firefoxに搭載されているPDFエディタの一部となる予定です。 最終目標としては、Webページを音声で読み上げるスクリーンリーダーを使用している視覚障害者などのユーザが一般的なブラウジングで利用できるようにすることとされています。 オンデバイスAIでAltテキストを生成する理由 画像のAltテキストは、Webページで画像が表示できないときに、画像の代わりに使われるテキストの情報です。しかし、Altテキストが設定されていない画像は多くのWebページで存在します。 今回のMozillaの取り組みは、こうしたAltテキストが設定されていない画像を含むW

                  Firefox、オンデバイスAIで画像のAltテキストを自動生成する実験的機能を導入、スクリーンリーダーのユーザーに利便性
                • Migrating OCR Enhancement from GPT-4 Turbo Vision Preview to GPT-4 Turbo GA

                  The introduction of Optical Character Recognition (OCR) enhancement as a component of the GPT-4 Turbo Vision Preview was aimed at generating higher-quality responses for dense texts, transformed images, and number-heavy financial documents. Although, the recent announcement regarding the GPT-4 Turbo 2024-04-09 General Availability (GA) model indicated that the OCR enhancement is not included in th

                    Migrating OCR Enhancement from GPT-4 Turbo Vision Preview to GPT-4 Turbo GA
                  • AIは過大評価どころではない 今後10年間の状況認識 - FIRE: 投資でセミリタイアする九条日記

                    この数年はAIブームです。特に株式市場では「AIにあらずんば会社にあらず」ってくらい、AI銘柄の評価が高まっています。この状態に対して「投資家はバブルを煽っている。AIなんてExcelにも及ばない」と評価する人もいます。ぼくは、AIはインターネットを超える、人類存続を左右するほどのイノベーションだと見ています。 AIは世界に何をもたらすのか?「SITUATIONAL AWARENESS The Decade Ahead」(今後10年間の状況認識)と題したエッセイを簡単に読み解きながら、これからのAIの行く末を占ってみたいと思います。 AIは過大評価? 生成AIはカンブリア紀にある AIはインターネットどころではない! 状況認識:今後の10年レオポルド・アッシェンブレンナー、2024年6月 AIは過大評価? 藤沢数希氏が、AIについて次のようにポストしていました。 ざっくりと世界経済に与える

                      AIは過大評価どころではない 今後10年間の状況認識 - FIRE: 投資でセミリタイアする九条日記
                    • プロンプトを5倍圧縮できる「LLMLingua-2」

                      導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、サービスのシステム開発を行なっています。サービスではLLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 本記事では、入力するプロンプトの圧縮を効率的に行うための技術、LLMLingua-2について解説します。 LLMLingua-2は、いくつかの手法を組み合わせることによって、品質を下げないままプロンプトを圧縮してくれます。 サマリー LLMLingua-2は以下の方法で、情報の欠落を抑えた上でプロンプトのトークン数を大幅に減らすことに成功しています。 ターゲットとなるLLM(GPT-4など)にプロンプトの圧縮タスクを行なってもらう そのデータを基に入力したプロンプトを構成するトークンの不要、必要を判断する機械学習モデルを作成する 入力に対して上記機械学習

                        プロンプトを5倍圧縮できる「LLMLingua-2」
                      1