はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    ノーベル賞

『qiita.com』

  • 人気
  • 新着
  • すべて
  • 最近(~2024年5月)公開された LLM の性能を ELYZA-tasks-100 で比較してみた - Qiita

    3 users

    qiita.com/wayama_ryousuke

    TL;DR 海外勢: Microsoft の Phi-3 は日本語応答性能も高い。Apple の OpenELM は日本語未対応 国内勢: Karakuri LM 8x7B は Phi-3 small とほぼ互角の性能、Fugaku LLM 13B は日本語の理解能力はありそうだが ELYZA-tasks-100 の得点は伸びず はじめに 前回の記事では、2024年4月にリリースされた LLM 3種(Llama3, Command R+, Phi-3 mini)に焦点をあてて、ELYZA-tasks-100 によるベンチマーク評価の結果をご紹介しました。 その後も国内・海外から続々とモデルがリリースされているので、今回はそれらを比較してみたいと思います。評価するのは次のモデルです。 Phi-3 small/medium OpenELM Fugaku LLM 13B Instruct Kar

    • テクノロジー
    • 2024/06/04 23:29
    • 最近(2024年4月)公開された LLM を ELYZA-tasks-100 で性能評価してみた - Qiita

      3 users

      qiita.com/wayama_ryousuke

      Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? TL;DR Command-R-Plus, Llama-3, Phi-3 mini を ELYZA-tasks-100 で評価しました Command-R-Plus と Llama-3 70B の性能は既存モデルを大きく上回り、ELYZA-tasks-100 ベンチマークのトップを争っています はじめに 2024 年に入ってからも、数々の LLM が公開されています。特に Cohere や Meta、Microsoft など AI 業界の大手が開発したモデルが、オープンアクセスモデルとして非常に高い性能をもち、話題となっています。 Co

      • テクノロジー
      • 2024/05/13 18:58
      • 日本語LLM 9種を量子化して回答内容を比較調査してみた - Qiita

        39 users

        qiita.com/wayama_ryousuke

        Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? TL;DR 量子化しても成績が下がりにくいモデルと、大きく下がるモデルがある 一部のモデルは量子化すると回答が極端に短くなる 量子化によって回答が短くなる度合いは、量子化前モデルの回答の長さと相関がある可能性がある はじめに 皆さんは量子化したLLMを使っていますか? 深層学習における量子化(quantization) とは、モデルのパラメータを少ないビット数で表現することです。 通常のモデルは float32 などの高精度なデータ型を使ってパラメータを表現しますが、この精度を float16 や int8 に下げることを量子化といいま

        • テクノロジー
        • 2024/04/10 18:34
        • LLM
        • 機械学習
        • 自然言語処理
        • qiita
        • 言語
        • あとで読む
        • ELYZA-tasks-100 でLLM14個の日本語性能を横断評価してみた - Qiita

          31 users

          qiita.com/wayama_ryousuke

          TL;DR 14個の「日本語が話せるLLM」(日本製・外国製問わず)の性能を、日本語データセット ELYZA-tasks-100 で横断評価しました 海外勢70Bモデルの性能が高いことがわかりました。7Bでは ELYZA-japanese-llama-2 や CALM2 の成績がよかったです モデルの回答・スクリプトへのリンクは記事内に貼っています JGLUE などのベンチマークは、モデルの性能を反映しているのか? 2023年は、かつてないほど多くの LLM が(クローズド・パブリック問わず)公開され、まさに LLM フィーバーの年でした。 一方で、どのモデルが高性能なのか、自分の利用用途に合ったモデルはどれなのか、とお悩みの方も多いのではないでしょうか。 LLM の性能を比較するときに役立つのが、ベンチマークです。 英語圏の LLM に関していえば、MMLU や HellaSwag、Wi

          • テクノロジー
          • 2023/12/20 11:23
          • LLM
          • qiita
          • あとで読む
          • ネタ
          • pix2pixで数日遊んだら数ヶ月のお仕事の成果を超えた件 - Qiita

            14 users

            qiita.com/wayama_ryousuke

            はじめに 今年もFOSS4G年末隠し芸大会(違)の時期がやってまいりました。前回はちょっと変態じみた投稿をしましたが、今回は真面目にディープラーニング周りとFOSS4Gを絡めたお話をしてみたいと思います。 pix2pixについて 最近pix2pixと言うプログラムがDNN界隈で話題になっておりますので、聞いたことがある方も多いかと思います。モノクロをカラーにしたりラベルを画像にしたり、イラストを作ったり等など、これもまでもエポックメイキング的なDNNが次々と発表されていきましたが、今回のこれはそれらを単一のニューラルネットワークでやっちゃいましたというとんでもないお話であります。 もともとDNNは汎化性能が高いと言われていますが、それでもドメインをまたいだ処理に関しては難しく、特定の問題に対してネットワーク設計するのが一般的でした。 今回のpix2pixは2つの変換前後の画像を用意するだけ

            • テクノロジー
            • 2016/12/07 13:14
            • pix2pix
            • 機械学習

            このページはまだ
            ブックマークされていません

            このページを最初にブックマークしてみませんか?

            『qiita.com』の新着エントリーを見る

            キーボードショートカット一覧

            j次のブックマーク

            k前のブックマーク

            lあとで読む

            eコメント一覧を開く

            oページを開く

            はてなブックマーク

            • 総合
            • 一般
            • 世の中
            • 政治と経済
            • 暮らし
            • 学び
            • テクノロジー
            • エンタメ
            • アニメとゲーム
            • おもしろ
            • アプリ・拡張機能
            • 開発ブログ
            • ヘルプ
            • お問い合わせ
            • ガイドライン
            • 利用規約
            • プライバシーポリシー
            • 利用者情報の外部送信について
            • ガイドライン
            • 利用規約
            • プライバシーポリシー
            • 利用者情報の外部送信について

            公式Twitter

            • 公式アカウント
            • ホットエントリー

            はてなのサービス

            • はてなブログ
            • はてなブログPro
            • 人力検索はてな
            • はてなブログ タグ
            • はてなニュース
            • ソレドコ
            • App Storeからダウンロード
            • Google Playで手に入れよう
            Copyright © 2005-2025 Hatena. All Rights Reserved.
            設定を変更しましたx