並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 6 件 / 6件

新着順 人気順

ベンチマークの検索結果1 - 6 件 / 6件

  • 連番IDを使うと会社が潰れる。(訳: 連番とUUIDのベンチマークを取ってみた❤️)

    大いなる流れには逆らえない あるAI研究者が言っていた、私の仕事もいつか AI に奪われるという言葉が非常に印象的だった。 私は一時期自分のキャリアに危機感を覚えAIに関する情報を集めていた。そのとき見つけたYoutube動画でこのようなことが語られていたのである。 ではなぜ彼らは研究を続けるのかと思うかもしれないが、個人や一団体がそれを放棄したところで世の中のイノベーションの流れを止めることは不可能だろう。 平和を望む国々も兵器開発をやめられないのと似たようなものだ。 私がこの記事のタイトルを思いついたとき、つい溜息が出た。あまり楽しくない思い出があるからだ。 ただ、思いついてしまった以上これを世に出さないわけにもいかず、血の涙を流しながらこの記事を書いている。 私というちっぽけな存在では、この大宇宙の大いなる流れには逆らえないのだ。 申し遅れました。私、YadaYadaKonnanYa

      連番IDを使うと会社が潰れる。(訳: 連番とUUIDのベンチマークを取ってみた❤️)
    • 今PCを買うなら「AI PC」にしようと決めた理由 【実用レビュー 最終回】やっぱり最新モデルだとベンチマークテストで実感

      日本HPの14型モバイルPC「Envy x360 Laptop 14-fc(インテル)」は、Core Ultra シリーズ1(開発コード名:Meteor Lake)を搭載した「AI PC」だ。これまで使っていた、同じく14型のモバイルPCであるNECパーソナルコンピュータのモバイルPC「LAVIE NEXTREME Carbon」(PC-XC950DAG)からリプレースしてPC USERの記事制作に使い込んできた。 今回は最終回として、性能面の比較を中心に触れていこう。 →今PCを買うなら「AI PC」にしようと決めた理由 【実用レビュー 第3回】キーボードやタッチパッドは使いやすい? ビデオ会議はどうだ?

        今PCを買うなら「AI PC」にしようと決めた理由 【実用レビュー 最終回】やっぱり最新モデルだとベンチマークテストで実感
      • iPhone 16 ProのA18 Proチップ、ベンチマークでM1を上回る - こぼねみ

        iPhone 16 Proに搭載されているA18 Proチップのベンチマーク結果が公開され、M1チップを超える非常に良いスコアとなっています。 Geekbenchスコアでは、シングルコアが3429、マルチコアが8790となっています。iPhone 15 ProのA17 Proチップよりも約15~20%速く、iPhone 15のA16 Bionicチップよりも30~35%速いです。これらの数値は、Appleの発表イベントでの主張とも一致しています。 A18 ProA18 Proチップはまた、Mac用の最初のAppleシリコンチップであるM1チップに迫ろうとしています。ほとんどのGeekbenchスコアで、A18 ProはM1チップを上回っています。もちろん、ベンチマークは必ずしも実際のパフォーマンスを示しているとは限りませんが、ベンチマークを確認することはまた非常に興味深いことでもあります。

          iPhone 16 ProのA18 Proチップ、ベンチマークでM1を上回る - こぼねみ
        • MacのM4チップのベンチマーク登場 iPad ProのM4やMacのM3と比較 - こぼねみ

          Appleは10月下旬に最初のM4 Macモデルの発表を予定していますが、そのうちの1つとされるベンチマークがGeekbenchで公開され、M4 iPad Proや前世代のM3 Macと比較してどのようなパフォーマンス向上があるのか確認できます。 今回登場したのは標準的なM4チップで、Mac miniと14インチMacBook Proモデルに搭載される見込みです。MacBook ProとMac miniの上位モデルにはM4 ProとM4 Maxチップが搭載されると予想されるが、これらのベンチマークはまだ出てきていません。 Apple M4未発表モデル「Mac16,1」は、10コアCPUを搭載し、シングルコアスコア3864、マルチコアスコア15288となっています。 比較として、9コアCPUを搭載したベースモデルのM4 iPad Proは、シングルコアスコアが3647、マルチコアスコアが13

            MacのM4チップのベンチマーク登場 iPad ProのM4やMacのM3と比較 - こぼねみ
          • LLMの日本語ロールプレイ能力を計測するベンチマーク「Japanese-RP-Bench」の概要と評価結果などのまとめ

            はじめに LLMのマルチターン対話における日本語ロールプレイ能力を計測するベンチマーク「Japanese-RP-Bench」を構築し、以下のリポジトリにて公開しました。 本記事では、構築に至った経緯やベンチマークの概要、評価結果などをまとめます。ベンチマークの実行方法についてはリポジトリをご確認ください。 また、結果だけを見たい方は結果のセクションをご覧ください。 概要 構築に至った背景 今回、以下のような背景・考えからこのベンチマークの構築に至りました。 LLMのロールプレイ的な用途での需要は比較的高いが、このタスクでの性能を計測するようなベンチマークが現状日本語では存在しない Japanese MT-BenchにはRoleplayのカテゴリが存在するが、大したロールプレイにはなっていない ロールプレイタスクに限らず、「対話の楽しさ」のような抽象的なものを測ろうとするオープンなLLMベン

              LLMの日本語ロールプレイ能力を計測するベンチマーク「Japanese-RP-Bench」の概要と評価結果などのまとめ
            • 最新ベンチマークで判明、Claude3.5 Sonnetがトップも、オープンソースモデルが怒涛の追い上げ 大きく変化するAIモデルのランドスケープ | AMP[アンプ] - ビジネスインスピレーションメディア

              最新ベンチマーク、「Hallucination Index」 1年ほど前まで、大規模言語モデル(LLM)は、いわゆるクローズドソースモデル、特にGPT-4が圧倒的な性能を誇っており、さまざまなベンチマーク/リーダーボードにおいて、トップを独占する状態が続いていた。 しかし現在、その状況は大きく変わりつつある。競合クローズドソースモデルの追い上げに加え、オープンソースモデルの躍進により、多極化が進んでいるのだ。開発者やユーザーにとってGPT-4以外の選択肢が大幅に増えたことを意味しており、AIアプリケーションの最適化や低コスト化が一層進む可能性が高まっている。 この状況を如実に示すベンチマークの1つがAIスタートアップGalileoの「Hallucination Index」の最新版だ。Galileoは22の主要な大規模言語モデルを対象に、不正確な情報を生成する傾向(ハルシネーション)を評価

                最新ベンチマークで判明、Claude3.5 Sonnetがトップも、オープンソースモデルが怒涛の追い上げ 大きく変化するAIモデルのランドスケープ | AMP[アンプ] - ビジネスインスピレーションメディア
              1