2025年2月2日のブックマーク (2件)

  • 何かと話題のDeepSeekをMacのローカル環境で実行してみた! - Qiita

    これらのモデルは、元のモデルに比べるとかなり小型化されています。 蒸留(ディスティレーション)を通じてモデルを“圧縮”することで、推論の速度を向上させ、一般的なPCiPhone等のスマートフォンでも動作可能なレベルに調整されています。 驚異のパフォーマンス:小型でも特定タスクでGPT-4oを超える? DeepSeekのテクニカルペーパーによると、Distilled Modelsのベンチマークテストでは、 「8Bパラメータのモデルでさえ、特定のタスクにおいてGPT-4o(昨年5月時点のバージョン)を上回る」 という結果が出ています。 ただし、これは数学やコード生成といった特定のタスクに特化したトレーニングを行った場合の話です。 総合的な文章生成や知識カバー率では、依然としてGPT-4oやClaude、o1などのフロンティアモデルのほうが優れています。 つまり、 「タスクによってはローカルモ

    何かと話題のDeepSeekをMacのローカル環境で実行してみた! - Qiita
    makiskyster
    makiskyster 2025/02/02
    “share”
  • 仕事に集中している時に割り込みが入って生産性が落ちる状態を表す「注意残余」という概念、もっと浸透してほしい

    相沢陽菜 @fetus_hina コーディングとかしてるエンジニアは一旦集中が外れると頭の中のメモリが飛んで一時間分くらい平気で損することがあるのを理解して言うんならどうぞ、ってかんじ x.com/nekomimi999/st… 2025-01-31 17:51:02 ぐれさん @grethlen いきなり話かけられるなどして脳に割り込みが入ると、しばらく生産性落ちる状態を表す "注意残余" (attention residue) という言葉がございまして。プログラミングの文脈だけじゃなく、頭脳労働一般を指せるので、もっと流行ってほしい。 2025-01-31 21:42:30

    仕事に集中している時に割り込みが入って生産性が落ちる状態を表す「注意残余」という概念、もっと浸透してほしい