タグ

2023年8月19日のブックマーク (3件)

  • プログラマの実力は経験だけであがらないことがレベル格差につながる - きしだのはてな

    プログラマというのは、道具に慣れることが、実力があがることにならないのですよね。だから、勉強せず業務経験だけだとレベルが低いままということになってしまう。 Javaを10年さわり続けて、Strutsを5年さわり続けても、それだけでは、与えられた画面を手際よく作成できるようになるだけで、たとえばStrutsすらよりよく使えるようになるわけではなかったりする。 Javaにしても、「volatileってなんですか?」という問いに、まあ知らないのはしかたないとしても、解説を見ながらですら答えられない可能性がある。 プログラムの反復生産は、プログラミング能力の向上にあまりつながらない。設定や記述に慣れるだけだ。そして、この「慣れ」というのには「難しいからそもそも実装を回避する」というようなものも含まれる。実力の向上は、作業ができるレベルで止まってしまう。 プログラマとしての実力をあげるための勉強が自

    プログラマの実力は経験だけであがらないことがレベル格差につながる - きしだのはてな
    stealthinu
    stealthinu 2023/08/19
    これ10年前のエントリなのに今書かれたエントリとして読んでもまったく違和感ない。つまり本質的な指摘だったってことだな。
  • Ranking Japanese LLMs with Rakuda

    stealthinu
    stealthinu 2023/08/19
    Rakudaベンチの手法。決まった質問集を40題作ってありそれにモデルごとに答えさせた出力をモデルA vs モデルBでGPT3.5に比較させて勝ち負けを決めて勝敗結果からランキングレート値を出す。なるほど!
  • 日本語LLMのベンチマーク:「JGLUE」と「Rakuda Benchmark」|Baku

    LINEの「japanese-large-lm-instruction-sft」リリースに関する公式ブログで「Rakuda Benchmark」という日語LLMベンチマークがモデルの性能評価に使われていた。 これまで日語LLMのリリースでよく見たのは「JGLUE(日語一般言語理解評価)」というベンチマーク。何が違うのか簡単に調べてみた。 JGLUE(日語一般言語理解評価)「JGLUE」は、早稲田大学とYahoo! JAPANが構築・公開したベンチマーク。 ベンチマークの具体的な構成については、以下の記事に詳しい。 この「JGLUE」のスコアでLLMの日語性能をランク付けしたリーダーボードには、「Nejumi LLMリーダーボード」や、Stability AIによる「JP Language Model Evaluation Harness」がある。 Nejumi LLMリーダーボー

    日本語LLMのベンチマーク:「JGLUE」と「Rakuda Benchmark」|Baku
    stealthinu
    stealthinu 2023/08/19
    Rakuda Benchってなんだろ?と思ってたからありがたい。んでLLM使ったプロダクトの評価をどうするか問題、今まさにどうすればいいかと思ってたからとても参考になる。やはりGPT-4に評価という方向か。