stealthinuのブックマーク / 2023年8月19日

stealthinu id:stealthinu

2023年8月19日のブックマーク (3件)

プログラマの実力は経験だけであがらないことがレベル格差につながる - きしだのはてな
プログラマというのは、道具に慣れることが、実力があがることにならないのですよね。だから、勉強せず業務経験だけだとレベルが低いままということになってしまう。 Javaを10年さわり続けて、Strutsを5年さわり続けても、それだけでは、与えられた画面を手際よく作成できるようになるだけで、たとえばStrutsすらよりよく使えるようになるわけではなかったりする。 Javaにしても、「volatileってなんですか？」という問いに、まあ知らないのはしかたないとしても、解説を見ながらですら答えられない可能性がある。プログラムの反復生産は、プログラミング能力の向上にあまりつながらない。設定や記述に慣れるだけだ。そして、この「慣れ」というのには「難しいからそもそも実装を回避する」というようなものも含まれる。実力の向上は、作業ができるレベルで止まってしまう。プログラマとしての実力をあげるための勉強が自
stealthinu 2023/08/19
これ10年前のエントリなのに今書かれたエントリとして読んでもまったく違和感ない。つまり本質的な指摘だったってことだな。

programming

仕事

考え方
リンク
Ranking Japanese LLMs with Rakuda
stealthinu 2023/08/19
Rakudaベンチの手法。決まった質問集を40題作ってありそれにモデルごとに答えさせた出力をモデルA vs モデルBでGPT3.5に比較させて勝ち負けを決めて勝敗結果からランキングレート値を出す。なるほど！

deeplearning

LLM
リンク
日本語LLMのベンチマーク：「JGLUE」と「Rakuda Benchmark」｜Baku
LINEの「japanese-large-lm-instruction-sft」リリースに関する公式ブログで「Rakuda Benchmark」という日本語LLMベンチマークがモデルの性能評価に使われていた。これまで日本語LLMのリリースでよく見たのは「JGLUE（日本語一般言語理解評価）」というベンチマーク。何が違うのか簡単に調べてみた。 JGLUE（日本語一般言語理解評価）「JGLUE」は、早稲田大学とYahoo! JAPANが構築・公開したベンチマーク。ベンチマークの具体的な構成については、以下の記事に詳しい。この「JGLUE」のスコアでLLMの日本語性能をランク付けしたリーダーボードには、「Nejumi LLMリーダーボード」や、Stability AIによる「JP Language Model Evaluation Harness」がある。 Nejumi LLMリーダーボー
stealthinu 2023/08/19
Rakuda Benchってなんだろ？と思ってたからありがたい。んでLLM使ったプロダクトの評価をどうするか問題、今まさにどうすればいいかと思ってたからとても参考になる。やはりGPT-4に評価という方向か。

deeplearning

LLM
リンク
- 2023年8月21日
- 2023年8月19日
- 2023年8月18日