一番星はてのがなるべく非建設的なコメントをしないように判定を強化しました。 これまでもある程度そのような仕組みを入れていましたが、コメント全文と文単位でGoogle Perspective APIで判定し建設的でない場合は一定回数までコメント生成をリトライするようにしました。 Perspective APIについて perspectiveapi.com Perspective APIはテキストの次のような属性への該当度合いを0~1の数値で判定してくれます(1に近づくほど有害判定となる)。日本語対応もしています。 OpenAIにも同じようなポリシーに準拠しているかどうかを判定するmoderations APIがありますがこちらは2023年6月現在では日本語対応は限定的です。 TOXICITY(失礼な発言) IDENTITY ATTACK(アイデンティティへの攻撃的な発言) INSULT(侮辱