タグ

2023年12月3日のブックマーク (3件)

  • 国産生成AIの開発進む「豊富な日本語の学習データが強み」 | NHK

    国内でも生成AIの開発が加速する中、京都府を拠点に研究を行う国立研究開発法人「情報通信研究機構」=NICTでは、豊富な日語の学習データを強みとした国産AIの開発を進めています。 京都府精華町にあるNICTデータ駆動知能システム研究センターの鳥澤健太郎フェローのチームは、生成AIの基盤となる「大規模言語モデル=LLM」をことし7月、開発に成功したと発表しました。開発にかかった期間はおよそ4か月です。 最大の特徴は、大規模な日語の学習データです。海外での開発が先行する生成AIでは、学習データは英語が中心で良質な日語のデータをどう確保するのかが課題となっています。 チームでは、これまで15年かけて膨大な日語のウェブサイトの情報を収集していて「アノテーター」と呼ばれる専門スタッフおよそ50人が学習データに不要な単語を取り除けるよう調整を行うなどして、ほかにはない良質な日語のデータを新聞1

    国産生成AIの開発進む「豊富な日本語の学習データが強み」 | NHK
    progrhyme
    progrhyme 2023/12/03
    情報通信研究機構発。「少なくとも他とは異なるユニークなものが作れると思う」人材不足が課題
  • 「カスタマイズできるGPT」に脆弱性。簡単だからこそ危険が潜む

    「カスタマイズできるGPT」に脆弱性。簡単だからこそ危険が潜む2023.12.03 11:00 Maxwell Zeff - Gizmodo US [原文] ( 福田ミホ ) 大事なデータをペラペラ開示しちゃうかも、と。 OpenAIは、カスタマイズしたチャットボットのマーケットプレイス「GPT Store」を立ち上げようとしています。 GPT Storeでは誰でも自分の用途に合わせたChatGPTを作れて、さらにそれを公開し、販売までできます。カスタマイズしたChatGPTは単に「GPT」と呼ばれ(ややこしくてすみません)、たとえばボードゲームのルールを解説してくれるGPTとか、算数を教えてくれるGPTといったものが考えられています。 目的に合わせてより詳細で信頼性の高い回答をしてくれるチャットボットがたくさんできるなら、それはかなりありがたいことです。が、サイバーセキュリティ企業のAd

    「カスタマイズできるGPT」に脆弱性。簡単だからこそ危険が潜む
    progrhyme
    progrhyme 2023/12/03
    プロンプトをハックすることで作ったGPTが複製されたり、学習に用いた機密情報が漏洩するリスクがある
  • スマートフォンアプリのA/Bテスト実装例 - エムスリーテックブログ

    これは エムスリー Advent Calendar 2023 の3日目の記事です。 前日は三浦さん(@yuba)による「9時間足すんだっけ引くんだっけ問題~あるいは、諸プログラミング言語はいかにタイムゾーンと向き合っているか」でした。 こんにちは、エムスリーエンジニアリンググループ・マルチデバイスチームの藤原です。 マルチデバイスチームでは複数のスマートフォンアプリを開発しており、新機能の追加やレイアウト変更をする際はA/Bテストをすることもしばしばです。 今回は弊チームで採用しているA/Bテストの実装方法を2通り紹介します。 スマートフォンアプリのA/Bテスト Remote Configを用いた実装例 GraphQLを用いた実装例 GraphQLで実装してみてちょっとした感動があった We are hiring!! スマートフォンアプリのA/Bテスト A/Bテストとは、特定の要素を変更し

    スマートフォンアプリのA/Bテスト実装例 - エムスリーテックブログ
    progrhyme
    progrhyme 2023/12/03
    "Remote Configによる実装ではコンテンツを取得できてA/B振分けの情報を取得できないケースが起こり得るが、GraphQLの場合は必ず同時に情報を取得できる"