2023年4月1日のブックマーク (4件)

  • 無料GPT-4アプリの公開とクリーンデータセットの作成について|kun1emon

    どうもこんにちは。最近、大規模言語モデル(LLM)の個人開発に取り組んでいる@kun1em0nと申します。この度、最近話題のChatGPTの最新モデルGPT-4を無料で使用できるアプリを作成したので公開いたします。今回アプリを無料で公開する意図についてこの記事で説明したいと思います。 Japanese-Alpaca-LoRAの作成前回の記事ではスタンフォード大学が作成したStanford Alpacaの日語対応モデル Japanese-Alpaca-LoRAを作成し公開した話を紹介しました。 このモデルの作成に使ったデータの大元(Alpacaデータ)はText-davinci-003というOpenAIサービスで出力した結果になりますが、OpenAIの利用規約ではコンテンツ生成者はOpenAIサービスで出力した結果を競合モデルの開発用途に使用してはならないと記載されています。ただ、コンテン

    無料GPT-4アプリの公開とクリーンデータセットの作成について|kun1emon
  • 大規模言語モデルの知識を補完するための Retriever の紹介 - ACES エンジニアブログ

    こんにちは、株式会社ACESでインターンをしている篠田 (@shino__c) と申します。普段は博士課程の学生としてNLPの研究をしています。 ここ数ヶ月で ChatGPT に加えて GPT-4 等の大規模言語モデル (LLM) が次々とリリースされていますね。 ChatGPT (gpt-3.5-turbo) はAPIの使用料が安いことから、多くの人が気軽にLLMを使用できるようになり、AI、特にNLPを売りにしている多くの企業は技術的にどうやって競争優位性を築けばいいのか模索しているのではないでしょうか。 その問いに対する1つの答えになりそうなものに、Retriever というものがあります。 例えば、社内にある外部には出せない文書を元に顧客からの質問に答える質問応答のサービスを作りたい場合、ChatGPT のような LLM の訓練にはそのようなデータは使われていないため、prompt

    大規模言語モデルの知識を補完するための Retriever の紹介 - ACES エンジニアブログ
  • 【Copilot はじめました】GitHub Copilot 導入におけるハードルの整理 - M&Aクラウド開発者ブログ

    こんにちは。M&AクラウドのEMの鈴木です。M&Aクラウドでは GitHub Copilot(以下Copilotと呼びます)を導入してみることになりました。導入にあたり一般に言われているCopilotのリスクを元に、弊社なりに整理してみました。この記事はその学びを共有するものです。最近は GPT-4をベースにした「Copilot X」も発表されて Copilot を導入しようか迷っている方も多いかと思いますが、導入の際の意思決定の参考になったら幸いです。 GitHub Copilot とは Copilot 関係のリリース状況整理 GitHub Copilot for Business GitHub Copilot X セキュリティ・ライセンス問題に関する論点 Copilot 経由で弊社コードが流出するセキュリティ上の懸念に対するチェック プライバシーポリシーを見てみる Copilot を使

    【Copilot はじめました】GitHub Copilot 導入におけるハードルの整理 - M&Aクラウド開発者ブログ
  • Webサーバーアーキテクチャ進化論2023

    はじめに 最近プログラマーとしてのキャリアに一区切りつけようと思っており、これまでのプログラミングの勉強の集大成となるブログを書きたくなったので書く。初めてプログラミングをして、フロントエンド開発をして、サーバーから値が返ってきたときは「どういう仕組みで値が返ってきたんだ?」と疑問に思っていた。ずっと理解したくて理解できていなかった。だからずっと勉強していた。そして最近になってようやく自分の言葉で説明できるようになった気がしたのでブログを書きたい。 2015 年版が自分の原点であり、この記事を書くモチベーションになった このような記事は実は過去に存在している。 FYI: https://blog.yuuk.io/entry/2015-webserver-architecture その記事はサーバーがどういう仕組みで動いていて、どのように進化し、2015 年に至るかを解説してくれた記事だ。自

    Webサーバーアーキテクチャ進化論2023