samurairodeoのブックマーク / 2023年10月20日

LLM-jp-13B を公開しました

LLM-jp （LLM 勉強会）は、日本語と英語を中心に事前学習した130億パラメータの大規模言語モデルをオープンなライセンスで公開しました。また、インストラクションデータでチューニングしたモデルや訓練・チューニングに用いたソフトウェアも公開しており、今後データセット等も順次公開していきます。詳細は以下のページをご覧ください。プレスリリース（国立情報学研究所）公開しているモデル・コーパス・ツール LLM-jp-13B 構築・公開に貢献した方々

samurairodeo 2023/10/20

あとで読む

リンク

kaggle LLMコンペ　上位解法まとめ

はじめに科学分野の5択問題を解くLLMの精度を競うKaggle - LLM Science Exam というkaggleコンペが2023/10/11まで開催されていました。コンペ終了後に公開された上位チームの解法からたくさん学びがあったので、備忘録も兼ねてまとめていきたいと思います。コンペ概要問題文（prompt）とA~Eの選択肢（option）が与えられ、それを解くモデルの精度を競うコンペでした。テストデータはSTEM分野のWikipedia記事からGPT3.5に作成させたことがDataタブで明言されていました。上位チーム解法まとめ 1. Approach 全てのチームが、問題の生成元となった記事をwikiテキストデータセットから検索（Retrieval）し、関連するテキスト（context）もモデルに入力するRAGと呼ばれるアプローチを採用していました。 RAGを行わないと

samurairodeo 2023/10/20

あとで読む

リンク

「ChatGPT」、ウェブブラウジング機能が正式リリース--有料版ユーザー限定で

OpenAIは、ChatGPTでインターネットにリアルタイムでアクセスして、情報源へのダイレクトリンクを表示できるウェブブラウジング機能を、米国時間9月27日付の「X」（旧Twitter）への投稿で発表していた。ただしこの時点では、この追加機能は「ChatGPT Plus」と「ChatGPT Enterprise」に加入している有料版ユーザーにのみ、ベータ版という形で提供されていた。これにより、有料版ユーザーはChatGPTをベータモードに切り替えることで、2021年9月以前の情報にしかアクセスできないという制限から解放されていた。 OpenAIは10月17日、ブラウジング機能がベータ版から移行したことをリリースノートで明らかにした。これにより、ブラウジング機能にアクセスするのにベータモードに切り替える必要がなくなり、有料版ユーザーにとっての使い勝手が向上した。有料版ユーザーが行うべき

samurairodeo 2023/10/20

あとで読む

リンク

自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO

自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみたはじめに今回は、OpenAIのWhisper APIとAmazon Transcribeという2つの音声文字起こしサービスを試し、それぞれの精度を比較してみました。 Amazon Transcribeは、音声をテキストに変換する自動音声認識サービスです。ストリーミングとバッチ処理のどちらでも文字起こしが可能です。攻撃的な言葉を指定すると、Amazon Transcribeがそれらの言葉を文字起こしから自動的に削除する語彙フィルタリングなどの機能もあります。 Amazon Transcribeの詳細は、下記の記事をご参考ください。 OpenAIには音声をテキストに変換する「Whisper」という音声認識モデルがあり、WhisperをAPIの形で呼び

samurairodeo 2023/10/20

あとで読む

リンク

My annual letter: Leading in a new era

Agree & Join LinkedIn By clicking Continue, you agree to LinkedIn’s User Agreement, Privacy Policy, and Cookie Policy. Sign in to view more content Create your free account or sign in to continue your search

samurairodeo 2023/10/20

あとで読む

リンク

Microsoft 2023 Annual Report

samurairodeo 2023/10/20

あとで読む

リンク

「それは、本当に安全なんですか？」　セキュリティ専門家が「GitHub Copilot」の全社一斉導入時に考えたあれこれ

「GitHub Copilot 導入時に考えたセキュリティのあれこれ」というタイトルで登壇したのは、freee株式会社のただただし氏。タイミー社主催の「GitHub Copilotで拓く開発生産性」で、「GitHub Copilot 」を全社一斉導入する際に考えるべきセキュリティリスクについて発表しました。 freee株式会社 PSIRT マネージャーのただただし氏ただただし氏：freee株式会社のただただしと申します。今日は、「GitHub Copilot 導入時に考えたセキュリティのあれこれ」ということで、Copilotのセキュリティリスクについて語るわけですが、考えてみたら、GitHubの中の人を前にこんなことをしゃべるのは相当大胆な話だと思います。最後にいいことで締めるのでちょっと我慢してください。自己紹介をいたします。ただただしと申します。PSIRTという組織でマネージャー

samurairodeo 2023/10/20

あとで読む

リンク

「GPT-4」は論文の査読ができるか？　米スタンフォード大らが検証　参加者の80％以上「AI査読は有益」

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 米スタンフォード大学、米ノースウェスタン大学、米コーネル大学に所属する研究者らが発表した論文「Can large language models provide useful feedback on research papers？ A large-scale empirical analysis」は、大規模言語モデル（LLM）が研究論文の査読を行えるかを調査した研究報告である。この検証のため、論文の査読を自動で行うシステムと、LLMによる査読コメントと人間による査読コメントとの間の共通点を探るシステムを開発した。学術雑誌に投稿される研究

samurairodeo 2023/10/20

あとで読む

リンク

AWS 内で大規模言語モデルを利用できる Amazon Bedrock を使って作る RAG アプリケーション - クックパッド開発者ブログ

こんにちは。機械学習グループの深澤(@fukkaa1225)です。先日、Amazon Bedrock が一般利用できるよう(GA)になりました。本記事ではこちらを用いて RAG(Retrieval-augmented generation) アプリケーションを作成してみた様子と、他 LLM モデルとの比較結果についてご紹介します。 Amazon Bedrock とは aws.amazon.com 公式サイトより文言を引用します。 Amazon Bedrock は、Amazon や主要な AI スタートアップ企業が提供する基盤モデル (FM) を API を通じて利用できるようにする完全マネージド型サービスです。そのため、さまざまな FM から選択して、ユースケースに最も適したモデルを見つけることができます。Amazon Bedrock のサーバーレスエクスペリエンスにより、すぐに FM

samurairodeo 2023/10/20

あとで読む

リンク

ZOZOTOWNにおける開発生産性向上に関する取り組み / Initiatives to Improve Development Productivity at ZOZOTOWN

■ ZOZOエンジニア向け会社説明資料 https://speakerdeck.com/zozodevelopers/company-deck ■ 運用改善によるチームパフォーマンス向上のための取り組み https://tech blog.zozo.com/entry/operational-improvements-tips ■ GitHub Copilotの全社導入とその効果 https://tech blog.zozo.com/entry/introducing_github_copilot

samurairodeo 2023/10/20

あとで読む

リンク

パラメーター1750億個、産総研・東工大など世界トップレベル「ＬＬＭ」公開へニュースイッチ by 日刊工業新聞社

産業技術総合研究所と東京工業大学、国立情報学研究所などは、世界トップレベルの大規模言語モデル（ＬＬＭ）の構築に着手した。まずはパラメーター数が１７５０億個のＬＬＭを構築して経験を蓄える。オープンに利用できるモデルになる。これを踏み台に、世界トップレベルのＬＬＭを構築して公開していく。情報学研が主宰する勉強会「ＬＬＭ―ｊｐ」と東工大が開発主体となり、産総研の人工知能（ＡＩ）向けスパコン「ＡＢＣＩ」を利用してＬＬＭを構築する。１７５０億パラメーターは米オープンＡＩが２０２０年に発表したＬＬＭ「ＧＰＴ―３」と同規模になる。学習データと学習プロセスを日本で管理できるため、透明性の高いＬＬＭになる。誤情報などが生成される仕組みを押さえられる。学習原理の解明や生成系ＡＩのロボット応用などに展開していく。

samurairodeo 2023/10/20

あとで読む

リンク

【StreamingLLM】トークン数400万、小説40冊を読み込める無限LLM | WEEL

【StreamingLLM】トークン数400万、小説40冊を読み込める無限LLM 2023 10/19 皆さん、StreamingLLMというLLM用のアプリケーションをご存知ですか？ LLMで無限に入力ができることを可能にしたツールなんです！LLMを日々使い倒している弊社としては、衝撃のツールなんですよ。 GitHubでも4500超えのスターを獲得しており、徐々に注目が集まっています。AI オタクであれば、知らなかったなんてことないですよね。このStreamingLLMを使えば、対話型でLLMを動かすことができ、モデルが質問の都度、リアルタイムで応答を生成してくれます。というわけで、今回はStreamingLLMの使い方や、実際に使ってみた感想などをご紹介します。この記事を最後まで読むと、StreamingLLMを使いこなすことができ、LLMとのリアルタイムの会話も可能になります！

samurairodeo 2023/10/20

あとで読む

リンク

はてなブックマーク

タグ

2023年10月20日のブックマーク (12件)

LLM-jp-13B を公開しました

kaggle LLMコンペ　上位解法まとめ

「ChatGPT」、ウェブブラウジング機能が正式リリース--有料版ユーザー限定で

自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO

My annual letter: Leading in a new era

Microsoft 2023 Annual Report

「それは、本当に安全なんですか？」　セキュリティ専門家が「GitHub Copilot」の全社一斉導入時に考えたあれこれ

「GPT-4」は論文の査読ができるか？　米スタンフォード大らが検証　参加者の80％以上「AI査読は有益」

AWS 内で大規模言語モデルを利用できる Amazon Bedrock を使って作る RAG アプリケーション - クックパッド開発者ブログ

ZOZOTOWNにおける開発生産性向上に関する取り組み / Initiatives to Improve Development Productivity at ZOZOTOWN

パラメーター1750億個、産総研・東工大など世界トップレベル「ＬＬＭ」公開へニュースイッチ by 日刊工業新聞社

【StreamingLLM】トークン数400万、小説40冊を読み込める無限LLM | WEEL

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス