サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
衆院選
weblab.t.u-tokyo.ac.jp
発表のポイント 経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GENIAC」プロジェクトにおいて、松尾・岩澤研究室が「Tanuki-8×8B」を開発・公開。 本モデルは、フルスクラッチで開発されており、対話、作文能力を評価する指標「Japanese MT-Bench」において「GPT-3.5 Turbo」と同等以上の性能を達成。 Apache License 2.0のライセンスに基づき、研究および商業目的での自由な利用が可能。「Tanuki-8×8B」の軽量版である、「Tanuki-8B」をチャット形式で利用できるデモも公開。 本モデルのNejumi LLMリーダーボード3における評価 発表内容 東京大学大学院工学系研究科技術経営戦略学専攻 松尾・岩澤研究室(以下「松尾研」)は、経済産業省及び国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が推進する、
最先端の大規模言語モデル(LLM)の基礎理論から応用事例まで網羅的にマスターしよう! 生成AIの基盤モデルとして注目を集める大規模言語モデル(LLM)について体系的に学べる実践型講座。LLMの基本からスタートし、LLMの学習や推論を支える技術、公開されているLLMやAPIなどの活用方法まで幅広く学べます。 実践型のデータサイエンティスト育成講座およびDeep Learning講座を10年以上運営し、のべ30,000人以上の人材を育成してきた東京大学松尾・岩澤研究室がコンテンツを監修・開発しています。 本講座はサマースクールの一環として大規模言語モデル(Large Language Models/LLM)に関して体系的に学べる講座を目的として開催されます。 具体的には以下のスキルを身につける事を目的としています。 ・LLMの原理について,事前学習からRLHFまでの一連の流れや意味合いを理解す
松尾教授が座長を務める、AI戦略会議の資料が公開されました。(第9回資料:「生成AIの産業における可能性」)
2024年3月2日(土)に、松尾研LLM開発プロジェクトのキックオフを実施しましたのでご報告いたします。 本プロジェクトは、当研究室が提供する講座の修了生および一般公募によって集まった有志の開発者のメンバーが500億パラメータサイズの大規模言語モデル開発を進めるものです。 また、開発された大規模言語モデル(LLM)の公開のみならず、開発過程の公開、そしてこれらの成果を社会全体で共有することを通じ、日本全体のLLM開発の技術レベル向上と社会実装の加速を目指します。 なお、本プロジェクトは国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)による、国内の生成AIの開発力を強化するためのプロジェクト「GENIAC(Generative AI Accelerator Challenge)」において、基盤モデル開発に必要な計算資源の提供支援を受けています。 ▼参考:NEDOの採択を受け、公
本プロジェクトは、大規模言語モデル講座の修了生を含む、松尾・岩澤研究室講座の修了生および一般公募によって集まった有志の開発者(⺠間企業・研究者・学生で構成)約250名が7チームに分かれ、各チーム10BクラスのLLMをコンペティション形式で開発を行い、優勝チームが50BクラスのLLMを作り、これらのモデルやコード開発で得た知見を共有する事を目的に行われます。 国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)の「ポスト5G情報通信システム基盤強化研究開発事業/ポスト5G情報通信システムの開発(助成)」に係る公募に採択されており、経済産業省が主導する基盤モデルの開発に必要な計算資源に関する支援や関係者間の連携を促す「GENIAC」プロジェクトの一環として行われます。 GENIACの詳細はこちら:https://www.meti.go.jp/press/2023/02/202
松尾研究室では複数のLLMに関する開発プロジェクトを推進しており、一緒に働いてくれる仲間を募集しています!! LLM研究者(特任研究員・特任助教・特任講師) [1] 効率的なLLMの学習方法に関する研究 [2] LLMの動作原理の理解 [3] LLMの社会的リスクに関する研究開発 [4] その他LLMの高度化や応用に関する研究 など。詳細はこちら LLM開発エンジニア(東京大学学術専門職員) [1] LLMのフルスクラッチ構築(1B〜100B),継続学習 [2] LLMの社会的リスクに関する研究開発 [3] 外部知識や外部ツールとの融合(LLM Agent) など。詳細はこちら その他全ての募集求人はこちら
訂正版20230822プレスリリース 東京大学松尾研究室 100億パラメータサイズ・日英2ヶ国語対応の 大規模言語モデル“Weblab-10B”を公開 ―公開済みの日本語大規模言語モデルで最高水準(注1)― この度日本語・英語の2ヶ国語に対応した100億パラメータサイズの大規模言語モデル(Large Language Model ;LLM)を事前学習と事後学習(ファインチューニング)により開発し、モデルを公開しましたのでお知らせします。今後も、Weblab-10Bのさらなる大規模化を進めるとともに、この資源を元に、LLMの産業実装に向けた研究を推進して参ります。 松尾研は、知能の謎を解くことを目的に人工知能の研究に取り組む研究室です。現在はテキスト生成で注目されることの多いLLMの技術ですが、今後は画像組み込みなどのマルチモーダル化、ブラウザ・ソフトウェア・ロボット等の行動制御の実装に発
このページでは,人工知能や深層学習を学んだことのない方向けに,それらを学ぶためのロードマップを紹介しています. ここでは対象者として「情報系以外の大学生向け」と「社会人向け」を想定し,それぞれ10時間・200時間で人工知能や深層学習について一通りの内容を学ぶことを念頭に作成しています. もちろん限られた時間で全てを学ぶことは不可能ですが,人工知能や深層学習を身につけるためにどのように学び進めていけば良いかわからない方は,是非参考にしてください. また,フォローしてみようと思ったロードマップがある場合は,各教材をやり始める前にそのロードマップを最後まで読むことをお勧めします.
松尾研では「知能を創る」というビジョンを掲げ、研究を進めています。 本記事では知能を創る上で重要な研究テーマとなる「世界モデル」について、松尾研の特任助教である鈴木雅大さんにお伺いしました。 (鈴木さんのインタビューは、前・後編の2回でお届けいたします。後編はこちら) 世界を「直感的」に理解する世界モデルは、真の知能の実現において必要不可欠。 ー「世界モデル」の説明をお聞きする前に、なぜ松尾研は「世界モデル」の研究を推進しているかを教えてください。 松尾研では「知能を創る」というビジョンを掲げており、世界モデルが真の知能の実現において必要不可欠だからです。 世界モデルについては後ほど詳しくご説明しますが、「外界(世界)から得られる観測情報に基づき外界の構造を学習によって獲得するモデル」を指します。 我々は、世界モデルが知能のベースにあって、その上に様々な知的な機能が実現できると考えています
2016年 未踏スーパークリエイター認定 2015年 M-1 グランプリ2015 二回戦進出(ロボットとして史上初) 2015年 The Boston Consulting Group入社 2014年 東京大学工学部システム創成学科 卒業
過去に得た知識を応用する、「転移学習」の研究が進んでいます。 今回は、この領域を中心に研究を重ね、先日8月1日付で松尾研に特任助教として入職した熊谷 亘さんのインタビューをお届けします。 「転移学習とは、人間なら成長過程や日々の生活の中で当たり前に行っていること」と熊谷さん。 少しずつ議論が進んでいる汎用型AIの中でも、なぜ転移学習に注目しているのか、話を聞きました。 「問題を解く」とはどういうことか? 学部では、数学を学んでいました。その中で、「問題を解くとはどういうことか」と考えるようになり、「人間より頭のいいものをつくればいいのでは」と思ったのが、人工知能に興味を持ったきっかけです。数学に限らずですが、人間より頭のいい人工知能をつくれれば、世の中の問題を全部解けるんじゃないか、と。 当時はそのための手法もよくわからなかったので、ひとまず基礎的な方向へ進もうと、修士でも数学を専攻しまし
Sorry, this entry is only available in Japanese. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.
本プログラムの最大の特徴の一つは、全てのトピックについて、演習を中心に構成されている点です。実際に手を動かしながら理解を進めることで、効率よく学習することができます。 実際にモデルを学習させながら技術を習得する本格的な演習内容となっています。Deep Learningは、モデルが実際に学習する様子を観測し、パラメータを調整することでアプリケーションに応じたパフォーマンス最大化を行うことが非常に重要な技術ですが、この一連の流れを全ての演習で経験しながら重要な要素を身につけることが可能です。
松尾研究室の教育活動 TMIの授業である「ウェブ工学とビジネスモデル」、データサイエンティストの育成を行うグローバル消費インテリジェンス寄付講座(GCI)、DeepLearning の講座を運営するDeep Leaning JPを軸に、次世代の情報社会を担う人材を輩出すべく、実践的な教育活動を行っています。 TMIの授業である「ウェブ工学とビジネスモデル」においては、社会の基盤技術であるインターネットを用いたサービス開発を通じて情報化社会に於ける工学的素養を身につける授業を行っています。グローバル消費インテリジェンス寄付講座においては、データ分析をできるCMO人材を育成する講座を2014年から開始しており、のべ200名以上の学生が参加しております。DeepLearning.JPに於いては、ディープラーニング人材の教育講座を国内で最も早く開設。2015年11月から。学部や学年を超えた実践型の
東京大学で開催中のグローバル消費インテリジェンス寄附講座におけるデータ解析パートのコンテンツです。 全15Chapterを通し、データのセットアップから解析、可視化やモデルのアウトプットまでを一気通貫で学習できます。
Skip to content ABOUTMissions & Activities Members RESEARCHMajor Research Areas Web & Business Collaborative Research GENIAC project EDUCATIONOverview 講座一覧Deep Learning講座深層学習 深層強化学習 深層生成モデル 世界モデル 大規模言語モデル Web工学講座基礎プロジェクト Web工学とビジネスモデル データサイエンス (GCI) 機械学習講座動機付けプロジェクト 金融市場取引と機械学習 AI経営講座AI起業サマープログラム AI経営トランスフォーメーション 知能ロボット開発講座創造的ものづくりプロジェクト・創造性工学プロジェクト アントレプレナーシップ講座ディープテック起業実践演習 ディープテック起業家への招待 ビジョナリー
データのセットアップから解析、可視化やモデルのアウトプットまでを一気通貫で学習できます。全体を通じて、データ分析の「流れ」を掴むことを意識した講義設計となっております。
1997年3月:国際基督教大学教養学部社会科学科卒業。 1997年4月~1998年3月:株式会社教育開発研究所。「教職研修増刊号」「教職研修」の編集を担当。 1998年4月~1999年4月:フリーランス。学術論文の翻訳、英和辞典の校正、出版社サイトの構築・運営、学会開催の請負等を担当。この間に ACADEMIC RESOURCE GUIDEを創刊(1998-07-11)。 1998年12月~1999年5月:サイバースペース・ジャパン株式会社。専門ガイド型の検索エンジン「iNET Guide」の立ち上げに参画。 1999年5月~2009年7月:ヤフー株式会社に勤務。 2009年9月:アカデミック・リソース・ガイド株式会社を設立。
ウェルスナビウェルスナビ株式会社との共同研究で、人間が心理的な罠に陥らず、長期の資産運用を成功させられるよう、AIによってサポートすることを目的としています。
松尾研究室では 人工知能、ウェブ、ビジネスモデルの研究を軸に 本格研究から社会実装まで一気通貫で活動を行っています。
このページを最初にブックマークしてみませんか?
『Matsuo-Iwasawa Lab.』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く