samurairodeoのブックマーク / 2024年6月7日

samurairodeo id:samurairodeo

2024年6月7日のブックマーク (8件)

自然言語とVision&Language
東京大学大学院の2024年度講義「知能情報論」で使用した資料です． Vision&Language関連の研究について，深層学習初期から大規模モデルにいたるまでを概観しています．なお，資料作成時期は2024年5月下旬であり，内容はその時点で発表されていた研究等に基づいています．
samurairodeo 2024/06/07
あとで読む
リンク
https://www.reddit.com/r/LocalLLaMA/comments/1d9h2pg/doing_rag_vector_search_is_not_enough/?rdt=59408
samurairodeo 2024/06/07
あとで読む
リンク
日本マイクロソフト、「Copilot」の社内活用を披露--広まる“BYOAI”
印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます日本マイクロソフトは6月6日、「Microsoft Copilot for Microsoft 365」（Copilot for Microsoft 365）に関する記者向けセミナーを開催した。併せて国内外のAI活用動向も披露している。同社業務執行役員モダンワークビジネス本部本部長の山田恭平氏はAIについて「AIの筋トレがとても重要。AIは意識せずに使えるインフラではなく、既にスキルに分類されている。仕事に役に立つプロンプトもほかの人が同様に役立つとは限らない。だからこそAIスキルを磨くため、（Copilot for Microsoft 365を）使えば使うほど、組織の変化を感じられる」と述べた。 Copilot for Mic
samurairodeo 2024/06/07
あとで読む
リンク
LangGraphを用いたマルチエージェント
A passwordless future! Passkeys for Spring Developers
samurairodeo 2024/06/07
あとで読む
リンク
自分だけの信頼できるAIへ　グーグル「NotebookLM」公開
samurairodeo 2024/06/07
あとで読む
リンク
SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering
- 1 user
- arxiv.org
- 学び
samurairodeo 2024/06/07
あとで読む
リンク
マルチモーダルLLMを理解する - Qiita
想像してみてください: お気に入りのソーシャルメディアをスクロールしていると、絵のように美しくて素晴らしい風景画像に出くわします。興味をそそられたあなたは、仲間からの反応を期待して、その場所に関する質問を入力します。すると、仲間に代わって機械が風景と場所をそのまま識別し、詳細な説明に加えて、近くのアトラクションまで提案してくれました。このシナリオはサイエンスフィクションではなく、さまざまなモダリティ（様式）を組み合わせることでAIの世界を拡張するマルチモーダルLLM (以下、M-LLMと記載します)の可能性を示しています。 M-LLMはマルチモーダル情報をシームレスに統合し、テキスト、画像、音声などを含む多様な形式のデータを処理して世界を把握できるようにします。M-LLMの中核は、さまざまなデータ型を取り込むことができる汎用性の高いニューラルネットワークで構成され、それによってさまざま
samurairodeo 2024/06/07
あとで読む
リンク
Hallucination of Multimodal Large Language Models: A Survey
samurairodeo 2024/06/07
あとで読む
リンク
- 2024年6月8日
- 2024年6月7日
- 2024年6月6日