secondlifeのブックマーク / 2023年7月27日

Japanese MiniGPT-4: rinna 3.6bとBLIP-2を組み合わせてマルチモーダルチャットのモデルを作る

はじめに LLMの応用先の一つに，テキストに加えて画像や音声といった複数のモーダルの入出力を行うマルチモーダル情報処理があります．例えば，2023年3月に発表されたGPT-4の論文では，テキストと画像から構成されるプロンプトを入力することで，画像の内容に関して高度な対話を実現できることが報告されています．GPT-4のように，テキスト以外の情報を考慮して対話を行うタスクはマルチモーダルチャットと呼ばれています．マルチモーダルチャットを実現する方法として，テキストの情報のみで事前学習されたLLMを改良し，マルチモーダル情報を扱えるようにする手法が多数提案されています．例えば，テキストと画像を入力可能なタスクであれば，画像データで学習された画像のエンコーダとなるモデルをLLMに接続することで，画像とテキストを同じ枠組みで処理する手法（BLIP-2やMiniGPT-4）が提案されています．今回

secondlife 2023/07/27

内容の興味深さもさることながら、学習リソースがA100 80Gx4 で10時間程度の少なさ・学習時間の短さというのもすごいな～

LLM

リンク

論文まとめ：GRiT: A Generative Region-to-text Transformer for Object Understanding | Shikoan's ML Blog

タイトル：GRiT: A Generative Region-to-text Transf ormer for Object Understanding 著者：Jialian Wu, Jianfeng Wang, Zhengyuan Yang, Zhe Gan, Zicheng Liu, Junsong Yuan, Lijuan Wang（所属：ニューヨーク州立大学バッファロー校、Microsoft）論文：https://arxiv.org/abs/2212.00280 コード：https://github.com/JialianW/GRiT ざっくりいうと物体検出にImage Captioningを導入した「Dense Captioning」の研究検出とテキスト生成の2段階からなり、画像特徴と、テキストトークンの特徴をText Decoderに入れてキャプション生成クローズドセット

secondlife 2023/07/27

リンク

Shopify MagicとSidekick：コマース特化型AI

Shopify Magic コマースに特化したAI 人工知能の力を活用し、生産性の高い未来を手に入れましょう。当社のビジョンヒーローである起業家の皆さんにも、強い味方が必要です。比類ない成長と成功への道を開く、AIを活用した未来に向けて備えましょう。Shopifyのコマースに特化した画期的なAIを活用すれば、あなたのような起業家は生産性、創造性を高め、かつてないほどの成功を収めることができます。新時代の起業家支援をご紹介します。

secondlife 2023/07/27

リンク

GitHub - comfyanonymous/ComfyUI: The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

secondlife 2023/07/27

“A powerful and modular stable diffusion GUI and backend. ”

リンク

Announcing SDXL 1.0 — Stability AI

secondlife 2023/07/27

SDXL 1.0 がリリースされる。"CreativeML OpenRAIL++-M License"

リンク

大規模言語モデル時代のHuman-in-the-Loop機械学習

画像の認識・理解シンポジウム（MIRU2023）チュートリアル

secondlife 2023/07/27

LLM

リンク

1 億ユーザー 1 億商品棚の実現に向けた、パーソナライズされた商品レコメンド機能の裏側（Part2 実装編）｜Tatsuya Shirakawa

こんにちは、カウシェの AI チームの tatsuya（白川達也）です。 2022 年 11 月に入社してから検証・実装していた商品レコメンド機能がついにリリースされました（現状 iOS 版でのみ先行配信されています）。カウシェでは初めての機械学習を使った機能だったこともあり、リリースまでこぎつけるには超えないといけないハードルがいくつもあってそれなりに大変だったのですが、そのあたりの背景や経緯を踏まえ、実装の裏側を公開してみたいと思います。本記事は「Part 2 実装」編です。カウシェで始めての機械学習系の機能である商品レコメンド機能の実装の裏側をお伝えします。背景や経緯を詳しくお知りになりたい方は「Part 1 背景・経緯編」をご覧ください。今回実装したパーソナライズされた商品コレクション（タイトルは変更される可能性があります）商品レコメンドで目指す体験「Part 1 背景・経緯

secondlife 2023/07/27

recommendation

リンク

Text Embedding と LSH を用いた高速商品バリアント判定｜Tatsuya Shirakawa

こんにちは、カウシェで機械学習エンジニアをしている白川です。先日、下記の記事でレコメンドの実装の裏側についてご紹介しました。この記事の内容を人に説明する機会があって読み直していたら商品バリアント判定部分のアルゴリズムの説明が抜けている事に気づいたので、その部分を切り出してちょっとした Tips としてご紹介したいと思います。商品バリアントって？同一商品の色違い・サイズ違い・柄違い・味違い…などを商品バリアントと呼びます。カウシェの扱う商品にも商品バリアントが無数にあります。商品レコメンドをする場合など、この商品バリアントを適切にコントロールしないと、同一商品のバリアントばかりレコメンドされるようなことになってしまったりします。そのためカウシェの現状の商品レコメンド機能では、同一商品のバリアントからランダムにひとつ選び、ほかは除外することにより、同一商品のバリアントがレコメンドを占

secondlife 2023/07/27

文ベクトル→正規化→LSHで8bit量子化→整数化

リンク

GitHub - transitive-bullshit/agentic: AI agent stdlib that works with any LLM and TypeScript AI SDK.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

secondlife 2023/07/27

“ChatGPTUnofficialProxyAPI”

リンク

AITuber の中身を丸裸にしちゃいます！ [AITuber みらい] +雑談

AITuber「みらい」の開発者、「猩々博士」が、みらいちゃんのソースコードを公開＆解説するよ！ https://github.com/Mega-Gorilla/AITuber_Mirai_Chan_v1.0.git 🤖￤AI Tuber　みらいちゃんとは？￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣猩々博士によって、開発された対話型AI Tuberだ！まだ生まれたばかりなので、うまくいかないことも多いが暖かく見守ってくれ！どうやらGPT4とGPT3.5を駆使して開発されているらしい？！ 🗨️￤ハッシュタグ￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣配信・感想ハッシュタグ: #ゴリライイラストハッシュタグ: #ゴリライイラスト 🌐￤その他情報・URLなど￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣￣

secondlife 2023/07/27

AI Tuber の実装について

リンク

はてなブックマーク

タグ

2023年7月27日のブックマーク (10件)

Japanese MiniGPT-4: rinna 3.6bとBLIP-2を組み合わせてマルチモーダルチャットのモデルを作る

論文まとめ：GRiT: A Generative Region-to-text Transformer for Object Understanding | Shikoan's ML Blog

Shopify MagicとSidekick：コマース特化型AI

GitHub - comfyanonymous/ComfyUI: The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.

Announcing SDXL 1.0 — Stability AI

大規模言語モデル時代のHuman-in-the-Loop機械学習

1 億ユーザー 1 億商品棚の実現に向けた、パーソナライズされた商品レコメンド機能の裏側（Part2 実装編）｜Tatsuya Shirakawa

Text Embedding と LSH を用いた高速商品バリアント判定｜Tatsuya Shirakawa

GitHub - transitive-bullshit/agentic: AI agent stdlib that works with any LLM and TypeScript AI SDK.

AITuber の中身を丸裸にしちゃいます！ [AITuber みらい] +雑談

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス