Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。 「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な
![日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan](https://cdn-ak-scissors.b.st-hatena.com/image/square/b7b4feb431d4e36d10f2638ce62e9ea5c1dbecaa/height=288;version=1;width=512/http%3A%2F%2Fstatic1.squarespace.com%2Fstatic%2F646b4513dbebfb2c0adc2b52%2F646b4524dbebfb2c0adc2ca9%2F64dd58b1a4fda410148a7c86%2F1692258482447%2FInstructBLIP_Main.png%3Fformat%3D1500w)