画像とテキストを組み合わせてタスクをこなせるマルチモーダル大規模言語モデルの「Ferret」のウェイト情報をAppleが公開しました。ウェイトのデータはCC-BY-NCライセンスでの提供となっており、研究目的でのみ利用可能です。 apple/ml-ferret https://github.com/apple/ml-ferret Ferretは2023年10月30日に公開されたマルチモーダル大規模言語モデルで、画像の領域を指定して解釈する能力があることが特徴です。領域の指定方法には「点」「四角形」「フリーフォーム」の3種類が存在しています。 画像の一部を指定することで、テキストで「領域[100, 600, 500, 900]には何がありますか?」のように領域を参照して質問することが可能です。Ferretモデルは画像とテキストを元に、「ネコの尻尾です」のように回答することができます。同時に、
Top > ビジネス > テスラ 人型2足歩行ロボット「Optimus 第2世代」公開 ーー卵をつまめる指先など、より人間に近くなめらかな動き
#HOSPO#SPACE COTAN#SSTO#将来宇宙輸送システム#スペースプレーン#メタン 宇宙を往復できる輸送システムの開発を目指す将来宇宙輸送システム(Innovative Space Carrier:ISC、東京都中央区)は、水素とメタン、酸素を推進剤として使う「トリプロペラント方式」ロケットエンジンの燃焼試験を成功させた。トリプロペラント方式の燃焼試験成功は、日本ではこれが初めての事例としている。 ISCは、完全再使用型の単段式スペースプレーン(Single Stage To Orbit:SSTO)の開発に取り組んでいる。SSTOを実現するには機体の軽量化が不可欠だ。 そこで、密度が小さく比推力が高い水素の使用を大気圏外に集中させ、大気圏内で不足する推力をメタンでカバーする、水素とメタン、酸素の3種類の推進剤を組み合わせるトリプロペラント方式の適用を試みている。トリプロペラント
つまりHPC向けの演算性能は、基本的な部分がMI250世代と変わっていないので、なるほどAMDがMI300XシリーズでAI性能の高さを大々的にアピールしていたわけである。また、MI200世代ではXCUという表記だったのが、MI300世代ではCUに戻っている。したがって、以下は表記をCUに戻す。 Matrixに関しても、FP64/FP32が全然変わっていない。もちろん科学技術計算でMatrix Engineを利用する可能性があるので、ここはMI250世代と同じスペックは維持している。一方でAI向けで言えば、学習用途でFP64を使う可能性はまずなく、FP32も最近はあまり使われなくなっている。 ただFP16/BF16では精度的にやや足りない用途向けに新たにTF32が追加され、これが1024Flops/サイクルとMI250のFP32から8倍のスループットになった。TF32は仮数部10bit、指数
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く