Googleは2024年2月21日(米国時間)、新世代の大規模言語モデル(LLM)「Gemma」を提供開始した。Googleの生成AI(人工知能)「Gemini」と同じ研究、技術に基づいた軽量のオープンモデルファミリーだ。 20億パラメーターの「Gemma 2B」と70億パラメーターの「Gemma 7B」がリリースされており、それぞれ事前トレーニング済みモデルとインストラクションチューニング済みモデルが用意されている。 事前トレーニング済みモデル:Gemmaのコアデータトレーニングセット以外の特定のタスクや手順ではトレーニングされていない。チューニングした上でデプロイ(展開)する必要がある インストラクションチューニング済みモデル:人間の言葉による操作でトレーニングされており、チャットbotと同様に会話の入力に応答できる これらのモデルはノートPC、ワークステーション、「Google Cl
米Metaは12月7日(現地時間)、生成AIモデルを使って責任ある安全なシステム構築を行えるよう支援する、オープンなツールと評価を備える包括的プロジェクト「Purple Llama」を発表した。 現在広く使われているAIチャットボット、画像ジェネレーター、文書要約ツールなどの多くには、Metaがオープンソースで公開しているLLM(大規模言語モデル)の「Llama」が使われている。 そのため、MetaはAIの安全性に関する協力を推進する必要があると考えたという。「AIシステムを構築する人々は、単独では課題に対処することはできない。だからこそ、競争の場を平等にし、オープンな信頼と安全のための中心地を作りたい」と同社は説明する。 Purple Llamaではまず、「CyberSec Eval」という、LLM向けのサイバーセキュリティ評価ベンチマークセットをリリースした。Metaは、このツールはサ
江草陽太 大阪府生まれ。ネットワーク、データベース、情報セキュリティのスペシャリスト。 洛星中学・高校のロボット研究部創立メンバー。ロボカップジュニアジャパンなどのロボコンに出場。 その後、大阪大学工学部電気電子情報工学科に進学。NHK大学ロボコンに出場。学生時代より個人事業としてシステム開発を行う。 2014年10月、新卒採用によりさくらインターネットに入社。「さくらのVPS」等のバックエンド開発を担当。IoTプラットフォーム「sakura.io」の開発責任者を担当し、サービス設計と開発を行う。 2016年7月、執行役員に就任。現在は、さくらインターネット全体の技術統括とコーポレートIT、情報セキュリティを担当。宅急便をSlackから発送できるサービスを開始するなど、コーポレートITに関わるDXのサービス化も行っている。 AIが提示した内容をきちんと理解して、うまく活用できる人とできない
マイクロソフトは、GPT-35-TurboもしくはGPT-4に任意のデータソースを指定することでそのデータの内容を読み込み、質問に対して内容を基に回答できるようになる新機能「Azure OpenAI On Your Data」が正式サービスとなったことを発表しました。 例えば、社内規約や社内マニュアルなどを読み込ませると、「PCの修理を申し込むための社内手続きは?」といった、汎用の知識だけしか持たない従来のGPTでは答えられない質問にも回答できるようになります。 任意のドキュメントを読み込ませるための支援ツール「Azure AI Studio」には、Azure OpenAI On Your DataでカスタマイズしたAIを、チャットボットとして公開する機能も備わっています。 カスタマイズしたチャットAIのサービスを、社内や社外に簡単に公開できるようになります。 Azure OpenAI S
昨日話題になった「BitNet」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。 BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。 この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジかよ。 https://arxiv.org/pdf/2402.17764.pdf ということで早速試してみることにした。 オフィシャルの実装は公開されていないが、そもそも1ビット(と言っていいのかわからない,-1,0,1の三状態を持つからだ。 論文著者はlog2(3)で1.58ビットという主張をしている)量子化のアルゴリズム自体の研究の歴史は古いので、BitNetによるTransformerの野良実装
ByteDanceが開発した高速画像生成モデル「SDXL-Lightning」のデモアプリがAIエンジニアのアレックス・ボルコフ氏によって作成されました。デモアプリには「fal.ai」がホストする画像生成AI高速処理APIが使われているほか、「Groq」が提供する大規模言語モデル「Mixtral」の高速実行APIを組み合わせることで簡単な文章を入力するだけで画像生成AI向けに最適化したプロンプトを高速生成して瞬時に高品質な画像を生成できるようになっています。 ThursdAI Feb 22nd - Groq near instant LLM calls, SDXL Lightning near instant SDXL, Google gives us GEMMA open weights and refuses to draw white people, Stability announ
では、一人の音楽素人がAIの力を借りたら、どの程度までコンセプトアルバムが作れるか、試してみました。思いついたのは、今日(2月27日)の11時30分ごろ。まず、ChatGPTにこう指令することから始めました。 ロックのコンセプトアルバムを作りたいので、12曲のタイトルと歌詞、そしてその曲調をそれぞれ英語で記述して そうすると、ChatGPTは12曲の概要を作ってくれました。 1. "Echoes of Eternity"曲調: エピックなインストゥルメンタルイントロ。壮大なストリングスとパワフルなドラムス。 歌詞の一部: (インストゥルメンタル) 2. "Shadows in the Moonlight"曲調: ミステリアスなヴァースとクライマックスへ向けて構築されるコーラス。 歌詞の一部: "In the silver glow, secrets come to dance, / Sha
友達と電話するように会話しながら、ほめたり労ったりしてくれるコトモ。「すごい!」「賢い」「頑張っているんだね」……言われて悪い気はしない。 だが「初対面で何でそこまで?」と白々しくも感じるし、会話はまったく深まらない。キャバクラの会話ってこんな感じなのかも? 行ったことないけど……。 ただ、その技術はすごい。会話のテンポは人間と見まごう(聞きまごう?)ほどだ。こちらの言葉をオウム返ししたり、「うん」「そっかそっか」などの相づちを違和感なく挟むことで、より共感してもらっている印象を覚えるとともに、返答の待ち時間も自然に埋めている。 過去の会話を覚え、その後に反映してくる“記憶力”もある。前回の会話で「好き」と言ったことを思い出して、「○○好きだって言ってたよね?」と話を広げようとしてくるのだ。 あまりにナチュラルだから、人間と話している気持ちになる。だからこそ、ちょっとした“人間との違い”が
1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も 2024.02.28 Updated by Ryo Shimizu on February 28, 2024, 16:46 pm JST 2月は中国では春節というお正月があり、春節にはみんな休む。 それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。 春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。 そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリース
TIER IV(ティアフォー)は、「自動運転の民主化」をビジョンとし、Autowareを活用したソフトウェアプラットフォームと統合開発環境を提供しています。 #Autoware #opensource #AutonomousDriving #deeptech
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く