deejayrokaのブックマーク / 2024年2月29日

Model Cards

deejayroka 2024/02/29

LLM

リンク

Google、商用利用可能な軽量オープンAIモデル「Gemma」を公開

Googleは2024年2月21日（米国時間）、新世代の大規模言語モデル（LLM）「Gemma」を提供開始した。Googleの生成AI（人工知能）「Gemini」と同じ研究、技術に基づいた軽量のオープンモデルファミリーだ。 20億パラメーターの「Gemma 2B」と70億パラメーターの「Gemma 7B」がリリースされており、それぞれ事前トレーニング済みモデルとインストラクションチューニング済みモデルが用意されている。事前トレーニング済みモデル：Gemmaのコアデータトレーニングセット以外の特定のタスクや手順ではトレーニングされていない。チューニングした上でデプロイ（展開）する必要があるインストラクションチューニング済みモデル：人間の言葉による操作でトレーニングされており、チャットbotと同様に会話の入力に応答できるこれらのモデルはノートPC、ワークステーション、「Google Cl

deejayroka 2024/02/29

リンク

Meta、責任ある安全な生成AI開発を促す「Purple Llama」を発表

米Metaは12月7日（現地時間）、生成AIモデルを使って責任ある安全なシステム構築を行えるよう支援する、オープンなツールと評価を備える包括的プロジェクト「Purple Llama」を発表した。現在広く使われているAIチャットボット、画像ジェネレーター、文書要約ツールなどの多くには、Metaがオープンソースで公開しているLLM（大規模言語モデル）の「Llama」が使われている。そのため、MetaはAIの安全性に関する協力を推進する必要があると考えたという。「AIシステムを構築する人々は、単独では課題に対処することはできない。だからこそ、競争の場を平等にし、オープンな信頼と安全のための中心地を作りたい」と同社は説明する。 Purple Llamaではまず、「CyberSec Eval」という、LLM向けのサイバーセキュリティ評価ベンチマークセットをリリースした。Metaは、このツールはサ

deejayroka 2024/02/29

“生成AIモデルを使って責任ある安全なシステム構築を行えるよう支援する、オープンなツールと評価を備える包括的プロジェクト「Purple Llama」”

リンク

ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors

deejayroka 2024/02/29

リンク

Purple Llama CyberSecEval: A benchmark for evaluating the cybersecurity risks of large language models | Research - AI at Meta

deejayroka 2024/02/29

リンク

Llama Guard: LLM-based Input-Output Safeguard for Human-AI Conversations | Research - AI at Meta

deejayroka 2024/02/29

LLMOps

リンク

https://www.meti.go.jp/meti_lib/report/2022FY/000249.pdf

deejayroka 2024/02/29

リンク

LLM in Production #2 Meetup 231023

deejayroka 2024/02/29

"LLMを使って何を改善したいかを明確に．Stealth releaseは効果的"[LLM]

リンク

Leveraging LLMs in Production: Looking Back, Going Forward | Mercari Engineering

deejayroka 2024/02/29

LLM

リンク

エンジニア間でも大きく差が出る「生成AIをうまく活用できる人」と「できない人」　江草陽太氏が考える、AI時代に求められる能力【一問一答】

江草陽太大阪府生まれ。ネットワーク、データベース、情報セキュリティのスペシャリスト。洛星中学・高校のロボット研究部創立メンバー。ロボカップジュニアジャパンなどのロボコンに出場。その後、大阪大学工学部電気電子情報工学科に進学。NHK大学ロボコンに出場。学生時代より個人事業としてシステム開発を行う。 2014年10月、新卒採用によりさくらインターネットに入社。「さくらのVPS」等のバックエンド開発を担当。IoTプラットフォーム「sakura.io」の開発責任者を担当し、サービス設計と開発を行う。 2016年7月、執行役員に就任。現在は、さくらインターネット全体の技術統括とコーポレートIT、情報セキュリティを担当。宅急便をSlackから発送できるサービスを開始するなど、コーポレートITに関わるDXのサービス化も行っている。 AIが提示した内容をきちんと理解して、うまく活用できる人とできない

deejayroka 2024/02/29

リンク

マイクロソフト、GPT-4に任意のドキュメントなどを読み込ませて回答してもらえる「Azure OpenAI Service On Your Data」が正式サービスに

マイクロソフトは、GPT-35-TurboもしくはGPT-4に任意のデータソースを指定することでそのデータの内容を読み込み、質問に対して内容を基に回答できるようになる新機能「Azure OpenAI On Your Data」が正式サービスとなったことを発表しました。例えば、社内規約や社内マニュアルなどを読み込ませると、「PCの修理を申し込むための社内手続きは？」といった、汎用の知識だけしか持たない従来のGPTでは答えられない質問にも回答できるようになります。任意のドキュメントを読み込ませるための支援ツール「Azure AI Studio」には、Azure OpenAI On Your DataでカスタマイズしたAIを、チャットボットとして公開する機能も備わっています。カスタマイズしたチャットAIのサービスを、社内や社外に簡単に公開できるようになります。 Azure OpenAI S

deejayroka 2024/02/29

リンク

驚異の1ビットLLMを試す。果たして本当に学習できるのか?｜shi3z

昨日話題になった「Bit Net」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。 Bit Netというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジかよ。 https://arxiv.org/pdf/2402.17764.pdf ということで早速試してみることにした。オフィシャルの実装は公開されていないが、そもそも1ビット(と言っていいのかわからない,-1,0,1の三状態を持つからだ。論文著者はlog2(3)で1.58ビットという主張をしている)量子化のアルゴリズム自体の研究の歴史は古いので、Bit NetによるTransf ormerの野良実装

deejayroka 2024/02/29

“BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。”

リンク

Stable Diffusion XLがプロンプト入力に追従して爆速画像生成してくれる「SDXL Lightning」のデモが公開中

ByteDanceが開発した高速画像生成モデル「SDXL-Lightning」のデモアプリがAI エンジニアのアレックス・ボルコフ氏によって作成されました。デモアプリには「fal.ai」がホストする画像生成AI高速処理APIが使われているほか、「Groq」が提供する大規模言語モデル「Mixtral」の高速実行APIを組み合わせることで簡単な文章を入力するだけで画像生成AI向けに最適化したプロンプトを高速生成して瞬時に高品質な画像を生成できるようになっています。 ThursdAI Feb 22nd - Groq near instant LLM calls, SDXL Lightning near instant SDXL, Google gives us GEMMA open weights and refuses to draw white people, Stability announ

deejayroka 2024/02/29

リンク

音楽の作り方が決定的に変わる。架空のロックバンドのコンセプトアルバムを丸ごとAIで作れてしまいました（CloseBox） | テクノエッジ TechnoEdge

では、一人の音楽素人がAIの力を借りたら、どの程度までコンセプトアルバムが作れるか、試してみました。思いついたのは、今日（2月27日）の11時30分ごろ。まず、ChatGPTにこう指令することから始めました。ロックのコンセプトアルバムを作りたいので、12曲のタイトルと歌詞、そしてその曲調をそれぞれ英語で記述してそうすると、ChatGPTは12曲の概要を作ってくれました。 1. "Echoes of Eternity"曲調: エピックなインストゥルメンタルイントロ。壮大なストリングスとパワフルなドラムス。歌詞の一部: （インストゥルメンタル） 2. "Shadows in the Moonlight"曲調: ミステリアスなヴァースとクライマックスへ向けて構築されるコーラス。歌詞の一部: "In the silver glow, secrets come to dance, / Sha

deejayroka 2024/02/29

リンク

これは“AIキャバクラ”なのか!?　おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に

友達と電話するように会話しながら、ほめたり労ったりしてくれるコトモ。「すごい！」「賢い」「頑張っているんだね」……言われて悪い気はしない。だが「初対面で何でそこまで？」と白々しくも感じるし、会話はまったく深まらない。キャバクラの会話ってこんな感じなのかも？　行ったことないけど……。ただ、その技術はすごい。会話のテンポは人間と見まごう（聞きまごう？）ほどだ。こちらの言葉をオウム返ししたり、「うん」「そっかそっか」などの相づちを違和感なく挟むことで、より共感してもらっている印象を覚えるとともに、返答の待ち時間も自然に埋めている。過去の会話を覚え、その後に反映してくる“記憶力”もある。前回の会話で「好き」と言ったことを思い出して、「○○好きだって言ってたよね？」と話を広げようとしてくるのだ。あまりにナチュラルだから、人間と話している気持ちになる。だからこそ、ちょっとした“人間との違い”が

deejayroka 2024/02/29

リンク

画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)

プロンプト：1 girl, photorealistic, solo, perfect lighting, sailor dress, looking at viewer, long hair, black hair, two side up, ネガティブプロンプト：illustration, 3d render, (worst quality:2), (low quality:2), (normal quality:2), signature, watermark, username, open mouth

deejayroka 2024/02/29

リンク

1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も

1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も 2024.02.28 Updated by Ryo Shimizu on February 28, 2024, 16:46 pm JST 2月は中国では春節というお正月があり、春節にはみんな休む。それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリース

deejayroka 2024/02/29

リンク

はてなブックマーク

タグ

2024年2月29日のブックマーク (20件)

Model Cards

Google、商用利用可能な軽量オープンAIモデル「Gemma」を公開

Meta、責任ある安全な生成AI開発を促す「Purple Llama」を発表

ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors

Purple Llama CyberSecEval: A benchmark for evaluating the cybersecurity risks of large language models | Research - AI at Meta

Llama Guard: LLM-based Input-Output Safeguard for Human-AI Conversations | Research - AI at Meta

https://www.meti.go.jp/meti_lib/report/2022FY/000249.pdf

LLM in Production #2 Meetup 231023

Leveraging LLMs in Production: Looking Back, Going Forward | Mercari Engineering

エンジニア間でも大きく差が出る「生成AIをうまく活用できる人」と「できない人」　江草陽太氏が考える、AI時代に求められる能力【一問一答】

マイクロソフト、GPT-4に任意のドキュメントなどを読み込ませて回答してもらえる「Azure OpenAI Service On Your Data」が正式サービスに

驚異の1ビットLLMを試す。果たして本当に学習できるのか?｜shi3z

Stable Diffusion XLがプロンプト入力に追従して爆速画像生成してくれる「SDXL Lightning」のデモが公開中

音楽の作り方が決定的に変わる。架空のロックバンドのコンセプトアルバムを丸ごとAIで作れてしまいました（CloseBox） | テクノエッジ TechnoEdge

これは“AIキャバクラ”なのか!?　おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に

画像生成AI「Stable Diffusion」使うなら「ComfyUI」のワークフローが便利です (1/4)

1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も

A Survey on Data Selection for Language Models

My Personal Top 5 Data Science Books Set to Publish in 2024

小さく始める Blue/Green Deployment | ドクセル

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス