Llamaの人気記事 81件 - はてなブックマーク

1 - 40 件 / 81件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Llamaの検索結果1 - 40 件 / 81件

Llamaに関するエントリは81件あります。 AI、 LLM、人工知能などが関連タグです。人気エントリには『Open Interpreterの使い方や料金を徹底解説！実際にアンケート結果のデータ分析をした活用事例を紹介！｜Ainova』などがあります。

Open Interpreterの使い方や料金を徹底解説！実際にアンケート結果のデータ分析をした活用事例を紹介！｜Ainova
- 318 users
- generativeinfo365.com
- テクノロジー
- 2023/09/11
1. インストール 1pip install open-interpreter ターミナルで次のコマンドを実行して、Open Interpreter をインストールします。 2. 対話型チャットの開始インストール後、次のコマンドを実行して、ターミナルで対話型チャットを開始できます。 1interpreter Python で対話型チャットを開始するには、次のコマンドを実行します。 1import interpreter 2interpreter.chat() 2. OpenAI APIキーの設定 OpenAIのAPIキーを利用する場合は設定が必要ですが、OpenAIのキーを使用しない場合は、Code-Llamaを利用することができます。これで、Open Interpreterを利用する準備が整いました。 Open Interpreterの使い方タスクの依頼・実行 Open Inter
- ChatGPT
- あとで読む
- AI
- LLM
- GPT
- OpenAI
- ツール
- プログラミング
- LLaMA
- 自然言語処理
無料で商用可、ChatGPT（3.5）に匹敵する生成AI「Llama 2」　Metaが発表、Microsoftと優先連携
- 290 users
- www.itmedia.co.jp
- テクノロジー
- 2023/07/19
米Metaは7月18日（現地時間）、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT（の3月1日版）と互角」（同社）という。ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習（ファインチューニング）したモデルを用意する。いずれも4096トークン（おおよそ単語数の意）まで文脈を読める。性能は、Llama-2-70b-chat（700億のチャット
- AI
- ChatGPT
- あとで読む
- Meta
- LLM
- 人工知能
- Llama
- microsoft
- 機械学習
- 無料
ラズパイで動く大規模言語モデルがGitHubで公開　性能は“GPT-3相当”、Metaの「LLaMA」派生
- 274 users
- www.itmedia.co.jp
- テクノロジー
- 2023/03/18
LLaMAは米Metaが独自開発した大規模言語モデル。LLM分野の研究推進を支援するため、研究者向けに2月にリリースした。大規模インフラを利用できない研究者のために小規模ながら性能の高いことが特徴で、7B（＝70億）、13B、33B、65Bの4種類のパラメーターを用意している。13Bモデルはベンチマークで米OpenAIのLLM「GPT-3」を上回るという。米スタンフォード大学は、LLaMAの7Bモデルを派生させ独自のLLM「Stanford Alpaca」を開発。このモデルは研究や学術目的でのみ利用でき、娯楽や商用での利用は禁止している。Alpaca LoRAでは、Stanford Alpacaが生成するトークン（単語列）を再現できるという。関連記事 Meta、独自大規模言語モデル（LLM）の「LLaMA」を限定リリース Metaは独自の大規模言語モデル「LLaMA」（Large La
- AI
- あとで読む
- Raspberry Pi
- ChatGPT
- 人工知能
- LLaMA
- 自然言語処理
- 機械学習
- HotEntry
- 言語
いちばんやさしいローカル LLM｜ぬこぬこ
- 274 users
- note.com/schroneko
- テクノロジー
- 2024/04/21
概要ローカル LLM 初めましての方でも動かせるチュートリアル最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル（LLM）の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。現状、様々な評価指標により LLM の性能が測定されていますが、
- LLM
- あとで読む
- AI
- ChatGPT
- Mac
- 人工知能
- 自然言語処理
- モデル
- 機械学習

東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開
- 231 users
- news.mynavi.jp
- テクノロジー
- 2024/01/13
東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日本語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日本語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオープンで商用利用も可能なことを共同で発表した。同成果は、東工大情報理工学院情報工学系の岡崎直観教授、同・横田理央教授、産総研の共同研究チームによるもの。今回、東工大は主にデータの語彙拡張によるモデル学習・推論効率の改善に取り組み、産総研はモデル構築に必須である大規模計算資源としてAI橋渡しクラウド(ABCI)を提供すると同時に、主に継続学習によるモデルの日本語能力の改善を担当したとしている。産総研のAI橋渡しクラウド「ABCI」(出所:東工
- LLM
- あとで読む
- AI
- 日本語
- 言語モデル
- 研究
- 人工知能
- 言語
- 学習
- 自然言語処理
意外と良くなってきてしまった動画生成と音楽生成。第二回AIアートグランプリはどうなる!?
- 216 users
- wirelesswire.jp
- テクノロジー
- 2023/08/13
意外と良くなってきてしまった動画生成と音楽生成。第二回AIアートグランプリはどうなる!? 2023.08.13 Updated by Ryo Shimizu on August 13, 2023, 11:41 am JST ほんの一ヶ月前まで、動画生成は全然だめだった。 Gen2は高価だが狙ったものを出しにくい。何より動いてくれない。ところがAnimateDiffという技術が公開された。これはとても激しく、それっぽく動く。コツは必要だが、以前よりずっと綺麗に動いているのは間違いない。筆者の運営するサイトMemeplexやreplicateで使うことができる音楽生成も、「やはりAIに音楽みたいな人間の機微を読み取るようなものは無理か」と考えていた。「専門家」である僕でさえ、つい一ヶ月ほど前はそうだったのだ。新しいオーディオ生成モデルである「JEN-1」と「AudioLDM2」はそ
- AI
- あとで読む
- 人工知能
- Llama
- 技術
- GPT
- OpenAI
- 動画
- 音楽
- 機械学習
ご家庭のパソコンでLLMが動く!・・・またかよ｜shi3z
- 211 users
- note.com/shi3zblog
- 暮らし
- 2023/03/30
やっぱあれですな。一度動いちゃうと後はもう雪崩のようですな。そしてこっち側も新鮮味を感じなくなってしまうというか。んで、ものすごくアッサリとうちのMacBookProで動きました。量子化済みのモデルをダウンロードしてスクリプト動かすだけ! 工夫なし! Windowsでもいけると書いてある。しかもめちゃくちゃ高速 % ./gpt4all-lora-quantized-OSX-m1 main: seed = 1680064969 llama_model_load: loading model from 'gpt4all-lora-quantized.bin' - please wait ... llama_model_load: failed to open 'gpt4all-lora-quantized.bin' main: failed to load model from 'gp
- AI
- ChatGPT
- あとで読む
- 開発
- ALL
- GPT
- 文章
- 機械学習
- idea
オープンソースの定義にこだわるのはもう無意味なのか？ - YAMDAS現更新履歴
- 197 users
- yamdas.hatenablog.com
- テクノロジー
- 2023/08/21
[2023年8月22日追記]：松尾研究室の投稿にあるように、問題のプレスリリースは修正がなされ、「オープンソース」の記述は削除されている。 weblab.t.u-tokyo.ac.jp 東京大学松尾研究室が大規模言語モデル（LLM）を公開というニュースが先週話題となったが、「商用利用不可のオープンソース」という記述に「商業利用できない」のであれば、オープンソースではないという突っ込みがすかさずあがり、佐渡秀治さんも「座視することが難しい」と意見表明している。ワタシもこれらの意見に賛成である（事実そうした声を受けて、ITmedia などは記事の記述を改めている）。ただ、この話題にすっぽり重なる文章を少し前に見て、居心地が悪い思いをしていたので、それを紹介しておきたい。 www.infoworld.com 「オープンソースのライセンス戦争は終わった」というタイトルだが、どういう文章なのか？
- OSS
- あとで読む
- license
- LLM
- ライセンス
- MongoDB
- 世代
- オープンソース
- tech
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました｜ELYZA, Inc.
- 182 users
- note.com/elyza
- テクノロジー
- 2023/08/29
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデモや評価用データセットも合わせて公開既に社内では、130億、700億パラメータのモデルの開発も進行中はじめにこんにちは。ELYZAの研究開発チームの佐々木、中村、平川、堀江です。この度ELYZAは、Metaの「Llama 2」をベースに、日本語による追加事前学習を行なった日本語言語モデル「ELYZA-japanese-Llama-2-7b」と、そこにELYZA独自の事後学習を施した「
- LLM
- AI
- あとで読む
- 機械学習
- 開発
- 自然言語処理
- 人工知能
- 日本語
- 学習
- 勉強
最近話題になった大規模言語モデルまとめ｜npaka
- 178 users
- note.com/npaka
- テクノロジー
- 2023/03/16
最近話題になった大規模言語モデルをまとめました。 1. クラウドサービス1-1. GPT-4「GPT-4」は、「OpenAI」によって開発された大規模言語モデルです。マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。現在、「ChatGPT Plus」(有料版)で制限付きで利用できる他、ウェイトリストの登録者を対象に「OpenAI API」での利用も開始しています。
- AI
- ChatGPT
- LLM
- 機械学習
- あとで読む
- 自然言語処理
- GPT-4
- GPT
- NLP
日本語Alpacaデータを用いてJapanese-Alpaca-LoRAを作ったので公開します【期間限定デモページあり】｜kun1emon
- 171 users
- note.com/kun1emon
- テクノロジー
- 2023/03/26
⚠️注意今回公開するのはLoRAを用いて作成したLLaMAの日本語化Adapterでありモデル自体ではありません。 LoRAをマージするベースのLLaMAは商用不可であり、今回公開するAdapterで日本語化したモデルも商用利用はできません。 OpneAIの利用規約で、OpenAIサービス、ChatGPTの出力結果を競合モデル開発用途に利用することはできませんコンテンツ生成者はできません。詳細は記事後半で述べていますが利用規約が適用されるのはコンテンツ生成者までです。概要2022年の11月末にOpenAIからChatGPTが発表されてから、それに追随するようにGoogleからBard、MetaからLLaMAなど大規模言語モデル（LLM）が発表されました。さらにLLaMA 7Bを「text-davinci-003」を用いて「Self-Instruct」で作成された52Kのデータセット（
- AI
- LLM
- ChatGPT
- あとで読む
- 機械学習
- 日本語
- 自然言語処理
- nlp
- 人工知能
- japanese
Llama
- 168 users
- ai.meta.com
- テクノロジー
- 2023/07/19
Llama is the next generation of our open source large language model, available for free for research and commercial use.
- AI
- LLM
- あとで読む
- meta
- llama
- GPT
- 自然言語処理
- 機械学習
- 人工知能
ChatGPTやGoogleのBardに匹敵する精度の日本語対応チャットAI「Vicuna-13B」が公開されたので使ってみた
- 164 users
- gigazine.net
- テクノロジー
- 2023/03/31
カリフォルニア大学バークレー校などの研究チームがオープンソースの大規模言語モデル「Vicuna-13B」を公開しました。Vicuna-13BはOpenAIのChatGPTやGoogleのBardに近い精度で回答を生成でき、日本語にも対応しているとのこと。実際に動かせるデモも公開されていたので、使ってみました。 Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality | by the Team with members from UC Berkeley, CMU, Stanford, and UC San Diego https://vicuna.lmsys.org/ GitHub - lm-sys/FastChat: An open platform for training, serving, a
- AI
- ChatGPT
- 人工知能
- あとで読む
- 研究
- LLM
- 文章
- 日本語
- 学習
- 機械学習
わずか4GBの実行ファイル1つで大規模言語モデルによるAIを超お手軽に配布・実行できる仕組み「llamafile」をWindowsとLinuxで簡単に実行してみる方法
- 146 users
- gigazine.net
- テクノロジー
- 2023/12/10
「llamafile」は大規模言語モデルのモデルやウェイトの情報が1つの実行ファイルにまとまった形式のファイルです。Linux・macOS・Windows・FreeBSD・NetBSD・OpenBSDという6つのOS上でインストール不要で大規模言語モデルを動作させることが可能とのことなので、実際にWindowsおよびLinuxディストリビューションの1つであるDebian上で動かしてみました。 Mozilla-Ocho/llamafile: Distribute and run LLMs with a single file. https://github.com/Mozilla-Ocho/llamafile#readme Introducing llamafile - Mozilla Hacks - the Web developer blog https://hacks.mozilla
- 人工知能
- あとで読む
- AI
- LLM
- Linux
- techfeed
- モデル
- tech
さまざまなチャットAIを簡単にローカル環境で動かせるアプリ「Ollama」の公式Dockerイメージが登場
- 143 users
- gigazine.net
- テクノロジー
- 2023/10/21
「Mistral」「Llama 2」「Vicuna」などオープンソースの大規模言語モデルを簡単にローカルで動作させることが可能なアプリ「Ollama」の公式Dockerイメージが登場したので、早速使い勝手を試してみました。 Ollama is now available as an official Docker image · Ollama Blog https://ollama.ai/blog/ollama-is-now-available-as-an-official-docker-image Ollamaで動作可能な大規模言語モデルの代表例は下記の通り。リストの全体についてはOllamaの公式サイトで確認することができます。モデルパラメーターサイズDownloadMistral7B4.1GBollama run mistralLlama 27B3.8GBollama run ll
- docker
- 人工知能
- AI
- あとで読む
- コンテナ技術
- techfeed
- LLM
- モデル
ChatGPT（3.5）に匹敵する「Llama 2」をローカルPCで動かしてみた
- 83 users
- www.itmedia.co.jp
- テクノロジー
- 2023/07/31
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。このLlama 2、GPT-3.5の3月1日時点のモデルに匹敵する性能を持っているというのがウリです。GPT-3.5といえば、無料版のChatGPTで使われているモデルです。それがオープンソースとして公開されたのですから、衝撃的です。さらに、高性能なだけでなくモデルサイズが小さいことも特徴です。GPT-3のパラメータ数は1750億（175B）、GPT-3.5は未公開ではあるものの3550億（355B）と推定されています。一方で、Llama 2は、700億（70B）パラメータで、GPT-3.5並をうたっています。パラメータが小さくなれば必要なGPUのメモリも小さくなります。GPT-3.5はデー
- LLaMA
- LLM
- AI
- ChatGPT
- 人工知能
- 機械学習
- あとで読む
- テクノロジー
経済情報特化の生成AI、日経が開発　40年分の記事学習 - 日本経済新聞
- 71 users
- www.nikkei.com
- テクノロジー
- 2024/04/24
日本経済新聞社は24日、経済情報に特化した生成AI（人工知能）の基盤技術を開発したと発表した。大規模言語モデルと呼ばれるもので、約40年分の日経グループの新聞や雑誌の記事を学習させた。記事の要約機能などで活用を見込む。大規模言語モデルの名称は「NIKKEI Language Model」。性能の指標となる「パラメーター数」が130億と700億の2種類がある。日本経済新聞社の研究開発組織である日
- AI
- LLM
- あとで読む
- 人工知能
- マスコミ
- technology
Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
- 62 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/19
米Metaは4月18日（現地時間）、オープンソースのLLMの最新版「Llama 3」を発表した。80億パラメータと700億パラメータの2モデルで、いずれもほぼすべての主要クラウドサービス（AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake）で間もなく利用可能になる。昨年リリースの先代「Llama 2」にも700億パラメータモデルはあったが、Llama 3は4000億パラメータの高密度モデル（こちらはまだ公開されていない）のトレーニングも継続中だとマーク・ザッカーバーグCEOは語った。トレーニングデータセットは、Llama 2よりも7倍大きく、4倍のコードが含まれている。英語以外での利用に備えるため、データセットの5％以上が非英語データで構成されて
チャットAI「LLaMA」を一発でローカルにインストールして「文章の続きを書く機能」を試せる「Dalai」使い方まとめ
- 62 users
- gigazine.net
- テクノロジー
- 2023/03/14
FacebookやInstagramの運営元であるMetaが開発した言語モデル「LLaMA」は、単体GPUで動作する手軽さとChatGPTに匹敵する性能を両立しているとして話題になっています。そんなLLaMAをApple シリコン搭載Macで動作可能にした「llama.cpp」をGUI付きで簡単に動作させられる「Dalai」が登場したので、実際にインストールして「文章の続きを書く機能」を試してみました。 dalai https://cocktailpeanut.github.io/dalai/ Dalaiを使うには、JavaScript実行環境「Node.js」や開発者向けツール詰め合わせパック「Command Line Tools」を先にインストールしておく必要があります。今回はiMacを使って、必要なソフトウェアから順番にインストールしてみます。既に環境が整っている場合は、「Dalai
- AI
- 文章
- あとで読む
- GIGAZINE
Meta、テキストプロンプトで作曲できる生成AIスイート「AudioCraft」をオープンソース化
- 58 users
- www.itmedia.co.jp
- テクノロジー
- 2023/08/03
米Metaは8月2日（現地時間）、テキストプロンプトから音楽や音声を生成する生成AIツールスイート「AudioCraft」をオープンソース化したと発表した。トレーニングに使うデータの多様化もオープンソース化のねらいの1つだ。 AudioCraftは、エフェクトやサウンドスケープを生成する「AudioGen」、テキストからメロディーを生成する「MusicGen」、ニューラルネットワークベースのオーディオ圧縮コーデックの「EnCodec」の3つのコンポーネントで構成されている。MusicGenは単体で6月にオープンソース化されている。EnCodecは昨年11月に公開済みだが、最近の改良でより高品質な音楽生成が可能になったという。 MusicGenは、Metaが所有する音楽と、「この目的のために特別にライセンスを取得した音楽」をあわせて2万時間分のデータでトレーニングしたとしている。 Metaは
- AI
- Meta
- あとで読む
- 音楽
Llama 2 をDocker使ってローカルで動かす
- 55 users
- zenn.dev/karaage0703
- テクノロジー
- 2023/07/20
Llama 2 発表！ Metaから商用利用可能なライセンスでオープンなLLMであるLlama 2が発表されました。こりゃすごそうだけど、しばらくは様子見かなーと思っていたら、npakaさんが一瞬で動かしているではありませんか。こりゃやるしかないと、ローカルでDockerで動かしてみました。要は、npakaさんの記事の「(1) Pythonの仮想環境の準備」を詳しく書いたものです。 DockerでLlama 2を動かす Dockerファイルは、以下リポジトリに格納してあります。セットアップ方法は、以下参照ください。Linux/Windows前提です。Mac(Apple Silicon)では残念ながら今のところ動きませんでした。 Macでも動きますが、時間が非常にかかるので実用的ではないです。 Dockerのイメージ作成（ビルド）まで実施したらOKです。続いて量子化されたモデルlla
- llama
- docker
- LLM
- あとで読む
- AI
Meta Llama 3
- 55 users
- llama.meta.com
- テクノロジー
- 2024/04/19
Build the future of AI with Meta Llama 3. Now available with both 8B and 70B pretrained and instruction-tuned versions to support a wide range of applications.
- meta
- llama
- AI
- LLM
- あとで読む
- 人工知能
- tech
- programming
Hello Dolly: オープンなモデルでChatGPTの魔法を民主化する - Qiita
- 54 users
- qiita.com/taka_yayoi
- テクノロジー
- 2023/03/25
サマリー我々は、誰でも歴史のあるオフザシェルフのオープンソース大規模言語モデル(LLM)を活用し、高品質トレーニングデータを用いて単体のマシンで30分トレーニングすることで、魔法のようなChatGPTのように指示に従う能力を提供できることを説明します。驚くべきことに、指示への追従には最新かつ最大のモデルは必要ないように見えています: GPT-3の1750億のパラメーターと比較して、我々のモデルは60億のパラメーターです。我々のモデル(Dolly)のコードをオープンソース化し、Databricks上でどのように再作成できるのかを示します。DollyのようなモデルによってLLMの民主化の助けとなって、限られた数社のみが購入できるような何かを、どの企業でも所有し、自身の製品を改善するためにカスタマイズできるようなコモディティになることを信じています。背景プロプライエタリの指示追従モデルであ
僅か2.3GBで日本語可能な超高性能ローカルLLMのPhi-3 MINIをllama.cppとCPUで動かしてみた。スマホでも可。従来のコンパクトLLMと比較して超越した性能で未来を感じさせるMicroSoft寄付ありがとう
- 51 users
- togetter.com
- テクノロジー
- 2024/04/25
Kapper@Linuxガジェヲタ＆異世界小説家＆生成AI＆電子工作大好き @kapper1224 昨日MicroSoftからリリースしたローカルLLMモデルのPhi-3 mini 4k Q4をllama.cppのサーバ版を動かしてみた。こいつ2.32GBしかないくせに日本語しゃべれるぞ。今までとは桁違いの性能なんですけど・・・ ./build/bin/server -m ../Phi-3-mini-4k-instruct-q4.gguf -n 128 huggingface.co/microsoft/Phi-… pic.twitter.com/DTmUmeh7JE 2024-04-24 22:46:51
- LLM
- あとで読む
- cpu
- microsoft
【超簡単手順】低スペックローカルPCで大規模言語モデル「LLaMA」を動かす！
- 47 users
- zenn.dev/ozushi
- テクノロジー
- 2023/03/13
ある日、Twitterを巡回しているとえ...マジで？となりました。自分の専属AIを作りたい！と思い立ち、実際に動かしてみました。目標このようにローカルPC上でLLaMAとチャットできるようになります。ただ、自分が使ったモデルは7Bモデルと言って、パラメータがあまり大きくない＝あまり賢くないモデルだったので出力は変な感じになっています笑 (明らかにネットの会話を推論に引っ張ってきてますね...) なので、今回はとりあえず動かしてみたい人向けです！精度などは気にせずお試しください。ちなみに、自分はM1 MacBookAir(8Gメモリ)で動きました！信じられないぐらい遅いですが笑 Macユーザー向けに解説しますが、windows、linuxユーザーでもほとんど変わらないと思います。手順基本的にはこのgithubでの手順を踏んでいきます。 Node.js (npm) をインストー
- npm
- AI
- node
- mac
- あとで読む
- 言語
- windows
【Youri 7B】日本最高峰の精度を叩き出す！学習量2兆トークン超えの最強日本語LLM | WEEL
- 45 users
- weel.co.jp
- テクノロジー
- 2023/11/03
【Youri 7B】日本最高峰の精度を叩き出す！学習量2兆トークン超えの最強日本語LLM 2023 11/09 Youri 7Bは、2023年10月31日に日本のrinna社が公開した最新の日本語LLMです。このモデルは、Llama2 7Bをベースに開発され、目的や環境に合わせて複数のモデルが用意されており、より多くのAI研究に活用されることを目的としています。また、量子化された軽量モデルもあるので、一般の方でも気軽に試すことができます！今回は、Youri 7Bの概要や使ってみた感想をお伝えします。是非最後までご覧ください！なお弊社では、生成AIの開発について1時間無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Youri 7Bの概要 Youri 7Bは、2023年10月31日に日本のrinna社が公開した最新の日本語LLMで、Meta社の
- LLM
- 日本語
- あとで読む
- 学習
Llama.cpp で Llama 2 を試す｜npaka
- 43 users
- note.com/npaka
- テクノロジー
- 2023/07/19
「Llama.cpp」で「Llama 2」を試したので、まとめました。・macOS 13.4.1 ・Windows 11 前回 1. Llama.cpp「Llama.cpp」はC言語で記述されたLLMのランタイムです。「Llama.cpp」の主な目標は、MacBookで4bit量子化を使用してLLAMAモデルを実行することです。特徴は、次のとおりです。・依存関係のないプレーンなC/C++実装・Appleシリコンファースト (ARM NEON、Accelerate、Metalを介して最適化) ・x86アーキテクチャのAVX、AVX2、AVX512のサポート・Mixed F16/F32精度・4bit、5bit、8bit量子化サポート・BLASでOpenBLAS/Apple BLAS/ARM Performance Lib/ATLAS/BLIS/Intel MKL/NVHPC/AC
- 機械学習
- LLM
- Python
- C++
- 人工知能
700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しました｜ELYZA, Inc.
- 40 users
- note.com/elyza
- テクノロジー
- 2024/03/12
700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しましたはじめにこの度 ELYZA は、新たに開発した700億パラメータの大規模言語モデル (LLM) である「ELYZA-japanese-Llama-2-70b」のデモを公開しました。「ELYZA-japanese-Llama-2-70b」は、前回までに引き続き、英語の言語能力に優れた Meta 社の「Llama 2」シリーズに日本語能力を拡張するプロジェクトの一環で得られた成果物です。 ELYZA が公開している日本語ベンチマーク ELYZA Tasks 100 を用いたブラインド性能評価では、公開されている日本語の大規模言語モデル (以下、LLM) を大きく上回っていることに加え、OpenAI 社の「GPT-3.5 Turboシリーズ」や Anthoropic 社の「Cla
- LLM
- AI
- あとで読む
- 人工知能
- 日本語
- techfeed
llama2のファインチューニング(QLORA)のメモ｜Kan Hatakeyama
- 39 users
- note.com/kan_hatakeyama
- テクノロジー
- 2023/07/21
2023/11/13追記以下の記事は､Llama2が公開されて数日後に書いた内容です｡公開から数ヶ月経った23年11月時点では､諸々の洗練された方法が出てきていますので､そちらも参照されることをおすすめします｡ (以下､元記事です) 話題のLamma2をファインチューニングします｡ QLoRAライブラリを使うパターンと､公式推奨の2つを試しました｡前者が個人的にはオススメです｡前提Hugging faceで配布されている公式のモデルが必要です｡以下を参考に､ダウンロードしておきます｡データセット作成 (7/20 15:20追記設定ミスってたので修正しました) test.jsonを適当に作ります｡ [ { "input": "", "output": "### Human: 富士山といえば?### Assistant: なすび" }, { "input": "", "output":
GPT-3.5に匹敵するチャットAIを構築可能なモデル「Alpaca 7B」をスタンフォード大学が公開、オープンソースで安価に再現可能
- 38 users
- gigazine.net
- テクノロジー
- 2023/03/14
Metaの大規模言語モデル「LLaMA」の7Bモデルに微調整を行った、オープンソースでよりよい命令追従性を実現した大規模言語モデル「Alpaca 7B」をスタンフォード大学の研究チームが公開しました。Alpacaを用いると、GPT-3.5に似た動作を、はるかに小さな環境で簡単・安価に再現することができます。 Alpaca: A Strong Open-Source Instruction-Following Model - Stanford CRFM https://crfm.stanford.edu/2023/03/13/alpaca.html Stanford Alpaca, and the acceleration of on-device large language model development https://simonwillison.net/2023/Mar/13/a
- Alpaca
- AI
- LLaMA
- あとで読む
- 人工知能
Google Colab で Llama 2 を試す｜npaka
- 37 users
- note.com/npaka
- テクノロジー
- 2023/07/19
「Google Colab」で「Llama 2」を試したので、まとめました。 1. Llama 2「Llama 2」は、Metaが開発した、7B・13B・70B パラメータのLLMです。 2. モデル一覧「Llama 2」は、次の6個のモデルが提供されています。 (hfでないモデルも存在) ・meta-llama/Llama-2-70b-hf ・meta-llama/Llama-2-70b-chat-hf ・meta-llama/Llama-2-13b-hf ・meta-llama/Llama-2-13b-chat-hf ・meta-llama/Llama-2-7b-hf ・meta-llama/Llama-2-7b-chat-hf 3. 利用申請「Llama 2」を利用するには、利用申請が必要です。 (1) 公式のMetaのフォームから利用申請。数時間後に利用許可のメールがきます。 (
- LLM
- LLaMA
- AI
- Google
- oss
- 人工知能
- あとで読む
Llama 2の性能がGPT-3.5並みだというのが本当かテストしてみた｜IT navi
- 35 users
- note.com/it_navi
- テクノロジー
- 2023/07/20
１．Llama 2の日本語能力最初に、Llama 2に日本語で話しかけてみました。入力　こんにちは。日本語は話せますか？ LLama 2　Konnichiwa! Yes, I can speak Japanese. How may I assist you today? （こんにちは。はい、日本語が話せます。今日はどのようなご用件でしょうか？）入力　富士山はどんな山ですか？ Llama 2　Fuji-san is a very famous mountain in Japan, known for its beautiful and iconic shape. It is a stratovolcano, which means it is a type of volcano that is characterized by its steep, conical shape and i
- Llama
- LLM
- 人工知能
- 日本語
- あとで読む
BloomをLoRaを使い日本語alpaca datasetでfine tuneを動かす - Qiita
- 35 users
- qiita.com/iss-f
- テクノロジー
- 2023/03/21
llamaをAlpacaデータセットを使いLoRaでfine tuneしたものが良い感じだったので、Bloomを日本語でfine tuneしてみようと思う以下をそのまま参考にするとりあえず、fine funeを動かしただけで、ちゃんと学習させてないので注意 HugginfaceのBloomとpeftも参考にする fine tune fine tune対象をBloomに変更 model = LlamaForCausalLM.from_pretrained( "decapoda-research/llama-7b-hf", load_in_8bit=True, device_map=device_map, ) tokenizer = LlamaTokenizer.from_pretrained( "decapoda-research/llama-7b-hf", add_eos_token=
Alpaca-loraを日本語タスクでファインチューニングする - Qiita
- 34 users
- qiita.com/toshi_456
- テクノロジー
- 2023/03/19
Alpaca-LoRAという家庭用GPUでも大規模言語モデルのFineTuningが可能なモデルが発表されました。本記事では、livedoorニュースコーパスを使用してAlpaca-LoRAをFineTuningしてニュースのタイトルを考えさせるというタスクに挑戦してみます。技術の概要 Alpacaとは Alpacaとは、先日Metaが発表したLLaMa 7Bをtext-davinci-003によるself-instructで生成されたデータを使用してFineTuningした言語モデル。生成したデータは52K個で生成コストは500ドル以下と低コストです。人間による予備評価では7Bという比較的小さなモデルにも関わらず、text-davinci-003に似た挙動を示すという報告があげられています。 Alpaca-LoRAとは Alpaca-LoRAとはAlpacaで作成したデータセット
- Alpaca
- 機械学習
- NLP
- AI
- 自然言語処理
- 日本語
m1 MacbookにLlama 2をインストールして使ってみる | DevelopersIO
- 34 users
- dev.classmethod.jp
- テクノロジー
- 2023/07/31
支給されているPC(m1 Macbook)を使ってローカルでLlama 2を動かしてみるまでの記録です。 AppleシリコンのMacでもLlama 2をつかえるようにするLlama.cppというプロジェクトがあるので、これを利用させてもらいました。 Llama.cppはLlamaをC/C++に移植したもので、Mac上で4ビット整数量子化を使ってLlama 2をローカルに実行できるようにしたものです Llama 2のモデルはmetaのダウンロードリンクから取得しています。準備作業用のディレクトリを作成して行います。 $ mkdir llama2 $ cd llama2 Llama 2, Llama.cppのgithubレポジトリをcloneしておきます。 $ git clone https://github.com/facebookresearch/llama.git $ git clo
- LLaMA
- あとで読む
- mac
- モデル
ローカルでLLMの推論を実行するのにOllamaがかわいい
- 32 users
- zenn.dev/seya
- テクノロジー
- 2024/01/30
ローカルでLLMを動かそうとなったら transformers ライブラリ、llama.cpp、text generation webuiなどいくつかの選択肢があると思いますが、どれもめちゃくちゃハードルが高いというほどではないですが、動かすまでの手続が若干いかつい印象があります。そんな中で Ollama というツールを試してみたところインターフェイスがシンプル、ついでにキャラクターのラマが可愛いのでご紹介していこうと思います。ちなみにですが、日本語での言及はあまり見かけなかったですが、LangChain が出してるレポートでは OSS モデルを動かすのに使われているものとしては3番目に多く使われており、出典: LangChain State of AI 2023 GitHub のスター数も現在約33700とかなり人気を集めていそうです。 Ollama で CLI から推論では早速
- LLM
- Ollama
- Llama
- 生成AI
- AI
- あとで読む
- oss
Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される
- 31 users
- gigazine.net
- テクノロジー
- 2023/08/21
デンマークの著作権侵害対策グループ「Rights Alliance」が、約20万冊にも上る書籍のデータセット「Books3」を削除するよう、ホストする「The Eye」に対して要請し、データセットの削除が行われました。Books3はMetaの開発する大規模言語モデル「LLaMA」のトレーニングにも使用されたデータセットです。 Anti-Piracy Group Takes Prominent AI Training Dataset ''Books3' Offline * TorrentFreak https://torrentfreak.com/anti-piracy-group-takes-prominent-ai-training-dataset-books3-offline-230816/ Revealed: The Authors Whose Pirated Books Are P
- meta
- AI
- 人工知能
- Copyright
- 著作権
- book
【西川和久の不定期コラム】 340億パラメータのLLMは手元のPCで動く？Metaの「Code Llama 34B」を試してみた！
- 31 users
- pc.watch.impress.co.jp
- テクノロジー
- 2023/09/29
- LLM
- AI
- あとで読む
- 人工知能
- techfeed
- PC
Alpaca まとめ｜npaka
- 30 users
- note.com/npaka
- テクノロジー
- 2023/03/15
「Alpaca」の学習方法について軽くまとめました。 1. Alpaca「Alpaca」は、「LLaMA 7B」(Meta)をファインチューニングした言語モデルです。「text-davinci-003」による「self-instruct」で生成された52Kの命令追従型の学習データを使って学習しています。「Alpaca」はOpenAIの「text-davinci-003」に似た挙動を示しますが、驚くほど小さく再現が容易で安価であることが特徴です。また、「Alpaca」は学術研究のみを目的としており、商用利用は禁止しています。 2. 学習済み言語モデルと学習データアカデミックな予算で高品質な言語モデルを学習させるためには、「強力な学習済み言語モデル」と「高品質な学習データ」が必要です。 1つ目は、最近リリースされたMetaの「LLaMA」で解決されます。2つ目は、「self-instru
- AI
- 自然言語処理
- NLP
- LLM
- 機械学習
- 学習
- あとで読む
【Zephyr 7B Alpha】HuggingFaceがLlama 2を超えるLLMを出したので、比較レビューしてみた | WEEL
- 30 users
- weel.co.jp
- テクノロジー
- 2023/10/13
Zephyr 7b Alphaは、Hugging FaceがリリースしたMistral AIのMistral 7bのファインチューニングモデルで、なんと10倍ほどモデルサイズが大きいChat Llama 70Bと同等の性能を持っています。ファインチューニングで10倍の差を埋めるのはすごいですよね！今回は、Zephyr 7b Alphaの概要や仕組み、実際に使ってみた感想をお伝えします。是非最後までご覧ください！なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Zephyr 7b Alphaの概要 Zephyr 7B Alphaは、Hugging FaceがリリースしたMistral AIのMistral 7bをファインチューニングしたモデルです。このモデルは、いくつかのベンチマークでChat Llama
- LLM
- LLaMA
- AI
- あとで読む
- モデル