本文「llama-cpp-python windows」を検索

1 - 15 件 / 15件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

llama-cpp-python windowsの検索結果1 - 15 件 / 15件

歴代チャットボットと最近のLLMのまとめ - Qiita
- 187 users
- qiita.com/Ted-HM
- テクノロジー
- 2023/06/02
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? LLMs The History of Chatbots ELIZA (1966) 初期の人工知能プログラムのひとつ。ルールベースの簡単なパターンマッチングで返答していた。心理療法士の会話を模したELIZA(DOCTOR)が有名。 PARRY (1972) PARRYは偏執病的統合失調症患者をシミュレートしようとしたもの。 ELIZA(DOCTOR)と通信し話題となった。 Jabberwacky (1982, 1988, 1997) ユーモラスな人間同士の自然な会話をシミュレートすることを目的としていた。ユーザーとの会話の大規模な
- AI
- 機械学習
- あとで読む
- 人工知能
- BERT
- 学習
- techfeed
- Qiita
- 勉強
LlamaIndexを使ってローカル環境でRAGを実行する方法 - 電通総研テックブログ
- 47 users
- tech.dentsusoken.com
- テクノロジー
- 2024/01/22
こんにちは。電通総研コーポレート本部システム推進部の山下です。最近はChatGPTなどのLarge Language Model(LLM)を利用したAIが話題ですね。そのLLMを応用したRetrieval-Augmented Generation(RAG)という技術があります。これは、LLMに文書検索などを用いて関連する情報を与えて回答させることで、 LLMが知識として持っていない内容を回答させたり誤った情報を答えてしまうハルシネーションを抑止する技術です。今回はこのRAGをLlamaIndexというライブラリを使ってローカル環境で実装する方法について紹介します。なぜローカル環境でLLMを利用したいのか大変便利なツールのLLMですが、利用が難しいこともあります。例えば、機密情報を取扱いたい、外部インターネットへの接続に制限が掛かっているといった場合です。最終的にOpenAI
- llm
- ai
- あとで読む
- technology
- Python
- プログラミング
- programming
Llama.cpp で Llama 2 を試す｜npaka
- 44 users
- note.com/npaka
- テクノロジー
- 2023/07/19
「Llama.cpp」で「Llama 2」を試したので、まとめました。・macOS 13.4.1 ・Windows 11 前回 1. Llama.cpp「Llama.cpp」はC言語で記述されたLLMのランタイムです。「Llama.cpp」の主な目標は、MacBookで4bit量子化を使用してLLAMAモデルを実行することです。特徴は、次のとおりです。・依存関係のないプレーンなC/C++実装・Appleシリコンファースト (ARM NEON、Accelerate、Metalを介して最適化) ・x86アーキテクチャのAVX、AVX2、AVX512のサポート・Mixed F16/F32精度・4bit、5bit、8bit量子化サポート・BLASでOpenBLAS/Apple BLAS/ARM Performance Lib/ATLAS/BLIS/Intel MKL/NVHPC/AC
- 機械学習
- Python
- LLM
- C++
- 人工知能
ゼロからはじめるPython(106) プログラム生成AIのCodeLlamaを手元のPCでも動かしてみよう
- 39 users
- news.mynavi.jp
- テクノロジー
- 2023/08/26
ChatGPTを筆頭にした「大規模言語モデル(LLM)」と呼ばれるAIが話題に上らない日はない。このAIが得意なタスクには「プログラムの自動生成」が挙げられるが、Metaからプログラム生成に特化したCodeLlamaが商用利用可能なオープンなライセンスでリリースされた。そこで実際に使ってみよう。 CodeLlamaで素数判定のプログラムを自動生成させたところプログラミングは大規模言語モデルが得意とするタスクリリースからわずか2ヶ月で1億ユーザーを達成した「ChatGPT」の公開から本稿執筆時点で8ヶ月が過ぎた。筆者も業務でChatGPTをはじめ、Github Copilotなど、大規模言語モデル(LLM)関連サービスを使わない日はないくらいだ。特に「プログラミング」は、間違いなく大規模言語モデルが得意とするタスクであり、GitHub Copilotを利用している多くの人がその利便性を
Fast and Portable Llama2 Inference on the Heterogeneous Edge
- 16 users
- www.secondstate.io
- テクノロジー
- 2023/11/13
Fast and Portable Llama2 Inference on the Heterogeneous EdgeNov 09, 2023 • 12 minutes to read The Rust+Wasm stack provides a strong alternative to Python in AI inference. Compared with Python, Rust+Wasm apps could be 1/100 of the size, 100x the speed, and most importantly securely run everywhere at full hardware acceleration without any change to the binary code. Rust is the language of AGI. We cr
- LLM
- Rust
- wasm
- AI
- *あとで読む
- あとで読む
WSL2でDeepSeek-R1-Distill-Qwen-32B-Japaneseをllama.cppで試してみる｜noguchi-shoji
- 16 users
- note.com/ngc_shj
- テクノロジー
- 2025/01/30
株価を暴落させているDeepSeekの蒸溜モデルをCyberAgentさんが追加学習したモデルであるDeepSeek-R1-Distill-Qwen-32B-Japanese。これをmomongaさんが量子化したモデル、を試してみます。 momongaさん、ありがとうございます。使用するPCはドスパラさんの「GALLERIA UL9C-R49」。スペックは・CPU: Intel® Core™ i9-13900HX Processor ・Mem: 64 GB ・GPU: NVIDIA® GeForce RTX™ 4090 Laptop GPU(16GB) ・GPU: NVIDIA® GeForce RTX™ 4090 (24GB)　※外付け・OS: Ubuntu22.04 on WSL2（Windows 11）です。 1. llama.cppのセットアップllama-cpp-pyth
- あとで読む
ローカルLLM"Phi-3"をWindows CPUで動かす
- 10 users
- zenn.dev/acntechjp
- テクノロジー
- 2024/05/02
はじめにおれの名前は樋口恭介。Phi-3というMicrosoftから2024年4月23日にリリースされた小規模LLMが、ギリCPUでも動くうえにGPT-3.5よりも精度が高いということで、触ってみることにした。まずはGoogle Colab上でCPUを選択し、動きを確認したところ、通常モデルでも20分～30分程度で、かなり精度が高い回答が得られ、4bit量子化モデルだと、2分～3分程度で、それなりの出力が得られることがわかった。そこで、気分がもりあがってきたので、自身のローカルPC（Windows11、GPUなし、メモリ16GB）でも動かしてみることにした。以下はそのときの試行錯誤のメモである（ほぼ趣味の領域の活動だが、業務時間中に行ったので、こうしてちゃんと会社のブログで手順をまとめているというわけだ）。何も考えずにやるとけっこうハマりポイントが多かった気がするので、ぜひ参考にし
- cpu
- windows
日本語のローカルLLM（文章生成AI）をWindowsで動かす - Qiita
- 7 users
- qiita.com/kenta1984
- テクノロジー
- 2024/08/05
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに LLM1は検索エンジンや翻訳ツールのように多くの人達にとって欠かせないサービスになりつつあります。ところが、ChatGPT、Gemini、ClaudeなどのLLMの代表的なサービスの多くはSaaSとして提供されており、セキュリティ上の懸念から機密性の高い情報をLLMにかけることができないという問題があります。そのため、LLMを十分に活用しきれていないという組織が多いと思います。特に、機密性が高い情報を扱う組織では、LLMを扱える業務が非常に限られているという状況になっているはずです。ローカルLLMとは？ローカルLLMと
- AI
- Python
ローカルPCでLLMを動かす（llama-cpp-python） | InsurTech研究所
- 6 users
- www.insurtechlab.net
- テクノロジー
- 2023/09/29
プレスリリースで「LLMをオープンソースで公開します！」なんてものが流れてくると、自宅のPCで動かしたみたいと思ったりしませんか？「Amazon SageMakerやGoogle Colabがあるから必要だと思わない」「どうせStable DuffusionのようにVRAM不足で落ちるんでしょ？」、ま、まあそういう面は確かにあるのですが、世の中にはCPUだけで動かしてしまう仕組みもあるのです。CPUだったら自宅PCにも必ず乗っている、つまり、ローカルで動くということです。ここで紹介する「llama-cpp-python」はその一つです。もちろんCPUだけで動きますが、NVIDIA GeForceのカードが刺さったPC（きっとゲーミングPC）であればもっと快適に動かすオプションもあり、有償版のサービスに手を出す前に、LLMを使って遊びたい方には良いプロダクトだと思います。 llama-c
- python
なんJLLM部避難所
- 5 users
- mercury.bbspink.com
- テクノロジー
- 2024/04/04
0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ e249-iArR)2023/12/17(日) 21:48:59.66ID:???0 !extend::vvvvv:1000:512 !extend::vvvvv:1000:512 AIに色々なことをしゃべってもらうんやでそこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで自薦・他薦のモデルやツールは>>2以降本スレなんJLLM部 ★6 https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/ VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured 0002名無しさん＠ピンキー (ﾜｯﾁｮｲ e249-iArR)2023/12/17(日) 21:50:26.11ID:???0 初心
llama-cpp-pythonで、OpenAI API互換のサーバーを試す - CLOVER🍀
- 4 users
- kazuhira-r.hatenablog.com
- テクノロジー
- 2024/04/04
これは、なにをしたくて書いたもの？ llama-cpp-pythonを使うとOpenAI API互換のサーバーを立てられることを知ったので、ちょっと動かしてみました。 llama-cpp-python llama-cpp-pythonのGitHubリポジトリーはこちら。 GitHub - abetlen/llama-cpp-python: Python bindings for llama.cpp ドキュメントはこちらです。 llama-cpp-python llama-cpp-pythonは、llama.cppのPythonバインディングです。 GitHub - ggerganov/llama.cpp: Port of Facebook's LLaMA model in C/C++ Llamaを使ったアクセスもできるのですが、 High-level API Python Bindings
microsoft/Phi-3-mini-4k-instruct-gguf · Hugging Face
- 4 users
- huggingface.co
- テクノロジー
- 2024/04/24
Intended Uses Primary use cases The model is intended for commercial and research use in English. The model provides uses for applications which require memory/compute constrained environments latency bound scenarios strong reasoning (especially math and logic) long context Our model is designed to accelerate research on language and multimodal models, for use as a building block for generative AI
Llama 2のLLM(モデル)をGGUFに変換する｜e
- 3 users
- note.com/educator
- テクノロジー
- 2024/02/26
なぜ、こんなことを思われるかもしれないが、自宅のPCはグラボは積まれているが、とてもではないがAIの分野で処理されている性能はない。従って、GPUを使わず、CPUとメモリで処理させたいという要望が出てきた。奇跡的にＣＰＵで処理させているツワモノがいたので、ありがたく使用するためのモデルの変換である前提Windowsのメモリは16GBはあった方がいい。ざっくり、モデルを使用したときに10GB程度は間違いなく消費しているので、それより下は難しいかもしれない今回のプログラムではCPUで処理させた。高いGPUを買うよりはマシかとLlamaのモデルのダウンロードが完了していること事前準備後述するが、llama.cppを使用するにあたり記載のあった w64devkitのfortranを含むzip(w64devkit-fortran-1.20.0.zip)をダウンロードして解凍しておくこと。実はf
GitHub - ComfyUI-Workflow/awesome-comfyui: A collection of awesome custom nodes for ComfyUI
- 3 users
- github.com/ComfyUI-Workflow
- テクノロジー
- 2025/01/08
ComfyUI-Gemini_Flash_2.0_Exp (⭐+172): A ComfyUI custom node that integrates Google's Gemini Flash 2.0 Experimental model, enabling multimodal analysis of text, images, video frames, and audio directly within ComfyUI workflows. ComfyUI-ACE_Plus (⭐+115): Custom nodes for various visual generation and editing tasks using ACE_Plus FFT Model. ComfyUI-Manager (⭐+113): ComfyUI-Manager itself is also a cu
Llama2とは？使い方・日本語性能・商用利用について解説 | 初心者ガイド
- 3 users
- soroban.highreso.jp
- テクノロジー
- 2024/03/21
この記事では、Llama2について幅広く解説しています。Llama2の性能や安全性、商用利用、日本語対応、様々な環境での使い方などに触れています。目次[非表示] 1.Llama2とは 2.Llama2の性能と安全性（ChatGPTとの比較） 2.1.有用性の評価 2.2.安全性の評価 3.Llama2モデルのバリエーション（7b,13b,70b,Chat） 4.Llama2は無料で使えて商用利用も可能 5.クローズドなローカル環境で使える軽量LLM 6.Llama2の日本語モデル（ELYZA-japanese-Llama-2） 7.Llama2を動かすにはGPUが必要 8.Llama2を使用するための環境 9.Windows + GPUのローカル環境 10.Windows + CPUのローカル環境（Llama.cpp、Llama-cpp-python） 11.Macのローカル環境（Lla
- あとで読む