本文「CUDA」を検索 - はてなブックマーク

1 - 40 件 / 322件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

CUDAの検索結果1 - 40 件 / 322件

最近ローカルLLMがアツいらしい
- 1045 users
- soysoftware.sakura.ne.jp
- テクノロジー
- 2024/05/20
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し
- AI
- LLM
- あとで読む
- ChatGPT
- 機械学習
- 人工知能
- mac
- IT
- API
- GPU
ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ
- 489 users
- tech.connehito.com
- テクノロジー
- 2023/11/15
はじめにはじめまして、8月にコネヒトに入社したy.ikenoueです。突然ですがみなさん、生成AIは使っておりますでしょうか？ ChatGPTやStable Diffusionといった代表的な生成AIの発表から約1年が経過し、そろそろブームも落ち着くかと思っていたのですが、つい先日もOpenAI DevDayにてChatGPTに関する様々なアップデートが発表されるなど、相変わらず目まぐるしい日々が続いていますね。弊社における生成AIの活用状況はというと、以前に下記の記事にて、Slack上でChatGPTと会話できる環境を社内提供しているという取り組みをご紹介しました。 tech.connehito.com 本日は、上記の社内ツールに新たに追加した「社内文書の参照機能」についてご紹介します。「社内文書の参照機能」の概要と開発動機まずは「社内文書の参照機能」の概要と開発にいたった動機
- ChatGPT
- AI
- あとで読む
- 開発
- LLM
- 検索
- 人工知能
- rag
- 文章生成AI
- 自然言語処理
AIでラフを線画に整えるだけの無料webアプリ『sketch2lineart』公開｜とりにく
- 349 users
- note.com/tori29umai
- テクノロジー
- 2024/06/20
結論から言うと、こんなことができます。カラーイラストを線画にすることも可能です。先日、AI-AssistantV3なるお絵描き補助AIフリーソフトを公開したのですが、多くの方から『私のPCじゃ動かん！』というご意見をいただきました。わかる～！ちょっとAIに興味あるだけの人が20万↑のPCに手を出せるわけないよね。それが本当に使えるモノかどうかもまだわからないのに。私もできる範囲で動作サポートするものの（抜けていたらすみません！）元々のPCのスペック問題自体はどうしようもないジレンマに葛藤していました。ならばスマホからでも動くシンプルなwebアプリ作ったろうじゃん！！！と思ったので作りました。機能限定版AI-AssistantV3みたいな立ち位置だと思って下さい。まぁ微妙にアルゴリズム違うんで厳密には別物ですが。【追記】勘違いする方もいるっぽいので明記しておきます！こちら
- AI
- あとで読む
- イラスト
- ソフトウェア
- image
- 無料
- 画像
- 人工知能
- webサービス
- 学習
自作PC2023: Ryzenをやめた - k0kubun's blog
- 325 users
- k0kubun.hatenablog.com
- テクノロジー
- 2023/10/20
Ryzenはゲーム用CPUとしては特に問題ないのだが、ソフトウェア開発においてはIntelのCPUに比べて不便なポイントがいくつかある。日々業務で使っていてあまりにもストレスが溜まるので、CPUをIntel Core i7に変更した。このマシンは8年前に組んだ自作PC なのだが、使っていて不便を感じたパーツを差し替え続けた結果、今回のアップデートで全てのパーツが当時とは違うものに変わったため、それぞれ古い方のパーツで不便だったポイントなどを紹介したい。仕事で使う自作PC 社内のサービスをいじる時は会社から貸与されているM1 MacBook Proを使うのだが、このマシンは不便である。 Rubyのビルドは自分のLinuxのマシンに比べ2倍以上遅いし、Reverse Debuggingができるデバッガが存在しないし、慣れたツールであるLinux perfも使えないし、Podman
- PC
- あとで読む
- CPU
- 自作PC
- 自作
- ECC
- intel
- Ryzen
- メモリ
- システム
無料でGPT4越え!?ついに来たXwin-LM｜shi3z
- 318 users
- note.com/shi3zblog
- 暮らし
- 2023/09/22
今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。大先生もまだ試してないというので番組内で一緒に試してみた。もちろんドスパラ製Memeplexマシン(A6000x2)を使用。 >>> from transformers import AutoTokenizer, AutoModelForCausalLM >>> model = AutoModelForCausalLM.from_pretrained("Xwin-LM/Xwin-LM-7B-V0.1") Downloading (…)lve/main/config.json: 100%|██████████████████| 626/626 [00:00<00:00, 56.2kB/s] [2023
- LLM
- あとで読む
- AI
- ChatGPT
- GPT
- 文章生成AI
- 人工知能
- 機械学習
- 無料
Dockerで構築する機械学習環境【2024年版】
- 228 users
- zenn.dev/mkj
- テクノロジー
- 2024/03/11
Dockerを使った機械学習環境の構築方法株式会社松尾研究所で働いているからあげ（@karaage0703）です。松尾研究所では、機械学習（ここでは、予測モデル、画像認識からLLMまで幅広く扱います）を使う多数のプロジェクトが走っています。プロジェクトの特性は多種多様なので、環境構築方法は様々なのですが、松尾研究所では、環境構築方法の1つとしてDockerを推奨していています。今回はDockerを使った機械学習環境の構築方法を紹介します。松尾研究所の特にインターン生を想定した記事にはなりますが、他の組織、個人の方にも参考になる部分があるかと思いWebに広く公開させていただきます。なぜDockerで機械学習環境を構築するのか？具体的な手法に入る前に、まずはDockerで機械学習環境を構築する理由から説明したいと思います。説明が不要な方はここはスキップしてもOKです。そのために、Do
- docker
- あとで読む
- 機械学習
- 学習
- 環境
- code
- mac
LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由｜erukiti
- 224 users
- note.com/erukiti
- テクノロジー
- 2024/04/24
もしあなたがLLMを使ったプロダクトを何かしら開発している、もしくは興味があるのなら、メモリを大量に積んだMac Studioの購入を検討すべきです。対象読者NVIDIAが絶対にいいという人はこの記事の対象読者ではありません。また、用途によって、ローカルマシンによるローカルLLMが向いてる・向いてないは明確にあるので、向いてない用途にしか使わない人も対象読者ではありません。あしからず。また、この記事は別にNVIDIAをdisる意図はありません。みんな違っていい。NVIDIAもいい選択肢ですが、Mac Studioも悪くないですよ、と言いたい。結論LLMプロダクト開発において、今年はもはやローカルLLMを無視できない、してはいけない状況です。 LLMプロダクト開発をする会社の視点でいえば、是非とも80GB以上の十分なGPUメモリを積んだマシンを用意できるようなアジリティを持つのが望まし
- LLM
- AI
- mac
- あとで読む
- 人工知能
- GPU
- 開発
- プロダクトマネジメン
- 絶対
- techfeed
自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで | テクノエッジ TechnoEdge
- 207 users
- www.techno-edge.net
- テクノロジー
- 2024/03/15
ITジャーナリスト／Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Cognition AI CEOのScott Wu氏以下はデモ動画からのキャプチャです。 Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面（右上）、コードエディタ（右下）、Webブラウザ（左下）を持っています（左上は人間とチャットでやり取りする領域）。人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。今回、Dev
- AI
- あとで読む
- エンジニア
- 人工知能
- github
- ソフトウェア
- LLM
- software
- 開発
【2024年版】WSL2+Ubuntu24.04+Docker＋GPUでつくる機械学習環境
- 203 users
- zenn.dev/yumizz
- テクノロジー
- 2024/05/18
はじめに WSL2（Windows Subsystem for Linux 2）は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU：NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。「コントロール
- docker
- WSL
- あとで読む
- 機械学習
- linux
- windows
- cuda
- コンテナ
- Ubuntu
- 環境
画像・PDF・TXT・メールなどの中身を読み取って検索できるようにするオープンソースのドキュメント整理ツール「Teedy」レビュー
- 188 users
- gigazine.net
- テクノロジー
- 2024/03/09
Teedyはさまざまな種類のファイルの中身を読み取って検索できる状態にしてくれるドキュメント整理ツールです。受信したメールを自動で取り込む設定もできるとのことなので、実際にセルフホストして使い勝手を確かめてみました。 sismics/docs: Lightweight document management system packed with all the features you can expect from big expensive solutions https://github.com/sismics/docs TeedyのインストールにDockerを利用するので、下記のリンクから自分の環境に合った方法でDockerをインストールします。 Install Docker Engine | Docker Documentation https://docs.docker.com
M1MacでOllamaを試したら爆速で驚いた
- 181 users
- zenn.dev/yasuna
- テクノロジー
- 2024/05/18
はじめにいつもNVIDIAが載っているWindowsで楽しくLLMを動かしたり生成AIライフを楽しんでいますが、今回はMacOSでOllamaを入れてLlama3を動かしてみました。スペック： Apple M1 Pro(16 GB) 少し前だとCUDAのないMacでは推論は難しい感じだったと思いますが、今ではOllamaのおかげでMacでもLLMが動くと口コミを見かけるようになりました。ずっと気になっていたのでついに私のM1 Macでも動くかどうかやってみました！結論、爆速で推論できていたのでとても驚きました。OSS開発に感謝です！ Ollamaとは OllamaとはローカルでLLMを動かすことができるアプリケーションです。以下からダウンロードできます。 MacOSとLinuxで使うことができます。Windowsもプレビュー版があるみたいです。 #いざ推論ダウロードができたらシ
- LLM
- AI
- あとで読む
- mac
- 機械学習
- research
Nintendo Switch 2の詳細スペック判明。CUDAコアは1280基、CPUはArm A78を8コア搭載
- 166 users
- gazlog.jp
- アニメとゲーム
- 2023/09/17
Nintendo Switch 2の詳細スペックが判明。GPU内蔵のCUDAコアは1280基、CPUはArm A78を8コア搭載 Nintendo Switch 2についてはGamescom2023にて関係者内でデモ機が披露され、そこでUnreal Engine 5などが動作しているデモが行われたという噂が出るなど、発売に向けて着々と開発が進められているためかここ最近はリーク情報が多く出始めています。今回はこの中でも今まで明らかにされていたAmpereアーキテクチャーのGPUを搭載すると言う情報に加えて、このGPUに内蔵されるCUDAコア数やCPUのアーキテクチャーとコア数、そして製造プロセスに関する情報が登場しました。 Samsung Foundry 7LPH(8-nanometer improved version) — Revegnus (@Tech_Reve) September
- 任天堂
- CUDA
- Switch
- あとで読む
- ゲーム
- GPU
- game
- 技術
- CPU
- techfeed
俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ
- 159 users
- www.m3tech.blog
- テクノロジー
- 2023/12/01
こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか？特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ現状の点数計算の練習
わずか4GBの実行ファイル1つで大規模言語モデルによるAIを超お手軽に配布・実行できる仕組み「llamafile」をWindowsとLinuxで簡単に実行してみる方法
- 145 users
- gigazine.net
- テクノロジー
- 2023/12/10
「llamafile」は大規模言語モデルのモデルやウェイトの情報が1つの実行ファイルにまとまった形式のファイルです。Linux・macOS・Windows・FreeBSD・NetBSD・OpenBSDという6つのOS上でインストール不要で大規模言語モデルを動作させることが可能とのことなので、実際にWindowsおよびLinuxディストリビューションの1つであるDebian上で動かしてみました。 Mozilla-Ocho/llamafile: Distribute and run LLMs with a single file. https://github.com/Mozilla-Ocho/llamafile#readme Introducing llamafile - Mozilla Hacks - the Web developer blog https://hacks.mozilla
- 人工知能
- AI
- あとで読む
- Linux
- LLM
- techfeed
- モデル
- tech
LLMを用いたLLMの自動評価について〜可能性と注意点〜 - NTT Communications Engineers' Blog
- 123 users
- engineers.ntt.com
- テクノロジー
- 2023/09/25
こんにちは、イノベーションセンターの杉本（GitHub：kaisugi）です。普段はノーコードAI開発ツール Node-AI の開発に取り組む傍ら、兼務1で大規模言語モデル（LLM:Large Language Model）について調査を行なっています。特に、日本語を中心に学習された LLM への関心があり、awesome-japanese-llm という日本語 LLM をまとめた Web サイトのメンテナンスにも取り組んでいます。今回は、LLM に LLM の評価そのものを行わせるという新たなアプローチ（LLM-as-a-judge）についてご紹介します。 ChatGPT の登場以降、国内外で LLM の開発競争が進行しており、モデルの重みが公開されたオープンなモデルも続々と現れています。そのような中で、新しいモデルの構築だけでなく、どのモデルが優れているかを比較検討することが今後ます
大規模言語モデルをフルスクラッチする練習 (環境構築ー前処理ー事前学習ーファインチューニングー評価まで)｜Kan Hatakeyama
- 112 users
- note.com/kan_hatakeyama
- テクノロジー
- 2024/03/06
はじめに以下のオープンなプロジェクトの一環で､大規模言語モデルをフルスクラッチで作る練習をします｡24年3月現在､協力者も募集中です｡リポジトリ当該プロジェクトの標準コードが公開※されたので､それを走らせてみます｡ ※24/3/5時点で､まだレポジトリ内に､工事中の箇所が多々､あります｡このリポ上では､事前学習ー事後学習ー評価まで､一気通貫(?)したパイプラインが提供されています※｡ 0. 環境構築プロジェクトの本番環境はクラウドですが､今回は手持ちのubuntuを使います｡ Dockerはお手軽な一方で､スパコン上で使うと､どうやら速度が落ちるらしいとの噂を聞いたので､condaで作ります(とはいえ､pipしか使わないので､pyenvでもいけると思います)｡必要なマシン適当なlinux: 例えばUbuntu 22.04.3 LTS GPU: 20 GBくらいは欲しいかも? ディスク
AI Bunchoモデルで何か物語めいたものを生成する｜shi3z
- 105 users
- note.com/shi3zblog
- テクノロジー
- 2023/08/13
もともと小説を書くためのAIなので物語には強いだろう。しかも日本製だし。ということで大先生が早速試していた。僕も真似をしてさっそく使ってみたのだが、そのままだとかなり短い文章しか出てこない。使い方に工夫が必要そうである。そこでこんなコードを書いた。 def b(prompt): input_ids = tokenizer.encode( prompt, add_special_tokens=False, return_tensors="pt" ).cuda() tokens = model.generate( input_ids.to(device=model.device), max_new_tokens=320, temperature=0.6, top_p=0.9, repetition_penalty=1.2, do_sample=True, pad_token_id=tok
- AI
- あとで読む
- LLM
- 人工知能
- 物語
- writing
- モデル
- 文章
- -
Apple A4チップやAMD Ryzenの生みの親であるジム・ケラー氏がNVIDIAのCUDAとx86アーキテクチャを「沼」と呼んで批判
- 91 users
- gigazine.net
- テクノロジー
- 2024/02/20
AMDのAthlonやZenマイクロアーキテクチャ、Apple A4などさまざまなチップの開発に携わったアーキテクトでエンジニアのジム・ケラー氏が、X(旧Twitter)で「NVIDIAのCUDAは沼です」と批判したことが報じられています。 Jim Keller criticizes Nvidia's CUDA, x86 — 'Cuda’s a swamp, not a moat. x86 was a swamp too' | Tom's Hardware https://www.tomshardware.com/tech-industry/artificial-intelligence/jim-keller-criticizes-nvidias-cuda-and-x86-cudas-a-swamp-not-a-moat-x86-was-a-swamp-too ケラー氏の経歴は以下の記事を
Bardのようなimage2textAIを構築して動画検索システムを作る
- 86 users
- zenn.dev/turing_motors
- テクノロジー
- 2023/07/21
Turing株式会社の自動運転MLチームでインターンをしている東大B4の中村です。突然ですが、web検索のように簡単に、ストレージ内に保存されている、日時以外のメタ情報のない動画が検索出来るようになったら幸せになれると思いませんか？例えば「赤信号で車が停止している」という検索クエリに対して、実際に赤信号で停止している動画が返ってきたら、簡単にそれを信号検知＋停止のモデル学習に使えるようになります。今回私が開発した動画検索システムはこれをAIの力を借りて実現しました。これにより、格段に動画検索の利便性が増し、より多様な動画を簡単に使用できるようになりました。今回はそのシステムについて紹介します。ワンパンで動画を探せると嬉しい課題 Turingでは、走行パートナーの方々と共に大量の走行データを収集してきました。車両にカメラ・データ収集キットを載せて、文字通り毎日朝から晩までデータを取
- 機械学習
- LLM
- あとで読む
- 検索
- AI
作って遊ぼう！LLMを搭載した君だけのV&Lモデル！
- 86 users
- zenn.dev/turing_motors
- テクノロジー
- 2023/08/09
はじめに TuringのBrain Research teamで頑張ってる井ノ上です。(Twitter: いのいち) Turingは完全自動運転の開発を目指しており、その実現のためには賢い頭が必要だと考えています。その方法の一つとして、近年の大規模言語モデル（LLM）に見られるような文脈理解力をうまく取り入れられないかと考えており、LLMとVisionの情報をかけ合わせたモデルに注目して研究を行っています。自動運転とVision and languageモデルについては、ぜひこちらの記事を読んでみてください。今回の記事は2023年7月に開催されたABCI LLMハッカソンで取り組んだときに開発していたGIT-LLMというモデルの開発について解説する記事となっています。途中のコードの解説部分などは少し退屈に感じるかもしれませんので、その場合はぜひ結果のパートだけでも見てみてください。いろい
AI分野でのNVIDIA一強状態を崩すためにIntel・Google・富士通・Armなどが参加する業界団体がCUDA対抗のAI開発環境を構築中
- 86 users
- gigazine.net
- テクノロジー
- 2024/03/26
NVIDIAはAI開発に使われるGPUで大きなシェアを獲得しているほか、ソフトウェア開発および実行環境「CUDA」もAIの開発現場で広く採用されています。そんなNVIDIAの一人勝ち状態に対抗するべく、Intelや富士通、Google、Armなどのテクノロジー企業が参加する業界団体「Unified Acceleration Foundation(UXL Foundation)」がオープンなソフトウェア開発環境の構築を進めています。 UXL Foundation: Unified Acceleration https://uxlfoundation.org/ Unified Acceleration (UXL) Foundation https://www.intel.com/content/www/us/en/developer/articles/news/unified-accelera
1BitLLMの実力を見る｜shi3z
- 77 users
- note.com/shi3zblog
- テクノロジー
- 2024/04/18
1BitLLMは本当に実現可能なのか?そして、実現されると予告されていることに意味はあるのか? ようやく再現実装に成功した人が現れたので僕も試してみた。ちなみに1Bit(1.58bit) LLMについての考察はこのページが面白いので一読をお勧めする。ただし、普通のHuggingFaceのお作法とはかなり違うので注意が必要。まず、このHuggingFaceリポジトリを丸ごとgit cloneする $ git lfs install $ git clone https://huggingface.co/1bitLLM/bitnet_b1_58-3B $ cd bitnet_b1_58-3Bこれをやらずにいつもの凡例みたいにいきなりpipelineに読み込もうとすると謎のエラーが出て悩まされることになる。海外でも悩んでる人が何人もいるみたいだ。まあ個人的には「こんな説明で誰がわかる?」と思
- LLM
- あとで読む
- AI
- 機械学習
コーディング支援AIツールContinueの紹介と構成例 - Qiita
- 77 users
- qiita.com/SH2
- テクノロジー
- 2024/04/06
Continueというコーディング支援AIツールの紹介です。コーディング支援AIツール・サービスとしてはGitHub Copilotが有名で、次いでCursorやCodeiumあたりが話題性のあるところかと思います。Publickeyに2024年3月時点での情報がまとまっています。 Continueはそれらと比べて知名度は劣りますが以下のような特徴があり、うまく使いこなせば有力な選択肢になると考えています。ツール本体がオープンソースである Visual Studio CodeとJetBrains IntelliJ IDEAの拡張機能がApache License, Version 2.0で提供されています言語モデルは自分で選ぶ Continueではコード補完用とチャット用で二つの言語モデルを利用しますが、そこでどの言語モデルを選ぶかは利用者側に任されています Continueを開発し
- 人工知能
- AI
- techfeed
- あとで読む
- qiita
- ツール
NVIDIAがCUDAを他のハードウェア上で実行することを禁止
- 71 users
- gigazine.net
- テクノロジー
- 2024/03/06
NVIDIAが、GPU向けのコンピューティングプラットフォームとして提供している「CUDA」のソフトウェア利用許諾契約(EULA)の中で、翻訳レイヤーを通じてNVIDIA以外のハードウェアプラットフォームで実行することを禁止していることがわかりました。もともとこの条項はNVIDIAのサイト上で公開されているオンライン版のEULAには含まれていましたが、インストールしたCUDAのドキュメントにも含まれるようになったとのことです。 License Agreement for NVIDIA Software Development Kits — EULA https://docs.nvidia.com/cuda/eula/index.html Nvidia bans using translation layers for CUDA software — previously the prohi
- NVIDIA
- GPU
- LLM&GPT
- あとで読む
- GIGAZINE
注目の日本語大規模モデルLLM-JP 13Bを試す(JSON吐けた)｜shi3z
- 67 users
- note.com/shi3zblog
- テクノロジー
- 2023/10/20
国立情報学研究所が作ったLLM-JP 13Bが公開されていたので早速試してみた。色々なモデルが公開されているが、全部盛りっぽい「llm-jp/llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0」を試す。マシンはもちろんドスパラ製Memeplexマシン(A6000x2)だ。 import torch from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("llm-jp/llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0") model = AutoModelForCausalLM.from_pretrained("llm-jp/llm-jp-13b
- LLM
- AI
- あとで読む
- 自然言語処理
- JSON
- 日本語
- モデル
- 人工知能
Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
- 65 users
- tech.mirrativ.stream
- テクノロジー
- 2024/03/04
こんにちはハタです。最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります構築していく上で色々試行錯誤したのでそれが紹介できればなと思っていますどんなものを作ったか前提知識: 配信基盤前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージまとめ We are hiring! どんなものを作ったか今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行うシス
LLMプロダクト開発とはどういうものなのか？｜erukiti
- 63 users
- note.com/erukiti
- テクノロジー
- 2024/04/26
LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由という記事を書きました。 mutaguchiさんのツイートを見て、LLMプロダクトの開発とはどういうものなのかを知らない人も多いのかなと気づいたので、そこらへんを記事として書いてみます。 https://t.co/4WvjuuoGnC 「LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由」の記事のはてブコメント見てたんだけど、ほとんど理解されてなかったのが興味深い。・プロプライエタリなLLMでは、ランニングコストが嵩み、これを利用したサービスは成立しづらい… — mutaguchi (@mutaguchi) April 24, 2024 商用LLM APIとローカルLLMって使い方が全然違う気がしてる。商用LLM APIって、機微情報を送らないこと、規約違反テキストを送らないこ
- LLM
- AI
- 開発
- あとで読む
- mac
- プロダクト
- 学習
- programming
「ゼロからGPU開発」に経験なし＆わずか2週間で成功した猛者が登場
- 58 users
- gigazine.net
- テクノロジー
- 2024/04/30
コードなしでWeb3コンテンツなどを開発することができるプラットフォーム・thirdwebの創設者であるadammaj氏が、「経験なしで2週間でゼロからGPUを構築した」と報告しています。 I've spent the past ~2 weeks building a GPU from scratch with no prior experience. It was way harder than I expected. Progress tracker in thread (coolest stuff at the end)👇 pic.twitter.com/VDJHnaIheb— adammaj (@MajmudarAdam) ◆ステップ1：GPUアーキテクチャの基礎を学ぶ adammaj氏はまず、最新のGPUがアーキテクチャレベルでどのように機能しているのかを理解しようとしたそうで
- GPU
- gigazine
- diy
- 学習
- hardware
- Development
Supercomputing Contest 2013/GPUプログラミング資料 - Supercomputing Programing Contest Official Site
- 54 users
- www.gsic.titech.ac.jp
- テクノロジー
- 2024/05/05
2023-09-13 SupercomputingContest2023 2023-09-06 Supercomputing Contest News News/sc230906 2023-09-01 News/sc230830 2023-08-28 News/sc230828 SupercomputingContest2023/本選結果 2023-08-01 MenuBar 2023-06-29 News/sc230629 SupercomputingContest2023/予選結果 2023-06-12 SupercomputingContest2023/予選・認定問題Ｑ＆Ａ 2023-06-01 SupercomputingContest2023/問題および関連ファイル群更新履歴 2023-05-31 News/sc230531 2023-05-30 News/sc230530 20
バクラクMLチームの技術スタックの変遷 - LayerX エンジニアブログ
- 54 users
- tech.layerx.co.jp
- テクノロジー
- 2023/07/28
機械学習エンジニアの吉田です。夏ですね。7月はLayerXエンジニアブログを活発にしよう月間です。昨年バクラクOCRの機械学習モデルの検証から本番投入までの取り組みについて記事を書きました。 tech.layerx.co.jp その後、運用する中で新たな課題が生まれたり、負債を解消するために当初の開発環境を見直しアップデートしてきました。今回は機械学習周辺の技術スタックに焦点を当ててその変遷について紹介したいと思います。 MLチームでは各サービスからのリクエストを処理するAPIやデータ基盤、社内のアノテーションツールなどの開発も行っており、これらは主にGo, TypeScriptで開発されていますが今回は対象外としています。技術スタックの変遷本番リリース時と現在の主な技術スタックの比較です。リリース時現在言語 Python Python パッケージ管理 pip Poetr
拡散モデルで将棋の方策を学習する - TadaoYamaokaの開発日記
- 50 users
- tadaoyamaoka.hatenablog.com
- アニメとゲーム
- 2023/07/16
拡散モデルで、将棋の方策を学習できないか試してみた。拡散モデル拡散モデルは、高品質で多様なサンプルを生成できる生成モデルである。昨年8月にStable Diffusionが公開されたことで注目を集めている。拡散モデルは、確率微分方程式によって表される確率分布を近似するモデルで、モード崩壊を起こさず多様な分布を学習できるという特徴がある。また、プロンプトと呼ばれるテキストにより条件付けを行い、テキストに従った画像を生成できる。将棋の方策将棋の方策は、座標と移動方向の組み合わせで表現でき、dlshogiで採用している表現方法では2187次元になる。つまり、指し手は、局面によって条件づけられた2187次元の確率分布からサンプリングを行っていることになる。拡散モデルの可能性条件付けを行い高次元の確率分布からサンプリングを行うという仕組みは、将棋の方策においても適用できると考える
- AI
- 将棋
- あとで読む
- Python
- プログラミング
- 数学
- 開発
- ゲーム
AI時代に一人勝ち。NVIDIAの「CUDA」がIntelやAppleを蹴散らし業界の“実質的なスタンダード”になった背景を中島聡が徹底解説 - まぐまぐニュース！
- 50 users
- www.mag2.com
- テクノロジー
- 2024/06/06
空前のAIブームの中にあって、その開発の現場で「一人勝ち」とも言うべき圧倒的なシェアを誇っているNvidia（エヌビディア）のGPU向け開発環境「CUDA」。IntelやAppleといったライバルたちを尻目に、いかにしてCUDAはトップに登り詰めたのでしょうか。今回のメルマガ『週刊 Life is beautiful』では世界的エンジニアとして知られる中島聡さんが、CUDA誕生の経緯から業界の「事実上の標準」となるまでを詳しく解説。さらにMicrosoftが5月20日に発表した「Copilot+PC」に関して、中島さんが注目したポイントを記しています。 ※本記事のタイトル・見出しはMAG2NEWS編集部によるものです／原題：NvidiaのCUDAが今の地位を築いた経緯プロフィール：中島聡（なかじま・さとし）ブロガー／起業家／ソフトウェア・エンジニア、工学修士（早稲田大学）／MBA（ワシ
- NVIDIA
- AI
- GPU
- Apple
- 人工知能
- 興味深い
- あとで読む
- Microsoft
- 技術
- pc
生成AIグラビアをグラビアカメラマンが作るとどうなる？第17回：新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久) | テクノエッジ TechnoEdge
- 50 users
- www.techno-edge.net
- テクノロジー
- 2024/01/31
ComfyUIが流行ってる？Stable Diffusionで生成AI画像を作る時、もっとも一般的なインターフェースはAUTOMATIC1111だろう。デファクトスタンダードと言ってもいいほどで、検索すると、インストール方法や使い方など、それこそ山盛り出てくる。ところが最近、ComfyUIがちょっとした人気だ。以前軽くご紹介したが、カスタムNodeを組み合わせ自由にWorkflowを構築できる結構マニアックなアプリなのに何故？ ComfyUI。カスタムNodeを接続してWorkflowを作る…と結構マニアックなアプリ。これは筆者が日頃使っているWorkflowの1つこれには理由があり、12月頃から以降、Stable Video Diffusion、Kohya's HiresFix、SDXL Turbo、LCM、FaceID、PhotoMaker、InstantID、様々なControlN
- 機械学習
- あとで読む
- ai
- イラスト
- python
- IT
- Webサービス
- 画像
1つの大きなLLM（大規模言語モデル）を複数のGPUで力を合わせて動かそう | IIJ Engineers Blog
- 46 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2024/05/07
地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 LLM群雄割拠の時代昨今、ローカルGPUで駆動できるようなLLM（大規模言語モデル）もかなり増えてきて、キャッチコピー的に「ついに我が家にもGPT-4が！」とか言われるようになってまいりました。パラメータ規模で言えば70億～130億(7B-13B)パラメータ、700億(70B)パラメータ、1400億(140B)パラメータあたりのモデルが活発にリリースされているように見受けられます。大きなモデルをGPU寄せ集めしつつ遊びたい！しかしながら、コンシュマー向けのGPUにおいては、7B
- LLM
- GPU
- AI
- あとで読む
- techfeed
線画から疑似3D画像を出力するアプリ『Line2Normalmap』&それをライティングするアプリ『NormalmapLighting』公開！｜とりにく
- 44 users
- note.com/tori29umai
- テクノロジー
- 2024/04/06
2024/04/06フリー公開しました！！！新しいアプリを作ったので機能の紹介です。こちらのアプリは現在（2024/4/3時点）でfanboxのみで公開（ソースコード自体はgithubで公開）しています。 3日後の2024/04/06にはフリー公開しますので、それまでお待ちください。【DL先】https://drive.google.com/file/d/1_LPHAFgs4lzDYGdZmv23aVDiTMnV9Y3t/view?usp=sharing ファンボックスで支援者様にのみ先行公開しています！【モデル開発協力者様】月須和・那々 (2vXpSwA7)様【必要スペック】理論上、CUDAに対応したGPU搭載PCなら動きます。むしろどのスペックなら動くのか教えてください。自分の環境だと、ゲーミングノートPC AMD Ryzen 7 5800HS 16GB 512GB RTX
- AI
- あとで読む
- illust
- 人工知能
- 機械学習
- 3D
LlamaIndexを使ってローカル環境でRAGを実行する方法 - 電通総研テックブログ
- 43 users
- tech.dentsusoken.com
- テクノロジー
- 2024/01/22
こんにちは。電通総研コーポレート本部システム推進部の山下です。最近はChatGPTなどのLarge Language Model(LLM)を利用したAIが話題ですね。そのLLMを応用したRetrieval-Augmented Generation(RAG)という技術があります。これは、LLMに文書検索などを用いて関連する情報を与えて回答させることで、 LLMが知識として持っていない内容を回答させたり誤った情報を答えてしまうハルシネーションを抑止する技術です。今回はこのRAGをLlamaIndexというライブラリを使ってローカル環境で実装する方法について紹介します。なぜローカル環境でLLMを利用したいのか大変便利なツールのLLMですが、利用が難しいこともあります。例えば、機密情報を取扱いたい、外部インターネットへの接続に制限が掛かっているといった場合です。最終的にOpenAI
- llm
- ai
- あとで読む
- technology
- Python
- プログラミング
- programming
大規模言語モデル(LLM)の作り方 GPT-NeoX編 Part 1
- 43 users
- zenn.dev/turing_motors
- テクノロジー
- 2023/07/19
はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 の藤井(@okoge_kaz)です。大規模モデルへの注目の高さを肌で感じる今日このごろですが、事前学習の知見については依然として十分に共有されているとは言い難いと個人的に感じています。 Turing株式会社では、次世代の自動運転技術を支える技術の1つとして大規模言語モデルに注目しており、独自に研究開発を行っています。今回は大規模言語モデルを学習する際、用いるライブラリ候補の１つに上がるであろうGPT-NeoXについて解説します。以下で環境構築方法、学習を行う方法などについて詳しく解説します。 GPT-NeoXとは EleutherAIが管理しているNIDIA/Megatron-LM ベースの大規模言語モデル(Large Language Model: LLM)を学習するためのライブラリです。 Mi
- LLM
- GPT
- Python
- 機械学習
- ai
- 人工知能
NVLink BridgeでGPUを繋いでも1GPUにはなりません | HPCシステムズ Tech Blog
- 42 users
- www.hpc.co.jp
- テクノロジー
- 2023/07/19
『NVLink Bridgeで複数GPUを繋いだら、それらが1GPUとして扱えるようになるんでしょ？』という誤解をされているお客様をしばしばお見受けいたします。こちらの記事では、それが誤解であること、また、SLIやUnified Memoryといった関連する情報についても整理して解説いたします。間違った期待を抱いて失敗しないように、正しい理解を深めていきましょう。 GPUのメモリ空間は他デバイスから隔絶されています GPU上には演算するためのプロセッサと、データを一時的に置いておくためのメモリ(VRAM)が搭載されています。GPUのメモリを、CUDAで書かれたプログラムから利用するには、cudaMallocでメモリ領域を確保し、cudaMemcpyを使ってホスト(CPU側)のメモリとデータの送受信を行い、GPU上で演算kernelとする関数（以下、GPU-Kernel）を呼び出し、最後にc
スーパーコンピューターで日本がトップに立ち続けていたら今ブームのAIに繋..
- 41 users
- anond.hatelabo.jp
- テクノロジー
- 2024/06/26
スーパーコンピューターで日本がトップに立ち続けていたら今ブームのAIに繋がったのか？それともスパコンとAIは関係ない？脱Android⁠⁠、Huaweiが独自OS「HarmonyOS NEXT」てのがニュースなったけどこれもスパコン技術が応用されてそこから生まれてたりするの？スパコン予算をすべてに優先してたら日本産独自OSとか日本産AIに繋がってたんだろうか？つながらない OSはもうぜんぜんまったく完璧に関係ないのでAIについてだけ説明するまず2010年代に始まった第3次AIのブームはソフトウェアというかアルゴリズムのブレークスルーがきっかけカナダのYoshua Bengio、Geoffrey Hinton、Yann LeCunの3人がディープニューラルネットワークに関する発見をしたこと 3人はこの業績で「ディープニューラルネットワークがコンピューティングの重要な要素となるた
- AI
- 増田
- 人工知能
- techfeed
- 企業
- ビジネス
llama2のファインチューニング(QLORA)のメモ｜Kan Hatakeyama
- 41 users
- note.com/kan_hatakeyama
- テクノロジー
- 2023/07/21
2023/11/13追記以下の記事は､Llama2が公開されて数日後に書いた内容です｡公開から数ヶ月経った23年11月時点では､諸々の洗練された方法が出てきていますので､そちらも参照されることをおすすめします｡ (以下､元記事です) 話題のLamma2をファインチューニングします｡ QLoRAライブラリを使うパターンと､公式推奨の2つを試しました｡前者が個人的にはオススメです｡前提Hugging faceで配布されている公式のモデルが必要です｡以下を参考に､ダウンロードしておきます｡データセット作成 (7/20 15:20追記設定ミスってたので修正しました) test.jsonを適当に作ります｡ [ { "input": "", "output": "### Human: 富士山といえば?### Assistant: なすび" }, { "input": "", "output":