並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 18 件 / 18件

新着順 人気順

onnxの検索結果1 - 18 件 / 18件

  • レベル別で紹介!オープンソースで挑戦できる120のプロジェクトアイデア集 - Qiita

    はじめに 「オープンソースに挑戦したいけど、どんなプロジェクトを作ればいいかわからない…」そんな悩みを持っていませんか? 本記事では、初心者・中級者・上級者・達人 の4つのレベルに分けて、合計 120個のオープンソースプロジェクトアイデア を紹介します。 それぞれのアイデアの詳細については折りたたんであります。興味がある内容については広げてみて機能要件や実装のポイント、拡張機能、学べることを見てみてください! 自分のスキルレベルに合ったプロジェクトを見つけて、実際に開発に挑戦してみましょう! 初心者向けプロジェクトアイデア 1. ToDoリストアプリ 概要 ToDoリストアプリは、ユーザーがタスクを追加・編集・削除し、完了状況を管理できるシンプルなアプリです。 初心者でも取り組みやすく、プログラミングの基礎となる CRUD(Create, Read, Update, Delete) の概念

    • LLMモジュールの普通ではない使い方

      それはある日のこと ある日のこと、社内Slackに吉川部長からこんな投稿がありました。 「伊達さんがXでリポストしてたアリババクラウドのオープンソースLLMって、オフラインでLLMが動く小さいモジュールなのかしら?オフラインでLLMが使える可能性があるなら試してみたい感じではあります。」 これは、M5Stack社のLLMモジュールの発売案内に関するポストでした。 LLMモジュールが面白いのは、AI対話アプリケーションをハードウエア単体だけで実現しているところです。高価なGPUを積んだPCであれば単体で実現するのは比較的容易なのですが、安価な基板1つだけで音声対話型AIを実現してしまうのは、ちょっとびっくりする技術です。 一般的に、音声対話型のAIを実現するためには、以下の4つの技術が必要になります。 キーワード検出 KWS(Keyword Spotting):特定のキーワードやフレーズを音

        LLMモジュールの普通ではない使い方
      • 自分の撮った写真数千枚を使って、リアルタイムに画像を生成してくれるVJツールを作った話 - Butadiene Works

        はじめに こんにちは、Butadieneです。 先日、「オーディオとビジュアルのパフォーマンスを楽しむリアルイベント」draw(tokyo); #2にVJとして出演してきました。 function-draw.com #function_draw@lactoice251 (Livecoding + 生演奏) ×@butadiene121 (多分?C++による自作AIジェネVJ) 最高すぎ! pic.twitter.com/a5I349EBLL— Saina(さいな) (@SainaKey) 2025年3月22日 今回のライブでは、らくとあいすさん(https://x.com/lactoice251)のGLSL Soundに合わせてVJを行いました。 当日の一旦のアーカイブです(そのうちちゃんとしたやつに差し替えます。) youtu.be 映し出されてるコードは、らくとあいすさんのGLSL S

          自分の撮った写真数千枚を使って、リアルタイムに画像を生成してくれるVJツールを作った話 - Butadiene Works
        • 初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita

          Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちは。 タイトルの通り、現在趣味半分で個人開発中のきゅうり収穫支援システムについてつらつらと書いていきます。 (記念すべき初投稿記事です!) 1. プロローグ 私はきゅうり栽培を営む農家の両親を持つ一会社員なのですが、スマート農業で両親の仕事を助けられないかと考え、今回の個人開発を始めてみました。 将来的には近年の農業従事者数の減少と高齢化の問題解決に貢献できればいいなぁと漠然と考えています。 2. 開発前の調査 開発を始める前に、両親へのヒアリングをする中で、きゅうり収穫における以下のような課題感が掴めてきました。 ①目視による

            初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita
          • Expert used ChatGPT-4o to create a replica of his passport in just 5 minutes bypassing KYC

            EDR-as-a-Service makes the headlines in the cybercrime landscape | Oracle privately notifies Cloud data breach to customers | SECURITY AFFAIRS MALWARE NEWSLETTER ROUND 40 | Security Affairs newsletter Round 518 by Pierluigi Paganini – INTERNATIONAL EDITION | Expert used ChatGPT-4o to create a replica of his passport in just 5 minutes bypassing KYC | A flaw in Verizon’s iOS Call Filter app exposed

              Expert used ChatGPT-4o to create a replica of his passport in just 5 minutes bypassing KYC
            • レベル別で紹介!オープンソースで挑戦できる120のプロジェクトアイデア集 - Qiita

              はじめに 「オープンソースに挑戦したいけど、どんなプロジェクトを作ればいいかわからない…」そんな悩みを持っていませんか? 本記事では、初心者・中級者・上級者・達人 の4つのレベルに分けて、合計 120個のオープンソースプロジェクトアイデア を紹介します。 それぞれのアイデアの詳細については折りたたんであります。興味がある内容については広げてみて機能要件や実装のポイント、拡張機能、学べることを見てみてください! 自分のスキルレベルに合ったプロジェクトを見つけて、実際に開発に挑戦してみましょう! 初心者向けプロジェクトアイデア 1. ToDoリストアプリ 概要 ToDoリストアプリは、ユーザーがタスクを追加・編集・削除し、完了状況を管理できるシンプルなアプリです。 初心者でも取り組みやすく、プログラミングの基礎となる CRUD(Create, Read, Update, Delete) の概念

              • 小規模言語モデルを活用したエッジAIソリューションについて共同検証を実施

                ヘッドウォータースは2025年2月17日、東京エレクトロン デバイスと共同で「Phiモデルを中心としたSLM(小規模言語モデル)×Microsoft IoT Edge×ファインチューニング」を活用したエッジAI(人工知能)について検証したと発表した。 Microsoft Oliveを活用したモデル量子化やLoRA、QLoRAファインチューニングにより、PhiモデルなどのSLMを業務に特化した形で適用し、テキストと画像処理の適用範囲を検証した。 また、Azure IoT Edge for Linux on Windows(EFLOW)やiotedge-compose、Azure IoT Edgeランタイムを活用し、SLMアプリケーションの開発やデプロイメント効率化を検証している。さらに、クラウドとエッジによるデータ連携の有効性やDirectML、CUDA、ONNXランタイムをサポートし、さま

                  小規模言語モデルを活用したエッジAIソリューションについて共同検証を実施
                • OCRソフト「YomiToku」で画像データを文字データにする|ワビスケ/ PBMB

                  ボードゲームのカードテキストやTRPGのルールブックの一部を電子化するときに書き写すことも可能ですが、多くの時間を要します。 そこで今回はOCRを使って書き出したいと思います。 使うOCRソフトは「YomiToku」を使います。こちらは日本語文書に特化して学習しているため変換精度に期待が持てます。 早速テキスト化したい対象データを選択します。今回はPDFファイルを用意しました。 1.セットアップ方法それでは実行方法を紹介したいと思います。検証に使ったPCは以下のような性能です。YomiTokuは処理にGPUを使うことができます。 WIndows11 GPU:Geforce  RTX3060Ti(vram 8GB) メモリ:32GB CUDA 12.4 Python 3.11.9 1-1.実行するフォルダを作るエクスプローラやコマンドでYomiTokuを実行するフォルダを作成します。今回はユ

                    OCRソフト「YomiToku」で画像データを文字データにする|ワビスケ/ PBMB
                  • 200ドルAIパソコンを作る方法|Tak

                    少し前から、私が愛用するノートパソコンであるDell Inspiron 16 5625をAIパソコンに変貌させるべくチャレンジしてきた。noteを書くこともそうだが、生成AIブームにだいぶ乗り遅れているのは自覚している。 Dell Inspiron 16 5625は2022年の春先に発売され、外面がMacbook Pro風味であること、CPUとGPUをひとつのデバイスに統合したAMD APUを搭載していることが特徴。そして、なにより安かった。私はデルから次のスペックで6万円もしないお値段で買っていた。 AMD Ryzen 5 5625U(6コア/12スレッド、最大4.3GHz) 16GB DDR4メモリ 512GB NVME M.2 SSD Dell Inspiron 16 5625AIといえば生成AI、生成AIといえば画像生成AIのStable Diffusion。そして、Stable

                      200ドルAIパソコンを作る方法|Tak
                    • 初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita

                      Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちは。 タイトルの通り、現在趣味半分で個人開発中のきゅうり収穫支援システムについてつらつらと書いていきます。 (記念すべき初投稿記事です!) 1. プロローグ 私はきゅうり栽培を営む農家の両親を持つ一会社員なのですが、スマート農業で両親の仕事を助けられないかと考え、今回の個人開発を始めてみました。 将来的には近年の農業従事者数の減少と高齢化の問題解決に貢献できればいいなぁと漠然と考えています。 2. 開発前の調査 開発を始める前に、両親へのヒアリングをする中で、きゅうり収穫における以下のような課題感が掴めてきました。 ①目視による

                        初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita
                      • Style-Bert-VITS2とAivisSpeechを使って自分の声でAI合成音声を作ってみたんだ|稲嶺双人(たり)

                        記事としては一般人の感想文的なものとして読んでください 上記動画でやってない部分はAivisSpeechで使うための設定くらいです onnxファイルの作り方など知りたい方は最後のほうを読んでみてください Style-Bert-VITS2の導入 ここからzipファイルをダウンロードして いつものようにCドライブ直下に展開 グラボがあるのでInstall-Style-Bert-VITS2.batをダブルクリック なんか多少のダウンロードはされるけど中途半端に終わる… というのはPowerShellのパスが通ってなかったからでした 自分みたいなもののためにメモっておきます コントロールパネル→システムとセキュリティ→システム→システムの詳細設定→環境変数→Pathを選択→編集→新規→C:\Windows\System32\WindowsPowerShell\v1.0 と入力 PowerShell

                          Style-Bert-VITS2とAivisSpeechを使って自分の声でAI合成音声を作ってみたんだ|稲嶺双人(たり)
                        • Core Ultra 200H (Arrow lake-H)は77 TOPS! ただしCopilot+ PC対応かは不明 - ウインタブ

                          先日、Intelの新しいデスクトップ用CPUのCore Ultra 200Sシリーズ(Arrow lake-S)の発表が行われました。こちらの概観および性能については、ほぼ以前の記事の説明通りになりそうなことが確認されたため、ここでは割愛します。 デスクトップ用の発表が主でしたが、合わせてノート用のArrow lake-HXおよびArrow lake-Hについてもチラ見せ的な発表があり、2025年第一四半期の登場となることが説明されました。最近の通例通り、年初のCESで正式な発表があり、2月ごろから新機種がぼちぼち登場する感じになるでしょう。 今回の公式説明ビデオの中で、ちょっと気になる発表がありました。それは、ビジネス~スタンダードノートを担当するCore Ultra 200H (Arrow lake-H)について、内蔵GPUにAI用回路XMXが追加された”Xe with XMX”にアッ

                            Core Ultra 200H (Arrow lake-H)は77 TOPS! ただしCopilot+ PC対応かは不明 - ウインタブ
                          • In Localhost We Trust: Exploring Vulnerabilities in Cortex.cpp, Jan’s AI Engine | Snyk

                            A recent Andreessen report shows a growing trend in self-hosted AI, jumping from 42% to 75% year-over-year. It demonstrates the notion among developers that on-premise is inherently more secure, but it still comes fraught with danger if you're not hyper-focused on security in addition to the AI. This came into play recently as the Snyk Security Labs team identified vulnerabilities within Cortex.cp

                              In Localhost We Trust: Exploring Vulnerabilities in Cortex.cpp, Jan’s AI Engine | Snyk
                            • Phi-4 multimodal を VRAM12GB に載せる

                              Why Phi-4 multimodalのsample codeをそのまま動作させると、VRAM12GBに収まりません。 細かく見ていませんが、16GBあればそのまま動作させられそうです。 手元のRTX4080 Laptop 12GBで動作させたいのでどうにかします。 What 前提 画像とテキストのモーダルだけ使う Python Debbugerでモデルの中を触りたいので、なるべく純正仕様が良い (この前提がなければ、ONNX量子化版を触る方が早そう) その前提で以下を実施します。 Audio encoder / projector の削除 (使うやつだけ残す) ↑に伴う内部変数の修正 入力画像サイズの縮小 修正版のsample code オリジナルはこちら。 import requests import torch import os import io from PIL import

                                Phi-4 multimodal を VRAM12GB に載せる
                              • Windowsの機械学習向けAPI「DirectML」が「Copilot+ PC」に対応、WebNNも利用可能に

                                米Microsoftは、Windowsが備える機械学習向けAPI「DirectML」が、米Qualcommの「Snapdragon X」シリーズに対応したと8月29日(現地時間)に発表した。DirectMLはWindows PCが備えるGPU(Graphics Processing Unit)の機能を機械学習向けに抽象化したAPI。これまでは米AMDや米Intel、米NVIDIAのGPUのほか、QualcommのSnapdragon SoC(System on Chip)が備える「Adreno」GPUに対応していた。 今回の更新によって、QualcommのSnapdragon Xシリーズが持つ「Hexagon NPU」も機械学習の処理に利用できるようになった。Snapdragon Xシリーズで動作する機械学習プログラムを作るには、DirectMLのバージョン1.15.2以降(64ビットAr

                                  Windowsの機械学習向けAPI「DirectML」が「Copilot+ PC」に対応、WebNNも利用可能に
                                • SMARC2.0業界標準に準拠し、コンパクトな 82mm×50mm を持つ高性能AI コアボード 「Core-3568J SMARC」システムオンモジュールの販売を開始

                                  SMARC2.0業界標準に準拠し、コンパクトな 82mm×50mm を持つ高性能AI コアボード 「Core-3568J SMARC」システムオンモジュールの販売を開始 2025年2月13日、東京都渋谷区 - ポジティブワン株式会社は、SMARC 2.0 業界標準に準拠し、コンパクトな 82mm × 50mm のフォームファクタを持つ高性能 AI コアボード 「Core-3568J SMARC」 システムオンモジュールの販売を開始いたします。 本製品は、Rockchip 社の クアッドコア 64 ビットプロセッサ RK3568 を搭載し、1TOPS の NPU を内蔵 することで軽量 AI アプリケーションの開発をサポートします。さらに、4K ビデオデコード機能を備え、豊富なインターフェースオプションを提供し、ギガビットイーサネット、WiFi、Bluetooth、5G/4G などの高速ネッ

                                    SMARC2.0業界標準に準拠し、コンパクトな 82mm×50mm を持つ高性能AI コアボード 「Core-3568J SMARC」システムオンモジュールの販売を開始
                                  • Pythonで作成した物体検出アプリをC++、C#でWindowsネイティブアプリに作り直した話 - Qiita

                                    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? どのようなアプリか ゲーム FF14のプレイ動画からユーザー名を黒塗りする動画編集アプリです。 ユーザー名の検出に物体検出を利用しています。 Pythonで実装、PyinstallerでEXE化していましたが、C++、C#で作り直し、この度Microsoftストアに公開できました。わーい! ここでは、その経緯や直面した問題、得られたものなどを振り返りたいと思います。 最終的にそれぞれで利用した主なライブラリ Python pytorch,torch-tensorrt,ultralytics,opencv-python,ffmpeg-py

                                      Pythonで作成した物体検出アプリをC++、C#でWindowsネイティブアプリに作り直した話 - Qiita
                                    • WebAssembly 2.0:ブラウザからクラウド、エッジまでを繋ぐ汎用プラットフォーム - Qiita

                                      はじめに WebAssembly は当初、ブラウザ上で高パフォーマンスなコードを安全に実行するための技術として登場しました。しかし、近年はサーバーサイドやエッジコンピューティング、IoTなどの領域でも注目され、「Write Once, Run Anywhere」を真に実現する汎用プラットフォームへと進化を遂げつつあります。 2024年にW3Cが発表し、現在ドラフト段階の WebAssembly Version 2.0の規格 は、その進化をさらに加速させる重要なマイルストーンです。コンポーネントモデルやWASI(WebAssembly System Interface)の強化、GCやSIMDの正式サポートなど、多数の新機能が追加され、今やWebAssemblyはコンテナ技術を補完・代替しうる「軽量かつ高性能」な実行環境としても注目されています。 本記事では、WebAssembly 2.0の主

                                        WebAssembly 2.0:ブラウザからクラウド、エッジまでを繋ぐ汎用プラットフォーム - Qiita
                                      1