並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 21 件 / 21件

新着順 人気順

onnxの検索結果1 - 21 件 / 21件

  • レベル別で紹介!オープンソースで挑戦できる120のプロジェクトアイデア集 - Qiita

    はじめに 「オープンソースに挑戦したいけど、どんなプロジェクトを作ればいいかわからない…」そんな悩みを持っていませんか? 本記事では、初心者・中級者・上級者・達人 の4つのレベルに分けて、合計 120個のオープンソースプロジェクトアイデア を紹介します。 それぞれのアイデアの詳細については折りたたんであります。興味がある内容については広げてみて機能要件や実装のポイント、拡張機能、学べることを見てみてください! 自分のスキルレベルに合ったプロジェクトを見つけて、実際に開発に挑戦してみましょう! 初心者向けプロジェクトアイデア 1. ToDoリストアプリ 概要 ToDoリストアプリは、ユーザーがタスクを追加・編集・削除し、完了状況を管理できるシンプルなアプリです。 初心者でも取り組みやすく、プログラミングの基礎となる CRUD(Create, Read, Update, Delete) の概念

    • LLMモジュールの普通ではない使い方

      それはある日のこと ある日のこと、社内Slackに吉川部長からこんな投稿がありました。 「伊達さんがXでリポストしてたアリババクラウドのオープンソースLLMって、オフラインでLLMが動く小さいモジュールなのかしら?オフラインでLLMが使える可能性があるなら試してみたい感じではあります。」 これは、M5Stack社のLLMモジュールの発売案内に関するポストでした。 LLMモジュールが面白いのは、AI対話アプリケーションをハードウエア単体だけで実現しているところです。高価なGPUを積んだPCであれば単体で実現するのは比較的容易なのですが、安価な基板1つだけで音声対話型AIを実現してしまうのは、ちょっとびっくりする技術です。 一般的に、音声対話型のAIを実現するためには、以下の4つの技術が必要になります。 キーワード検出 KWS(Keyword Spotting):特定のキーワードやフレーズを音

        LLMモジュールの普通ではない使い方
      • 自分の撮った写真数千枚を使って、リアルタイムに画像を生成してくれるVJツールを作った話 - Butadiene Works

        はじめに こんにちは、Butadieneです。 先日、「オーディオとビジュアルのパフォーマンスを楽しむリアルイベント」draw(tokyo); #2にVJとして出演してきました。 function-draw.com #function_draw@lactoice251 (Livecoding + 生演奏) ×@butadiene121 (多分?C++による自作AIジェネVJ) 最高すぎ! pic.twitter.com/a5I349EBLL— Saina(さいな) (@SainaKey) 2025年3月22日 今回のライブでは、らくとあいすさん(https://x.com/lactoice251)のGLSL Soundに合わせてVJを行いました。 当日の一旦のアーカイブです(そのうちちゃんとしたやつに差し替えます。) youtu.be 映し出されてるコードは、らくとあいすさんのGLSL S

          自分の撮った写真数千枚を使って、リアルタイムに画像を生成してくれるVJツールを作った話 - Butadiene Works
        • 初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita

          Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちは。 タイトルの通り、現在趣味半分で個人開発中のきゅうり収穫支援システムについてつらつらと書いていきます。 (記念すべき初投稿記事です!) 1. プロローグ 私はきゅうり栽培を営む農家の両親を持つ一会社員なのですが、スマート農業で両親の仕事を助けられないかと考え、今回の個人開発を始めてみました。 将来的には近年の農業従事者数の減少と高齢化の問題解決に貢献できればいいなぁと漠然と考えています。 2. 開発前の調査 開発を始める前に、両親へのヒアリングをする中で、きゅうり収穫における以下のような課題感が掴めてきました。 ①目視による

            初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita
          • レベル別で紹介!オープンソースで挑戦できる120のプロジェクトアイデア集 - Qiita

            はじめに 「オープンソースに挑戦したいけど、どんなプロジェクトを作ればいいかわからない…」そんな悩みを持っていませんか? 本記事では、初心者・中級者・上級者・達人 の4つのレベルに分けて、合計 120個のオープンソースプロジェクトアイデア を紹介します。 それぞれのアイデアの詳細については折りたたんであります。興味がある内容については広げてみて機能要件や実装のポイント、拡張機能、学べることを見てみてください! 自分のスキルレベルに合ったプロジェクトを見つけて、実際に開発に挑戦してみましょう! 初心者向けプロジェクトアイデア 1. ToDoリストアプリ 概要 ToDoリストアプリは、ユーザーがタスクを追加・編集・削除し、完了状況を管理できるシンプルなアプリです。 初心者でも取り組みやすく、プログラミングの基礎となる CRUD(Create, Read, Update, Delete) の概念

            • 小規模言語モデルを活用したエッジAIソリューションについて共同検証を実施

              ヘッドウォータースは2025年2月17日、東京エレクトロン デバイスと共同で「Phiモデルを中心としたSLM(小規模言語モデル)×Microsoft IoT Edge×ファインチューニング」を活用したエッジAI(人工知能)について検証したと発表した。 Microsoft Oliveを活用したモデル量子化やLoRA、QLoRAファインチューニングにより、PhiモデルなどのSLMを業務に特化した形で適用し、テキストと画像処理の適用範囲を検証した。 また、Azure IoT Edge for Linux on Windows(EFLOW)やiotedge-compose、Azure IoT Edgeランタイムを活用し、SLMアプリケーションの開発やデプロイメント効率化を検証している。さらに、クラウドとエッジによるデータ連携の有効性やDirectML、CUDA、ONNXランタイムをサポートし、さま

                小規模言語モデルを活用したエッジAIソリューションについて共同検証を実施
              • OCRソフト「YomiToku」で画像データを文字データにする|ワビスケ/ PBMB

                ボードゲームのカードテキストやTRPGのルールブックの一部を電子化するときに書き写すことも可能ですが、多くの時間を要します。 そこで今回はOCRを使って書き出したいと思います。 使うOCRソフトは「YomiToku」を使います。こちらは日本語文書に特化して学習しているため変換精度に期待が持てます。 早速テキスト化したい対象データを選択します。今回はPDFファイルを用意しました。 1.セットアップ方法それでは実行方法を紹介したいと思います。検証に使ったPCは以下のような性能です。YomiTokuは処理にGPUを使うことができます。 WIndows11 GPU:Geforce  RTX3060Ti(vram 8GB) メモリ:32GB CUDA 12.4 Python 3.11.9 1-1.実行するフォルダを作るエクスプローラやコマンドでYomiTokuを実行するフォルダを作成します。今回はユ

                  OCRソフト「YomiToku」で画像データを文字データにする|ワビスケ/ PBMB
                • 200ドルAIパソコンを作る方法|Tak

                  少し前から、私が愛用するノートパソコンであるDell Inspiron 16 5625をAIパソコンに変貌させるべくチャレンジしてきた。noteを書くこともそうだが、生成AIブームにだいぶ乗り遅れているのは自覚している。 Dell Inspiron 16 5625は2022年の春先に発売され、外面がMacbook Pro風味であること、CPUとGPUをひとつのデバイスに統合したAMD APUを搭載していることが特徴。そして、なにより安かった。私はデルから次のスペックで6万円もしないお値段で買っていた。 AMD Ryzen 5 5625U(6コア/12スレッド、最大4.3GHz) 16GB DDR4メモリ 512GB NVME M.2 SSD Dell Inspiron 16 5625AIといえば生成AI、生成AIといえば画像生成AIのStable Diffusion。そして、Stable

                    200ドルAIパソコンを作る方法|Tak
                  • 初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita

                    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちは。 タイトルの通り、現在趣味半分で個人開発中のきゅうり収穫支援システムについてつらつらと書いていきます。 (記念すべき初投稿記事です!) 1. プロローグ 私はきゅうり栽培を営む農家の両親を持つ一会社員なのですが、スマート農業で両親の仕事を助けられないかと考え、今回の個人開発を始めてみました。 将来的には近年の農業従事者数の減少と高齢化の問題解決に貢献できればいいなぁと漠然と考えています。 2. 開発前の調査 開発を始める前に、両親へのヒアリングをする中で、きゅうり収穫における以下のような課題感が掴めてきました。 ①目視による

                      初心者がエッジAIできゅうり収穫支援システムをエッホエッホ作ってみた - Qiita
                    • Style-Bert-VITS2とAivisSpeechを使って自分の声でAI合成音声を作ってみたんだ|稲嶺双人(たり)

                      記事としては一般人の感想文的なものとして読んでください 上記動画でやってない部分はAivisSpeechで使うための設定くらいです onnxファイルの作り方など知りたい方は最後のほうを読んでみてください Style-Bert-VITS2の導入 ここからzipファイルをダウンロードして いつものようにCドライブ直下に展開 グラボがあるのでInstall-Style-Bert-VITS2.batをダブルクリック なんか多少のダウンロードはされるけど中途半端に終わる… というのはPowerShellのパスが通ってなかったからでした 自分みたいなもののためにメモっておきます コントロールパネル→システムとセキュリティ→システム→システムの詳細設定→環境変数→Pathを選択→編集→新規→C:\Windows\System32\WindowsPowerShell\v1.0 と入力 PowerShell

                        Style-Bert-VITS2とAivisSpeechを使って自分の声でAI合成音声を作ってみたんだ|稲嶺双人(たり)
                      • 異常検知モデルのデプロイ時に注意すべきポイントと落とし穴

                        異常検知モデルを実際に運用環境へデプロイする際には、さまざまな課題が発生します。本記事では、異常検知モデルのワークフロー全体をカバーし、気をつけるべきポイントと落とし穴を洗い出し ます。 1. データ収集・前処理フェーズ ✅ 注意点 データの正確性と整合性の確保 センサーデータ、ログデータなど、リアルタイムデータの欠損値・ノイズに注意。 データストリームの遅延やドリフト(Data Drift)を監視する仕組みが必要。 異常ラベルの不均衡問題 異常データは通常少ないため、教師あり学習ではデータ不均衡が問題となる。 オーバーサンプリング(SMOTEなど)や教師なし学習の検討が必要。 リアルタイムデータとのズレ 学習時のデータと実際の推論時のデータ分布が異なると、精度が低下する。 定期的なデータ再評価が必要。 オンライン vs バッチ処理の選定 リアルタイム異常検知(例:ネットワーク監視、IoT

                          異常検知モデルのデプロイ時に注意すべきポイントと落とし穴
                        • Core Ultra 200H (Arrow lake-H)は77 TOPS! ただしCopilot+ PC対応かは不明 - ウインタブ

                          先日、Intelの新しいデスクトップ用CPUのCore Ultra 200Sシリーズ(Arrow lake-S)の発表が行われました。こちらの概観および性能については、ほぼ以前の記事の説明通りになりそうなことが確認されたため、ここでは割愛します。 デスクトップ用の発表が主でしたが、合わせてノート用のArrow lake-HXおよびArrow lake-Hについてもチラ見せ的な発表があり、2025年第一四半期の登場となることが説明されました。最近の通例通り、年初のCESで正式な発表があり、2月ごろから新機種がぼちぼち登場する感じになるでしょう。 今回の公式説明ビデオの中で、ちょっと気になる発表がありました。それは、ビジネス~スタンダードノートを担当するCore Ultra 200H (Arrow lake-H)について、内蔵GPUにAI用回路XMXが追加された”Xe with XMX”にアッ

                            Core Ultra 200H (Arrow lake-H)は77 TOPS! ただしCopilot+ PC対応かは不明 - ウインタブ
                          • アノテーションせずに物体検知してみた(YOLO-World v2モデル)|分析屋

                            分析屋の町田です。 AIによる画像認識を行う場合、通常、膨大な数の画像をアノテーションする必要があります。しかしながら、2024年に発表されたYOLO-World v2というモデルを使用することにより、アノテーションを全く行わずに物体検知を実現することが可能となります。今回は、アノテーションレスの物体検知を実現するAIモデル「YOLO-World」の概要と実際の使い方を紹介します。 YOLO-Worldの概要物体検知とは物体検知とは、コンピュータを使って画像や動画に映っている物体の位置を推定する技術を指します。例えば、写真の中に人や動物がいるかどうか、あるいはどこにいるのかを自動で判断します。 物体検知の技術は様々な業界で活用されています。例えば、防犯カメラに写る不審人物を自動で検知したり、医療画像から病気の有無を診断するために利用されています。 アノテーションの必要性物体検知の手法として

                              アノテーションせずに物体検知してみた(YOLO-World v2モデル)|分析屋
                            • ジュニア・ミドルエンジニアの成長しNight (2025/03/25 19:00〜)

                              📝 開催概要 -ジュニア・ミドルエンジニアの成長しNight- ソニー株式会社では、技術が好きな人たちのための勉強会を定期的に開催しています。今回のイベントは、「ジュニア・ミドルエンジニアの成長しNight」と題し、研究開発やデータサイエンスなどに携わる若手エンジニアたちが登壇し、実際に挑戦した技術や成長のエピソードを共有し、技術的な交流を深める場を提供します。 質疑応答セッションも設けており、リラックスした雰囲気の中で弊社エンジニアとの交流をお楽しみいただけます。 普段なかなか聞くことができないソニーの技術に関する話を聞く機会ですので、ぜひ奮ってご参加ください! 🎤 ソニーLT① 「Unity Sentis + Onnx Runtimeで作る!?AI画像認識ゲーム!」 登壇者 中山 一輝 氏 技術開発研究所 コンテンツ技術研究開発部門 空間映像技術開発部 5課 🎤 ソニー講演② 「

                                ジュニア・ミドルエンジニアの成長しNight (2025/03/25 19:00〜)
                              • In Localhost We Trust: Exploring Vulnerabilities in Cortex.cpp, Jan’s AI Engine | Snyk

                                A recent Andreessen report shows a growing trend in self-hosted AI, jumping from 42% to 75% year-over-year. It demonstrates the notion among developers that on-premise is inherently more secure, but it still comes fraught with danger if you're not hyper-focused on security in addition to the AI. This came into play recently as the Snyk Security Labs team identified vulnerabilities within Cortex.cp

                                  In Localhost We Trust: Exploring Vulnerabilities in Cortex.cpp, Jan’s AI Engine | Snyk
                                • Phi-4 multimodal を VRAM12GB に載せる

                                  Why Phi-4 multimodalのsample codeをそのまま動作させると、VRAM12GBに収まりません。 細かく見ていませんが、16GBあればそのまま動作させられそうです。 手元のRTX4080 Laptop 12GBで動作させたいのでどうにかします。 What 前提 画像とテキストのモーダルだけ使う Python Debbugerでモデルの中を触りたいので、なるべく純正仕様が良い (この前提がなければ、ONNX量子化版を触る方が早そう) その前提で以下を実施します。 Audio encoder / projector の削除 (使うやつだけ残す) ↑に伴う内部変数の修正 入力画像サイズの縮小 修正版のsample code オリジナルはこちら。 import requests import torch import os import io from PIL import

                                    Phi-4 multimodal を VRAM12GB に載せる
                                  • 省スペース設計と高度な計算能力を求めるエッジデバイスや産業アプリケーションに最適!極小型で高機能を兼ねそなえたブラックチップ「SSoM-iMX935-CHINCHILLA」システムオンモジュール発表

                                    省スペース設計と高度な計算能力を求めるエッジデバイスや産業アプリケーションに最適!極小型で高機能を兼ねそなえたブラックチップ「SSoM-iMX935-CHINCHILLA」システムオンモジュール発表 2025年1月30日、東京都渋谷区 - ポジティブワン株式会社は、省スペース設計と高度な計算能力を求めるエッジデバイスや産業アプリケーションに最適!極小型で高機能を兼ねそなえたブラックチップ「SSoM-iMX935-CHINCHILLA」システムオンモジュール発表しました。 本製品は、世界最小のi.MX 93システムオンモジュールとして、最新のNXP i.MX 93アプリケーションプロセッサを搭載し、エッジコンピューティングや産業用途における高度な性能と柔軟性を提供します。また、「SSoM-iMX935-CHINCHILLA」はNXP純正評価ボード「MCIMX93-EVK」の設計および信号仕様

                                      省スペース設計と高度な計算能力を求めるエッジデバイスや産業アプリケーションに最適!極小型で高機能を兼ねそなえたブラックチップ「SSoM-iMX935-CHINCHILLA」システムオンモジュール発表
                                    • Windowsの機械学習向けAPI「DirectML」が「Copilot+ PC」に対応、WebNNも利用可能に

                                      米Microsoftは、Windowsが備える機械学習向けAPI「DirectML」が、米Qualcommの「Snapdragon X」シリーズに対応したと8月29日(現地時間)に発表した。DirectMLはWindows PCが備えるGPU(Graphics Processing Unit)の機能を機械学習向けに抽象化したAPI。これまでは米AMDや米Intel、米NVIDIAのGPUのほか、QualcommのSnapdragon SoC(System on Chip)が備える「Adreno」GPUに対応していた。 今回の更新によって、QualcommのSnapdragon Xシリーズが持つ「Hexagon NPU」も機械学習の処理に利用できるようになった。Snapdragon Xシリーズで動作する機械学習プログラムを作るには、DirectMLのバージョン1.15.2以降(64ビットAr

                                        Windowsの機械学習向けAPI「DirectML」が「Copilot+ PC」に対応、WebNNも利用可能に
                                      • SMARC2.0業界標準に準拠し、コンパクトな 82mm×50mm を持つ高性能AI コアボード 「Core-3568J SMARC」システムオンモジュールの販売を開始

                                        SMARC2.0業界標準に準拠し、コンパクトな 82mm×50mm を持つ高性能AI コアボード 「Core-3568J SMARC」システムオンモジュールの販売を開始 2025年2月13日、東京都渋谷区 - ポジティブワン株式会社は、SMARC 2.0 業界標準に準拠し、コンパクトな 82mm × 50mm のフォームファクタを持つ高性能 AI コアボード 「Core-3568J SMARC」 システムオンモジュールの販売を開始いたします。 本製品は、Rockchip 社の クアッドコア 64 ビットプロセッサ RK3568 を搭載し、1TOPS の NPU を内蔵 することで軽量 AI アプリケーションの開発をサポートします。さらに、4K ビデオデコード機能を備え、豊富なインターフェースオプションを提供し、ギガビットイーサネット、WiFi、Bluetooth、5G/4G などの高速ネッ

                                          SMARC2.0業界標準に準拠し、コンパクトな 82mm×50mm を持つ高性能AI コアボード 「Core-3568J SMARC」システムオンモジュールの販売を開始
                                        • Pythonで作成した物体検出アプリをC++、C#でWindowsネイティブアプリに作り直した話 - Qiita

                                          Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? どのようなアプリか ゲーム FF14のプレイ動画からユーザー名を黒塗りする動画編集アプリです。 ユーザー名の検出に物体検出を利用しています。 Pythonで実装、PyinstallerでEXE化していましたが、C++、C#で作り直し、この度Microsoftストアに公開できました。わーい! ここでは、その経緯や直面した問題、得られたものなどを振り返りたいと思います。 最終的にそれぞれで利用した主なライブラリ Python pytorch,torch-tensorrt,ultralytics,opencv-python,ffmpeg-py

                                            Pythonで作成した物体検出アプリをC++、C#でWindowsネイティブアプリに作り直した話 - Qiita
                                          • WebAssembly 2.0:ブラウザからクラウド、エッジまでを繋ぐ汎用プラットフォーム - Qiita

                                            はじめに WebAssembly は当初、ブラウザ上で高パフォーマンスなコードを安全に実行するための技術として登場しました。しかし、近年はサーバーサイドやエッジコンピューティング、IoTなどの領域でも注目され、「Write Once, Run Anywhere」を真に実現する汎用プラットフォームへと進化を遂げつつあります。 2024年にW3Cが発表し、現在ドラフト段階の WebAssembly Version 2.0の規格 は、その進化をさらに加速させる重要なマイルストーンです。コンポーネントモデルやWASI(WebAssembly System Interface)の強化、GCやSIMDの正式サポートなど、多数の新機能が追加され、今やWebAssemblyはコンテナ技術を補完・代替しうる「軽量かつ高性能」な実行環境としても注目されています。 本記事では、WebAssembly 2.0の主

                                              WebAssembly 2.0:ブラウザからクラウド、エッジまでを繋ぐ汎用プラットフォーム - Qiita
                                            1