並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 43件

新着順 人気順

OpenCVの検索結果1 - 40 件 / 43件

  • オープンソースAIとは何か? – Open Source AI Definition策定経緯とドラフト版概説

    オープンソースAI(Open Source AI)とは、オープンソースの状態にあるAIシステムのことである。これはある意味で自明なのではあるが、「オープンソースの定義」(OSD)を管理している米国の非営利団体Open Source Initiative(OSI)では、2023年からわざわざ新たに「オープンソースAIの定義」(OSAID: Open Source AI Definition)の策定を開始している。2024年の8月頃には定義のRC版が公開される見込みであるが、本稿ではこの新たな定義が何故必要になり、その定義がどのような機能するものであるかということに対し、主に佐渡が視点から時系列的に簡単に紹介していく。これによって日本国内においてOSAIDが認知され、AI開発コミュニティにおいて自由かつ透明性が確保されたシステムの必要性への理解が深まる一助となることを期待する。 OSIにおける

      オープンソースAIとは何か? – Open Source AI Definition策定経緯とドラフト版概説
    • CVPR2024が開催中なので、エムスリー AI・機械学習チームの推し論文を勝手に紹介するぜ! - エムスリーテックブログ

      こんにちは。エンジニアリンググループのAI・機械学習チームに所属している三浦(@mamo3gr) です。弊チームでは毎週1時間の技術共有会を実施しており、各自が担当するプロダクトの技術や、最近読んだ論文を紹介しています。今週はCVPR2024が開催されていることもあり、同学会の論文読み会となりました。1セッション1名の担当で、各自がセッション内で気になった論文の詳細を解説します。本ブログではその一部として、セッションごとの「推し論文」を紹介します。 DALL-E 3が生成した「シアトル開催のコンピュータビジョンの学会会場」のイメージ図 LDP: Language-driven Dual-Pixel Image Defocus Deblurring Network 推しポイント EventPS: Real-Time Photometric Stereo Using an Event Came

        CVPR2024が開催中なので、エムスリー AI・機械学習チームの推し論文を勝手に紹介するぜ! - エムスリーテックブログ
      • Pythonで作ったコンソール上で動くライフゲーム#3 - Qiita

        はじめに どうも、y-tetsuです。 これまでに2つの記事を通して、Pythonでライフゲームを作ってきました。 前回は、"標準Pythonのみ"という条件で処理の高速化を試してみたのですが、すぐに限界が来てしまいました。そろそろ違う取り組みを試してもいい頃かなと思いまして、今回は外部ライブラリを導入してコードの改良をやってみたいと思います。 どうやらQiitaの記事の中には、便利なライブラリを用いた高速なライフゲームの実装例が、いくつかあるようです。 とても面白そうなので、これらを参考にして、私もNumPyとOpenCVに触れてみようと思います。(ついでに、どれくらい高速化できるのかも確かめてみたいと思います) おさらい 本題へ入る前に、これまで作ってきたものの"おさらい"を、軽くしておきたいと思います。 ライフゲームとは ライフゲームの仕様については、以下のWikipediaに詳しく

          Pythonで作ったコンソール上で動くライフゲーム#3 - Qiita
        • Python AIプログラミング その1 環境構築、文字認識 - Qiita

          1. はじめに 最近家でプログラミングあまりやっていないなと思い、以前やろうとしたWebサービス作りも滞ってしまっていたのでAIプログラミングを少し勉強してみようと思い、こちらの本を使って学習を始めてみた。 今回はその本の3.3 「文字認識・手書き数字を判定しよう」をやってみた。 2. 環境構築 今回はWindowsでの環境構築だが、今はMicrosoft Storeでインストールできるのでめっちゃ簡単! ついでに必要なライブラリとかもコマンドプロンプトまたはPowershellからpipでインストールできるので、めっちゃ簡単! 3.3章で使うライブラリはmatplotlib(グラフ描画ライブラリ)とscikit-learn(機械学習ライブラリ)、OpenCV(画像処理ライブラリ)なので、以下のコマンドを打てば終わり。 pip install -U pip pip install -U m

            Python AIプログラミング その1 環境構築、文字認識 - Qiita
          • Pythonで作ったコンソール上で動くライフゲーム#3 - Qiita

            はじめに どうも、y-tetsuです。 これまでに2つの記事を通して、Pythonでライフゲームを作ってきました。 前回は、"標準Pythonのみ"という条件で処理の高速化を試してみたのですが、すぐに限界が来てしまいました。そろそろ違う取り組みを試してもいい頃かなと思いまして、今回は外部ライブラリを導入してコードの改良をやってみたいと思います。 どうやらQiitaの記事の中には、便利なライブラリを用いた高速なライフゲームの実装例が、いくつかあるようです。 とても面白そうなので、これらを参考にして、私もNumPyとOpenCVに触れてみようと思います。(ついでに、どれくらい高速化できるのかも確かめてみたいと思います) おさらい 本題へ入る前に、これまで作ってきたものの"おさらい"を、軽くしておきたいと思います。 ライフゲームとは ライフゲームの仕様については、以下のWikipediaに詳しく

              Pythonで作ったコンソール上で動くライフゲーム#3 - Qiita
            • Gemini Pro APIの活用 : Hey Gemini! 音声起動による対話型マルチモーダルAIアプリ開発|AstroPomeAI

              プログラムの概要このプログラムは、音声入力の録音とテキストへの変換、AIによる応答生成、生成されたテキストの音声への変換、画像処理を組み合わせた複合的な機能を提供します。目的は、ユーザーからの音声入力に対して、AIが適切に応答し、その応答を音声として出力することです。最終的にはDeepmindのDemoを目指しています。 こちらの記事の続きです。 プログラムの主要機能ウェイクワードの検出: Porcupineを使用して特定のキーワード(ウェイクワード)を検出し、システムをアクティブ化します。 プライバシーを保護し、システムリソースを節約しながら、効率的かつユーザーフレンドリーな方法で音声認識APIを適切なタイミングでのみアクティブ化します。 利用方法はこちらの記事が参考になります。 https://note.com/npaka/n/n0e4be05e9887 音声録音と認識 (record

                Gemini Pro APIの活用 : Hey Gemini! 音声起動による対話型マルチモーダルAIアプリ開発|AstroPomeAI
              • 本当にPython初心者でも作れるモノ4選【Webアプリ・データ取得・自動化etc.】 | GeekSalon

                GeekSalonライターのたかぱんです! この記事をお読みの方は 「Python始めたばかり初心者におすすめなプロダクトが知りたい」 「Pythonでなにか作ってみたいけれど何が作れるかわからない」 といったような悩みをお持ちではありませんか? この記事では、Pythonでどのような物が作れるか、その中でも初心者におすすめなプロダクトについて解説していきます。 Pythonってどんな言語? Pythonの特徴 Pythonは汎用性の高いプログラミング言語として人気な言語です。Pythonは、書きやすくて読みやすい構文であるということが特徴となっています。 日経クロステック プログラミング言語利用実態調査2021より 日経クロステックのプログラミング言語利用実態調査でのアンケートでは、現在使っているプログラミング言語を3つまで挙げており回答数は、455となっています。 その結果、利用言語の

                • 【Python入門】Pythonで何ができる?初心者でもできることの紹介(自動化や機械学習など) - Qiita Zine

                  Pythonでできることは多岐にわたりますが、代表的なものでは以下の7点が考えられます。 機械学習/人工知能の開発 データ分析 webサイト/webアプリの開発 ゲーム開発 単純作業の自動化 画像処理 データベース操作 それぞれ解説していきます。 機械学習/人工知能の開発 機械学習/人工知能に関する開発は発展の一途を辿り、市場規模も大きな分野になっていくと言われています。Pythonには機械学習/人工知能の開発を支えるライブラリやドキュメントが多数用意されており、機械学習に関する基礎知識がなくても人工知能の開発を実感することができるでしょう。 機械学習/人工知能の初心者向け入門用記事 機械学習/人工知能に関する、初心者向けの記事をピックアップします。 真似して色々作ってみてみましょう。 機械学習の超初心者が、みんなが良いと言う記事を読んでまとめてみた – Qiita やってみたら簡単!ディ

                    【Python入門】Pythonで何ができる?初心者でもできることの紹介(自動化や機械学習など) - Qiita Zine
                  • AI Copilotと一緒に学ぶ!Pythonで顔認識とモザイク処理をマスターしよう - APC 技術ブログ

                    1. はじめに この記事では、私がCopilotと対話を重ね、その経験を共有します。私の目標は、Pythonを使って画像にモザイク処理を施すプログラムを作成することです。このアイデアは、Processingというアーティスト・クリエイター向けのプログラム言語を使ったこちらの記事から得ました。 2. Copilotとの対話 私がCopilotに求めたのは、「Pythonでイメージファイルを読み込み、人の顔を認識してモザイクを掛けるコード」の生成でした。また、必要なライブラリがあれば、それについても教えてもらいました。 2.1 私の質問 Pythonでイメージファイルを読み込み、人の顔を認識してモザイクを掛けるコードを教えてください。インストールが必要なライブラリがある場合は、それについても教えてください。 2.2 Copilotの回答 Pythonで画像を読み込み、顔を認識し、その顔にモザイ

                      AI Copilotと一緒に学ぶ!Pythonで顔認識とモザイク処理をマスターしよう - APC 技術ブログ
                    • cv2.VideoCapture(0)は700番(cv2.CAP_DSHOW)を使え - Qiita

                      を使えばよいだけの話である。 ほとんどの人はVideoCaptureの第二引数を意識したことがないだろうが、GStreamerのパイプラインを記述するときにはcv2.CAP_GSTREAMERをよく使う。で、僕が知っていたのはcv2.CAP_GSTREAMER(=1800)とcv2.CAP_FFMPEG(=1900)だけだったので、てっきりwebカメラのキャプチャにもこのいずれかを使用しているものだと思い込んでいたのだが、何やらたくさんあるようだ。(数字としては、CAP_ANYが最小値0で、CAP_OBSENSORが最大値2600である。) 調査 第二引数を省略するとデフォルトでcv2.CAP_ANY(=0)が指定され、以下の中から使えるものを自動的に選ぶという仕様だそうだ。ここで、cv2.CAP_GSTREAMERやcv2.CAP_FFMPEGをWebカメラに対して使用したらどうなるのか

                        cv2.VideoCapture(0)は700番(cv2.CAP_DSHOW)を使え - Qiita
                      • Pythonでできること・初心者が簡単に作れるプログラムも紹介 | PARK | データサイエンスに関する情報を発信

                        Python(パイソン)は、直感的な文法と高い可読性から、初心者でも比較的習得しやすいプログラミング言語です。Pythonは、データ分析、ディープラーニング、業務効率化など、幅広い分野で活用されています。 この記事では、これからPythonを学んでみたいという初心者の方に向けてPythonでできることや、初心者が簡単に作れるプログラムなどを紹介します。 Pythonは、1990年初頭にGuido van Rossum(グイド・ヴァンロッサム)氏によって開発されたプログラミング言語です。 直感的で読みやすい文法から、プログラミング初心者から上級者まで幅広く支持されています。Pythonはデータ分析、業務効率化、Webアプリケーションなど、さまざまな分野で活用されています。 Pythonの主な特徴は以下のとおりです。 ・シンプルで読みやすい文法:Pythonの文法は明確で、他の言語に比べて短い

                        • Python+OpenCVで流星群画像を仕分ける

                          2020年ふたご座流星群コロナ禍にあっても―毎年友人とふたご座流星群を見に行くことが恒例行事になっています。 コロナ禍でしたが、屋外で一晩中空を見上げるだけなのでリスクは低そうと判断し、お互いにマスク等々安全に気をつけて決行しました。 自転車仲間が所属されている天文同好会の観望会にお邪魔させていただいていたのですが、今回は観望会自体は無いが個人的には見に行くということだったので、私たちも恒例となった場所で観望することにしました。 毎年、寒空の下で空を見上げながら一年間の振り返りのようなことをするのですが「今年はコロナで遠征が難しかった」とか「自宅だと曇りが長くほとんど稼働しなかった」等々コロナ禍での星撮りの難しさを改めて実感しました。 はじめての FUJIFILM カメラ今回は11月に発売されたばかりのFUJIFILM X-S10を携えて撮影に臨みました。 X-S10は手ぶれ補正に惹かれて

                            Python+OpenCVで流星群画像を仕分ける
                          • タンジブルインターフェースを活用した住民参加型まちづくり等, | Use Case | PLATEAU [プラトー]

                            「タンジブルインターフェース」を用いた体感型のアーバンプランニングツールを開発。参加型まちづくりにおけるコミュニケ―ションの活性化を目指す。 行政機関やデベロッパーによる新規開発、にぎわいの創出、景観の保全などを目的としたアーバンプランニングのプロセスにおいて、市民参加の必要性が強く求められている。アーバンプランニングにおける市民参加を活性化させるためには、行政やデベロッパー等の専門家に加え、専門的なスキルを持たない市民も含めた幅広い関係者が共通の課題認識や都市構造の理解を持ち、まちの将来像のイメージを共有しながら議論を進めていく手法の開発が必要となる。 今回の実証実験では、2022年度の「XR技術を用いた体感型アーバンプランニングツール」において開発した「タンジブルインターフェース」を活用したアーバンプランニングツールの汎用性や可搬性を高める改修を行う。これにより、同ツールを活用した市民

                              タンジブルインターフェースを活用した住民参加型まちづくり等, | Use Case | PLATEAU [プラトー]
                            • トップページ

                              テスト用のホームページです. ホームページ作成の勉強のためにレンタルサーバーを借りて,ホームページを公開しました. レンタルサーバー:XFREE ウェブサイトのアイコンはこちらを利用させていただきました. 以下はコンテンツ一覧です.レイアウトの勉強中であるため完成しているものも近々改善します. 本サイトの内容に関するお問い合わせはこちらのメールアドレスにお願いします. 連絡先:mikami.contact333 (@) gmail.com 免責事項・プライバシーポリシーはこちら サイト内検索 テーブルデザイナー:表の作成・編集・保存 を公開しました 2024/7/10 12:00 欧州4大リーグ・欧州カップ戦・各国主審のイエローカードの枚数について を公開しました 2024/7/3 12:00 サッカー選手の経歴・クラブのシーズン別所属選手の検索 を公開しました 2024/6/26 12:

                              • 【VSCode】Pythonコードのデバッグ中に画像の入った変数を可視化できる拡張機能を試した - meowの覚え書き

                                はじめに 拡張機能の使用方法 各ライブラリのオブジェクトの可視化結果結果 Pillow・・・○ NumPy(, Scipy)・・・○ opencv-python・・・△ imageio・・・○ Matplotlib・・・○ PyTorch・・・○ TensorFlow・・・✕ おわりに はじめに この記事では、Visual Studio Code(以下VSCode)の拡張機能の1つを使った際の所感を紹介する。 私は普段、画像系の機械学習タスクに取り組む時VSCodeで開発している。 その際、画像に対して自前実装の前処理やデータオーグメンテーションがちゃんと施されているかを簡易的に確認したい場合がある。 そういう時に私はこれまでディスクに書き出して結果を確認していた1:。 しかし、もう少しスマートな方法がないかと思い、デバッグ中に画像を可視化できるVSCodeの拡張機能が無いか探したところ、

                                  【VSCode】Pythonコードのデバッグ中に画像の入った変数を可視化できる拡張機能を試した - meowの覚え書き
                                • OpenCVの膨張処理と収縮処理について

                                  「膨張」は領域を広げるとき、「収縮」は領域を狭めるときに使われる。 ノイズ除去などに威力を発揮するぞ。 ✔️ 読者さんへの前置きメッセージ 本記事は「膨張/収縮処理とその実装方法」について書いています。 画像処理プログラミングでは、 画像に対して膨張処理や収縮処理をかけることがあります。 これらの膨張処理や収縮処理をかけることでノイズ除去などの効果を得ることができます。 画像処理ライブラリのOpenCVでも膨張処理や収縮処理を行うことができます。 この記事では 実際に膨張処理や収縮処理をかけると画像がどのように変換されるのかOpenCVで膨張処理や収縮処理を実装するにはどのようにコードを書けば良いのかについて解説します。 それでは、解説していきましょう。 まずはOpenCVをインストールする OpenCVを使うには、 まず自身の環境にOpenCVをインストールする必要があります。 以下のコ

                                  • OpenCVとAmazon Rekognitionでリアルタイムに顔の表情から感情を分析する - Qiita

                                    AmazonRekognitionを使用すると物体認識だけでなく、顔認識やその感情分析までできるようです。 機械学習の専門家でなくてもAPIを利用するだけで手軽に画像認識が使えるというのは非常に魅力的です。 これを動画のようにリアルタイムでスキャンして解析できたら面白いだろうと思い、少し描いてみました。 今回作成したソースコードはこちらです。 公開しているリポジトリにはAmazonRekognitionを使用したソースコード以外にもOpenCVだけの機能で実装した顔検知も含まれています。 動作イメージ 笑顔を検知すると、四角い線が緑になるように実装しています。 左上には感情分析の結果を表示、SUPRISEDやCONFUSEDが目立ちますw 実装 想像以上に簡単に実装できました。 Rekognitionには画像ファイルをAPIで送信し、返却されたJsonに顔認識の情報などが含まれているので

                                      OpenCVとAmazon Rekognitionでリアルタイムに顔の表情から感情を分析する - Qiita
                                    • ③ubuntu20.04にORB-SLAM3を導入する — 真面目にhandaru

                                      概要 ①格安ドローンTello×ORB-SLAM3×ROS-noeticでVisual-SLAM自律飛行する とりあえずROSでドローンを飛ばす ②格安ドローンTelloをROS1-noeticで飛ばす Visual-SLAMとしてORB-SLAM3を導入 ③ubuntu20.04にORB-SLAM3を導入する ←本記事 Visual-SLAMでナビゲーション ORB-SLAM3について ORB-SLAM3はスペインのサラゴサ大学のRaúl Mur Artal氏のチームが開発したORB-SLAMアルゴリズムを用いたSLAMソフトウェアの最新バージョンです。 ORB-SLAM自体は2014年に発表されたアルゴリズムなんですが、なかなか優秀で有名なので未だに研究畑でも用いられていたりするらしいです。 SLAMソフトウェアとして、ORB-SLAM3は2をもとに開発されているわけですが、さらなる性

                                        ③ubuntu20.04にORB-SLAM3を導入する — 真面目にhandaru
                                      • OpenCV+pygameで簡単な立ち絵付きシューティングゲームを作るお気軽ゲーム入門(後編) - Qiita

                                        OpenCV+pygameで簡単な立ち絵付きシューティングゲームを作るお気軽ゲーム入門 前編はこちらです。 この記事はGoogle Developer Student Clubs 12/19のアドカレとして寄稿しています。前後編に分けたのは記事が長かったためであり, 間に合わなかったというわけではありません。本当です。信じてください。 目次 OpenCVで素材画像切り抜き(前編にて実装) 設計図紹介(前編にて実装) 実装(前編にて実装) consts.py(前編にて実装) classes.py(前編にて実装) events.py main.py 前編のおさらい OpenCVで素材画像を切り抜く方法を学んだ 制作するゲームのディレクトリ構造は以下のとおりであった。 . ├── assets │   ├── fonts │   │   └── font.ttf │   ├── images │

                                          OpenCV+pygameで簡単な立ち絵付きシューティングゲームを作るお気軽ゲーム入門(後編) - Qiita
                                        • 【画像処理】Pillowを使って画像周りの余白削除(トリミング)を自動化してみた!(2) - Qiita

                                          概要 以下の記事では,OpenCVを使って,画像周りの余白削除を行いました. 【画像処理】OpenCVを使って画像周りの余白削除(トリミング)を自動化してみた!(1) 今回は,Pillowを用いて同様のことをやってみようと思います.どちらが簡単に実装できるのでしょうか? それではやっていってみましょう! 動作環境 Windows10(64bit) Python 3.7.2 Pillow 6.0.0 やりたいこと 上の画像を下の画像のようにするのが目標です.少しわかりにくいかもしれませんが, 下の画像では,上の画像の周りの余白を除いた部分が切り取られ,枠ぴったりに物体が収まっています. ちなみにこれは非同期式6進ダウンカウンタです。 ↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓ どのようにし

                                            【画像処理】Pillowを使って画像周りの余白削除(トリミング)を自動化してみた!(2) - Qiita
                                          • p5.js で様々な画像処理を高速・手軽に行える p5.FIP(Fast Image Processing)を紹介したい! - Qiita

                                            p5.js で様々な画像処理を高速・手軽に行える p5.FIP(Fast Image Processing)を紹介したい!JavaScript画像処理p5.jsp5.jsWebEditorp5.FIP p5.js で使える画像処理用のライブラリが良さそうだったので、紹介記事を書いてみます。 とりあえずカメラ映像に対して、様々な行える画像処理のうちの 1つ「グリッチエフェクト」をやってみたのが以下です。 これ以外にも非常の多くの画像処理を扱えて、なおかつ処理が高速という、とても良さそうなライブラリです。 ●prontopablo/p5.FIP: Real-time image processing library for p5.js. https://github.com/prontopablo/p5.FIP/tree/main?tab=readme-ov-file p5.js で過去に画像

                                              p5.js で様々な画像処理を高速・手軽に行える p5.FIP(Fast Image Processing)を紹介したい! - Qiita
                                            • [Amazon Bedrock] Amazon Titan Multimodal Embeddings G1モデル を使用して、生産ラインにおける外観検査を試してみました | DevelopersIO

                                              [Amazon Bedrock] Amazon Titan Multimodal Embeddings G1モデル を使用して、生産ラインにおける外観検査を試してみました 1 はじめに 製造ビジネステクノロジー部の平内(SIN)です。 Amazon Bedrockで利用可能なAmazon Titan Multimodal Embeddings G1モデル は、 テキスト、イメージ、または、その組み合わせによるマルチモーダル埋め込みモデルです。 今回は、これを利用して、外観検査を試してみました。 以前、Embedding(埋め込み)モデルで、画像を数値ベクトルに変換し、画像の差異を判別(分類モデルとして利用)できることを確認できました。 今回は、部品や製品の品質を維持・保証する目的で行う、外観検査を試してみました。 最初に、作成したデモが動作している様子をご確認下さい。 ベルトコンベア上を流

                                                [Amazon Bedrock] Amazon Titan Multimodal Embeddings G1モデル を使用して、生産ラインにおける外観検査を試してみました | DevelopersIO
                                              • アノテーションルールはどう作られるのか 顔検出を例に - Qiita

                                                画像認識を機械学習で開発することとなって、どのような実装を開発するか決まったとき、 次に決める必要があるものの1つは、アノテーションルールを明らかすることだ。 顔検出の場合 Haar-Cascade 検出器の時代 Haar-Cascade 検出器で、正面顔の検出器の場合には、両目のそれぞれの目の中央の位置を基準として、正方形の領域を顔位置として検出するものが多かった。 https://docs.opencv.org/3.4/db/d28/tutorial_cascade_classifier.html それらに対して、一定のルールで回転画像を加えて学習させており、基本は、両目の位置が水平になっている画像が基本になっていた。 両目の位置を基準に正規化するやりかたでは、大人の顔と子どもの顔で、口の位置が違ってくるという課題を生じる。 子どもの顔は大人の顔に比べて丸っこく、両目の位置で正規化する

                                                  アノテーションルールはどう作られるのか 顔検出を例に - Qiita
                                                • バーコード画像を解読するWebアプリケーション - Qiita

                                                  目的 Webページ上に<img>で表示した画像に含まれたバーコードを解読し、その値を文字列として表示します。こんな感じです。 処理には、画像処理ライブラリの定番OpenCVを使います。JavaScript版なので、OpenCV.jsと呼ばれます。 + JavaScriptなので、<script src="opencv.js">で読み込むだけでWebページ上で動作させられます。HTML5やCSSでは達成できない、顔認識や機械学習など高度な画像処理を扱うWebアプリケーションの構築に利用できます。 OpenCV.jsを始めるなら、まずはOpenCV公式ドキュメントのOpenCV.js Tutorialsがおすすめです。英語はちょっと... という向きには、『OpenCV.jsで作る画像・ビデオ処理Webアプリケーション』という書籍もあります(2024年6月刊)。 注意 本記事のコードをローカル

                                                    バーコード画像を解読するWebアプリケーション - Qiita
                                                  • Python初心者が作れるものは?最初にやるべきことや注意点などを紹介 | BIZ ROAD(ビズロード)

                                                    1994年神奈川県生まれ。情報学修士取得。 ソフトウェア業界で自動運転やロボット開発を担当した後、DX推進やRPA開発に従事。幅広いソフトウェア開発の経験を活かし、現在はAIやプログラミング教育、コンサルティングなどを行っている。 日本最大モビリティ団体Deep4DriveのJetRacerプロジェクト代表。 Pythonは汎用性の高いプログラミング言語であり、初心者でも高度なプログラムを作ることが可能です。しかし、Pythonを学習し始めたばかりの方ですと、何が作れるのかわからないかと思います。 本記事では初心者が最初にやるべきこと、Python初心者でも作れるもの、そしてPython学習における注意点について解説します。実際に触れてみて、Pythonの使い方をマスターしましょう。 Pythonの初心者が最初にやること Python初心者が作れるものを作成するためには、はじめにライブラリ

                                                    • WindowsとVSCodeでC++版OpenCVの開発環境構築

                                                      ビルドツールのインストール Build Tools for Visual Studio 2022 をダウンロードしてください。 wingetを使う場合 ダウンロードしたファイルを実行するとVisual Studio Installerが起動するので、「C++によるデスクトップ開発」を選択後、右の欄から「ビルドツール用C++ ATL」をチェックしてインストールしてください。 OpenCVのインストール opencv-{version}-windows.exe をダウンロードしてください。 ダウンロード後、実行するとOpenCVのインストールフォルダを選択する画面になるので、適当なパスを設定します。 ここではCドライブ直下にインストールするものとします。 インストール後、ユーザー環境変数の OpenCV_DIR に C:\OpenCV\build\x64\vc16 を、 Path に %OPE

                                                        WindowsとVSCodeでC++版OpenCVの開発環境構築
                                                      • Pythonで何ができる?初心者向けに作れるもの・学習法を紹介 | Pythonの学習帳

                                                        この記事では、Pythonの基礎から学びながら、初心者でも作れるプログラムの例を紹介します。また、Pythonの学習法についても詳しく解説します。Pythonの魅力を知り、実際に手を動かしながら学ぶことで、プログラミングの世界が広がることでしょう。是非、この記事を読んでPythonの可能性を探ってみてください。 初心者がPythonで作れるもの5選 Pythonは初心者でも簡単に学べるプログラミング言語であり、様々なことができます。 ここでは、初心者がPythonで作れるものの中から5つを紹介します。 1. Web情報の自動収集:クローリングとスクレイピング Pythonを使えば、Web上の情報を自動的に収集することができます。 例えば、特定のサイトから商品情報やニュース記事を収集したり、SNSの投稿を自動的に取得したりすることができます。 これにより、大量の情報を手動で収集する手間を省く

                                                        • コンピュータビジョン: PnP問題って何?

                                                          コンピュータービジョンでは、PnP問題という単語が度々登場します。PnP問題とはなにか、を数学を用いずに、主に論文の引用を用いて紹介します。すべての論文にリンクをつけていますので、詳細を知りたい方はそちらをご覧ください。 はじめに LiDAR(Light Detection and Ranging)センサーなどをもちいて、現実世界の3D座標を得たとします。その後、その機器(ドローンなど)に固定搭載されているカメラの位置と方向を知ることができれば、グローバル座標系における自らの位置を知ることができます。 PnPとは、カメラの位置と姿勢(向き)を計算することであり、「問題」というわれる所以は、この計算を効率的かつ正確に行う方法が複数存在するためです。 いかに計算負荷を低くし、正確な近似値を求められるか?、が盛んに研究されています。 Imagine you took an image of yo

                                                            コンピュータビジョン: PnP問題って何?
                                                          • 【色検知】OpenCVで色情報から特定の物体を検出してみる - Qiita

                                                            概要 今回はPythonとOpenCVを用いて画像の色情報から特定の物体を検出してみようと思います.この画像処理手法については様々なものがありますが,今回は定番である「元画像をマスクしてラベリングする手法」を用います♪ 実行環境 Python : Ver.3.10.2 OpenCV : Ver.4.6.9 全体の流れ 全体の大まかな流れは次のようになります.これからそれぞれの処理について取り扱っていきますが,「はやく結果だけほしい!!」という方は4項の最後まで飛ばしてくださいね♪ 1.画像をヒストグラム平坦化する 2.RGB空間からHSV空間に移行させる 3.抽出したい色の閾値でマスクする 4.ラベリングする 5.まとめ 1.画像をヒストグラム平坦化する なぜヒストグラム平坦化をするの?? まずはじめに元画像をヒストグラム平坦化します.これによって画素の輝度のヒストグラムを平らにして画像の

                                                              【色検知】OpenCVで色情報から特定の物体を検出してみる - Qiita
                                                            • Python初心者が作れる簡単なプログラム6選!必要な作業や注意点も | BIZ ROAD(ビズロード)

                                                              1994年神奈川県生まれ。情報学修士取得。 ソフトウェア業界で自動運転やロボット開発を担当した後、DX推進やRPA開発に従事。幅広いソフトウェア開発の経験を活かし、現在はAIやプログラミング教育、コンサルティングなどを行っている。 日本最大モビリティ団体Deep4DriveのJetRacerプロジェクト代表。 Pythonを学習する上でプログラムを実際に作ってみることは重要です。手を動かしてみることで、プログラムの記述の仕方やコツを覚えることができ、以降の作業がスムーズにはかどります。 なおプログラムを作る上ではやっておくべき作業や注意点があることを知っておくことが大切です。 今回はPythonを学習し始めたばかりの初心者でも作れる簡単なプログラムを6選紹介。またプログラム作成前に必要な作業や注意点についても解説します。 Pythonで簡単なプログラムを作るために必要な作業 Pythonを

                                                              • OpenCVでスプライトを半透明にする #2 ~グラデーションな半透明を作る~ - Qiita

                                                                はじめに 連休を楽しむために、宿題を片付けよう。 目次 OpenCVでスプライトを半透明にする #1 ~おばけを出現させる~ OpenCVでスプライトを半透明にする #2 ~グラデーションな半透明を作る~ ←今ここ 行列の計算をnumpyでおこなう まず、前回の関数を再掲する。関数だけなのでこれだけでは動かないことに注意。 import cv2 def sprite_alpha(back, front4, alpha): front = front4[:, :, :3] # RGB(3ch) mask = front4[:, :, 3] # A要素(1ch) mask = cv2.merge((mask, mask, mask)) # 3chにする # 全体を合成 compo = cv2.addWeighted(front, alpha, back, 1-alpha, 0) # マスク処理

                                                                  OpenCVでスプライトを半透明にする #2 ~グラデーションな半透明を作る~ - Qiita
                                                                • [環境構築]64bit。Windowsで、OpenCV+VSCode,C++,CMakeの開発環境を構築してみた。(コンパイラはMSVC)

                                                                  Abstract OpenCVを、 Windows,VSCode,C++,CMakeで環境構築してみた。 OpenCVですよ。大切なので2回言いました。 ↓↓↓ここがすごい参考になった。あざっす。 前提 CMake、VisualStudio2022、VSCodeは、インストール済。[環境構築]Windowsで、VSCode,C++,CMakeの開発環境を構築してみた。(コンパイラはMSVC) 7-zipもインストールしとく。 手順 1. OpenCVのビルドとインストール プロジェクトフォルダ作成

                                                                    [環境構築]64bit。Windowsで、OpenCV+VSCode,C++,CMakeの開発環境を構築してみた。(コンパイラはMSVC)
                                                                  • 【画像処理】Line Detection - オムライスの備忘録

                                                                    画像処理 タスク一覧 yhayato1320.hatenablog.com Index Index Line Detection ハフ変換 / Hough Transformation Probabilistic Hough Transform Progressive Probabilistic Hough Transform Line Segment Detection / LSD Fast Line Detector / FLD 参考 Line Detection ハフ変換 / Hough Transformation ハフ変換 / Hough Transformation yhayato1320.hatenablog.com Probabilistic Hough Transform OpenCVで使われるHoughLinesPとは?定義から実用例を徹底解説!? kuroro.blo

                                                                      【画像処理】Line Detection - オムライスの備忘録
                                                                    • 多摩科学技術高校のリアル評価 - 日比谷高校を志す君に贈る父の言葉

                                                                      次男が多摩科学技術高校に入学して間もなく1年が過ぎようとしています。 通学保護者の目から見た多摩科技は、学校のリアルな実態がほとんど理解されていない高校の一つというのが正直な感想です。 このため今回は、多摩科学技術高校への入学を検討している中学生とその保護者の方に向け、現時点でのリアルな感想をお届けしたいと思います。 理解されていない多摩科技 まず第一に言えることは、中学校の先生も塾講師も、多摩科学技術高校についてはほとんど何も理解できていないという事実です。 これは、 次男の受験を通じて得たリアルな体験 実際に入学した後で理解できた実態 多摩科技についての発信に対する周辺からの反応 により客観的に理解できる点です。 実際に公立中学の進路指導の先生も担任の先生も、多摩科技がどのような学校であるかは全く認識できていません。 ですので進路指導の際に学校に尋ねても、満足のいく回答を得ることは難し

                                                                        多摩科学技術高校のリアル評価 - 日比谷高校を志す君に贈る父の言葉
                                                                      • ハフ変換 (Hough Transform) による直線・円の検出 | CVMLエキスパートガイド

                                                                        1. ハフ変換 (Hough Transform) による直線・円の検出とは [概要] ハフ変換 (Hough Transform)とは,画像上のパラメトリックな基本図形(直線・円など)の輪郭検出を,パラメータ空間上の投票問題に置き換えることで上手く行う手法である [Hough, 1962], [Duda and Hart, 1972], [Hart, 2009].図形の検出を,元の画像の空間上では行わず,代わりに「図形パラメータ空間」上で投票をおこない,最頻パラメータ値を探すことにより,元の画像上の基本図形(のパラメータ)を検出する.パラメータ空間でフィッティングをおこなうおかげで,画像上の直線・円のエッジが断片的であったり,ノイズ交じりであっても,頑健に基本図形(のパラメータ)を検出できるのが,利点である. この記事では,ハフ変換の最もよく使う例である,ハフ変換による直線の検出の基本的

                                                                          ハフ変換 (Hough Transform) による直線・円の検出 | CVMLエキスパートガイド
                                                                        • SDFマップを利用した影テクスチャツールを作ってみた。|TMR.S1

                                                                          本記事をご覧いただきありがとうございます。 とりあえず「何はともあれツールだ!!!」という方は、下記目次の「3.ツールにしてみる」をご覧ください。 0.はじめに先日X(旧Twitter)において、セルルックキャラクターの顔影を1枚のテクスチャで制御する技法に関する記事が話題になっていました。 原理や仔細などに関してはalwei様(https://x.com/aizen76)の以下の記事において詳細に記載されております。自分もここで基礎原理を学びました。 本記事はこちらの記事を前提として書かれておりますのでご了承ください。 1.どうしたものかさて、こちらの方法は昔トライして原理は理解できているつもりでしたので、割とまっすぐ学ぶことが出来ました。 実装してライトを動かすとしっかり顔影が動きます!が、 「ジャギるなぁ・・・」0~255までの値を「ここ以上は白、ここ以上は黒」と分けているので寄って

                                                                            SDFマップを利用した影テクスチャツールを作ってみた。|TMR.S1
                                                                          • OpenCV のピクセル形式が BGR である理由 - Qiita

                                                                            はじめに 主に Python のOpenCV 利用者の間でよくあがる疑問。 何故、imread で取得したピクセル値の並びが RGB でなく BGR なのか? NumPy 配列として RGB 順でうっかりアクセスしたり、matplotlib 等の外部プログラムに BGR 配列をそのまま渡して色味が変わる罠が有名ですね。 BGR から RGB の並びに変換したい時は cvtColor が便利です。 imgRGB = cv2.cvtColor(imgBGR, cv2.COLOR_BGR2RGB) はじめに結論 OpenCV の低レベル層の前身 IPL (Intel Image Proecssing Library) の開発を始めた頃の一般的な並びが BGR で、IPL は元々 Windows 用1かつ性能重視のプロダクトなので、Windows OS の内部画像形式 DIB に合わせた可能性が高

                                                                              OpenCV のピクセル形式が BGR である理由 - Qiita
                                                                            • Anacondaに頼らない、pipとvenvを用いたPython環境の構築

                                                                              最近、Pythonに触れることが多くなってきました。 その中で、環境構築についていろいろ学んできました。 Pythonの参考書の多くは”Anacondaで環境構築しましょう”と書いてあります。 しかし、Anacondaはセットアップファイルだけで4GBもあります。 また、自分のシステムに既に入っているPythonとの相互関係も最初の頃はよくわからなくなります。 Anacondaを横においておくと、Pythonには、パッケージマネージャーとして、”pip” というものがあります。 これも若干クセがあるので、いくつかおさえておくべきことがあります。 さらに、Pythonは”venv”というパッケージを使うことで、仮想環境を簡単に構築できます。 このvenvについて把握すると、Anacondaなどのことも理解しやすくなります。 ということで、私なりに理解したことをここでまとめていきたいと思います

                                                                                Anacondaに頼らない、pipとvenvを用いたPython環境の構築
                                                                              • AWS Rekognition で初めての画像解析(人物判定)してみた|デロイト トーマツ ウェブサービス株式会社(DWS)公式ブログ

                                                                                最近はモバイルアプリ開発に打ち込んでいる sekky です。 今回は 9 月に行われた合宿でシングルボードコンピュータを利用したハッカソンをやるチームだったので、その中で利用した AWS Rekognition を利用した人物判定を取り上げたいと思います。 AWS Rekognition とは? AWS が提供する機械学習を使用した画像認識とビデオ分析を自動化するためのサービスです。 画像・映像解析ライブラリを利用することでボード上でも実現できる機能ではありますが、AWS Rekognition を利用することで画像解析ライブラリの仕様等を知らなくてもやりたいことベースで機能を構築することができます。 AWS Rekognition は画像データからの人物(顔)の検出、判定のみならず、画像からの視線の分析、映像からの人物の動線検出、テキスト分析をはじめとする画像、映像の解析に関する様々な機

                                                                                • Python初心者でも作れるもの6選!学習する際の注意点も解説 - 法人様向けパソコンならドスパラプラス

                                                                                  この記事では、主に機械学習の開発などに用いられるプログラミング言語・Pythonを使用して初心者でも作れるものを紹介します。 Pythonがプログラミング初心者におすすめな理由や、学習する際の注意点もあわせてお伝えします。 Pythonで何が作れるのか知りたい方や、Pythonの学習を考えている方は、ぜひ最後までご覧ください。 初心者でもPythonで作れるもの Pythonは、ほかのプログラミング言語と比べてコードがシンプルで取り組みやすく、ライブラリも豊富であるため、初心者でもさまざまなものを作成できます。 クローリング・スクレイピング Pythonを使用すれば、Web上の情報を自動で取得・抽出するクローリングやスクレイピングが可能です。 クローリングやスクレイピングは、WebサイトのHTMLデータを元に、文章・画像などの情報を自動で取得・抽出するプログラムです。検索エンジンがWeb上

                                                                                    Python初心者でも作れるもの6選!学習する際の注意点も解説 - 法人様向けパソコンならドスパラプラス