並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 379件

新着順 人気順

yoloの検索結果1 - 40 件 / 379件

  • 中学1年生が開発した「カラスからゴミを守るシステム」の成果 Python、TensorFlowLite、Raspberry Piなどを活用

    2022年度に未踏ジュニアに採択されたクリエイターが、5月から半年間取り組んできたプロジェクトについて発表を行う「未踏ジュニア 成果報告会」。ここで五島氏と、メンターの尾藤氏が登壇。「カラスからゴミを守るシステム」の開発理由から成果について報告します。 五島氏の自己紹介 尾藤正人(以下、尾藤):メンターの尾藤です。僕がメンターをさせてもらった、五島くんのカラスを追い返すシステムの発表をお願いしたいと思います。五島くん、どうぞ。 五島舜太郎氏(以下、五島):はい。みなさんこんにちは。五島舜太郎です。僕は今回「scairecrow」という、カラスからゴミを守るシステムの開発を行いました。 (会場拍手) ありがとうございます。scarecrowとは英語でカカシを意味する単語ですが、今回は「AIの機能を内蔵したカカシ」という意味を込めて名付けました。 では自己紹介です。年齢は13歳、中学1年生です

      中学1年生が開発した「カラスからゴミを守るシステム」の成果 Python、TensorFlowLite、Raspberry Piなどを活用
    • 弁護士をやっている弟が資産を全て銀行預金にしているのだが、その理由が真理すぎて反論出来なかった話

      まりーさん@ USA🇺🇸YOLO❗️(You Only Live Once) @maryoakleysan 私の弟、弁護士なんですが、資産は全て銀行貯金でかなりの大金。「なんで投資しないの?もったいない」と言ったら、「投資は管理が面倒。お金が増えても幸せは増えないけど、減るとストレスになる」真理すぎて反論出来なかった。自分と家族の幸せの軸がぶれない弟が誇らしい。投資だけが正義じゃない。 2022-06-07 11:11:19 まりーさん@ USA🇺🇸YOLO❗️(You Only Live Once) @maryoakleysan My brother is a lawyer in 🇯🇵 & all his wealth is in the bank. I said “why don’t u invest? Such a waste!” He replied “it’d tak

        弁護士をやっている弟が資産を全て銀行預金にしているのだが、その理由が真理すぎて反論出来なかった話
      • JP Contents Hub

        AWS 日本語ハンズオン Amazon Web Services(AWS) の 日本語ハンズオンやワークショップを、カテゴリごとにまとめています。 右側の目次や、ヘッダー部分の検索ボックスから、各コンテンツにたどり着けます。 また、Ctrl + F や command + F を使ったページ内検索もご活用いただけます。 料金について ハンズオンで作成した AWS リソースは通常の料金が発生します。作成したリソースの削除を忘れずにお願いします。 もし忘れてしまうと、想定外の料金が発生する可能性があります。 画面の差異について ハンズオンで紹介されている手順と、実際の操作方法に差異がある場合があります。 AWS は随時アップデートされており、タイミングによってはハンズオンコンテンツが追いついていない事もあります。 差異がある場合、AWS Document などを活用しながら進めて頂けますと幸い

          JP Contents Hub
        • AI・Python活用レシピ100選 - Qiita

          ※ 一部ガイドラインに反する内容がありましたので、該当箇所を修正のうえ再投稿しております。 はじめに Axross は、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによる実践ノウハウが"レシピ"として教材化されており、実際に動くものを作りながら、具体的な目的・テーマをもってプログラミングを学ぶことができます。 今回は、Axross運営が厳選した『AI・Python活用レシピを100選』をご紹介します。是非、みなさまのAIやPython学習の参考にしてみてください。 Axross:https://axross-recipe.com 公式Twitter:https://twitter.com/Axross_SBiv 基礎 スクレイピング 01 . JUMPの掲載順をスク

            AI・Python活用レシピ100選 - Qiita
          • Windows 95のプロダクトキーは「111-1111111」や「000-0000000」でも突破できる超単純アルゴリズムで実装されていた

            1995年に登場した「Windows 95」のインストール時にはプロダクトキーの入力を求められるのですが、プロダクトキーは「111-1111111」や「000-0000000」といった単純な数字の羅列でも認証されてしまいます。このような単純なプロダクトキーでも認証可能な理由について、セキュリティ研究者のstacksmashing氏が解説しています。 Why 111-1111111 is a valid Windows 95 key - YouTube これが、Windows 95のプロダクトキー入力画面です。不正なプロダクトキーを入力するとインストールを続行できなくなるのですが、「111-1111111」という単純なプロダクトキーでも「正しいプロダクトキー」として認識され、インストールを続行できます。 また、先頭の3桁を「000-1111111」「001-1111111」「567-1111

              Windows 95のプロダクトキーは「111-1111111」や「000-0000000」でも突破できる超単純アルゴリズムで実装されていた
            • おわりに - なぜ機械学習はうさん臭く感じられるのか? / 真面目なプログラマのためのディープラーニング入門

              本講座では計8回にわたり、ディープニューラルネットワークの原理と実装について 説明してきた。ニューラルネットワークの原理は基本的には 勾配降下法であり、その基盤となっているのが関数の微分可能性である。 ニューラルネットワークにはさまざまな形態が存在するが、 画像処理・画像認識の場合は畳み込みニューラルネットワークが非常に 有効であることがわかっている。また、ニューラルネットワークの 出力形式や損失関数を変えることにより、ニューラルネットワークが 物体検出や奥行き推定など、さまざまなタスクに利用可能であることを紹介した。 さて、本講座は「真面目なプログラマのための」ディープラーニング入門、 と銘打っている。真面目なプログラマとは何か? 諸説いろいろあるだろうが、 多くのプログラマは、ソフトウェア開発において 仕様の明確さや、 システムの効率・堅牢性、そして 保守のしやすさといったものを 追求

              • ごめんVisionPro誤解してた (๑˃̵ᴗ˂̵)|shi3z

                朝起きて、「うーんまだ布団から出たくないな」と思ったとき、おもむろにVisionProを被ってみた。 暗い部屋では認識が格段に悪くなるが、なぜPSVRではこういう使い方をしなかったのかわかった。後頭部だ。 PSVRは後頭部にゴツい部品があって、それで寝ながらVRを見るということが少し難しくなってる。VisionProの標準のバンドはこういうときにちょうどいい。 VisionProでTerminalを動かして、継之助の様子を見る。今日も元気に学習しているようだ。 昨日寝落ちした Amazon Primeの「沈黙の艦隊」第五話と六話を見る。音がいい。空間オーディオに対する長年の研究が結実してる感じ。しかもすごくいい音なのだ。 昨日、路上で歩きながら使ってみた(技適の特例申請には移動経路を申告済み)。路上で使うと思わぬ欠点というか盲点にぶちあたる。ウィンドウがついてこないのだ。 他のHMDと違い

                  ごめんVisionPro誤解してた (๑˃̵ᴗ˂̵)|shi3z
                • 現役Vueエンジニアが参考にしているフロントエンド素材まとめおすすめサイト4選 - Qiita

                  今回の記事ではフロントエンド開発で参考にしているサイトを紹介していきます。 どれも動くCSS素材やコピペだけで簡単に実装できる素材がまとまっています。 気に入ったサイトを自己判断で参考にしてみてください。 TwinzLabo コピペだけで作れるデザインレシピを公開しています。動きのあるデザインやオシャレなWebデザインなど様々な記事があるのでおもちゃ屋さんに来たかのように楽しめます。記事に使用しているアニメーションはVue環境で作成されているので普段Vueで開発している方はコピペだけできれいに反映させることができて便利です。記事で紹介されているコードひとつひとつに詳しく解説がついているので初心者にはありがたいかと思います。 Free Frontend By using freefrontend.com you accept our cookies and agree to our priv

                    現役Vueエンジニアが参考にしているフロントエンド素材まとめおすすめサイト4選 - Qiita
                  • How to recover from microservices

                    I won't deny there may well be cases where a microservices-first architecture makes sense, but I think they're few and far in between. The vast majority of systems are much better served by starting and staying with a majestic monolith. The Prime Video case study that blew up the internet yesterday is but the latest illustration. Maybe once you reach the scale of Netflix or Amazon, there are areas

                      How to recover from microservices
                    • ライゾマティクスの Squarepusher 新 MV 制作を支えた Google Cloud | Google Cloud 公式ブログ

                      Squarepusher "Terminal Slam" MV 9/9 からオンラインでのフェスティバル開催となった世界有数のメディアアートの祭典、アルス・エレクトロニカ。毎年、メディアアートに革新をもたらした人物や作品・プロジェクトを表彰する「アルス・エレクトロニカ賞(Prix Ars Electronica)」が発表され、真鍋大度氏率いるライゾマティクスが制作した Squarepusher の新作 MV「Terminal Slam」がコンピューターアニメーション部門の「栄誉賞(Honorary Mention)」を受賞した。機械学習(ML)による Diminished Reality(減損現実)や Image Inpaint(画像修復)で構成された Mixed Reality(複合現実)の 4K 画像がスクリーンを覆い尽くすという新しい演出が注目を集めている。 このライゾマティクスのク

                        ライゾマティクスの Squarepusher 新 MV 制作を支えた Google Cloud | Google Cloud 公式ブログ
                      • 【自動運転】信号機認識に挑む / 走行画像15,000枚のアノテーションとYOLOXモデルによる深層学習実践

                        こんにちは。TURING株式会社でインターンをしている、東京大学学部3年の三輪と九州大学修士1年の岩政です。 TURINGは完全自動運転EVの開発・販売を目指すスタートアップです。私たちの所属する自動運転MLチームでは完全自動運転の実現のため、AIモデルの開発や走行データパイプラインの整備を行っています。 完全自動運転を目指すうえで避けて通れない課題の一つに信号機の認識があります。AIが信号機の表示を正しく理解することは、自動運転が手動運転よりも安全な運転を達成するために欠かせません。信号機を確実に認識したうえで、周囲の状況を総合的に判断して車体を制御し、安全かつ快適な走行を実現する必要があります。 TURINGでは信号機の認識に取り組むため、15,000枚規模のデータセットを準備し、高精度なモデルのための調査・研究を開始しました。この記事ではデータセットの内製とその背景にフォーカスしつつ

                          【自動運転】信号機認識に挑む / 走行画像15,000枚のアノテーションとYOLOXモデルによる深層学習実践
                        • 物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌

                          はじめに 先月、YOLOv4が公開されました。位置づけとしては、物体認識のポピュラーなモデルの1つであるYOLO系統の最新版となります。結果がすごいのはぱっと見分かりましたし、内容も既存の手法をサーベイ・実験頑張って、精度上げていったんだなあくらいのさら読みはしていましたが、もう少しちゃんと読んでおこうと思い、読んでみたので紹介します。 私自身は物体認識の研究者というわけではないですが、なんだかんだ物体認識周りの記事をいくつか書いているので興味のある方は以下もご参照下さい。 note.com note.com [DL輪読会]Objects as Points from Deep Learning JP www.slideshare.net さて、このYOLOv4ですが、元々のYOLOの作者であるJoseph Redmon氏は著者ではありません。Jeseph Redmon氏は研究の軍事利用や

                            物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌
                          • プログラミング初心者がKaggle Expertになるまでの10ヵ月間を振り返る - Qiita

                            Kaggle Expertになったので、イキってポエムを書こうと思いました。 AIに興味あるけどプログラミングすらできないんだよねという人向けの参考になれば幸いです。 1. 初期スペック (2019年2月) 機械工学系修士卒。よくいるメカニカルエンジニア 線形代数も統計も正直そんなに好きじゃない。力学の方が得意。 AI?あれでしょ。将棋超強いやつでしょ? パイソン?スト2のボクサーみたいなやつ? 2. 現在のスペック (2019年12月) Kaggle Expert (微妙?) 機械学習コンペでそれなりの成績 (Kaggle Kuzushiji Recognition 7th,Signate tellus 3rd 5th) 機械学習:なんとなくコーディングできる。 深層学習:なんとなくコーディングできる。 関連論文読める。簡単なものは実装できる。 業務適用も見えてきた 3. 機械学習を学ん

                              プログラミング初心者がKaggle Expertになるまでの10ヵ月間を振り返る - Qiita
                            • 物体検出のDeepLearning読むべき論文7選とポイントまとめ【EfficientDetまでの道筋】 - Qiita

                              お久しぶりです。 2012年のHintonさんのAlexNetによるILSVRCでの圧勝を皮切りに、画像認識の世界でもDeepLearningが脚光を浴びることとなりました。 物体検出の世界でも現在DeepLearningを用いたモデルが主流になっています。 https://paperswithcode.com/sota/object-detection-on-coco を見ると、 COCO test-devにおいて、state-of-the-art(SoTA)のモデルはEfficientDet-D7xのようです。 独断と偏見も少々ありますが、そのEfficientDetを理解するために読むべき論文を7つ集めてみました。 DeepLearning以降の物体検出に焦点を当てて、出来るだけ簡潔につらつらと書いていきたいと思います。 物体検出とは 物体検出について知らないという人は以下の動画を見

                                物体検出のDeepLearning読むべき論文7選とポイントまとめ【EfficientDetまでの道筋】 - Qiita
                              • 日本人でも英語圏で戦えることを証明したい。28歳が会社を辞め、個人開発者としてカナダでひたすらもがき続けた一年間とこれから - Qiita

                                日本人でも英語圏で戦えることを証明したい。28歳が会社を辞め、個人開発者としてカナダでひたすらもがき続けた一年間とこれから起業海外スタートアップ個人開発 新卒で入社して4年間エンジニアとして働いてきたYahoo! Japanを退職し、約一年が経ちました。退職後は日本を離れ、カナダのバンクーバーから、大好きな個人開発に思いきり打ち込み、ひたすらプロダクトを日本ではなく、世界に公開することに専念してきました。 今回は、自分がプロダクトをローンチし続けた経緯、また、その開発のなかで出会った人たちと切磋琢磨をしていくなかで、個人開発ではなく、スタートアップとして本気で世界を獲ってみたいと思えるプロダクトに出会うまでの思いを書いていければと思います。 少し長くなりますが、アメリカや北米で勝負してみたいと考えている開発者、サービス作り大好きな方々に読んでもらえれば嬉しいです。 なぜバンクーバーなのか?

                                  日本人でも英語圏で戦えることを証明したい。28歳が会社を辞め、個人開発者としてカナダでひたすらもがき続けた一年間とこれから - Qiita
                                • 画像ディープラーニングの始め方(画像系AIの概要理解からUdemy受講, E資格取得まで) - Qiita

                                  本記事の目的 もともと本業でデータサイエンスやディープラーニングを扱っていたわけでもなく、ディープラーニング周りは「なんとなく知っている」という状態。ちゃんと勉強したいと思いながらもなかなか手が出ず、モデル実装の経験もない。 上記の状態から、この1年間くらいでやっと、初めてディープラーニング実装の経験をするところまでたどり着いた。とりあえずデータサイエンスの入口に立てた(かもしれない)ということで、整理のためここまで取り組んできたことをまとめてみた。 これから勉強を始める、誰かのために役立てば嬉しい。 <画像ディープラーニングの始め方> ◇ ステップ1. 画像系AIの全体像を把握する ◇ ステップ2. 画像分類を実装してみる ◇ ステップ3. 理論をフォローアップする ◇ ステップ4. 実装の経験を積む ステップ1.画像系AIの全体像を把握する とりあえず初心者向けの書籍や動画などを見て全

                                    画像ディープラーニングの始め方(画像系AIの概要理解からUdemy受講, E資格取得まで) - Qiita
                                  • 高校の「情報II」でデータサイエンスがしっかり学べる!すごい!

                                    高校の「情報II」でデータサイエンスがしっかり学べる!すごい! 2020-06-25-1 [Programming][Python][BookReview] データサイエンティストに俺はなる!! Python 初学者のタツヲです。 いまどきは高校の授業(情報II)でデータサイエンスをやるのですね。 文部科学省から教員用の資料が公開されてるのを知りました。 「情報II」を取った高校生がどんなことを学んでいるのかを知るために、さっそく調査です! 高等学校情報科「情報Ⅱ」教員研修用教材(本編):文部科学省 第3章がデータサイエンスの話題ですので、そこを読みました。 で、読んでみた感想ですが、内容が本格的すぎて震える。 大学のデータサイエンス演習のテキストじゃないのかよ、これ。 流し読みでは一部ついていけないところも(真面目に読む必要あり)。 高校生のうちからこの辺をマスターできれば将来安泰でしょ

                                      高校の「情報II」でデータサイエンスがしっかり学べる!すごい!
                                    • プログラミング初心者がKaggle Expertになるまでの10ヵ月間を振り返る - Qiita

                                      Kaggle Expertになったので、イキってポエムを書こうと思いました。 AIに興味あるけどプログラミングすらできないんだよねという人向けの参考になれば幸いです。 1. 初期スペック (2019年2月) 機械工学系修士卒。よくいるメカニカルエンジニア 線形代数も統計も正直そんなに好きじゃない。力学の方が得意。 AI?あれでしょ。将棋超強いやつでしょ? パイソン?スト2のボクサーみたいなやつ? 2. 現在のスペック (2019年12月) Kaggle Expert (微妙?) 機械学習コンペでそれなりの成績 (Kaggle Kuzushiji Recognition 7th,Signate tellus 3rd 5th) 機械学習:なんとなくコーディングできる。 深層学習:なんとなくコーディングできる。 関連論文読める。簡単なものは実装できる。 業務適用も見えてきた 3. 機械学習を学ん

                                        プログラミング初心者がKaggle Expertになるまでの10ヵ月間を振り返る - Qiita
                                      • GPT-4oはどのように画像をエンコードしてトークンに分解しているのか?

                                        AIチャットサービス「ChatGPT」のモデルの1つ、GPT-4oは、人間から受け取ったテキストをまず「トークン」に処理した後、AIが扱いやすい数値ベクトルに変換して計算を行います。画像でも同様の処理を行いますが、その際にどのような処理をしているのか、プログラマーのオラン・ルーニー氏が推測しました。 A Picture is Worth 170 Tokens: How Does GPT-4o Encode Images? - OranLooney.com https://www.oranlooney.com/post/gpt-cnn/ GPT-4oが高解像度の画像を処理する際は、画像を512x512ピクセルのタイルに切り分けて処理し、1タイル当たり170トークンを消費します。この「170トークン」という数字に着目したルーニー氏は、「OpenAIが使う数字にしては中途半端すぎる」と指摘し、な

                                          GPT-4oはどのように画像をエンコードしてトークンに分解しているのか?
                                        • エッジで機械学習ってなんだろう -ブラウザ、スマホ、IoT機器での推論を概観する- - Qiita

                                          本内容は、技術書典7 合同本『機械学習の炊いたん2』収録の、「エッジで機械学習」記事を公開したものです。内容は2019年9月時点の調査等に基づきます。 最近Raspberry Pi 4の検証結果などをみていると、エッジ、かつCPUでもそれなりの速度で動くケースもみられます。またこの後にM5StickV(K210)などを触りましたが、専用チップも使い所があります。今後、それらの動きもできれば補足したいと思います。 9/12-22に開催された技術書典9では、新刊『機械学習の炊いたん3』を頒布しました。私は、「AIエンジニア、データサイエンティストのための経営学、ソフトウェア工学」を寄稿しています。他にも機械学習のビジネス、エンジニアリング、数理までもりだくさん。気になられたら、ぜひご覧ください! 他にも、技術書典9「機械学習、データ分析」系の新刊リスト - Qiitaの通り、たくさんの本が出品

                                            エッジで機械学習ってなんだろう -ブラウザ、スマホ、IoT機器での推論を概観する- - Qiita
                                          • 物体検出ライブラリの紹介と所感 - arutema47's blog

                                            記事について 画像はDetectron2より 物体検出をほとんど使っていない方を対象として、2021年末の物体検出ライブラリを俯瞰することが本記事の目的。 ある程度物体検出の経験ある方は学ぶことは少ないと思う。またあくまで書いてあるのは筆者の感想であるので人によっては全く違う意見になることもあるかと。また本記事ではモデルの技術的な説明はありません。それらについて理解を深める際は参考ページや元論文を当ってみると良いかと思います。 また大変遅くなりましたが、本記事はKaggleアドベントカレンダー(裏)の24日目でもあります(年明けちゃってすみません)。 qiita.com 記事について 紹介するライブラリ一覧 所感 アンサンブルについて 精度vs速度トレードオフ ライブラリ紹介 yolov5 学習について 推論について Yolox 学習について Efficientdet 学習コード torc

                                              物体検出ライブラリの紹介と所感 - arutema47's blog
                                            • JetsonにEdge TPUにM5StickV で、エッジAI用やるには何を選べばいいの? - masato-ka's diary

                                              1. 概要 追記 公開当初Jetson Nanoの性能表記に誤記があったため修正しています。 最近組み込みデバイス(以下エッジと表現)で画像認識や音声認識、センサ情報の処理といったディープラーニングを利用した処理を実行することが容易になっている。低消費電力で、高速にディープラーニングを処理するためのエッジAI用アクセラレータが各社から発売されていることがその理由の一つだろう。 こういった、エッジAI用のアクセラレータは各社によってその使用や対応フレームワーク、利用できるディープラーニングのネットワーク構成に違いがある。どれも同じように利用できるわけではない。自分でエッジAI用アクセラレータを利用しようとしたときにいくつか調べてみた内容をメモがわりに残してみる。ちなみに個人で遊べるものを中心にしてるので、産業的にどうなのかは知らない、悪しからず。。。 あとこのブログではAndroid Thi

                                                JetsonにEdge TPUにM5StickV で、エッジAI用やるには何を選べばいいの? - masato-ka's diary
                                              • 【初学者向け】Python社内DX7選 - Qiita

                                                Pythonを使うことで身の回りの面倒な業務を効率化することができます。 本記事では、Pythonで社内DX(業務効率化)できることを7つの分野に分けてご紹介したいと思います。 Excel処理 Pythonのライブラリopenpyxlを使うとExcelファイルを操作することができます。 以下はopenpyxlで処理できる基本操作の一部です。 ファイル操作(新規作成、保存) シート操作(集計、移動、削除) 行と列の操作(グループ化、挿入、削除) セルの操作(取得、代入) 具体的には、複数のシートから集計シートを作成したり、ExcelやAccessのデータベースに接続してデータを加工し、グラフを作成することが可能です。 ※Accessのデータベースに接続する場合は、別途pyodbcモジュールを使う必要があります。 追記 2023年8月、ExcelにPythonが追加されました。 概要を知りたい

                                                  【初学者向け】Python社内DX7選 - Qiita
                                                • Slackアプリ開発の社内勉強会を開催しました - JX通信社エンジニアブログ

                                                  サーバサイド開発やインフラ周りをいじっているたっち(TatchNicolas)です。 JX通信社の日々の運用では、Slack workflowやbotが大活躍しています。 かなり作り込まれた高機能なBotもあり欠かせないものになっていますが、開発者メンバーのなかには普段そのリポジトリを触らない人・すでにあるものに機能追加・改修はするがゼロから立ち上げたことはない人などもいます。ハードルをグッとさげることで自分たちの斧を研ぎやすくできないか?と考えました。 そこで毎月開催している社内勉強会にて、今回はSlackアプリ開発をテーマにしましたのでその様子について紹介します。 内容 初めて触る人でも開発をすぐに始められるように、社内でよく使われる言語でテンプレになるリポジトリを用意しました。 Golang: https://github.com/TatchNicolas/slack-scaffol

                                                    Slackアプリ開発の社内勉強会を開催しました - JX通信社エンジニアブログ
                                                  • Raspberry Pi 3 B+ & PyTorchの深層学習で、カメラ映像内の複数物体をリアルタイム分類 - Qiita

                                                    Raspberry Pi 3 B+ & PyTorchの深層学習で、カメラ映像内の複数物体をリアルタイム分類PythonOpenCVRaspberryPiDeepLearningPyTorch 大学の授業関係でラズパイ3B+とpicameraをゲット。暇なので、ラズパイに深層学習を用いた分類をさせてみようと思い立ちました。ただ、前もって撮った写真を分類させるのではなく、picameraからのリアルタイムの映像内の物体を分類させ、いい感じに表示させます。 学生レベルかもしれませんが、一部分でも参考になれば幸いです。 思い描いたこと 「固定されたpicameraの視野内に複数の私物を置くと、それをリアルタイムに分類し、表示する機能」をラズパイ内に作ってみようと思いました。 具体的には、背景差分(背景画像と変化した部分を抜き出す手法)で物体を抽出し、PyTorch [パイトーチ](Keras,

                                                      Raspberry Pi 3 B+ & PyTorchの深層学習で、カメラ映像内の複数物体をリアルタイム分類 - Qiita
                                                    • 実装初心者向けにディープラーニングの全体像、実装手順をわかりやすくまとめてみた - Qiita

                                                      対象者 機械学習、ディープラーニングを一通り勉強したが、実装するときにどう関連するのかわからない人。 頭の中を整理したい人。 詳しい数学的な説明はchainerチュートリアルを参照すると良い。 解説内容 ディープラーニングでもっとも一般的な教師あり学習の手順を解説する。また、それに伴う周辺知識を説明する。 ディープラーニングのモデルになったもの ディープラーニングは人の神経細胞における情報伝達の仕組みを真似て作られた。これにより、精度が飛躍的に向上した。 ニューラルネットワークの仕組み ニューロンのモデル化 ニューラルネットワークでは、人間の神経細胞の動きをコンピュータで再現した数式モデルを作る。個々の神経細胞は簡単な演算能力しか持たないが、お互いに繋がり連動することで高度な認識、判断をすることができる。行列や特別な関数の計算をしながら情報伝達の仕組みを数式で再現していく。 ニューロンのモ

                                                        実装初心者向けにディープラーニングの全体像、実装手順をわかりやすくまとめてみた - Qiita
                                                      • 数行のコード追加でStable Diffusion生成画像を高品質にする「FreeU」、Llama2を10万トークンに低コストで増やす手法「LongLoRA」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                                        2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第13回目は、画像生成AIを高品質にする手法、画像と文章を中間言語を用いずに入出力するモデルなど5つの論文をまとめました。 生成AI論文ピックアップ数行のコード追加でStable Diffusionなどの生成画像を高品質にする手法「FreeU」 大規模言語モデルのトークンを効率よく増やす手法「LongLoRA」 Llama2を10万トークンに 2.6兆トークンで訓練された、130億のパラメータを持つ多言語モデル「Baichuan 2」 スマホで物体検出をリアルタイムかつ高精度で行う新モデル「Gold-YOLO」 画像と文章を“そのまま”入出力できる生成モデル「Drea

                                                          数行のコード追加でStable Diffusion生成画像を高品質にする「FreeU」、Llama2を10万トークンに低コストで増やす手法「LongLoRA」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                                        • 日本CTO協会による合同ISUCON研修の紹介 - Pepabo Tech Portal

                                                          こんにちは!技術部プラットフォームグループのharukin, pochyです。 この記事では、「ISUCON」を模したパフォーマンスチューニング研修を複数社合同で実施した概要と、そのための準備について紹介します。 研修について 目的 今回の研修の目的は次のものとしました。 パフォーマンスチューニングの問題を会社横断でチームを組成し取り組むことで、サーバサイドやインフラのパフォーマンス・チューニングを中心に幅広い知識を総動員して課題解決に望む。 課題解決過程のコミュニケーションを通じて、会社の枠を超えた同期作りを促進する。 概要 今回の研修では、チームごとにパフォーマンスチューニングの課題に挑戦しました。 実際のISUCONのように、各チームにwebサーバーを貸し出す形式です。各チームはそのアプリケーションを時間内にパフォーマンスチューニングし、最適化された度合いによってチームに点数をつけま

                                                            日本CTO協会による合同ISUCON研修の紹介 - Pepabo Tech Portal
                                                          • YOLOをpythonで動かしてリアルタイム画像認識をしてみた - Qiita

                                                            背景 友人から、画像認識においてかなり高機能でイケているYOLOv3というのを教えてもらった。 少し調べてみると、 簡単に言えば、今までのものより正確に早く物体検出・物体検知をしてくれる便利なもの。導入も簡単。 ディープラーニングで自分が一からモデルを構築しなくても、YOLOは初期装備でかなり使える。 画像はもちろん、Webカメラなどとも連動できる。リアルタイムに物体検出が可能ということ。 参考:https://pycarnival.com/yolo_python_opencv/ とあり、早速触ってみました。 まずはYOLOv3ではなく、YOLOにトライしました。 途中エラーも発生したので、対処法をメモしておきます。 非ソフトエンジニアなので、わかりにくい点があるかもしれませんがご容赦ください。 開発環境 macOS Mojave 10.14.2 tensorflow 1.12.0 pyt

                                                              YOLOをpythonで動かしてリアルタイム画像認識をしてみた - Qiita
                                                            • データサイエンスから機械学習エンジニアリングへの移行 | AI専門ニュースメディア AINOW

                                                              著者のCaleb Kaiser氏は機械学習モデル開発プラットフォームCortexの開発に関わりながら、機械学習に関する技術論をMediumに投稿し続けています。AINOWで紹介した記事『機械学習自体を学ぶな』で機械学習モデルの開発実践力の重要性を力説した同氏は、最近Mediumに投稿した記事『データサイエンスから機械学習エンジニアリングへの移行』において、そうした開発実践力に「機械学習エンジニアリング」という名称をつけて詳しく解説しています。 テキストアドベンチャーゲーム『AI Dungeon』のような機械学習システムには、同ゲームに活用されている言語モデルGPT-2を開発する技術と、この言語モデルを使ってゲームを開発するそれという位相の異なるふたつの技術が関わっています。同氏は、前者のような機械学習システムの中核機能を司る技術をデータサイエンス、そして後者を機械学習エンジニアリングと区別

                                                                データサイエンスから機械学習エンジニアリングへの移行 | AI専門ニュースメディア AINOW
                                                              • scikit-learn、Keras、TensorFlowによる実践機械学習 第2版

                                                                本書はコードを動かしながら学び、機械学習が使えるようになることを目的とした書籍です。現実的な問題を出し、サンプルデータを示しながら、機械学習で問題を解決に導くまでの一連の手法を体系立てて解説します。 深層学習以外の機械学習にはscikit-learnを使い、機械学習プロジェクトの流れ、データからモデルを学習する方法、データの処理・クリーニングなどの基礎から、特徴量の選択や過学習、データの次元削減など応用までを学びます。深層学習にはTensorFlowとKerasを使い、ニューラルネットワークの構築と訓練、ニューラルネットワークアーキテクチャ、深層学習や強化学習、さらにTensorFlowの分散処理のメカニズムや実装までを幅広く解説します。 第2版では教師なし学習と深層ネットワーク訓練手法、コンピュータビジョンテクニック、自然言語処理、Tensor Flowの大規模な訓練や効率的なデータの取

                                                                  scikit-learn、Keras、TensorFlowによる実践機械学習 第2版
                                                                • 【YOLOv5】マスクしてる人・してない人を物体検出 - Qiita

                                                                  YOLOv5がリリースされたとのことなので試してみました。 https://github.com/ultralytics/yolov5/ 目次 使用データと目的 実装例 データ準備 COCOデータのpretrainedモデルのダウンロード コードのダウンロード 環境準備 コード実行 コード説明 最後に 1. 使用データと目的 以下のサイトから物体検出用の画像を拾ってきました。 https://public.roboflow.ai/object-detection/ 色んなデータがありますが、コロナの時期なのでマスク有り無しのデータを選択してみました。 目的は図のようにマスクをしている人・していない人の物体検出を行うことです。 2. 実装例 2-1. データ準備 まずデータをダウンロードします。 以下のURLにアクセスします。 https://public.roboflow.ai/objec

                                                                    【YOLOv5】マスクしてる人・してない人を物体検出 - Qiita
                                                                  • AIで通行量調査の映像解析精度を上げるのに苦労した - Qiita

                                                                    AIを使って映像から通行量(歩行者量)を調査するソフトを作ったけど、最初は解析精度が低くて使い物にならず、いろいろ苦労してカウントの精度を上げた話です。車両の映像解析をした時にも苦労しましたが、歩行者は車両より小さい上バラバラの方向に移動するので、まったく別の苦労がありました。解析結果のムービーはこちら。映像解析は面白い&奥深いですねえ。 サマリー ・歩行者量を正しくカウントするための要件 ・物体検出の手法と学習モデルの選定 ・軌跡の描画機能によるノイズの発見と除去 ・トラッキング方法の検証と機能追加 ・正しいカウントを実現するための機能追加 ・まとめ 歩行者量を正しくカウントするための要件 以前、車両の通行量を映像解析し際にトラッキングしたり、速度を出したりしててそれなりの結果が出せたので、「歩行者も楽勝では?」と考えてソフトを開発しましたがとんでもなく苦労しました。 そもそも「映像から

                                                                      AIで通行量調査の映像解析精度を上げるのに苦労した - Qiita
                                                                    • 五等分の花嫁をAIで予想してみた - Qiita

                                                                      若干釣りタイトルです。深層学習による画像認識をAIと呼ぶか否か問題。 背景 五等分の花嫁の原作の方がだいぶ佳境ですね。 この前12巻が発売されましたが、作者によると14巻で完結とのこと。 だらだら続けるよりは良いんでしょう。名残惜しいけど。 さて、五等分の花嫁と言えば可愛い五つ子ちゃんたちを終始眺めるのも乙なもんですが、一応本作のテーマは「未来の花嫁は誰になるのか?」です。 劇中にも花嫁が何回か出てきてはいるけどもそこは五つ子、ウェディングドレスじゃ誰か分からないわけです。 人の目には誰か分からなくてもAIならば誰か当てられるのでは…?と言うのがこの記事の主題になっています。 実はアニメから入っていて、アニメを観ていた当初そんなネタで記事書いたらバズらないかなーとか何とか思ってたのですが、アイデアを温め、もといめんどくさがってたらいつの間にか師走に入ってました。アニメが今年の初めだったこと

                                                                        五等分の花嫁をAIで予想してみた - Qiita
                                                                      • 物体検出について読むならこれ! - Qiita

                                                                        Deep Learning論文多すぎませんか? 「物体検出のためのDeep Learning論文」だけでも多すぎませんか? 多すぎて全容を把握できないせいで、逆に R-CNN, YOLO, SSD, CornerNet とその発展ばかり紹介されてませんか? いやー、物体検出のためのDeep Learningについての良いサーベイがあると良いんですけどねー。 という方におすすめなのがこちら! Deep Learning for Generic Object Detection: A Survey [Li Liu+, IJCV2019] https://arxiv.org/abs/1809.02165 https://doi.org/10.1007/s11263-019-01247-4 日本語訳しておきました! https://shinya7y.github.io/note/detection

                                                                          物体検出について読むならこれ! - Qiita
                                                                        • 統計学と機械学習におけるマルチコ(多重共線性)に対する考えの相違

                                                                          先日、デスマーチの末なんとか機械学習案件のリリースに漕ぎ着けました。 今回の案件に関わらないですが、要件や仕様はしっかり明文化しておくべきですね。 後から(特にリリース間近になって)言った言わないの議論になるのは双方にとってあまり気持ちのいいものではありません。 些細な仕様変更のため口頭で合意した内容でも、しっかりと資料化しておくことの重要さを再認識しました。 さて、今回はマルチコ(多重共線性)について投稿します。 クライアント先で多変量解析をしているときにこの話題が出たので、いろいろと調べてみました。 大学では統計学視点でのマルチコを若干勉強したのですが、この機会に再度勉強し直してみたのでまとめます。 マルチコ(多重共線性)とはマルチコとは、重回帰モデルにおいて説明変数間に強い相関がある事象のことをいいます。 マルチコはmulti-colinearlity(マルチ-コリニアリティ)の略称

                                                                            統計学と機械学習におけるマルチコ(多重共線性)に対する考えの相違
                                                                          • はてブで話題の記事&ブックマークのまとめ(2020/02) - ゆとりずむ

                                                                            こんにちは、らくからちゃです。 今月は、相場をおっかけるのが楽しくて忙しくて、なかなかブログも書けませんでした。大して期待している人も少ないかとでしょうし、すでに半月たってしまっておりますが、やるぞー!と言ったのに書かないのは気持ちが悪いので、下記記事の続きを書いてみたいと思います。 www.yutorism.jp 2020年2月度の注目記事ランキング ブックマークコメントへのスター数による2020年2月度のランキングは下記の通りとなりました。 なお B:ブックマーク数 ※:コメント付ブックマーク数 ★:コメントへのスター数(同一ユーザーでの連続スターは1件でカウント) となります。 いっくぞー( ・`д・´) 順 カ B ※ ★ 記事 1 政 1043 617 5942 はしもとがく(橋本岳) on Twitter: "ちなみに、現地はこんな感じ。画像では字が読みにくいですが、左手が清潔

                                                                              はてブで話題の記事&ブックマークのまとめ(2020/02) - ゆとりずむ
                                                                            • Web Neural Network API

                                                                              Web Neural Network API W3C Candidate Recommendation Draft, 5 May 2024 More details about this document This version: https://www.w3.org/TR/2024/CRD-webnn-20240505/ Latest published version: https://www.w3.org/TR/webnn/ Editor's Draft: https://webmachinelearning.github.io/webnn/ Previous Versions: https://www.w3.org/TR/2024/CRD-webnn-20240503/ History: https://www.w3.org/standards/history/webnn/ Im

                                                                              • Kaggle Grandmasterになったので今までを振り返る - kaggle日記

                                                                                kaggleを始めてから3年半、ようやく1つの目標であったGMになることが出来ました。 前回の記事で最初の金メダルを取るところまでは書いたので、その続きとして金メダルを取ったコンペを中心に機械学習人生を振り返っていきたいと思います。 転職:2020年8月 RSNA STR Pulmonary Embolism Detection:2020年10月 SIIM FISABIO RSNA COVID-19 Detection:2021年5月 Happywhale - Whale and Dolphin Identification:2022年2月 (番外編) Kaggle Days World Championship:2022年10月 RSNA Screening Mammography Breast Cancer Detection:2022年11月 なぜ金メダルが取れたか これから 転職:

                                                                                  Kaggle Grandmasterになったので今までを振り返る - kaggle日記
                                                                                • 物体検出器 EfficientDet をブラウザで高速推論 - OPTiM TECH BLOG

                                                                                  R&D チームの奥村(@izariuo440)です。EfficientDet がブラウザで動いているのを見たことがなかったので、やってみました。以下はブラウザで実行中の様子1です。 結果として、EfficientDet-D0 で 256x256 の解像度の画像を TensorFlow Lite で推論させると、ネイティブで 20 FPS、WebAssembly SIMD support ありの Chrome で 7 FPS 程度の速度性能を確認できました。 Case XNNPACK XNNPACK スレッド数 FPS A OFF N/A 4 B ON 1 15 C ON 4 20 測定環境は MacBook Pro (Retina, 15-inch, Mid 2015) の 2.5 GHz です。 背景と動機 周辺知識 EfficentDet EfficientDet の精度 Effici

                                                                                    物体検出器 EfficientDet をブラウザで高速推論 - OPTiM TECH BLOG