並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 825件

新着順 人気順

"image recognition"の検索結果1 - 40 件 / 825件

  • 府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまった論文を読んだ - Qiita

    Deep Learning Advent Calendar 2016の20日目の記事です。 ConvNetの歴史とResNet亜種、ベストプラクティスに関連スライドがあります(追記) 背景 府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまったようです。 M2の学生が趣味でやっていたCIFAR10とCIFAR100の認識タスクで,現時点での世界最高性能の結果を出したそうだ…趣味でっていうのが…https://t.co/HKFLXTMbzx — ニーシェス (@lachesis1120) 2016年12月7日 府大のプレスリリース 一般物体認識分野で、府大生が世界一の認識精度を持つニューラルネットワークを開発 黄瀬先生の研究室の学生さんだそうです。凄いですね! ちょうどResNet系に興味があったので、読んでみます。この論文を理解するには、ResNet, (Wide

      府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまった論文を読んだ - Qiita
    • 機械学習を始めたい方に見て欲しいTensorflow入門資料まとめ

      機械学習は日々進化を遂げ、全てのエンジニアにとって無視できない存在となってきました。 現在では、検索エンジン、マーケティング、データマイニング、SNS等さまざまな分野で活用されています。 そんな中、2015年11月10日にGoogleが機械学習ライブラリ・TensorFlowをオープンソース化し、大きな注目を集めました。 そこで今回は、機械学習に興味があるけれど何から手を付けたらいいのかわからないエンジニア向けに、TensorFlowの入門資料(記事・スライド)をまとめました。 機械学習案件を提案してもらう 特にプログラマーでもデータサイエンティストでもないけど、Tensorflowを1ヶ月触ったので超分かりやすく解説 / Qiita http://qiita.com/tawago/items/c977c79b76c5979874e8 TensorflowがMNIST(手書き数字データ)の

        機械学習を始めたい方に見て欲しいTensorflow入門資料まとめ
      • 30分で完全理解するTransformerの世界

        はじめに 初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。 深層学習界隈では、2017年に衝撃的なタイトル(Attention Is All You Need)の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。 今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま

          30分で完全理解するTransformerの世界
        • 手を動かしながら学べるディープラーニングの優良なチュートリアル - karaage. [からあげ]

          ディープラーニングは習うより慣れろかも ファッションでディープラーニングをしているディープラーニング芸人からあげです。私は、特に専門家でも何でもないのですが、機械学習に興味もって、ディープラーニングに関することブログでアウトプットしているうちに「AIに関する本に名前がクレジットされたり」「AI解析のオンラインコンテスト#Aidemynoteで特別賞受賞したり」「ラズパイマガジンという商業誌にAI関係で記事を書いたり」「ディープラーニングおじさんの記事がバズったあげくITmediaで取り上げられたり」と多少なりとも価値を提供できるようになってきました。 何の知識もバックグラウンドも、大した能力も無い自分が、どうやって知識を身につけることができたかというと、色々本も読んだのですが、実際に手を動かしてプログラムを組んで、実問題に対して試行錯誤した結果をブログにアウトプットし続けたことが大きいのか

            手を動かしながら学べるディープラーニングの優良なチュートリアル - karaage. [からあげ]
          • 機械学習/ディープラーニング初心者が2018年にやったこと、読んだ論文 - Qiita

            2018年もいよいよ本日が最後となりました。皆さんいかがお過ごしでしょうか。この記事では機械学習/ディープラーニング初心者だった自分が2018年にやったことをまとめていきたいと思います。ポエムじみた記事になってしまいましたが、何らかの参考になれば幸いです。 2018年のBefore-After Before 今年(4月)ぐらいまで機械学習の「き」の字も知らなかった。k-Nearest Neighbor?Support Vector Machine?なにそれ美味しいのってレベル 昔統計をやっていたので、ロジスティクス回帰ぐらいは知っていた。オーバーフィッティングの概念ぐらいは知っていたが、厳密な定義は知らなかった。 Pythonも触ったことなかった After 機械学習とディープラーニングの基礎はだいたいわかった Pythonがだいたい使いこなせるようになった 物によってはディープラーニング

              機械学習/ディープラーニング初心者が2018年にやったこと、読んだ論文 - Qiita
            • Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita

              08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。 言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします!(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ

                Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita
              • 画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

                0. 忙しい方へ 完全に畳み込みとさようならしてSoTA達成したよ Vision Transformerの重要なことは次の3つだよ 画像パッチを単語のように扱うよ アーキテクチャはTransformerのエンコーダー部分だよ 巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ 事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ 1. Vision Transformerの解説 Vision Transformer(=ViT)の重要な部分は次の3つです。 入力画像 アーキテクチャ 事前学習とファインチューニング それぞれについて見ていきましょう。 1.1 入力画像 まず入力画像についてです。ViTはTransformerをベースとしたモデル(というより一部を丸々使っている)ですが、

                  画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita
                • 2016年のディープラーニング論文100選 - Qiita

                  これはFujitsu Advent Calendar 2016の11日目の記事です。 掲載内容は個人の意見・見解であり、富士通グループを代表するものではありません。なお、内容の正確性には注意を払っていますが無保証です。 はじめに この記事では先月今年発表されたディープラーニング論文(ArXivでの発表時期、発表された国際会議が2016年開催またはジャーナル掲載が2016年のもの)から私が個人的に重要だと思った論文を収集しています。また、2015年末ごろの論文も重要なものは採用しています。 以下の投稿も合わせてご覧ください。 2017年のディープラーニング論文100選 DeepLearning研究 2016年のまとめ 2016年の深層学習を用いた画像認識モデル foobarNet: ディープラーニング関連の○○Netまとめ NIPS2016実装集 ディープラーニングにとっての2016年 20

                    2016年のディープラーニング論文100選 - Qiita
                  • GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less

                    CVPR2018にて超解像分野において極めて重要そうだなと感じた論文がありました。Yochai Blauらによる下記の論文です。 [1711.06077] The Perception-Distortion Tradeoff この内容を踏まえて最近の超解像研究の流れをまとめたいと思います。 超解像とは? 超解像について振り返ります。多くの方がwaifu2xというソフトウェアで一度は目にしたことがあるかもしれません。下記イメージのように低解像の画像を高解像の画像に変換する方法を 超解像(Super Resolution)と呼ばれます。 (参照元:二次元画像を拡大したいと思ったことはありませんか? - デー) このwaifu2xがざっくりどのように超解像を行っているかというと、ベースはSRCNNというConvolutional Neural Netoworkを使った超解像手法であり、下記のよう

                      GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less
                    • 【AI動画生成】Sora 要素技術解説

                      もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと

                        【AI動画生成】Sora 要素技術解説
                      • Imagine Cup - 学生の開発者ツール、リソース、エクスペリエンス | Imagine Cup

                        Meet the 2024 Imagine Cup World Champion Learn about this year's winner of the Imagine Cup trophy, USD 100,000 cash prize, and a mentorship session with Microsoft Chairman and CEO, Satya Nadella. FROM YOUR EYES Empowered by GPT-4 and advanced image recognition, FROM YOUR EYES has built a mobile application and API, delivering immediate visual translations for users with a vision disability. An adv

                        • Google、人工知能に機械学習モデルの設計を生成させる「AutoML」で設計した大規模な画像分類と物体検出に適応するアーキテクチャ「NASNet」を論文発表。人間が設計してきたモデルより高精度

                          Google、人工知能に機械学習モデルの設計を生成させる「AutoML」で設計した大規模な画像分類と物体検出に適応するアーキテクチャ「NASNet」を論文発表。人間が設計してきたモデルより高精度 2017-11-03 Google Brainの研究者らは、数ヶ月前、機械学習モデルの設計を機械学習で自動化するアプローチ「AutoML(Auto Machine Learning)」を発表しましたが、今回は、これまで小規模にテストしてきたAutoMLを大規模な画像分類と物体検出に適応した論文を発表しました。 Learning Transferable Architectures for Scalable Image Recognition(PDF) 「AutoML」とは、人工知能に機械学習のコードやアルゴリズムを生成させる新しい開発アプローチで、ニューラルネットワークがニューラルネットワークを設

                            Google、人工知能に機械学習モデルの設計を生成させる「AutoML」で設計した大規模な画像分類と物体検出に適応するアーキテクチャ「NASNet」を論文発表。人間が設計してきたモデルより高精度
                          • iOS 10の新機能のサンプルコード集「iOS-10-Sampler」を公開しました - その後のその後

                            iOS 10でも大量のAPIが追加されました。が、新しいAPIはどう使うのか、実際に何がどこまでできるのか、といった具体的なところが、英語のドキュメントやWWDCのセッション動画をながめているだけだと正直あまりピンときません。やはり実際にコードを書いて動かしてみるのが一番わかりやすい・・・ということで今年もつくりました! iOS-10-Sampler 恒例の新機能のサンプルコード寄せ集めアプリです。ソースコードは GitHub に置いてあるので、ご自由にご活用いただけると幸いです。 https://github.com/shu223/iOS-10-Sampler 使い方は Xcode 8 でビルドするだけ なので、デザイナーさんやディレクターさんもぜひお近くのエンジニアにビルドしてもらってください。 iOSももうかなり成熟してしまい、話題になる革新的な新機能とか、どの開発者にとっても嬉しい

                              iOS 10の新機能のサンプルコード集「iOS-10-Sampler」を公開しました - その後のその後
                            • Microsoft、次期「Excel for iOS」で撮影した写真内の表を直接テーブル化してくれる機能を追加。

                              Microsoftが次期「Excel for iOS」で撮影した写真内の表を直接Excelのテーブル化してくれる機能を追加すると発表しています。詳細は以下から。 MicrosoftのOffice for macOS/iOSチームのプロダクトマネージャーAkshay Bakshiさんによると、同社は2019年02月のアップデートでExcel for Androidに「Insert Data from Picture」という撮影した写真内の表を自動認識し、直接Excelのテーブルに転写してくれる機能を追加しロールアウトを開始しており、iOSチームも現在この機能を実装中だと発表しています。 Add data to Excel directly from a photo — Using the Excel app, you can take a picture of a printed data

                                Microsoft、次期「Excel for iOS」で撮影した写真内の表を直接テーブル化してくれる機能を追加。
                              • 手書きひらがなの認識で99.78%の精度をディープラーニングで - Qiita

                                手書きひらがなの認識、教科書通りの畳み込みニューラルネットワーク(ディープラーニング)で、99.78%の精度が出ました。教科書通りである事が(独自性がない事が)逆に読む方・書く方にメリットがありそうなので、Qiitaで記事にします。 ソースコード ソースコードは https://github.com/yukoba/CnnJapaneseCharacter です。 いきさつ いきさつは、友人と手書きひらがなの認識の雑談をFacebookでしていて、ググったら、この2つが見つかりました。 「Tensorflowを2ヶ月触ったので"手書きひらがな"の識別95.04%で畳み込みニューラルネットワークをわかりやすく解説」 http://qiita.com/tawago/items/931bea2ff6d56e32d693 スタンフォード大学の学生さんのレポート「Recognizing Handwri

                                  手書きひらがなの認識で99.78%の精度をディープラーニングで - Qiita
                                • dzone.com

                                  You Can Shape Trend Reports: Participate in DZone Research Surveys + Enter the Prize Drawings! Hello, DZone Community! We have several surveys in progress as part of our research for upcoming Trend Reports. We would love for you to join us by sharing your experiences and insights (anonymously if you choose) — readers just like you drive the content that we cover in our Trend Reports. check out the

                                  • scikit-learn: machine learning in Python

                                    Simple and efficient tools for predictive data analysis Accessible to everybody, and reusable in various contexts Built on NumPy, SciPy, and matplotlib Open source, commercially usable - BSD license Classification Identifying which category an object belongs to. Applications: Spam detection, image recognition. Algorithms: Gradient boosting, nearest neighbors, random forest, logistic regression, an

                                    • TechCrunch | Startup and Technology News

                                      Welcome back to TechCrunch’s Week in Review — TechCrunch’s newsletter recapping the week’s biggest news. Want it in your inbox every Saturday? Sign up here. Over the past eight years,…

                                        TechCrunch | Startup and Technology News
                                      • 画像処理を導入するときに検討すべき10の手法 - LIFULL Creators Blog

                                        あけましておめでとうございます。 おうちハッカー@リッテルラボラトリーの石田です。 画像から何かを検出したい、ユーザーの動きに連動して何か作りたい、なんて思うことがあると思います。 そんなときに、どんな技術を使えばよいのか迷うと思うのですが、そんなときに検討すべきライブラリ、API、デバイスを紹介したいと思います。 画像処理といったらlennaさん オープンライブラリ系 こちらはソースが公開されている画像処理ライブラリで、自分で組み合わせて適切な処理を作成します。 ライブラリによって得手不得手があるので、単独というより、組み合わせて使うことが多いと思います。言語はC++, Pythonがメインになります。 OpenCV OpenCV | OpenCV 画像処理といったらこれ!という定番ライブラリです。 動かせるプラットフォームも、windows,mac,Linux,Android, iOS

                                          画像処理を導入するときに検討すべき10の手法 - LIFULL Creators Blog
                                        • Twitter社が発表した超解像ネットワークをchainerで再実装 - 人工言語処理入門

                                          この記事は Chainer Advent Calendar 2016の18日目の記事です。昨日は@zacapa_23さんのPokemonGANでした。僕もDCGANを使って百合漫画の解析に活かそうとしたことがあるので、なんだか親近感がわきます。ちなみにこの記事もDCGANがらみです。 数年前にニューラルネットで超解像を行う研究が発表されてから、近年のディープラーニングブームの中で、特に企業の研究として(学習型一枚絵)超解像が発表されています。国内でも、特にイラストへの応用として、waifu2xという実装が注目を浴びたりしました。GitHub - nagadomi/waifu2x: Image Super-Resolution for Anime-Style Art さて、いくつかある論文の中で、今回はTwitter社が9月に公開したもの( Photo-Realistic Single Im

                                            Twitter社が発表した超解像ネットワークをchainerで再実装 - 人工言語処理入門
                                          • Deep Learning のトレンドについて喋ってきた

                                            Convolutional Neural NetworksのトレンドについてCasualじゃない話をしてきました. 全脳アーキテクチャ若手の会カジュアルトーク 全脳アーキテクチャ若手の会カジュアルトーク というところでお話をしてきました. ちょっと層がわからなかったのですが,IT系のエンジニアの方が多かったみたいです. (学生は4人くらい…?しかもほぼ身内) 僕のスライドはSlide Shareの方にアップロードされています. しかも,映像もアップロードされていた… 発表後記 実際はConvolutional Neural Networks(CNN)系論文128本ノックにするつもりだったとはいえない空気でしたね… 個人的には画像生成やキャプション生成系の研究速度はとても速く進んでいると感じています. Visual Turing Test の話はもう少し掘り下げたかったですね. Deep M

                                            • Neural networks and deep learning

                                              Neural Networks and Deep Learning What this book is about On the exercises and problems Using neural nets to recognize handwritten digits How the backpropagation algorithm works Improving the way neural networks learn A visual proof that neural nets can compute any function Why are deep neural networks hard to train? Deep learning Appendix: Is there a simple algorithm for intelligence? Acknowledge

                                                Neural networks and deep learning
                                              • Deep Learning ideas that have stood the test of time

                                                Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably

                                                • CNN による画像分類で使われる前処理・テスト時処理まとめ - iwiwi 備忘録

                                                  とりあえず ImageNet 系の論文で、目に入ったものから順々にまとめていきます。情報・ツッコミ歓迎。 前処理・Data Augmentation Mean Subtraction 入力画像から平均を引く。[103.939, 116.779, 123.68] を各ピクセルから引く。VGG はこれ。 Per-pixel Mean Subtraction 入力画像から平均を引く。ピクセル・チャンネルごとに計算された平均を引く。即ち、224x224x3 個の値について個別に平均を計算し用いる。AlexNet 論文から使われており、ResNet もこれ。 Random Crop 256x256 ピクセルに画像をリサイズし、そこから 224x224 のパッチをランダムに取り出す。AlexNet 論文で使われていた。ちなみに Chainer の ImageNet サンプルはこれと Horizonta

                                                    CNN による画像分類で使われる前処理・テスト時処理まとめ - iwiwi 備忘録
                                                  • Kerasで学ぶ転移学習

                                                    前回記事では、KaggleのFacial Keypoints Detectionを題材にして、単純なニューラルネットワークから転移学習まで解説しました。 事前に学習した重みを読み込んだ後、全ての層で学習するのではなく、一部の層をフリーズさせることもできるという話を最後に少しだけしました。ちょうどその後、転移学習について詳細に解説しているKerasの公式ブログ記事が公開されましたこともあり、今回はこの記事を参考にしつつ、転移学習をメインに解説していきます。間違いがあれば指摘してください。今回もFacial Keypoints Detectionのデータを使って解説していくので、前回記事も是非合わせて読んでみてください。 また、Keras 1.0.4が公開されたのでまだの人はアップデートしておくと良いかと思います。 目次 転移学習 可視化 全結合層のみ学習(前回モデル) 全結合層+一部の畳み込

                                                      Kerasで学ぶ転移学習
                                                    • ピンポイント指定で高度な画像検索ができる『xcavator』 | p o p * p o p

                                                      「こ~んな感じの画像が欲しいんだけど・・・見つけられない・・・」といった経験はないでしょうか。画像の検索はテキスト検索に比べて複雑なので、なかなか苦労します。 ただ、そうした苦労もxcavatorがあれば良いのかもしれません。まだ一般公開されていませんが、その機能には期待できそうです。 xcavatorの特徴は「画像の一部を指定するとその一部をもとに画像を検索してくれる」というもの。実際にどういうことなのか、詳しく説明した動画がありますのでご紹介します。 以下、もうちょっと詳しくご説明。 ↑ 左の花と同じような花を探したいとします。花の背景は無視して検索したいですよね。その場合、花の「黄色の花弁」「白い花びら」をクリックすれば、その部分にマッチする花を検索してくれます。 右側が検索結果なのですが、探していた同じ花を見つけることができました。 ↑ 人を探すときも「黒い髪の毛」や「白い背景」を

                                                        ピンポイント指定で高度な画像検索ができる『xcavator』 | p o p * p o p
                                                      • Deep Learning for NLP Best Practices

                                                        Deep Learning for NLP Best Practices Neural networks are widely used in NLP, but many details such as task or domain-specific considerations are left to the practitioner. This post collects best practices that are relevant for most tasks in NLP. This post gives an overview of best practices relevant for most tasks in natural language processing. Update July 26, 2017: For additional context, the Ha

                                                          Deep Learning for NLP Best Practices
                                                        • Announcing New Tools for Building with Generative AI on AWS | Amazon Web Services

                                                          AWS Machine Learning Blog Announcing New Tools for Building with Generative AI on AWS The seeds of a machine learning (ML) paradigm shift have existed for decades, but with the ready availability of scalable compute capacity, a massive proliferation of data, and the rapid advancement of ML technologies, customers across industries are transforming their businesses. Just recently, generative AI app

                                                            Announcing New Tools for Building with Generative AI on AWS | Amazon Web Services
                                                          • 深層学習のモデル圧縮・高速化に関する論文80本ノック - そうだね

                                                            こんにちは.無事に3年生に進級できてホッとしています. 昨年度から深層学習のモデル改変による高速化手法について調べていました.そんなわけで本稿では深層学習モデルのパラメータ容量の削減や高速化を目的とした手法に関する論文を80本紹介します. 一部, ハイパーパラメータ探索(Neural Architecture Search等)の論文を「高速なモデルの探索に使えないかな〜」というきもちで含めました. また, 蒸留に関する論文は必ずしも高速化を狙ったものだけではなく, 蒸留そのものの派生論文についても含めています. 全ての論文について詳解ではなく雑な概要のみ記載しています. サーベイする際のガイドにでも使っていただければ幸いです. サクッと読んだだけの論文も多々ありますので間違い等ございましたらご指摘ください. では参りましょう. 高速なモデルアーキテクチャ より良い速度と精度のトレードオフを

                                                              深層学習のモデル圧縮・高速化に関する論文80本ノック - そうだね
                                                            • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

                                                              2.3k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした

                                                                Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
                                                              • 2016年の深層学習を用いた画像認識モデル - Qiita

                                                                実装 検証が終わっていないモデルの使用は気をつけてください cifar10の数値感覚 現時点で97%以上ではSoTAになると思います。僕が知っている限り、最高精度は96.69%です。そろそろcifar100か別のデータセットを評価の軸にするべきかもしれません。 最近の傾向 今年はResnetファミリーの年だったと思います。特徴的な点として、深さ=精度が終わった点です。googlenetなどは昔から主張していましたが、ある程度深いと、深さよりも幅を広くしたほうが精度が上がるということが、様々な論文の結果で今年は示されました。3月くらいから、Resnetの幅を広くしたほうが良いという結果は副次的にぞろぞろ出ていて、5月23日に出たWide Residual Netowrksで決定的になったような形だと思います。幅が大事といったことが、今年はっきりした点であるように思います。 論文を俯瞰してみる

                                                                  2016年の深層学習を用いた画像認識モデル - Qiita
                                                                • Residual Network(ResNet)の理解とチューニングのベストプラクティス

                                                                  Residual Network(ResNet)とは ResNetのアイデア Shortcut Connectionの導入 Bottleneckアーキテクチャ ResNetの最適化ベストプラクティス Optimizerの選定 Batch Normalizationの位置 Post Activation vs Pre Activation Wide Residual Network まとめ 参考 2015年のImageNetコンペティションとCOCOセグメンテーションの最良モデルとしてDeep Residual NetworksがMicrosoft Researchから提案され、最大1000層以上の深いニューラルネットワークを構築することが可能となった。 本記事では、 Residual Networkとは何か Residual Networkのチューニング方法 Residual Networ

                                                                    Residual Network(ResNet)の理解とチューニングのベストプラクティス
                                                                  • 専門家なしで誰でも使える(ガチ勢でも便利),機械学習の大本命 Google Cloud AutoML 発表 - Qiita

                                                                    専門家なしで誰でも使える(ガチ勢でも便利),機械学習の大本命 Google Cloud AutoML 発表初心者機械学習MachineLearninggooglecloud tl;dr 機械学習の恩恵を,先陣を切るGoogleから手軽に受けられるように しかも勝手によしなにしてくれるので,学習させたいものを与える以外に何もする必要がない まずは画像の分類から 背景 機械学習はこれまでにも,オープンソースやe-ラーニングなどで広く開かれている技術ではありました. しかし専門知識が要るのは依然として変わらず,急成長しているため追従も大変でした. ブラウザ上のGUI(あるいはAPI)からプログラミング不要で,誰でも機械学習を利用することができます. 学習させたいものを与える以外に何もする必要がありません.あとはいい感じに学習してくれます. 最初は画像認識から,今後は音声認識,翻訳など拡大されてい

                                                                      専門家なしで誰でも使える(ガチ勢でも便利),機械学習の大本命 Google Cloud AutoML 発表 - Qiita
                                                                    • エイブリックNET

                                                                      Jun. 11, 2024 Design Freely: Innovate vehicle power supply design - Proposing the ideal stabilized power that fits customers' specific application from a broad lineup. Ideal for applications that operate when the engine is turned off. Excellent transient response. Achieves both heat countermeasures and a smaller footprint. Automotive Linear Regulator with Reset Function May. 31, 2024 What is a Lit

                                                                        エイブリックNET
                                                                      • ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(後編) | POSTD

                                                                        前編はこちら: ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(前編) 逆畳み込みネットワーク(DN) は、インバース・グラフィックス・ネットワーク(IGN)とも呼ばれていますが、畳み込みネットワークを逆転させたものになります。例えばネットワークに”猫”という言葉を入力すれば、生成した猫らしき画像と本物の猫の写真を比較しながら猫の画像を作成するよう訓練するようなイメージです。普通のCNNと同様にDNNをFFNNに組み合わせることができますが、新しい略語が見つかる時に線が描かれるところが特色です。深層逆畳み込みニューラルネットワークとでも呼べそうですが、FFNNの前後にDNNをつなげると、新しい名前をつけるにふさわしい別のアーキテクチャのネットワークができると主張できます。実際にはほとんどのアプリケーションにおいて、ネットワークにテキストに似たものが

                                                                          ニューラルネットワークの動物園 : ニューラルネットワーク・アーキテクチャのチートシート(後編) | POSTD
                                                                        • Deep Forest :Deep Neural Networkの代替へ向けて - Qiita

                                                                          技術動向についていくことは多くの労力を必要とする。次々に新しい論文が発表されるためだ。 一方で最新論文さえも長年の地道な積み重ねの上にあることを、その引用文献から気付かされる。 ディープラーニングブームの流れも変わるのだろうか? 勉強のため、2017年2月28日付けでarXivに投稿されたZhi-Hua Zhou, Ji Feng「Deep Forest: Towards An Alternative to Deep Neural Networks」を翻訳した。 訳には誤りがないよう注意を払いましたが、完全であることを保証できないため、実装等の際には元論文を参照願います。 原文: Deep Forest: Towards An Alternative to Deep Neural Networks https://arxiv.org/abs/1702.08835 https://arxiv

                                                                            Deep Forest :Deep Neural Networkの代替へ向けて - Qiita
                                                                          • ディープラーニング徹底活用 -画像認識編-

                                                                            "Deep Learning for Image Recognition" at TokyoWebmining 42nd http://www.eventbrite.com/e/42-web-tokyowebmining-42nd--tickets-15325824955 Keywords Machine Learning, Object Recognition, Face Recognition, Artificial Intelligence (AI) ディープラーニング, 深層学習, 機械学習, 画像認識, 物体認識, 顔認識, 人工知能Read less

                                                                              ディープラーニング徹底活用 -画像認識編-
                                                                            • 2020年のおもしろかったDL/ML論文10選 - Qiita

                                                                              はじめに 2020年も,機械学習コミュニティでは多くの新しい成果が見られました.2019年に引き続き,1年を振り返ってもっとも面白かった論文を10本紹介したいと思います. * 本記事は,私のブログにて英語で書いた記事を翻訳し,適宜加筆修正したものです. ** 記事中の画像は,ことわりのない限り対象論文からの引用です. 論文10選(公開順) 普段から,読んだ論文を簡単にまとめてツイートしているので,それを使って公開日順に振り返っていきます.対象はおおまかに「2020年に公開された論文」と「2020年に学会・雑誌で発表されたもの」とします.全くの主観で選んでいるので,私の興味範囲である深層学習および応用研究に偏っている点はご容赦ください. 紹介するのはこちらの10本です! Rigging the Lottery: Making All Tickets Winners PIFuHD: Multi

                                                                                2020年のおもしろかったDL/ML論文10選 - Qiita
                                                                              • Apache Tika – Apache Tika

                                                                                Apache Tika - a content analysis toolkit The Apache Tika™ toolkit detects and extracts metadata and text from over a thousand different file types (such as PPT, XLS, and PDF). All of these file types can be parsed through a single interface, making Tika useful for search engine indexing, content analysis, translation, and much more. You can find the latest release on the download page. Please see

                                                                                • Neural Network Libraries by Sony

                                                                                  by Sony An open source software to make research, development and implementation of neural network more efficient. Get Started Features Write less do more Neural Network Libraries allows you to define a computation graph (neural network) intuitively with less amount of code. Dynamic computation graph support Dynamic computation graph used enables flexible runtime network construction. The Library

                                                                                    Neural Network Libraries by Sony