並び順

ブックマーク数

期間指定

  • から
  • まで

481 - 520 件 / 799件

新着順 人気順

"deep learning"の検索結果481 - 520 件 / 799件

  • CVPR 2019 速報

    CVPR 2019 ( http://cvpr2019.thecvf.com/ )の参加速報を書きました。 この資料には下記の項目が含まれています。 ・DNNの動向・CVのトレンド(DNNの流れとCVにおけるトレンドの変遷) ・CVPR 2019での動向や気付き ・最近のトレンドを創っている/引用されそうな論文 ・今後の方針 (・CVPR 2019の論文まとめはこちらにあります Link: http://xpaperchallenge.org/cv/survey/cvpr2019_summaries/ ) cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有しています。 http://xpaperchallenge.org/cv/

      CVPR 2019 速報
    • A Gentle Introduction to Graph Neural Networks

      Neural networks have been adapted to leverage the structure and properties of graphs. We explore the components needed for building a graph neural network - and motivate the design choices behind them. Hover over a node in the diagram below to see how it accumulates information from nodes around it through the layers of the network. Authors Affiliations Benjamin Sanchez-Lengeling Google Research E

        A Gentle Introduction to Graph Neural Networks
      • さまざまなゲームを人間のようにプレイ可能なAIをDeepMindが開発、マルチプレイにも対応

        世界最強の棋士を打ち負かした囲碁AI「AlphaGo」やタンパク質構造解析アルゴリズム「AlphaFold」を開発したことで知られるAI開発企業のDeepMindが、「まったくルールの異なるゲームにも対応できるAI」を開発したことを発表しました。 Open-Ended Learning Leads to Generally Capable Agents | DeepMind https://deepmind.com/research/publications/open-ended-learning-leads-to-generally-capable-agents Generally capable agents emerge from open-ended play | DeepMind https://deepmind.com/blog/article/generally-capabl

          さまざまなゲームを人間のようにプレイ可能なAIをDeepMindが開発、マルチプレイにも対応
        • 【まとめ】ディープラーニングによる環境音の認識 - Qiita

          とあるきっかけで、環境音の認識(歩く音や雨の音、掃除機の音など)について、 論文を調べたので、メモとして残しておきます。 せっかくなので、精度向上の歴史を振り返る形式で、書いていきます。 データセット 精度の基準となるデータセットをご紹介します。画像の認識では、ImageNetという圧倒的な データセットがあり、性能評価で用いられます。 一方、音の認識はImageNetほど巨大ではありませんが、ESC-50というデータセットが あります。今回の基準となるESC-50の概要は以下のとおりです。 犬の鳴き声やドアのノック音など50種類、2000個の音源を収録 音源の長さは5秒間 精度評価をするときは、学習用とテスト用に分けて(5-foldなど)それぞれ評価 音の前処理 画像の前処理は、通常255で割れば良く、非常に簡単です。 一方、音の前処理は通常logmelを用います。logmelで処理する

            【まとめ】ディープラーニングによる環境音の認識 - Qiita
          • 言語処理のニューラルネットワークモデルが脳の働きと同じ構造をしているという仮説

            脳がどのように時間を把握するのかという研究や選択的に恐怖やトラウマなどの記憶を消去する実験など、「脳がどのように機能して、脳のどこで何をするのか?」という疑問は依然として不明な点が多くなっています。そのような脳の働きについて、言語処理の深層学習モデルであるTransformerが、脳の機能を追跡する類似モデルとして役に立つことが示されました。 Quanta Magazine https://www.quantamagazine.org/how-ai-transformers-mimic-parts-of-the-brain-20220912/ Relating transformers to models and neural representations of the hippocampal formation | OpenReview https://openreview.net/f

              言語処理のニューラルネットワークモデルが脳の働きと同じ構造をしているという仮説
            • TechCrunch | Startup and Technology News

              Welcome to Startups Weekly — Haje‘s weekly recap of everything you can’t miss from the world of startups. Sign up here to get it in your inbox every Friday. Well,…

                TechCrunch | Startup and Technology News
              • AI歌声合成最前線。NEUTRINOとはどう違うの?2月12日発売が決まったCeVIO AI対応の東北きりたんを一足早く試してみた|DTMステーション

                歌声合成の世界は、従来のVOCALOIDなどとは一線を画す、AI歌声合成に対応したソフトが次々と発表され、明らかに新たな時代に突入しました。その時代を動かすキッカケになったのが2020年2月に発表された「AIきりたん」でした。これは国の研究予算で作られた研究者向けの音声合成検証用データベースをディープラーニングすることで作られたAI歌声合成システムで、NEUTRINOというソフトを用いて、東北きりたん(CVは茜屋日海夏さん)の歌声を合成するというもの。その歌声のデモを聴き、そして私自身の手でも歌声合成させてみたところ、あまりにも人間的にリアルに歌うことには度肝を抜かされました。 それから1年。2021年2月12日に、東北きりたんのCeVIO AI版が発売されることになりました。この話を聞いて「あれ?すでにNEUTRINOがあるのにどういうこと?」、「NEUTRINOとCeVIO AIって競

                  AI歌声合成最前線。NEUTRINOとはどう違うの?2月12日発売が決まったCeVIO AI対応の東北きりたんを一足早く試してみた|DTMステーション
                • [活性化関数]Mish関数(ミッシュ関数)とは?

                  用語「Mish関数」について説明。「0」を基点として、入力値が0以下なら出力値は「ほぼ0」だが(わずかに「負の値」になる)、0より上なら「入力値とほぼ同じ値」を返す、ニューラルネットワークの活性化関数を指す。類似するReLUやSwish関数の代替として使われる。 連載目次 用語解説 AI/機械学習のニューラルネットワークにおけるMish関数(ミッシュ関数)とは、関数への入力値が0以下の場合には出力値がほぼ0(※わずかに負の値になり、最小値は約-0.31)、入力値が0より上の場合には出力値が入力値とほぼ同じ値(最大値は∞)となる関数である。 図1を見ると分かるように、ReLUという活性化関数に似ている曲線を描く(=ReLUをMish関数に置き換えやすい)が、その曲線が連続的で滑らか(smooth)かつ非単調(non-monotonic)である点が異なる。基点として(0, 0)を通るが、滑らか

                    [活性化関数]Mish関数(ミッシュ関数)とは?
                  • 大澤昇平 :: AI 救国論 🇺🇳 on Twitter: "IT ベンチャー、歴史的に見て人間性に欠けてる人が成功してるから「人間性なんて欠けててもいいんだ!」って雰囲気になってるけど、よく考えるとこれ是正されるべきだよなと思う。"

                    IT ベンチャー、歴史的に見て人間性に欠けてる人が成功してるから「人間性なんて欠けててもいいんだ!」って雰囲気になってるけど、よく考えるとこれ是正されるべきだよなと思う。

                      大澤昇平 :: AI 救国論 🇺🇳 on Twitter: "IT ベンチャー、歴史的に見て人間性に欠けてる人が成功してるから「人間性なんて欠けててもいいんだ!」って雰囲気になってるけど、よく考えるとこれ是正されるべきだよなと思う。"
                    • Shota Imai@えるエル on Twitter: "深層学習を使う場合の学習効率化,高速化などの手法,テクニックなどが非常に網羅的にまとめられたサーベイ論文です 研究や開発で深層学習を使う人には非常に重要な知見の宝庫 "Efficient Deep Learning: A Surv… https://t.co/wxaJZOzttb"

                      深層学習を使う場合の学習効率化,高速化などの手法,テクニックなどが非常に網羅的にまとめられたサーベイ論文です 研究や開発で深層学習を使う人には非常に重要な知見の宝庫 "Efficient Deep Learning: A Surv… https://t.co/wxaJZOzttb

                        Shota Imai@えるエル on Twitter: "深層学習を使う場合の学習効率化,高速化などの手法,テクニックなどが非常に網羅的にまとめられたサーベイ論文です 研究や開発で深層学習を使う人には非常に重要な知見の宝庫 "Efficient Deep Learning: A Surv… https://t.co/wxaJZOzttb"
                      • 米国、NVIDIAに輸出規制 中国・ロシア向け半導体で - 日本経済新聞

                        米半導体大手エヌビディアは1日までに、米政府から一部GPU(画像処理半導体)製品の中国、ロシア輸出について政府承認を課したという通知があったと明らかにした。GPUは人工知能(AI)の演算用途などに使われる半導体。米政府は軍事用途に使用されたり、転用されたりするリスクに対応するとしているという。エヌビディアが米証券取引委員会(SEC)に提示した文書で通知につい

                          米国、NVIDIAに輸出規制 中国・ロシア向け半導体で - 日本経済新聞
                        • GitHub - lucidrains/deep-daze: Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network). Technique was originally created by https://twitter.com/advadnoun

                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                            GitHub - lucidrains/deep-daze: Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network). Technique was originally created by https://twitter.com/advadnoun
                          • JAXとPyTorch、どっちが速いのか検証してみた - まったり勉強ノート

                            高速化が趣味&仕事なので、最近よく目にするJAXの速度が気になってました。このため、今回は日ごろ使っているPyTorchと比較したので、その結果のまとめを紹介します。 結論 結果だけ知りたい方が多いだろうと思ったので先に結論から書くと、私のPyTorch力では力及ばず、今回の検証では JAXのほうがPyTorchの2.2倍速い という結果でした。ここから詳しく評価について説明します。 評価方法 今回、JAXとPyTorchを比較するにあたり、この前紹介したSmooth Smith Watermanのコードを利用しました。Smooth Smith Watermanについて知りたいという方は以下の記事をご覧ください。 この記事で紹介したJAXコードは論文の著者が頑張って高速化した結果なため、十分最適化された結果であるという認識です。このため、今回はPyTorchのコードを私が作成し、測定を行い

                            • TensorFlow 2+Keras(tf.keras)入門

                              機械学習の勉強はここから始めてみよう。ディープラーニングの基盤技術であるニューラルネットワーク(NN)を、知識ゼロの状態から概略を押さえつつ実装。さらにCNNやRNNも同様に学ぶ。これらの実装例を通して、TensorFlow 2とKerasにも習熟する連載。 第1回 初めてのニューラルネットワーク実装、まずは準備をしよう ― 仕組み理解×初実装(前編)(2019/09/19) ニューラルネットワークは難しくない ディープラーニングの大まかな流れ 1データ準備 ・Playgroundによる図解 ・Pythonコードでの実装例 2問題種別 ・Playgroundによる図解 ・Pythonコードでの実装例 3前処理 ・Playgroundによる図解 ・訓練用/精度検証用のデータ分割について ・ノイズについて ・Pythonコードでの実装例 第2回 ニューラルネットワーク最速入門 ― 仕組み理解×

                                TensorFlow 2+Keras(tf.keras)入門
                              • DALL-E in Pytorch の使い方|npaka

                                以下の記事が面白かったので、ざっくり翻訳しました。 ・lucidrains/DALLE-pytorch: Implementation / replication of DALL-E, OpenAI's Text to Image Transformer, in Pytorch 1. DALL-E in Pytorch 「DALL-E in Pytorch」は、OpenAIのText-to-Image Transformerである「DALL-E」(論文)のPyTorch実装/複製です。生成画像をランク付けするための「CLIP」も含まれます。 Eleuther AIのSid、Ben、Aranは、「DALL-E for  Mesh Tensorflow」に取り組んでいます。 DALL-EがTPUで学習されるのを見たい場合は、彼らに手を貸してください。 2. 状態Hannuは、わずか2000枚の

                                  DALL-E in Pytorch の使い方|npaka
                                • 機械学習のアルゴリズムはドーパミン神経によって脳にも実装されていることが判明

                                  決まった時間にブザーを鳴らし餌をやることでブザーが鳴るだけで唾液が出るようになったパブロフの犬のように、生物の脳や神経構造は長い間科学者の研究対象となっています。また、脳の仕組みを参考にしたニューラルネットワークなど、人工知能の開発に脳神経の研究が用いられることもあります。そんな中、世界最強の囲碁プログラム「AlphaGo」を開発したDeepMindが、機械学習のアルゴリズムがドーパミン神経によって脳にも備わっていることを発見しました。 A distributional code for value in dopamine-based reinforcement learning | Nature https://www.nature.com/articles/s41586-019-1924-6 Dopamine and temporal difference learning: A fr

                                    機械学習のアルゴリズムはドーパミン神経によって脳にも実装されていることが判明
                                  • ディープラーニングモデルを自動構築するAutoML OSS「AutoKeras」

                                    ディープラーニングモデルを自動構築するAutoML OSS「AutoKeras」:AutoML OSS入門(7)(1/3 ページ) AutoML OSSを紹介する本連載第7回は、KerasベースのAutoML OSSである「AutoKeras」を解説します。AutoKerasは、ENAS(Efficient Neural Architecture Search)によりニューラルネットワークの構造設計とハイパーパラメーターチューニングを自動で行うツールです。

                                      ディープラーニングモデルを自動構築するAutoML OSS「AutoKeras」
                                    • 子どもの学習方法に着想、データ効率を高める機械学習の新アプローチ

                                      深層学習では、機械学習モデルの正確さを高めるには訓練用データの量を増やすことが一般的だ。カーネギーメロン大学の研究者らは、親が子どもに教える方法にヒントを得て、データ量を増やさなくてもモデルの正確さを高められる学習アルゴリズムを見い出した。 by Karen Hao2020.05.11 48 17 19 7 機械学習アルゴリズムを訓練する標準的な方法は、すべての詳細情報を一度に与えることだ。さまざまな動物の種類を認識する画像分類システムを構築している場合であれば、各種類の例を示し、それに応じてラベルを付ける。たとえば、犬の場合であれば「ジャーマンシェパード」や「プードル」といった具合だ。 だが、人間の親が子どもに何かを教えるときのアプローチはまったく異なる。親ははるかに広範なラベルで始める。どんな犬種であっても最初は単に「犬」である。子どもがこうしたより単純なカテゴリを区別する方法を学習し

                                        子どもの学習方法に着想、データ効率を高める機械学習の新アプローチ
                                      • デジタル相も接待に同席 | 共同通信

                                        デジタル庁は、計3回あった接待の一部に、平井卓也デジタル相と、同庁参与の向井治紀氏が同席していたと明らかにした。

                                          デジタル相も接待に同席 | 共同通信
                                        • 音楽からダンスを自動生成、J-POPも踊れる「Dance Revolution」 Microsoftなど開発

                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Microsoftと中国・復旦大学による研究チームが開発した「Dance Revolution」は、深層学習を用いて音楽からダンスの動きを生成する手法だ。与えられた音楽を基に1分程度のダンスシーケンスを生み出す。コナミのゲーム「Dance Dance Revolution」とは無関係。 これまでの類似研究では、ネット検索を使って音楽からダンスを合成する手法や、分析によって得られた音楽と動きの相関を適用し新しいダンスを生成する機械学習ベースの手法などが実装されてきた。 Dance Revolutionでは、既存研究を踏まえて、音楽とダンスの対応関係をより詳細に捉えた深層学習ベースの合成法を

                                            音楽からダンスを自動生成、J-POPも踊れる「Dance Revolution」 Microsoftなど開発
                                          • 東京五輪まで1年なのに具体策が見えない「鉄道大混雑」の不安

                                            1982年、埼玉県生まれ。東京地下鉄(東京メトロ)で広報、マーケティング・リサーチ業務などを担当し、2017年に退職。鉄道ジャーナリストとして執筆活動とメディア対応を行う傍ら、都市交通史研究家として首都圏を中心とした鉄道史を研究する。著書『戦時下の地下鉄 新橋駅幻のホームと帝都高速度交通営団』(2021年 青弓社)で第47回交通図書賞歴史部門受賞。Twitter @semakixxx News&Analysis 刻々と動く、国内外の経済動向・業界情報・政治や時事など、注目のテーマを徹底取材し、独自に分析。内外のネットワークを駆使し、「今」を伝えるニュース&解説コーナー。 バックナンバー一覧 東京五輪まであと1年。来週から東京都は「スムーズビズ」なる、鉄道や道路の混雑緩和の予行演習を行う。しかし、驚くほど広報されておらず、知っている人の方が少ないと思われる今回の取り組み。結局、鉄道の混雑緩和

                                              東京五輪まで1年なのに具体策が見えない「鉄道大混雑」の不安
                                            • 物体を追加しても影や回り込みをリアルに合成する技術 ワシントン大学が開発

                                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米ワシントン大学の研究チームが開発した「People as Scene Probes」は、一方向から撮影した映像の奥行きや光の当たり方を分析する深層学習ベースの技術だ。この技術を使うことで、影や「オクルージョン」(遮蔽物によって光の反射がさえぎられる度合い、環境遮蔽とも) を考慮したリアルな画像合成が可能になる。 映像内の物体から奥行き、オクルージョン、照明/影の情報を抽出し、新しく挿入する画像に適応することで自然な合成画像を生成するネットワークの概要図。下段の図では、手前の人物や奥の赤い車に対して適切な影が加えられている

                                                物体を追加しても影や回り込みをリアルに合成する技術 ワシントン大学が開発
                                              • Google、虹彩追跡のための機械学習モデル「MediaPipe Iris」を公開

                                                Googleは2020年8月6日(米国時間)、虹彩の追跡によって目の位置の推定を正確に行うための新しい機械学習(ML)モデル「MediaPipe Iris」を公開したと発表した。 虹彩の追跡による目の位置の推定は、コンピュータによる写真撮影や拡張現実(AR)エフェクトの提供など、幅広い用途に利用されている。 MediaPipe Irisは、顔の大まかな形状のメッシュを生成する「MediaPipe Face Mesh」に関するGoogleの取り組みに基づいている。

                                                  Google、虹彩追跡のための機械学習モデル「MediaPipe Iris」を公開
                                                • ViT時代の終焉?MetaFormerの論文紹介と実証実験 - Qiita

                                                  著者たちによるGitHubにはPoolFormerとして実装されているが、ここでは論文の趣旨を尊重してより抽象的なMetaFormerとして実装し、TokenMixingを変更できるようにしている。 def ChannelMLP(x, mlp_ratio, normalize, drop_path=0.0, prefix='' ): dense_kwargs = { 'kernel_initializer':'he_normal', 'bias_initializer': tf.keras.initializers.RandomNormal(stddev=1e-2), } in_shape = x.shape dim = in_shape[-1] mlp_dim = dim*mlp_ratio shortcut = x # norm x = normalize(x, name = pref

                                                    ViT時代の終焉?MetaFormerの論文紹介と実証実験 - Qiita
                                                  • RAGの評価:評価の必要性と問題点 - Beatrust techBlog

                                                    本ブログはこんな人におすすめ RAG (Retrieval Augmented Generation)を使ったアプリケーションを開発しているけど評価に関心のある人 LLM (Large Language Model)やRAGのハルシネーションをどう評価するのかに関心のある人 Ragas (RAGの評価ライブラリ:Retrieval augmented generation assessment)の挙動に興味がある人 こんにちは。私はBeatrustのML周辺のお手伝いをしている鈴木宏和と申します。今回はこれから3つのパートに分けて紹介させていただきますが、LLMの応用として特に注目を集めているRAG (Retrieval Augmented Generation)について、RAGの評価の必要性とアプローチ方法について考察しつつ、RAGに特化した評価ライブラリであるRagasの有用性に関する

                                                      RAGの評価:評価の必要性と問題点 - Beatrust techBlog
                                                    • Tsultra on Twitter: "回帰問題をNNで解くときはドロップアウトとBatchNormは使わないほうがいいって話、あまり知られてない気がする Pitfalls with Dropout and BatchNorm in regression proble… https://t.co/4ra2zVPStC"

                                                      回帰問題をNNで解くときはドロップアウトとBatchNormは使わないほうがいいって話、あまり知られてない気がする Pitfalls with Dropout and BatchNorm in regression proble… https://t.co/4ra2zVPStC

                                                        Tsultra on Twitter: "回帰問題をNNで解くときはドロップアウトとBatchNormは使わないほうがいいって話、あまり知られてない気がする Pitfalls with Dropout and BatchNorm in regression proble… https://t.co/4ra2zVPStC"
                                                      • PIFuHD

                                                        We introduce a multi-level framework that infers 3D geometry of clothed humans at an unprecedentedly high 1k image resolution in a pixel-aligned manner, retaining the details in the original inputs without any post-processing. Recent advances in image-based 3D human shape estimation have been driven by the significant improvement in representation power afforded by deep neural networks. Although c

                                                          PIFuHD
                                                        • 顔画像で試す画像特徴ベクトルの足し算引き算 - Qiita

                                                          # FEAR(怖れ)、HAPPY(喜び)、SUPRISE(驚き) # ANGRY(怒り)、NEUTRAL(無表情)、DISGUST(嫌悪)、SADNESS(悲しみ) ['FE', 'HA', 'SU', 'AN', 'NE', 'DI', 'SA'] (KRさん, 怖)、(KRさん、怒)、(KRさん、喜)、(NMさん、怖)、(NMさん、怒)...という特徴ベクトルから、特徴変換の演算によって KRさんの特徴ベクトル、NMさんの特徴ベクトル、"怖れ"の特徴ベクトル、"怒り"の特徴ベクトルを取り出すのが目標 損失関数 今回は、TripletLossを利用して、 明示的に同一人物・同表情は近く、別人物・別表情は遠くにする学習を行う -> 画像データが多くあれば、暗黙的にも学習が可能? Deep Metric Learning の定番⁈ Triplet Lossを徹底解説(解説記事) class

                                                            顔画像で試す画像特徴ベクトルの足し算引き算 - Qiita
                                                          • Browse - Artbreeder

                                                            Browse images created by the Artbreeder community.

                                                              Browse - Artbreeder
                                                            • GPU Benchmarks for Deep Learning | Lambda

                                                              GPU Benchmark Methodology To measure the relative effectiveness of GPUs when it comes to training neural networks we’ve chosen training throughput as the measuring stick. Training throughput measures the number of samples (e.g. tokens, images, etc...) processed per second by the GPU. Using throughput instead of Floating Point Operations per Second (FLOPS) brings GPU performance into the realm of t

                                                              • GitHub - NVIDIAGameWorks/kaolin: A PyTorch Library for Accelerating 3D Deep Learning Research

                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                  GitHub - NVIDIAGameWorks/kaolin: A PyTorch Library for Accelerating 3D Deep Learning Research
                                                                • RにTorchとLightGBMがやってきた - 渋谷駅前で働くデータサイエンティストのブログ

                                                                  これまで、RとPythonは両方使える人が少なくないながらも開発陣やコミュニティの思想が違うせいもあってか、「Rは統計学向け」「Pythonは機械学習向け」的な住み分けが年々進み、特に機械学習関連の重要なフレームワーク・ライブラリ類はPython向けのみがリリースされることが多く、R向けにはリリースされないということが常態化している印象がありました。 そんな中、この9月にPythonの機械学習OSSを代表する2つのライブラリが相次いでR版パッケージを発表したので、個人的にはなかなか驚きました。中には「この2つがRに来たからにはもうPythonは触らない」と豪語する過激派の方もいらっしゃるようですが(笑)、それはさておき個人的な備忘録としてこの2つのR版パッケージを試してみた記録を記事として残しておこうと思います。 なお、以下のモデリングはほぼ何もチューニングを行っておりません。あくまでも「

                                                                    RにTorchとLightGBMがやってきた - 渋谷駅前で働くデータサイエンティストのブログ
                                                                  • GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)

                                                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                      GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)
                                                                    • Rustで作る機械学習を用いた画像クロッピングシステム

                                                                      ML@Loft #9. Deep Learning フレームワークと推論 https://ml-loft.connpass.com/event/157785/

                                                                        Rustで作る機械学習を用いた画像クロッピングシステム
                                                                      • コンピュータビジョンの最新論文調査 3D Vision編 | BLOG - DeNA Engineering

                                                                        はじめに こんにちは、AIシステム部でコンピュータビジョンの研究開発をしております宮澤です。 我々のチームでは、常に最新のコンピュータビジョンに関する論文調査を行い、部内で共有・議論しています。前回は Human Recognition編 ということで我々が読んだ最新の論文をご紹介しましたが、今回は3D Vision編をお届けします。今回論文調査を行なったメンバーは、奥田 浩人、宮澤 一之です。 論文調査のスコープ 2018年11月以降にarXivに投稿されたコンピュータビジョンに関する論文を範囲としており、その中から重要と思われるものをピックアップして複数名で調査を行っております。今回は3D Vision編として、主に2次元画像から3次元情報を復元する技術に関する最新論文を取り上げます。 前提知識 カメラで得られる2次元画像から3次元情報を復元するためには、複数の視点から撮影した画像が必

                                                                          コンピュータビジョンの最新論文調査 3D Vision編 | BLOG - DeNA Engineering
                                                                        • ソフトバンクグループ ミスラ副社長が辞任 投資戦略担う | NHK

                                                                          ソフトバンクグループは、投資戦略で重要な役割を担ってきたラジーブ・ミスラ副社長が31日付けで辞任したと発表しました。会社はことし6月までの3か月間の決算で3兆円を超える最終赤字を計上しましたが、ミスラ氏の辞任はグループの今後の戦略に影響を与える可能性もあります。 辞任したのは、ソフトバンクグループで2018年から副社長を務めてきたラジーブ・ミスラ氏です。 ドイツ銀行の債権部門の責任者などを経て、孫正義社長が迎え入れる形で投資戦略の立案など重要な役割を担ってきました。 在任中の2017年には、10兆円規模の投資ファンドの立ち上げにかかわり、孫社長を支えてきました。 関係者によりますと、ミスラ氏はみずからが新たな投資ファンドを立ち上げるということで、会社は「本人が新しいチャレンジに取り組む時間を確保するため、辞任することになった」と説明しています。 一方で、傘下の投資ファンド、「ビジョン・ファ

                                                                            ソフトバンクグループ ミスラ副社長が辞任 投資戦略担う | NHK
                                                                          • スッキリわかるAlphaFold2 - どこから見てもメンダコ

                                                                            注意: Alphafold2の手法解説です。使い方の説明ではありません 構造生物学ドメインにはある程度の説明をつけます アーキテクチャ設計の意図については個人の考察であり、正しさに何ら保証がありません AttentionとTransformerそのものについての説明は行いません AlphaFold2とは タンパク質折り畳み問題について タンパク質はバイオ・ナノマシン タンパク質立体構造の重要性 データ駆動の立体構造予測 AlphaFold2の概観 4つのモジュール AF2のやってることをざっくり理解する 0. データ準備 MSA (Multiple sequence alignment) の作成 MSAへのBERT風マスク導入 テンプレート構造の検索(任意) 1. Embeddingモジュール 入力データのOne-hot化 MSA Representation Pair Represent

                                                                              スッキリわかるAlphaFold2 - どこから見てもメンダコ
                                                                            • Deep LearningがECサイトの商品分類でどう活用されたのか

                                                                              ECサイト運営の業務効率化のために、商品説明を読んで掲載カテゴリーを提案してくれる人工知能を作成した。ディープラーニング実践の参考事例として、筆者の会社がどう取り組んでいったのかを紹介する。 連載目次 はじめに 人工知能という言葉に話題性があることと、企業には大量の文書が蓄積されていることから、手元にある文書をとりあえず人工知能に与えれば何か知見が得られるだろうと相談されることがある。しかし残念ながら、人工知能や、その要素技術の機械学習やディープラーニングは、ただ文書を与えただけでは期待した結果をもたらしてくれないことの方が多い。 成果が出ない理由の一つとして、データの質が挙げられる。ディープラーニングの登場によって、量の拡大が質を補うといわれることもあるが、それを実現するためには想像以上のデータ量が必要となる。 データが足りないとなると、結局はデータの質を上げる必要が出てくるので、辞書の

                                                                                Deep LearningがECサイトの商品分類でどう活用されたのか
                                                                              • Collaborative Metric Learningの関連研究まとめ - Qiita

                                                                                はじめに 今回は、協調フィルタリング(Collaborative Filtering)とMetric Learningを組み合わせたCollaborative Metric Learning (CML)とそこから発展したいくつかの論文を読んだので、まとめていきたいと思います。 割と新しめな研究だからか、あまり日本語の記事がヒットしないなと感じました。 オンラインでの計算量が大きくて大変なところを近似的に解くことで高速化できるのは魅力的だと思うので、この記事を通して興味を持ってもらえたらと思います。 Metric Learningについてはほぼ初心者なので、何かありましたらコメントいただけると嬉しいです。 よろしくお願いします。 Metric Learningについてはこの辺りを参考にさせていただきました。 Deep Metric Learning の定番⁈ Triplet Lossを徹底解

                                                                                  Collaborative Metric Learningの関連研究まとめ - Qiita
                                                                                • マイコンで深層学習も、エッジコンピューティングの未来

                                                                                  機械学習(ML)、さらには深層学習(DL)は、ほんの数年前までハイエンドのハードウェアでしか実行できず、エッジでのトレーニングや推論はゲートウェイ、エッジサーバ、またはデータセンターで実行されると考えられていた。当時、クラウドとエッジの間で計算リソースを分配するという動きが初期段階にあったため、このような考え方は正しいとされていた。しかし、産学の集中的な研究開発によって、このシナリオは劇的に変化した。 いまやMLを実行するのに優れたTOPS性能を実現可能なプロセッサは必要ない。最新のマイコンの中にはMLアクセラレーターを組み込んだものもあり、エッジデバイスでMLを実行できるケースが増えている。 これらのデバイスは、単にMLを実行するのではなく、低コストと低消費電力を実現し、どうしても必要な場合にのみクラウドに接続することが可能だ。つまり、MLアクセラレーター搭載のマイコンは、次のステップと

                                                                                    マイコンで深層学習も、エッジコンピューティングの未来

                                                                                  新着記事