本記事は、2022年度PFN夏季インターンシップで勤務された石﨑慎弥さんによる寄稿です。 1. はじめに 2022年度夏期インターンシップに参加させていただいた、京都大学大学院情報学研究科知能情報学専攻1回生の石﨑慎弥です。普段は自動運転に関連するコンピュータビジョンの研究を行っています。 今回のインターンでは、リモートセンシングデータに対する画像解析・超解像というテーマで、画像のデノイジングに取り組みました。 2. 背景 2.1. SAR画像のデスペックリング 近年SAR(Synthetic Aperture Radar)というセンシング技術が発達しています。日本語で合成開口レーダーといい、主に人工衛星などに取り付けられて地表の様子をセンシングしています。SARはマイクロ波を使ったアクティブセンシング技術であり、その物理的特性から雲や雨といった気象の影響を受けにくいという強みがあります。
この記事は以下の論文の再現実装を中心とし、線形多層ニューラルネットワークにおける陰的ランク最小化について解説を行います。 Jing, L., Zbontar, J. & LeCun, Y. Implicit Rank-Minimizing Autoencoder. NeurIPS' 20, 2020. https://arxiv.org/abs/2010.00679 線形多層ニューラルネットワークおける勾配降下法による低ランク解の獲得¶一般的なニューラルネットワークにおいて非線形な活性化関数はなぜ必要か、という質問に対する簡単な解答は「複数の線形写像 (or アフィン写像)の合成は1つの線形写像 (or アフィン写像)で表せる」というものです。簡単な例で説明しましょう。まず、入力を$\mathbf{x}$, 出力を$\mathbf{y}$, 重み行列を$W_1, W_2$とした2層の線形ニ
今回紹介するのはEdgeCortix(エッジコーティックス)という会社だ。2019年に創業という、まだ歴史の浅いAI業界の中でも若い部類に入る。創業者はSakyasingha Dasgupta博士なのだが、実は本社は日本にある。 Dasgupta博士の経歴は少しおもしろく、2015年にドイツのゲッティンゲン大学で物理学の博士号を取った後でなぜか理研に籍を置きながら日本のIBMで研究スタッフとして勤務後に、やはり日本のLeap MindでPrincipal Scientist(主席科学者)のポジションに就いている。 その後、これまた東京のAscent RoboticsでChief Scientific Officer(最高科学責任者)となった後に、なぜかシンガポールのNeuri Pte Ltdという会社のCTO兼CEO代理を務め、2019年7月にEdgeCortixという会社を創業している。
本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、自律型AIエージェントの機能や動作についての説明とあわせて、AIエージェントをいくつかご紹介します。 こんにちは。アナリティクスサービス部の江本です。 昨年2022年11月末にChatGPTがリリースされてから半年もたたずして、自律型AIエージェントが続々とリリースされ大きな話題を呼びました。 今では様々な自律型AIエージェントが存在しており、その多くはウェブブラウザを通して簡単に試すことができるようになっています。 本記事では、自律型AIエージェントの機能や
こんにちは、Dajiroです。今回は、PyTorchを使った複雑なネットワークの構築についてご紹介します。機械学習モデルを組んでいると、複数の種類の入力(画像と1次元配列状のデータなど)を使ったり、複数の種類の出力を得たい場合などがあります。そんなときに必要となる多入力多出力モデルの作り方を見ていきます。 【目次】 多入力多出力モデル データの読み込み データローダーの定義 モデルの定義 オプティマイザ 損失関数 学習実行部分 おわりに 多入力多出力モデル ここでは、以下のようなモデルの構築を目的とします。入力には画像とそのRBGのヒストグラムを表す3つの1次元配列を用います。出力には、その画像に何が移っているか(大聖堂、食べ物、花など)、それが天然物か人工物かの2種類のクラス分類を行います。なお、実装方法の紹介がメインなので、予測精度向上にはここでは拘らないこととします。 今回作成する多
こんにちは。前回に引き続き、拡散モデルに関する話題を取り上げます。拡散モデルとはGoogleのImagen等に活用されている話題の生成モデルであり、一部のタスクでは最も研究が進んでいる生成モデルGAN(敵対的生成ネットワーク)の最高性能を上回ることが報告されています。拡散モデルにはスコアベースモデル、拡散確率モデルなど幾つかのタイプがありますが、今回はスコアベースモデルについて解説を行います[1,2,3,4]。 以下は、スコアベースモデルによる画像生成の実例です。人間の目にはフェイクであることが分からないほどの精度で、画像が生成できています。 socre based modelによる画像生成例(出典[4]) エネルギーベースモデルの復習 スコアベースモデルの概要 スコアマッチング スコアベースモデルの課題 多段階のノイズ付加 更なる改良 おわりに 出典 エネルギーベースモデルの復習 スコア
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く