AI×医用画像の現状と可能性_2020年上半期版/AI×medical imaging in japan (first half of 2020)
世界のルールが根本的に変わってしまう… そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。 あと数日(から数週間)で「トップレベルの画像生成AI」が、世界中にフリーで配布される。 イラスト、マンガはおろか3D CGや建築、動画、映像…果てはフェイクニュースからポルノまで…あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。 凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。 メルカリで悪魔の実が買える世界では、誰もが能力者(一流とは限らない)になれる。そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。 Stable Diffusionで出力したドワーフの王様Stable Diffusionで出力したホビットのスタディ Stabl
3つの要点 ✔️ 未知ドメイン知識なし教師なし表現学習成功、価値ある実証実験(PoC)、計算量は度外視 ✔️ 生成モデルとしても驚きの画像生成能力 ✔️ 獲得した表現を用いた画像分類でSOTA性能 Generative Pretraining from Pixels written by Mark Chen, Alec Radford, Ilya Sutskever (OpenAI) (Submitted on 17 Jun 2020) Comments: Accepted at ICML2020 Subjects: Computer Vision and Pattern Recognition (cs.CV) Paper Official Code COMM Code 今回から3回の予定で、ライター持ち込み特集企画「画像の表現学習2020夏」と題して、教師なし学習による各種手法をご紹介
3つの要点 ✔️ 画像分類タスクに必要不可欠なData Augmentationの体系をまとめた ✔️ 基本的なData Augmentationについて手法と利点/欠点をまとめた ✔️ 基本的なDAは実装が簡単な上に絶大な効果を発揮する A survey on Image Data Augmentation for Deep Learning written by Connor Shorten, Taghi M. Khoshgoftaar (Submitted on 06 July 2019) Comments: Published by Journal of Big Data Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Image and Video Proc
3つの要点 ✔️ ランダムにData Augmentationの手法を選択するRandAugmentを提案 ✔️ 従来のAutoAugmentと比べ探索空間を$10^{-30}$にも削減し計算量を激減させたことで実践で使えるようにしただけでなく、CIFAR-10/100やImageNet, COCOなどのデータセットにおいて有用性が確認できた ✔️ ImageNetのSoTAであるNoisyStudentにも使われており、関数は2行で実装できるため読者の方も容易に使うことができる。 RandAugment: Practical automated data augmentation with a reduced search space written by Ekin D. Cubuk, Barret Zoph, Jonathon Shlens, Quoc V. Le (Submitted
3つの要点 ✔️相互情報量を最大化する枠組みでニューラルネットを学習する教師なし学習手法IICの提案 ✔️予測値をそのまま出力するニューラルネットを学習可能であるため、クラスタリングが不要 ✔️従来の教師なし学習手法の「クラスタが一つにまとまってしまう問題」および「ノイズに弱いという問題」を解決 Invariant Information Clustering for Unsupervised Image Classification and Segmentation written by Xu Ji et.al (Submitted on 22 Aug 2019) subjects : Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG) はじめに 近年、様々な場面において、深層学習手法が使用さ
これまで見えにくかった微小な血管が造影剤なしで鮮明に見える――。ベンチャー企業のLuxonus(ルクソナス)は光超音波技術を用いて微小な血管などを3次元(3D)画像として撮影する製品を開発している。同社はキヤノンや日立製作所、京都大学、慶応義塾大学などが参画した国の研究プロジェクトの技術を実用化するために発足した。 現在は細い血管をコンピューター断層撮影装置(CT)や磁気共鳴画像装置(MRI)で撮影する場合、造影剤を体内に注入することが多い。Luxonusの光超音波技術を利用すれば、血管は造影剤を使わなくても画像化できる。光超音波技術は、生体にパルス光を照射した際に発生する超音波をセンサーが受信し画像化する。血管の場合はパルス光で赤血球中のヘモグロビンが光を吸収し、赤血球が熱膨張して発生した超音波を受信する。 高い解像度にできた理由の1つはおわん型に配置したフィルム状のセンサーだ。国の研究
理化学研究所(理研)生命医科学研究センター医科学数理研究チームの角田 達彦チームリーダー(東京大学大学院理学系研究科生物科学専攻医科学数理研究室教授、東京医科歯科大学難治疾患研究所医科学数理分野教授)らの国際共同研究グループ※は、人工知能技術の一つである「深層学習[1]」で扱えるように、ゲノミクス[2]データなどの非画像データを画像データに変換する方法を開発しました。 本研究成果により、遺伝子データなどさまざまな非画像データを深層学習で扱うことで、背後にある複雑な特徴や構造を抽出できるようになり、医療での診断や医学・生命科学など広範囲の応用に貢献すると期待できます。 ゲノミクスデータなどの多くのデータは非画像データであるため、深層学習の能力を生かすには画像データにする必要があります。 今回、国際共同研究グループは、遺伝子発現などのゲノミクスデータを使って医療診断や予測のためのクラス同定や分
3つの要点 ✔️ 低解像から高解像へ変換 ✔️ 時間的に一貫したフレームを生成するために双方向損失関数を採用 ✔️ 超解像度へ変換するTecoGANを提案 Learning Temporal Coherence via Self-Supervision for GAN-based Video Generation Temporally Coherent GANs for Video Super-Resolution (TecoGAN) written by Mengyu Chu, You Xie, Jonas Mayer, Laura Leal-Taixé, Nils Thuerey (Submitted on 23 Nov 2018 (v1), last revised 21 May 2020 (this version, v4)) Comments: Published by arXi
Chainer Advent Calendar 2017の17日目です。 はじめに 枠に空きができたので、最近の実装して見た論文の簡単な解説と結果を紹介します。今日も今日とて、人の褌で相撲を取っていこうと思います。 今日紹介する論文は「Deep Image Prior」というものです。画像処理の基本タスクとして、ノイズ除去・超解像・インペインティングなど、色々な手法が研究されていますが、Deep Image Priorは、これらのタスクに汎用的に使える中々便利なテクニックです。 以下の図が著者の論文で扱われているタスク群です。色々使えてすごいですね。 ということで、本日はこれを実装していきましょう。 前提知識 上記に挙げた画像処理群は、基本的には以下の式を最小化することで行われます。 $x_0$は元の画像であり、例えばノイズなどを含む画像、$x$は生成画像とします。$E$は元の画像と処理後
(7/24) 大阪大学大学院情報科学研究科、ビッグデータ解析のゲストスピーカー担当分講義の資料をアップしました。画像検索とコンテストの話です。
CVPR2018にて超解像分野において極めて重要そうだなと感じた論文がありました。Yochai Blauらによる下記の論文です。 [1711.06077] The Perception-Distortion Tradeoff この内容を踏まえて最近の超解像研究の流れをまとめたいと思います。 超解像とは? 超解像について振り返ります。多くの方がwaifu2xというソフトウェアで一度は目にしたことがあるかもしれません。下記イメージのように低解像の画像を高解像の画像に変換する方法を 超解像(Super Resolution)と呼ばれます。 (参照元:二次元画像を拡大したいと思ったことはありませんか? - デー) このwaifu2xがざっくりどのように超解像を行っているかというと、ベースはSRCNNというConvolutional Neural Netoworkを使った超解像手法であり、下記のよう
本日、無料WordPressテーマ Godios. をリリースしました。 公式サイトを見ていただけるとわかると思うのですがページが一瞬で遷移しています。 どうでしょう、dev.toと同じくらい速いんじゃないでしょうか。 この記事ではテーマを高速化するにあたって用いたテクニックを書いていきたいと思います。 圧縮 テーマに含まれている画像・CSS・JSファイルの圧縮。 画像はOptimizilla・TinyPNG、CSSはCSS Minifier、JSはJSCompressを使用しました。 CSS・JSファイルの遅延読み込み レンダリングをブロックするファイルが大量にあると表示が遅くなりますので、JSファイルはdeferまたはasync属性を付与し、CSSファイルはインライン、またはJSで非同期に読み込んでいます。 無駄なSQLクエリを減らす データベースへのアクセスが多いと負荷が掛かる上、速
ATRと京都大学、fMRIで測定した人間の脳活動のみから、その人が見ている画像を機械学習を用いて再構成する提案を発表。心の中でイメージした内容の画像化にも成功 2018-01-14 ATR(国際電気通信基礎技術研究所)と京都大学の研究者らは、fMRI(機能的磁気共鳴画像法)によって測定された人間の脳活動のみから機械学習を用いて視覚像を再構成する提案を論文にて発表しました。 Deep image reconstruction from human brain activity 著者:Guohua Shen, Tomoyasu Horikawa, Kei Majima, Yukiyasu Kamitani (左が見ている画像、右が再構成された画像) 本稿は、人間が見ている画像を、fMRIで測定した脳活動パターンのみで知覚内容を視覚化する機械学習を用いた手法を提案します。 提案手法では、画像を見
Qureでは、私たちは通常、セグメンテーションとオブジェクト検出の問題に取り組んでいます。そのため、最先端技術の動向について検討することに関心があります。 本稿では、セマンティックセグメンテーションに関する論文を検討します。セマンティックセグメンテーションの研究の多くは、自然界・現実世界の画像データセットを使用します。その結果を医療用画像に直接適用できるわけではありませんが、現実世界の画像に関する研究は医療用画像のものよりもずっと成熟しているので、これらの論文を見直してみたいと思います。 本稿は、以下のような構成です。最初に セマンティックセグメンテーションの問題を説明 し、 アプローチ方法に関する概略 を述べます。最後に いくつかの興味深い論文を要約します。 今後の記事で、医療用画像が現実世界の画像となぜ異なるのかを説明する予定です。更に、今回の再検討から得たアプローチが、医療用画像の代
読んだ。 ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases. IEEE CVPR 2017 3万人の患者から10万枚程度の胸部X線画像を入手し、CNNによりAtelectasis, Cardiomegaly, Effusion, Infiltration, Mass, Nodule, Pneumonia, Pneumothorax, Normal の8つの病気と正常の区別を行う。 F値ベースだと0.8-0.9 くらい、ただしNodule やMass だと0.5 とかになる。 AUCベースだと0.7-0.8 くらい、これもMass だと0.56 でやる意味ある
※サンプル・コード掲載 あらすじ 「フルーツの画像を判別するモデルを作ってくれませんか?」 と言われた時に、どのようにモデルを作りますか? ディープラーニングで画像分類を行う場合、通常畳み込みニューラルネットワークという学習手法を使いますが、画像の枚数によっては数週間程度がかかってしまいます。 また、学習に使用する画像の枚数も大量に用意しないといけません。 では、短時間・少ない画像から画像を分類するモデルを作るにはどうすればよいでしょうか。 その解決策として、画像分類でよく使われているfine tuningという手法をご紹介します。 今回はkeras2.0を使ってサンプルコードを書いて行きます。 *keras = Pythonで書かれたニューラルネットワークライブラリ。裏側でtheanoやtensorflowが使用可能。 fine tuning(転移学習)とは? 既に学習済みのモデルを転用
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く