[B! 画像] p_tanのブックマーク

p_tan id:p_tan

画像に関するp_tanのブックマーク (33)

AI×医用画像の現状と可能性_2022年版/AI×medical_imaging_in_japan_2022
AI×医用画像の現状と可能性_2020年上半期版/AI×medical imaging in japan (first half of 2020)
p_tan 2022/12/30
そうか、テキストから画像が生成できるなら、医用機器の画像から診断テキストも生成できるのか。潜在空間を通じた表現の変換ができることが立証されたから、来年以降のAIの発展はさらに恐ろしい事になりそうだ。

診断

AI

画像

医用
リンク
世界変革の前夜は思ったより静か｜深津貴之 (fladdict)
世界のルールが根本的に変わってしまう… そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。あと数日（から数週間）で「トップレベルの画像生成AI」が、世界中にフリーで配布される。イラスト、マンガはおろか3D CGや建築、動画、映像…果てはフェイクニュースからポルノまで…あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。メルカリで悪魔の実が買える世界では、誰もが能力者（一流とは限らない）になれる。そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。 Stable Diffusionで出力したドワーフの王様Stable Diffusionで出力したホビットのスタディ Stabl
p_tan 2022/08/22
Google翻訳やDeepLで翻訳の世界はもはや変革してる。画像生成AIではどうか。

機械学習

AI

画像
リンク
ドメイン知識なし教師なし学習を実現したImage GPT、画像生成もすごい! (画像の表現学習2020夏特集1)
3つの要点 ✔️ 未知ドメイン知識なし教師なし表現学習成功、価値ある実証実験(PoC)、計算量は度外視 ✔️ 生成モデルとしても驚きの画像生成能力 ✔️ 獲得した表現を用いた画像分類でSOTA性能 Generative Pretraining from Pixels written by Mark Chen, Alec Radford, Ilya Sutskever (OpenAI) (Submitted on 17 Jun 2020) Comments: Accepted at ICML2020 Subjects: Computer Vision and Pattern Recognition (cs.CV) Paper Official Code COMM Code 今回から3回の予定で、ライター持ち込み特集企画「画像の表現学習2020夏」と題して、教師なし学習による各種手法をご紹介
p_tan 2020/07/10
学習

画像

教師なし学習
リンク
【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた！
3つの要点 ✔️ 画像分類タスクに必要不可欠なData Augmentationの体系をまとめた ✔️ 基本的なData Augmentationについて手法と利点/欠点をまとめた ✔️ 基本的なDAは実装が簡単な上に絶大な効果を発揮する A survey on Image Data Augmentation for Deep Learning written by Connor Shorten, Taghi M. Khoshgoftaar (Submitted on 06 July 2019) Comments: Published by Journal of Big Data Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Image and Video Proc
p_tan 2020/05/18
画像

CNN

AI

data augmentation
リンク
たった2行で画像認識モデルの精度向上！？新しいDataAugmentation自動最適化手法「RandAugment」解説！
3つの要点 ✔️ ランダムにData Augmentationの手法を選択するRandAugmentを提案 ✔️ 従来のAutoAugmentと比べ探索空間を$10^{-30}$にも削減し計算量を激減させたことで実践で使えるようにしただけでなく、CIFAR-10/100やImageNet, COCOなどのデータセットにおいて有用性が確認できた ✔️ ImageNetのSoTAであるNoisyStudentにも使われており、関数は2行で実装できるため読者の方も容易に使うことができる。 RandAugment: Practical automated data augmentation with a reduced search space written by Ekin D. Cubuk, Barret Zoph, Jonathon Shlens, Quoc V. Le (Submitted
p_tan 2020/02/10
画像

解説

データセット

AI

モデル

前処理
リンク
教師あり学習の精度を超えた！？相互情報量の最大化による教師なし学習手法IICの登場！
3つの要点 ✔️相互情報量を最大化する枠組みでニューラルネットを学習する教師なし学習手法IICの提案 ✔️予測値をそのまま出力するニューラルネットを学習可能であるため、クラスタリングが不要 ✔️従来の教師なし学習手法の「クラスタが一つにまとまってしまう問題」および「ノイズに弱いという問題」を解決 Invariant Information Clustering for Unsupervised Image Classification and Segmentation written by Xu Ji et.al (Submitted on 22 Aug 2019) subjects : Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG) はじめに近年、様々な場面において、深層学習手法が使用さ
p_tan 2020/02/02
画像

分類

deep learning

deeplearning

相互情報量
リンク
さらば造影剤、0.2ミリの微小血管まで見える光超音波技術が変える「常識」
これまで見えにくかった微小な血管が造影剤なしで鮮明に見える――。ベンチャー企業のLux onus（ルクソナス）は光超音波技術を用いて微小な血管などを3次元（3D）画像として撮影する製品を開発している。同社はキヤノンや日立製作所、京都大学、慶応義塾大学などが参画した国の研究プロジェクトの技術を実用化するために発足した。現在は細い血管をコンピューター断層撮影装置（CT）や磁気共鳴画像装置（MRI）で撮影する場合、造影剤を体内に注入することが多い。Lux onusの光超音波技術を利用すれば、血管は造影剤を使わなくても画像化できる。光超音波技術は、生体にパルス光を照射した際に発生する超音波をセンサーが受信し画像化する。血管の場合はパルス光で赤血球中のヘモグロビンが光を吸収し、赤血球が熱膨張して発生した超音波を受信する。高い解像度にできた理由の1つはおわん型に配置したフィルム状のセンサーだ。国の研究
p_tan 2020/01/31
技術

画像

医療
リンク
人工知能でゲノミクスを | 理化学研究所
理化学研究所（理研）生命医科学研究センター医科学数理研究チームの角田達彦チームリーダー（東京大学大学院理学系研究科生物科学専攻医科学数理研究室教授、東京医科歯科大学難治疾患研究所医科学数理分野教授）らの国際共同研究グループ※は、人工知能技術の一つである「深層学習[1]」で扱えるように、ゲノミクス[2]データなどの非画像データを画像データに変換する方法を開発しました。本研究成果により、遺伝子データなどさまざまな非画像データを深層学習で扱うことで、背後にある複雑な特徴や構造を抽出できるようになり、医療での診断や医学・生命科学など広範囲の応用に貢献すると期待できます。ゲノミクスデータなどの多くのデータは非画像データであるため、深層学習の能力を生かすには画像データにする必要があります。今回、国際共同研究グループは、遺伝子発現などのゲノミクスデータを使って医療診断や予測のためのクラス同定や分
p_tan 2019/08/11
deep learning

機械学習

deeplearning

研究

画像

CNN

学習
リンク
低解像度ビデオもすぐに高解像度に変換できる超解像アルゴリズムTecoGANがすごい
3つの要点 ✔️ 低解像から高解像へ変換 ✔️ 時間的に一貫したフレームを生成するために双方向損失関数を採用 ✔️ 超解像度へ変換するTecoGANを提案 Learning Temporal Coherence via Self-Supervision for GAN-based Video Generation Temporally Coherent GANs for Video Super-Resolution (TecoGAN) written by Mengyu Chu, You Xie, Jonas Mayer, Laura Leal-Taixé, Nils Thuerey (Submitted on 23 Nov 2018 (v1), last revised 21 May 2020 (this version, v4)) Comments: Published by arXi
p_tan 2019/05/27
画像

AI

GAN

機械学習

deep learning

deeplearning

画像処理

超解像

動画処理
リンク
AI×医用画像の現状と可能性 - Speaker Deck
presented by @Tdys13
p_tan 2018/12/05
画像

slide

機械学習

deep learning

deeplearning

画像処理

事例

まとめ
リンク
ChainerでDeep Image Priorをやってみた - Qiita
Chainer Advent Calendar 2017の17日目です。はじめに枠に空きができたので、最近の実装して見た論文の簡単な解説と結果を紹介します。今日も今日とて、人の褌で相撲を取っていこうと思います。今日紹介する論文は「Deep Image Prior」というものです。画像処理の基本タスクとして、ノイズ除去・超解像・インペインティングなど、色々な手法が研究されていますが、Deep Image Priorは、これらのタスクに汎用的に使える中々便利なテクニックです。以下の図が著者の論文で扱われているタスク群です。色々使えてすごいですね。ということで、本日はこれを実装していきましょう。前提知識上記に挙げた画像処理群は、基本的には以下の式を最小化することで行われます。 $x_0$は元の画像であり、例えばノイズなどを含む画像、$x$は生成画像とします。$E$は元の画像と処理後
p_tan 2018/09/10
chainer

画像

Deep Image Prior

Deep learning

CNN
リンク
画像検索 (特定物体認識) — 古典手法、マッチング、深層学習、Kaggle - Speaker Deck
(7/24) 大阪大学大学院情報科学研究科、ビッグデータ解析のゲストスピーカー担当分講義の資料をアップしました。画像検索とコンテストの話です。
p_tan 2018/07/28
画像

画像処理

物体認識
リンク
GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less
CVPR2018にて超解像分野において極めて重要そうだなと感じた論文がありました。Yochai Blauらによる下記の論文です。 [1711.06077] The Perception-Distortion Tradeoff この内容を踏まえて最近の超解像研究の流れをまとめたいと思います。超解像とは？超解像について振り返ります。多くの方がwaifu2xというソフトウェアで一度は目にしたことがあるかもしれません。下記イメージのように低解像の画像を高解像の画像に変換する方法を超解像（Super Resolution）と呼ばれます。（参照元：二次元画像を拡大したいと思ったことはありませんか？ - デー）このwaifu2xがざっくりどのように超解像を行っているかというと、ベースはSRCNNというConvolutional Neural Netoworkを使った超解像手法であり、下記のよう
p_tan 2018/07/23
医療診断支援に使用するような、人間が最終決定者な場合への応用だと、GANのような「それっぽい」復元は危険な気もする。

GAN

画像

論文

超解像

deep learning

deeplearning
リンク
Deep Learningによる超解像の進歩
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
p_tan 2018/07/19
画像

deep learning

deeplearning

超解像
リンク
dev.toに匹敵する速度を出せるWordPressテーマを開発した話 - Qiita
本日、無料WordPressテーマ Godios. をリリースしました。公式サイトを見ていただけるとわかると思うのですがページが一瞬で遷移しています。どうでしょう、dev.toと同じくらい速いんじゃないでしょうか。この記事ではテーマを高速化するにあたって用いたテクニックを書いていきたいと思います。圧縮テーマに含まれている画像・CSS・JSファイルの圧縮。画像はOptimizilla・TinyPNG、CSSはCSS Minifier、JSはJSCompressを使用しました。 CSS・JSファイルの遅延読み込みレンダリングをブロックするファイルが大量にあると表示が遅くなりますので、JSファイルはdeferまたはasync属性を付与し、CSSファイルはインライン、またはJSで非同期に読み込んでいます。無駄なSQLクエリを減らすデータベースへのアクセスが多いと負荷が掛かる上、速
p_tan 2018/04/07
web

圧縮

画像

最適化

高速化

WordPress
リンク
ATRと京都大学、fMRIで測定した人間の脳活動のみから、その人が見ている画像を機械学習を用いて再構成する提案を発表。心の中でイメージした内容の画像化にも成功
ATRと京都大学、fMRIで測定した人間の脳活動のみから、その人が見ている画像を機械学習を用いて再構成する提案を発表。心の中でイメージした内容の画像化にも成功 2018-01-14 ATR（国際電気通信基礎技術研究所）と京都大学の研究者らは、fMRI（機能的磁気共鳴画像法）によって測定された人間の脳活動のみから機械学習を用いて視覚像を再構成する提案を論文にて発表しました。 Deep image reconstruction from human brain activity 著者：Guohua Shen, Tomoyasu Horikawa, Kei Majima, Yukiyasu Kamitani （左が見ている画像、右が再構成された画像）本稿は、人間が見ている画像を、fMRIで測定した脳活動パターンのみで知覚内容を視覚化する機械学習を用いた手法を提案します。提案手法では、画像を見
p_tan 2018/01/15
機械学習

画像

deepLearning

deep learning

deeplearning
リンク
ディープラーニングにおけるセマンティックセグメンテーションのガイド2017年版 | POSTD
Qureでは、私たちは通常、セグメンテーションとオブジェクト検出の問題に取り組んでいます。そのため、最先端技術の動向について検討することに関心があります。本稿では、セマンティックセグメンテーションに関する論文を検討します。セマンティックセグメンテーションの研究の多くは、自然界・現実世界の画像データセットを使用します。その結果を医療用画像に直接適用できるわけではありませんが、現実世界の画像に関する研究は医療用画像のものよりもずっと成熟しているので、これらの論文を見直してみたいと思います。本稿は、以下のような構成です。最初にセマンティックセグメンテーションの問題を説明し、アプローチ方法に関する概略を述べます。最後にいくつかの興味深い論文を要約します。今後の記事で、医療用画像が現実世界の画像となぜ異なるのかを説明する予定です。更に、今回の再検討から得たアプローチが、医療用画像の代
p_tan 2017/12/05
画像

データセット

論文

deep learning

画像処理

セグメンテーション

まとめ

CNN

FCN

研究
リンク
10万枚の胸部X線画像をCNNした - 驚異のアニヲタ社会復帰の予備
読んだ。 ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases. IEEE CVPR 2017 3万人の患者から10万枚程度の胸部X線画像を入手し、CNNによりAtelectasis, Cardiomegaly, Effusion, Infiltration, Mass, Nodule, Pneumonia, Pneumothorax, Normal の8つの病気と正常の区別を行う。 F値ベースだと0.8-0.9 くらい、ただしNodule やMass だと0.5 とかになる。 AUCベースだと0.7-0.8 くらい、これもMass だと0.56 でやる意味ある
p_tan 2017/11/06
deep learning

deeplearning

画像認識

画像処理

画像

X線

論文

データセット
リンク
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Feature Pyramid Networks for Object Detection, CVPR'17の内容と見せかけて、Faster R-CNN, YOLO, SSD系の最近のSingle Shot系の物体検出のアーキテクチャのまとめです。
p_tan 2017/11/05
画像

機械学習

deep learning

deeplearning

画像認識

コンピュータビジョン

物体検出
リンク
少ない画像から画像分類を学習させる方法（kerasで転移学習：fine tuning）
※サンプル・コード掲載あらすじ「フルーツの画像を判別するモデルを作ってくれませんか？」と言われた時に、どのようにモデルを作りますか？ディープラーニングで画像分類を行う場合、通常畳み込みニューラルネットワークという学習手法を使いますが、画像の枚数によっては数週間程度がかかってしまいます。また、学習に使用する画像の枚数も大量に用意しないといけません。では、短時間・少ない画像から画像を分類するモデルを作るにはどうすればよいでしょうか。その解決策として、画像分類でよく使われているfine tuningという手法をご紹介します。今回はkeras2.0を使ってサンプルコードを書いて行きます。 *keras = Pythonで書かれたニューラルネットワークライブラリ。裏側でtheanoやtensorflowが使用可能。 fine tuning（転移学習）とは？既に学習済みのモデルを転用
p_tan 2017/08/22
転移学習の事例

画像

学習

ディープラーニング

分類

deep learning

機械学習

転移学習

事例

モデル
リンク
1 2 次のページ