タグ

画像処理に関するotori334のブックマーク (224)

  • 効率的なミサイル迎撃用のAIを開発する研究者が「トンボの脳」をコピーする意味とは?

    AIと聞くと「人間の脳を模倣したもの、あるいは人間の脳を上回る性能を持つもの」という印象を持つ人も多いかもしれません。しかし、軍事科学や安全保障の研究を行うアメリカのサンディア国立研究所に勤めるフランシス・チャンス博士は、人間の脳ではなく「トンボの脳」をモデルにしたAIの開発を行っているとのことです。 Fast, Efficient Neural Networks Copy Dragonfly Brains - IEEE Spectrum https://spectrum.ieee.org/fast-efficient-neural-networks-copy-dragonfly-brains 人間の脳には全体で860億個もの神経細胞(ニューロン)があるといわれており、高度な認知能力を必要とするさまざまなタスクを実現しています。一方、昆虫が持つニューロンはせいぜい数十万~100万個程度です

    効率的なミサイル迎撃用のAIを開発する研究者が「トンボの脳」をコピーする意味とは?
  • ステガノグラフィーの解析について

    この解説について この解説は、当ソフトウェア『うさみみハリケーン』に付属する汎用ファイルアナライザ「青い空を見上げればいつもそこに白い」が実装している、「ステガノグラフィー解析機能」の活用補助を目的として執筆しました。同機能は、特に情報セキュリティにおける、コンピュータセキュリティ技術を競う競技であるCTF(Capture The Flag)での使用を想定しています。また、同機能は、画像ステガノグラフィーの解析ツール「Stegsolve」の互換機能をベースとして、色々な機能拡張を行い、さらに「青い空を見上げればいつもそこに白い」に実装された、「文字コード別の文字列抽出」、「バイナリデータの視覚化表示」、「ファイル・データ抽出」および「YARAルールでスキャン」など各種機能との連携を図る形で実装しました。 なお、上記ステガノグラフィー解析機能は、すでに画像ファイルへ埋め込まれた各種データ

  • HTMLファイルの中に画像を埋め込んで表示させる方法 [ホームページ作成] All About

    ウェブページ内に画像を表示する際、一般的にはHTMLファイルと画像ファイルは別々に存在します。例えば、index.html ファイル内に記述されたHTMLソースから画像として image.png ファイルが指定されている場合は、index.html と image.png は別々に存在するファイルです。当たり前ですね。 そもそも、HTMLファイルはテキストデータなのに対して、PNGやJPEGなどの画像ファイルはバイナリデータです。ですから、画像とHTMLを1ファイルにまとめることはできなさそうに思えます。 ※テキストデータ:人間に読める文字だけで構成されたデータ。 ※バイナリデータ:人間用ではない(画面に表示できない)文字などを含んだデータ。

    HTMLファイルの中に画像を埋め込んで表示させる方法 [ホームページ作成] All About
  • ワープロ専用機の拡大処理を再現したフォント「ワープロ明朝」

    ワープロ専用機の拡大処理を再現したフォント「ワープロ明朝」 「ワープロ明朝」は、1980年代〜90年代初めのワープロ専用機などで使われていた、ビットマップフォントの拡大処理を再現したフォントです。 ワープロ専用機も後期にはアウトラインフォントが搭載されて綺麗な拡大が可能になりましたが、それ以前は大きな文字を印刷するときにもビットマップフォントを拡大して使っていました。そのまま拡大するとギザギザになってしまうので、階段状になったドットを斜めの線で補間する処理が施されて独特な見た目になっていました。 「ワープロ明朝」は24ドットの明朝体ビットマップフォント jiskan24 にこの補間処理を行い、アウトラインフォント化したものです。 使用例 張り紙に:

    ワープロ専用機の拡大処理を再現したフォント「ワープロ明朝」
  • 網膜における視覚情報処理のメカニズム

    otori334
    otori334 2021/07/30
    網膜における視覚情報処理のメカニズム
  • 写真からアニメ背景を生成するAI『Anime Art Painter』| cre8tiveAI

    アニメ背景を創る Anime Art Painterとは?Anime Art Painter(アニメ背景生成AI)とは、写真をアニメ風に変換するAIです。 一般的に、アニメは1話あたり200枚〜300枚の美術背景が使われています。 短い納期の中でクオリティの高い背景を制作する必要があるため大変な仕事です。 Anime Art Painter は、アップロードするだけでアニメ風の背景に変換できるため アニメ制作を効率化できます。1回の変換で4種類のアウトプットを提供しており、 アニメだけでなく広告の素材、挿絵や漫画等、様々な用途でご活用いただけます。 様々な種類の写真を精度高くアニメ風に変換できます

    写真からアニメ背景を生成するAI『Anime Art Painter』| cre8tiveAI
  • SVGで「文字を書いていくアニメーション」を作る – コーヒーサーバは香炉である

    かきかたプリントメーカーに「書き順アニメーション」という機能を実装した。 これを作る際に使ったテクニックを紹介する。スクリプトは不要。純粋なSVGだけで次ようなアニメーションが作れる。 (2021/06/16追記 : アニメーションSVGの貼り過ぎでスマホだとめちゃくちゃ重かったり表示されなかったり遅延が発生したりします。すみません。) SVGに「線を途中まで書く」という機能自体はない。そこでちょっと工夫が必要になる。 テクニックの概要はこんな感じだ。 「ものすごく荒い破線で線を表示し、破線のオフセットがちょっとずつ変化するようにする」 ステップ0 : 破線を使って「書きかけの線」を作る こちらはベジエ曲線1で作った「の」である。 ソリッドな線で表示される。SVGのソースはこんな感じだ。 <?xml version="1.0" encoding="UTF-8" standalone="n

  • 音声に合わせ顔の動きを深層学習で作成 Adobeなど「MakeItTalk」開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米マサチューセッツ大学アマースト校、米Adobe Research、中国Huya Incによる研究チームが開発した「MakeItTalk」は、音声に合った顔と頭の動きを生成する深層学習フレームワークだ。音声信号と顔の静止画像から、音声と同期した表情と頭部のアニメーションを生成する。実際の顔写真やアニメキャラクター、手描きスケッチまで、さまざまな顔に対応可能だ。

    音声に合わせ顔の動きを深層学習で作成 Adobeなど「MakeItTalk」開発
  • 東大、デジカメ画像から植物の3次元形質を測定可能なPythonパッケージ公開

    東京大学は6月15日、一般的なデジタルカメラの画像から、鉢植え植物の3次元データを高精度に自動測定するPythonパッケージ(EasyDCP:Easy Dense Cloud Phenotyping)を開発し、公開したと発表した。 EasyDCPを利用した測定の大まかな流れ 資料:東京大学 同大学によると、近年は植物の3次元形質を非破壊的に測定するための手法が発展してきているが、既存のシステムは高価であり、大規模な施設や専門的な装置が必要といった理由から、生態学の分野ではそれらのシステムがほとんど用いられてこなかったという。 しかし、生態学的研究において草丈、投影葉の面積、草姿など植物の形に関する測定は非常に重要であり、鉢植えの植物を安価で高速に測定するシステムが必要とされていた。そこで同大学は、一般的なデジタルカメラと、市販およびオープンソースのソフトウェアを組み合わせたパイプライン(E

    東大、デジカメ画像から植物の3次元形質を測定可能なPythonパッケージ公開
  • クロマグラムと和音 – blog|メディア情報研究室|村上真研究室|東洋大学総合情報学部

    目的 音楽データは和音やコードと言われる心地良いいくつかの音の組み合わせで構成されることが多い.ここでは,和音と和音を表現するときに使用されることが多いクロマグラムについて学ぶ. 説明 長三和音 ピアノでC3から1オクターブ上のC4までの13音「C3 C#3 D3 D#3 E3 F3 F#3 G3 G#3 A3 A#3 B3 C3」を順に弾いたオーディオデータにConstant-Q変換をかけ,パワースペクトログラムを表示してみよう. 実行すると以下のように表示され,例えば最初の1秒でC3の音を弾いている区間では,C3の2倍・3倍・4倍…の周波数成分が強く現れていることがわかる.これは調波構造や倍音構造と呼ばれる特徴で,弦楽器や管楽器で弾いた音に現れる特徴である. C3の2倍の周波数の音は1オクターブ上のC4であり,4倍の周波数の音は2オクターブ上のC5であることは自明である.ここではC3の

  • 離散コサイン変換 - Wikipedia

    二次元DCTとDFTとの比較。左はスペクトル、右はヒストグラム。低周波域での相違を示すため、スペクトルは 1/4 だけ示してある。DCTでは、パワーのほとんどが低周波領域に集中していることがわかる。 離散コサイン変換(りさんコサインへんかん、英: discrete cosine transform、DCT)は、離散信号を周波数領域へ変換する方法の一つである。 概要[編集] DCTは、有限数列を、余弦関数数列 cos(nk) を基底とする一次結合(つまり、適切な周波数と振幅のコサインカーブの和)の係数に変換する。余弦関数は実数に対しては実数を返すので、実数列に対してはDCT係数も実数列となる。 これは、離散フーリエ変換 (DFT: discrete Fourier transform) が、実数に対しても複素数を返す exp(ink) を使うため、実数列に対しても複素数列となるのと大きな違い

    離散コサイン変換 - Wikipedia
    otori334
    otori334 2021/07/09
    直流バイアスの拡張 “DCTはy軸で折り返して偶関数化してDFTすることと等価であり、実際にそう計算することが多い。”
  • 直流バイアス - Wikipedia

    時間領域で周期関数を記述する場合、直流バイアス(直流成分、直流オフセット、直流係数)は波形の平均値である。平均振幅が0の場合、直流オフセットがないということである。直流成分のない波形は、直流バランス(DC-balanced)または直流フリー(DC-free)な波形として知られている[1]。 起源[編集] この用語は電子工学の世界において直流電圧を指す言葉に由来する。それに対し、他の様々な非直流周波数は重ね合わせた交流(AC)電圧・電流に類似しており、そのため交流成分もしくは交流係数と呼ばれる。 この発想は、あらゆる波形の表現や、JPEGで使われる離散コサイン変換のような2次元変換に拡張されている。 応用[編集] 電子増幅回路の設計では、全ての能動素子は信号が印加されていない時に、動作点、定常状態の電流電圧をデバイスに設定するためにバイアシングをしている。例えばバイポーラトランジスタのバイア

  • FlashのSelenium対応 - Qiita

    目的 Adobe Flashで作成されたサイトのUIの自動テストがしたい. http://www.adobe.com/jp/products/flashplayer.html 主に,Click,Drag & Drop, Double Clickなど. 問題点 Web Browserの自動テスト=Seleniumを使う,という安直な思考でSelenium Pythonを選択する. しかしながら,FlashはHTML上一つのオブジェクトとしてみなされるため,その子供の要素を指定する方法がSeleniumにはない. 解決案 Selenium Web Driver APIにmove_to_element_with_offset(to_element, xoffset, yoffset)というMethodがある.これを利用できないか 手順 Flashゲーム・艦隊これくしょんを例にして実装方法を説明す

    FlashのSelenium対応 - Qiita
  • スナック菓子の袋に反射した光から、周囲の様子を画像で“復元”する:米研究チームが実験に成功

  • https://www.jstage.jst.go.jp/article/fss/30/0/30_154/_pdf/-char/ja

    otori334
    otori334 2021/07/05
    単眼カメラでの曲面文字情報取得のための断面形状推定による平面化手法の提案
  • カメラキャリブレーションと3次元再構成 — opencv 2.2 documentation

    カメラキャリブレーションと3次元再構成¶ このセクションで述べる関数は,いわゆるピンホールカメラモデルを取り扱います.つまりこのモデルでは,3次元座点を透視投影変換を用いて画像平面に射影することで,シーンのビューが構成されています. ここで はワールド座標系の3次元座標を表し は画像平面に投影された点の座標を表します. は,カメラ行列,またはカメラの内部パラメータ行列と呼ばれます. は主点(通常は画像中心), はピクセル単位で表される焦点距離です. したがって,あるファクタによってカメラ画像がスケーリングされている場合, このすべてのパラメータを同じファクタでスケーリング(それぞれが,拡大または縮小)する必要があります. 内部パラメータ行列はビューに依存しないので,一度推定すれば(ズームレンズの場合)焦点距離を固定している限りは繰返し使用することができます. 並進-回転の同次変換行列である

  • Harrisコーナー検出 — OpenCV-Python Tutorials 1 documentation

    We Harrisのコーナー検出の背景にある概念を理解します. 以下の関数の使い方を学びます: cv2.cornerHarris(), cv2.cornerSubPix() 理論¶ 前チュートリアルでコーナーとは全方向に対して画素値の大きな変化が観測される領域であることを学びました.初期のComputer Visionにおけるコーナー検出の試みとして Chris Harris と Mike Stephens が A Combined Corner and Edge Detector という論文で提案したHarrisのコーナー検出と呼ばれる方法があります.Harrisらはこの単純なアイディアを数式で表現しました.基的には全方向に対して画素位置 の移動量に対する画素値の違いを見つけるわけです.以下のように表現できます. 窓関数は矩形窓か画素に対して重み付けをするガウシアン窓を使います. コー

  • 30.ディープラーニングでノイズを消してみよう - keep learning blog(キープラーニングブログ)

    ――科学者とは、自然のひみつと美しさを探し求めるおとぎの国の旅人です。それは大変おもしろく、夢のある楽しい仕事なんですよ。―― マリア・スクウォドフスカ・キュリー ディープラーニングでノイズを消してみよう 論文の概要 U-Netとは U-Netのアレンジ Pythonで実装 ディープラーニングでノイズを消してみよう すっかり季節が初夏の陽気になってきたと思っていたら、暦はもう6月になっていました。キュリー夫人の言う「おとぎの国」という表現がぴったりのデンマーク生活も、そろそろ終わりを告げようとしています。 昨年7月にデンマークの土を踏んでから約1年間、短いようでとても長かったです。西洋のことわざで、「ロバが旅に出かけたところで、馬になって帰ってくるわけではない」という言葉があります。私はポニーくらいにはなれたでしょうか。 デンマーク生活で印象に残っていることはいくつかあります。そこに住む人

    30.ディープラーニングでノイズを消してみよう - keep learning blog(キープラーニングブログ)
    otori334
    otori334 2021/07/05
    “2015年頃に電子顕微鏡画像から細胞などの特定箇所を検出する(Segmentation)用途で開発された、U-Netという比較的シンプルな畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を採用”
  • Python: LibROSA で調波打楽器音分離 (HPSS) - Wizard Notes

    調波打楽器音分離とは? 一般的な楽曲では、様々な楽器音が含まれています。 そのため、元の楽曲信号から直接、音楽的な情報(例:コード進行)を分析するのは 計算機ではなかなか難しいです*1。 そこで、分析の前処理として、 打楽器の音と非打楽器(調波楽器)の音を分離する調波打楽器音分離 (HPSS: Hermonic/Percussive Source Seperation) *2が良く使われています。 この記事では、HPSSの概要とPython (LibROSA) のコードの解説します。 調波打楽器音分離とは? 調波打楽器音分離のアイディア アルゴリズムの設計 非負値行列因子分解+基底クラスタリング 最適化問題(行列因子分解)として解く 深層学習を使った手法 メディアンフィルタベースの手法 LibROSAにおける調波打楽器分離(HPSS)の実装 使い方 実装の詳細 librosa.effect

    Python: LibROSA で調波打楽器音分離 (HPSS) - Wizard Notes
  • 折り返し雑音 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "折り返し雑音" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2022年12月) 正しく標化されたレンガの壁の画像 空間折り返しひずみ(モアレ)が生じている例 折り返し雑音(おりかえしざつおん、(英: folding noise)またはエイリアシング(英: aliasing)とは、統計学や信号処理やコンピュータグラフィックスなどの分野において、異なる連続信号が標化によって区別できなくなることをいう。エイリアスは、この文脈では「偽信号」と訳される。信号が標化され再生されたとき、元の信号とエイリアスとが重なって生じる歪みのことを折り返し

    折り返し雑音 - Wikipedia