タグ

技術と画像に関するsuperrush4xのブックマーク (13)

  • Stable Diffusionをいらすとやでファインチューニングする

    巷で話題のStable Diffusion(以下SD)をファインチューニングする方法が公開されたので、早速やります。

    Stable Diffusionをいらすとやでファインチューニングする
  • Stable Diffusion メモ: キャンバスの縦横比は構図にどれくらい影響するか - jt_noSke's diary

    Stable Diffusion が公開されてからいろいろ動かして出力の傾向を見てみようとしたメモ。 やったこと 同じpromptを指定して、 縦長(512x768) 横長(768x512) 正方形(512x512) のサイズごとにそれぞれ200枚ずつ出力、それら画像の傾向を見て構図にどんな変化があるかを確認しようとした。ザッと見の印象、感触のみで評価し、定量評価はしない。 使用したプロンプト: a picture of robot and drill and girl greg manchess character concept art of an anime goddess of lust | | cute - fine - face, pretty face, realistic shaded perfect face, fine details by stanley artger

    Stable Diffusion メモ: キャンバスの縦横比は構図にどれくらい影響するか - jt_noSke's diary
  • Google、画像フォーマット「WebP」に可逆圧縮と透明度を追加

    Googleは11月18日(現地時間)、オープンソースのWeb向け画像フォーマット「WebP(ウェッピーと読む)」に、可逆圧縮(ロスレス圧縮)モードと透過度を設定できるアルファチャンネルを追加したと発表した。 WebPは、同社が昨年9月に発表した画像フォーマット。Webサイトのページ読み込みの高速化を目的としており、ビデオフォーマット「WebM」のビデオ圧縮技術「VP8」を流用している。発表の時点では、JPEGのような非可逆圧縮にのみ対応していた。10月にはアニメーション、ICCプロファイル、XMPメタデータをサポートした。 Webページ向けの画像フォーマットとしては、一般に写真など階調の細かい画像にはJPEGが、ロゴやアイコンなどにはPNGが、アニメーションにはGIFが採用されることが多いが、今回の機能追加でWebPがそれらに取って代われることになる。ただし、今のところWebPに対応す

    Google、画像フォーマット「WebP」に可逆圧縮と透明度を追加
    superrush4x
    superrush4x 2011/11/21
    『「WebM」のビデオ圧縮技術「VP8」を流用』『対応するWebブラウザはGoogle Chrome、Opera、Android 4.0』
  • ニュースリリース (2011-04-27):改ざん防止機能付きSDメモリカード「Write Onceメモリカード」を発売 | ニュース | 東芝

    当社は、電子写真データなどの証拠保存用に、データの改ざん防止機能を持つ「Write Onceメモリカード」を製品化し、日から官公庁や企業向けに販売を開始します。 昨今、デジタルカメラの急速な普及により、司法関係などで用いられる証拠保存用の画像を電子データで保存したいというニーズが高まっています。ただ、電子データは容易に編集などの改ざんができるという課題がありました。 新製品は、一般に市販されているSDメモリ対応のデジタルカメラ注1を用い、一度保存した電子写真データの編集や消去、撮影日の変更、カードのフォーマットなどによる改ざんを防止する機能を搭載しています。またSDメモリカード対応のPC、プリンタなどで他のSDメモリカードと同様にデータの読込みができます。容量は1GB注2の1モデルです。また、表面のカードラベルに書き込めるスペースを設けることで撮影日などの情報を書くことができます。 現在

  • 業界初!複雑な背景上で多色のテロップの認識に成功 : 富士通

    業界初!複雑な背景上で多色のテロップの認識に成功 膨大な数のテレビ番組やネット動画から見たいシーンを検索できる 株式会社富士通研究所(注1)と富士通研究開発中心有限公司(注2)は、多様な色や模様を持つ複雑な背景上で多色のテロップを文字認識する技術を開発しました。従来のように、テロップの背景を単一色に限定したり、テロップ文字の色を限定することなく、テロップを文字認識することができます。 技術により、映像コンテンツからより多くの文字情報を抽出・認識することが可能になり、映像コンテンツへの自動索引付けに利用することで見たいシーンの検索が容易になります。 開発の背景 近年、映像コンテンツの爆発的な増加により、映像コンテンツの検索技術が不可欠になってきました。テロップは映像コンテンツの内容に連動して表示されるため、映像のどの部分に必要な情報があるかといった検索にも利用できることから、映像の検索や索

  • 海辺で拾った貝殻に、思い出の映像を詰め込む技術~NTTコムウェアが開発中 

    superrush4x
    superrush4x 2010/10/08
    Gogglesとか、はてなモノリスとか
  • アイ・オー・データ機器、デジカメを載せるだけで写真を転送できるクレイドル | パソコン | マイコミジャーナル

    アイ・オー・データ機器は、TransferJet規格を採用し、対応のデジタルカメラを載せるだけでパソコンなどに写真を転送できるUSB接続型クレイドル「USB2-TJC」を7月下旬から発売する。価格は13,600円(税別)。 USB2-TJC TransferJetは、機器同士を数cmの距離にかざすだけで接続し、通信を行えるようにするデータ転送の規格。近接専用のシステムであるため他の無線通信に干渉しにくく、データ漏洩のリスクが小さい。「USB2-TJC」はこの規格を採用し、TransferJet対応デジタルカメラを載せるだけでパソコンやUSBポート搭載のデジタルテレビ・デジタルフォトフレームなどに写真を転送できるようにしたクレイドル。対応のデジタルカメラには、ソニー「DSC-TX7」「DSC-HX5V」があり、これらにTransferJet対応メモリースティックを装着した状態で利用可能となる

    superrush4x
    superrush4x 2010/07/08
    『機器同士を数cmの距離にかざすだけで接続し、通信を行えるようにするデータ転送の規格。近接専用のシステムであるため他の無線通信に干渉しにくく、データ漏洩のリスクが小さい』
  • 顔認識APIを無料公開 商用利用もOK

    ソフトウェア開発のインクリメント(東京都多摩市)は5月21日、顔を含む画像を送ると、顔や目、鼻などの位置を認識して座標データを送り返す顔認識APIを提供するサイト「detectFace();」を公開した。APIの提供は無料で、商用利用もできる。 顔、目、鼻、口、眉の位置と輪郭を認識し、その座標データをXML形式で送り返すWeb API。各パーツの輪郭情報まで提供するため、凝ったアプリケーションを構築できるという。 同APIを使ったサンプルサービスとして、画像をアップロードすると、画像中の人間の顔がパンダのイラストに変わる「ぱんだら」も公開している。 「価格はまちまちだが、顔認識エンジンの価格は安くても100万円以上。高い場合には1000万円以上するものもある」ため、個人のアプリ開発者は顔認識エンジンを使ったWebアプリが作りにくかったという。「今まで高価で手が出せなかったデベロッパーやWe

    顔認識APIを無料公開 商用利用もOK
    superrush4x
    superrush4x 2010/05/24
    『画像をアップロードすると、画像中の人間の顔がパンダのイラストに変わる「ぱんだら」も公開』
  • 落書きから写真を合成する「Sketch2Photo」が日本で発売へ

    「Display 2010」(東京ビッグサイト、16日まで)で、タッチパネルディスプレイ開発のイーアイティー(東京都文京区)の製品デモでは、ラフスケッチを元に写真を合成できるソフトウェア「Sketch2Photo」を利用している。 Sketch2Photoは、手描きの絵とそれに付けたテキストを元に、似た画像をデータベースから検索・合成できるソフトウェア。中国の清華大学などが開発した画像処理技術で、「SIGGRAPH Asia 2009」で注目を集めた。日ではソフトウェア開発のエム・アイ・エス・テクノロジー(東京都港区)が販売する予定だ。 「sea」「hill」など背景をテキストで指定し、「バイクに乗る人」や「犬」など合成したい画像のイメージを簡単に描く。それぞれにテキストで「moto rider」「dog」などタグ付けをすれば検索できる。 例えば海の中を魚が泳ぐ画像を作りたい場合には、背

    落書きから写真を合成する「Sketch2Photo」が日本で発売へ
    superrush4x
    superrush4x 2010/04/16
    『例えば海の中を魚が泳ぐ画像を作りたい場合には、背景に「Sea」と入力し、魚のラフスケッチを描いて「fish」とタグ付けすれば、それぞれの画像を検索可能。候補一覧から画像を選べば合成できる』
  • NEC開発の画質評価技術が国際標準に採用、映像配信の品質を自動チェック可能に

    NECは2010年2月22日、同社が開発した映像の画質に関する客観評価技術が、ITU-T SG9(国際電気通信連合 電気通信標準化部門作業グループ9)における画質の客観評価方法に関する国際標準規格「J.249」(ITU-T推奨のデジタルケーブルテレビ向け映像画質測定方法 )の一方式として採用されたと発表した。 この技術は、少量の画像特徴量を用いて映像の画質(QoE: Quality of Experience)の客観的な評価を自動で行うもの。従来、元の映像との直接比較による画質の客観評価技術はあったが、元の映像そのものが必要となるため受信端末上でリアルタイムにQoEを捉えることは困難だったという。 今回は、具体的には画面を16×16画素のブロックに分割した各ブロック内の輝度の分散に相当する簡易なものを特徴量として算出する。画質チェックを行う際に送信元の映像が不要で、抽出された少量の特徴量だ

    NEC開発の画質評価技術が国際標準に採用、映像配信の品質を自動チェック可能に
    superrush4x
    superrush4x 2010/02/22
    『画面を16×16画素のブロックに分割した各ブロック内の輝度の分散に相当する簡易なものを特徴量として算出』『演算量が、地上デジタルテレビ放送の映像復号処理(MPEG-2)に比べ約1/20と少ない』
  • Google、写真内のテキストを翻訳できる携帯向け機能を披露

    Googleは2月16日、カメラ付き携帯電話で撮影した写真内のテキストを翻訳できる機能をモバイル業界展示会Mobile World Congressで披露した。 この機能は、携帯電話で撮影した写真を使って情報を検索できる「Google Goggles」の一部。例えば、ドイツ語のレストランのメニューを撮影して、英語に翻訳するといったことができる。 この翻訳機能は、OCR(光学式文字認識)を使って写真内の文字を読み取り、Google Translateを使って翻訳する。まだプロトタイプの段階であり、ドイツ語から英語への翻訳のみが可能。Googleは、いずれGoogle Translateでサポートしている52言語すべてを翻訳できるバージョンを構築したいとしている。

    Google、写真内のテキストを翻訳できる携帯向け機能を披露
    superrush4x
    superrush4x 2010/02/18
    『この翻訳機能は、OCR(光学式文字認識)を使って写真内の文字を読み取り、Google Translateを使って翻訳する。まだプロトタイプの段階であり、ドイツ語から英語への翻訳のみが可能』
  • NEC、服の色や種類から人物を検索--迷子や足取り調査に利用

    NECは11月4日、「茶色のジャケットに黒いズボン」など自然な言葉を入力することで、監視カメラによって蓄積された大量の映像の中から、特定の人物を高精度に発見できる人物検索技術を発表した。 従来の服装をもとにする人物検索では、服の色として代表的な一色を指定するか、あるいは画像で指定する必要があった。今回発表された人物検索技術は、服の色や種類に関する単語を自動抽出し、これを画像の特徴データに変換して検索するという。 変換の際に、服の重ね着による色の割合の変化や、正面とそれ以外による色の見え方の違い、上下半身の服の違いなどを考慮して特徴データを作成することで、より正確に検索ができるとのこと。 人物の向きや上下それぞれの服の色や色の割合を検出して判定することで、従来の服全体の色だけによる判定よりも高精度な検索を実現する。 さらに、顔の向きや光の当たり方が異なる場合でも高精度な顔の検出・照合ができる

    NEC、服の色や種類から人物を検索--迷子や足取り調査に利用
    superrush4x
    superrush4x 2009/11/11
    『「茶色のジャケットに黒いズボン」など自然な言葉を入力することで、監視カメラによって蓄積された大量の映像の中から、特定の人物を高精度に発見できる人物検索技術』
  • 低解像度の映像や静止画像をフルハイビジョンで美しく表示する超解像システムLSIの発売について | ニュースリリース | ニュース & イベント | NECエレクトロニクス

    superrush4x
    superrush4x 2009/05/26
    『SDと呼ばれる標準画質(画素数640×480ドット)の動画・静止画像をフルHD(画素数1920×1080ドット)対応テレビで拡大表示した際のぼやけを改善できる』
  • 1