![https://twitter.com/rei_software/status/1583499209252012035](https://cdn-ak-scissors.b.st-hatena.com/image/square/f0ce6fc1c4ecd36f96833e42cf0eef20c1a28086/height=288;version=1;width=512/https%3A%2F%2Fpbs.twimg.com%2Fprofile_images%2F883085228381577216%2FmdtGRjZp.jpg)
ウェブブラウザ「Firefox 106」の正式版が公開されました。記事作成時点ではmacOS限定ながら画像内のテキストを抽出する機能が追加されるなど、ユーザーが直接触れる機会が多くなりそうな数々の機能が導入されています。 Firefox 106.0, See All New Features, Updates and Fixes https://www.mozilla.org/en-US/firefox/106.0/releasenotes/ ◆画像内のテキスト抽出 macOS 10.15(Catalina)以降で、選択した画像からテキストを抽出できるようになります。テキストの抽出を行うには、テキストを含む画像を右クリックし、表示されるポップアップメニューから「Copy Text from Image」を選択します。 抽出されたテキストは共有・保存・検索するためにクリップボードにコピーされ
2022年9月25日、Googleのクラウドサービス「Googleフォト」の公式フォーラムに「以前Googleフォトにアップロードしたデータが破損している」という問題が投稿され、その後も同様の報告が多数行われ始めました。 Corrupted photos - Google Photos Community https://support.google.com/photos/thread/180787712/corrupted-photos Scott Miller 8444氏は、2014年頃にGoogleフォトへアップロードしたという写真を数枚フォーラムに投稿し、「写真を振り返っていたところ、写真の一部が崩れていることが分かりました。適切にアップロードし、保存されていたにもかかわらず、この問題が発生しました」と訴えました。 Scott Miller 8444氏が投稿した写真の1つが以下のも
ラーメン二郎のラーメンの写真から、「自動的にレンゲだけを消す」技術が魔法のようだと話題です。レンゲなんか最初からなかったみたいになってる……! レンゲを消せる仕組みも消す理由もよく分からないけど、とにかくすごい……! 公開されたデモ映像では、レンゲにかけられたボカシがじわじわ減衰。レンゲが消えるとともに、もともとは見えていなかった麺や具材が現れる様子が映し出されています。つまり、レンゲを消した跡へ、新たにラーメンを違和感なく描いている……! レンゲにかかったマスクが薄くなるに連れて、向こう側から補完された麺や具材が浮かび上がる……ふしぎ! 開発者のKenji Doi(@knjcode)さんは、機械学習の研究に取り組むエンジニア。過去にもラーメン二郎を題材に研究し、「リプライで寄せられたラーメンの画像が『二郎の何店か』言い当てるbot(@jirou_deep)」を実現しています。 今回も大量
Rust でモザイク加工を実装し、それを WebAssembly として Web アプリから利用する2022-07-11 Twitter のアイコンが本人とかなり乖離してきたため、職場の人に「え、誰ですか?」と言われることが多々あり、そろそろアイコンを変えようかなと思っていました。でもアイコンを変えると認識できなくなると思ったので、少しずつアイコンにモザイクをかけていこうと思い、モザイクツールを自作していました。自作しなくても既存のツールがあるのではと思うかもしれませんが、車輪は再発明するものなので再発明しました。ただ車輪の再発明とは言っても、Wasm で動作(=クライアントで加工してくれるからサーバーに送らなくていいし Web で使える)という点では比較的新しい車輪の再発明な気がしています。 それがこの umie です。ファイル選択して送信するとこのようにモザイクをかけられます。 ちなみ
Research paper GitHub repository Introduction We introduce the Pathways Autoregressive Text-to-Image model (Parti), an autoregressive text-to-image generation model that achieves high-fidelity photorealistic image generation and supports content-rich synthesis involving complex compositions and world knowledge. Recent advances with diffusion models for text-to-image generation, such as Google’s Im
ベンチャー企業のS'moreは、一頭ずつ異なる犬の鼻の紋様(鼻紋)をAIで識別することで、迷い犬を探し出すスマートフォンアプリ「NoseID」のβ版を公開した。 飼い犬の鼻の動画を撮影し、登録しておけば、愛犬が迷子になった際、周辺エリアのユーザーに通知できる。迷い犬を発見した人は、その鼻をアプリで撮影すると、登録済みの犬を照会可能。鼻紋が一致すれば、発見者と飼い主が個人情報を伏せた状態でメッセージのやり取りできる。 犬の鼻紋は、人の指紋のように成長しても形が変わらないという。ディープラーニングを活用して鼻紋を解析し、犬を特定する。登録が増えるほど認証精度が向上する仕組み。現在、5000頭分の鼻紋データが集まっており、認証率は92%まで向上したという。まず1万頭分の登録を目指し、精度を100%に近づけていきたいという。 登録時には、飼い犬の生年月日やワクチン接種状況、既往歴、アレルギー、薬、
特定の色を透明にする背景の透過表示や、複数の画像を1つのファイルに収めてのアニメーション表示、ファイルの読み込みが進むにつれて画像を表示する「インターレース表示」といった機能を備えた画像ファイルフォーマットとして知られる「GIF」の設計に携わったコンピューター科学者のスティーブ・ウィルハイト氏が、2022年3月14日、新型コロナウイルス感染症(COVID-19)のため亡くなりました。74歳でした。 Stephen E. Wilhite Obituary - Visitation & Funeral Information https://www.megiefuneralhome.com/obituaries/Stephen-E.-Wilhite?obId=24311617 Stephen Wilhite, creator of the GIF, has died - The Verge h
If you buy something from a Verge link, Vox Media may earn a commission. See our ethics statement. Wilhite after winning a Webby Lifetime Achievement award. Photo by Stephen Lovekin/Getty Images for The Webby Awards Stephen Wilhite, one of the lead inventors of the GIF, died last week from COVID at the age of 74, according to his wife, Kathaleen, who spoke to The Verge. He was surrounded by family
NECは2月10日、写真に映る景色を基に撮影場所を特定する技術を開発したと発表した。目印となるランドマークが映っていなくても特定可能で、災害時の救助活動での活用を目指す。 地上で撮影された画像と衛星画像・航空写真を対応づけて機械学習させ、両者を照らし合わせてることで撮影場所を特定する。照合精度は85.6%。1枚の画像から建物や街路樹などの被写体を分離した画像を自動生成して学習させることで、時間経過による変化や、撮影画像と衛星画像に映り込むオブジェクトの違いに惑わされずに場所を特定できるという。 これまでの技術では目印となる建物(ランドマーク)を基準に場所を特定していたが、ランドマークがない地域では精度が出ない問題があった。NECは衛星写真や航空写真など広域を捉えた画像を利用することでさまざまな地域で使えるようにした。 今後は災害時の救助活動や被災状況の確認などでの活用を検討。この技術を活用
悪用されても気付けない 「駅名は明かせませんが、約110の駅のコンコースなどに設置したおよそ5800台の監視カメラの一部に、顔認証機能を搭載しました。マスクをつけていても、不審者の顔を判別できる能力があります」(JR東日本広報) JR東日本が、ひっそりと「顔認証監視カメラ」を導入したことをご存じだろうか。駅利用者の顔と、登録されている犯罪容疑者や不審者の顔をリアルタイムで照合し、検知しているというのだ。 五輪開幕に合わせて、7月から導入していた。顔データの出元や最終的な情報提供先は「答えられない」と言うものの、警察とみて間違いない。 先月24日夜、東京・港区で男性に硫酸をかけた男は、JR品川駅から新幹線に乗って逃走した。男は28日にスピード逮捕されたが、この捜査にも顔認証監視カメラが活用されたとみられる。 捜査に役立つなら、問題ないと思うかもしれない。しかし、顔の画像を無差別に収集されるの
愛知県豊田市では、イスラエルのITベンチャー・Utilisの技術を用いて、衛星画像データをAIで解析するシステムを利用した水道管の漏水調査が行われたそうだ。水道水とそうでない水はマイクロ波の反射の仕方が異なるという特性を利用しているとされる。2020年9月から21年4月にかけて市内の556区域を調査した結果、154区域の259カ所で漏水を見つけたとしている。従来は約5年必要だった作業を約7か月にまで短縮できたという(ジャパン・トゥエンティワ、ITmedia)。 人工衛星からマイクロ波を照射して対象となる地域の画像データを取得。続いて反射で得られたマイクロ波の特性と取得した画像をUtilisが独自開発したAIで分析、それにより半径100mの範囲の漏水カ所を特定。そのデータを元にして水道管の敷設データを元にして実地調査を人の手で行ったとしている。
人工知能(AI)を用いた画像認識技術は自動運転車や防犯システムなどさまざまな分野で活躍していますが、最先端のパフォーマンスを実現するディープラーニングを用いた画像認識モデル「InceptionNet」であっても、画像を正しく認識できないケースが多々あります。スタンフォード大学で機械学習やAIについて研究するアブバカル・アビド氏は、「最先端の画像認識モデル(InceptionNet)でも正しく認識できなかった画像」をまとめており、まだまだAIが人間並みの認識能力を有することは難しいと実感できます。 What Inception Net Doesn't See – Abubakar Abid – Zou Group @Stanford https://abidlabs.github.io/Inception-Blindspots/ ◆1:逆さまの車 自動車が逆さまに写っている場合、画像認識モデ
どうも、まさとらん(@0310lan)です! 今回は、JavaScriptで機械学習モデルを手軽に扱える便利なライブラリをご紹介します! わずかなプログラムで静止画像やWebカメラからのリアルタイムな映像を解析して「手」を検出できるのが特徴です。JavaScriptライブラリを読み込むだけですぐに使えるので、HTMLファイル1つあればブラウザ上で実行できるのも魅力的です。 手の動きを利用したWebアプリを簡単に開発できるので、機械学習にご興味ある方はぜひ参考にしてみてください! なおJavaScriptの基本は、paizaラーニングの「JavaScript入門編」で学ぶことができます。 【 Handtrack.js 】 ■「Handtrack.js」で実現できること 使い方を解説する前に、まずは「Handtrack.js」でどのようなことが実現できるのかサンプル例を見ていきましょう。 「H
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く