並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 1703件

新着順 人気順

recognitionの検索結果281 - 320 件 / 1703件

  • OpenAIの音声認識モデルWhisperを利用し、オーディオやビデオファイルの音声をテキストへ変換してくれるMacアプリ「AI Transcription」がリリース。

    OpenAIの音声認識モデルWhisperを利用し音声をテキストへ変換してくれるMacアプリ「AI Transcription」がリリースされています。詳細は以下から。 ChatGPTなどを開発するOpenAIは2022年09月、Web上から収集した68万時間にも及ぶ音声データを利用し学習させた自動音声認識(ASR: Automated speech recognition)システム「Whisper」を公開しましたが、このWisperを利用し、音声をテキストへ変換してくっるMacアプリ「AI Transcription」が新たにリリースされています。 Turn audio into text! AI Transcription uses advanced Speech Recognition to transcribe your audio and video files in a bli

      OpenAIの音声認識モデルWhisperを利用し、オーディオやビデオファイルの音声をテキストへ変換してくれるMacアプリ「AI Transcription」がリリース。
    • WebXR ( WebVR/WebAR ) の現状確認 2021 Summer

      @ikkou a.k.a HEAVEN chan です。本エントリは #CEDEC2021 で発表した「コロナ禍における WebXR ( WebVR/WebAR ) のイマ!」のフォローアップエントリです。 資料は Speaker Deck に公開済みですが、Speaker Deck はその仕様上、リンクがなくなってしまうため、関連するリンクや、時間の都合で省かざるを得なかった情報を記載しています。 WebXR とはなにか? WebXR そのものを定める『標準仕様』はありません。 関連する JavaScript API WebXR Device API については後述します。 WebXRの定義 “私は” WebXR の次のように定義しています。 ブラウザを通した VR 体験を WebVR、同 AR 体験を WebAR と定義し、それらの総称を WebXR と定義する WebXR Devic

        WebXR ( WebVR/WebAR ) の現状確認 2021 Summer
      • 機械学習で「似ているヘアスタイル」を見つける手法 〜 Yahoo! BEAUTYでの実装事例

        ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。CTO直下のR&D組織であるテックラボにて、メディア処理系の研究開発に取り組んでいる志賀と三浦です。本記事ではYahoo! BEAUTYにおける「似ているヘアスタイル」表示機能の性能を改善した方法を紹介いたします。 Yahoo! BEAUTYと「似ているヘアスタイル」 Yahoo! BEAUTYは「好みのヘアスタイルからスタイリストを探せて出会えるサービス」として2019年12月にスタート。ヘアスタイルに関する検索、ヘアスタイル写真、スタイリスト情報、ヘアサロン情報などの機能やコンテンツを提供しています。 ユーザーが好みのヘアスタイルを見つけるための機能のひとつとして提供されているのが、ヘアスタイル詳細画面で表示された

          機械学習で「似ているヘアスタイル」を見つける手法 〜 Yahoo! BEAUTYでの実装事例
        • Whisperの音声認識精度および認識速度の検証 - RevComm Tech Blog

          TL;DR🤩 音声認識器Whisperの認識精度と認識速度について調査 認識精度 英語では論文同様の結果 日本語の認識精度はドメインに依存 baseモデルの推論がドメインにより不安定 ビームサーチの利用により、推論の頑健性が向上 largeモデルのCERはbaseモデルの半分程度 認識速度 baseモデルのRTFはGPUで0.104 largeのRTFは0.408 バッチサイズなどを最適化することで改善 こんにちは。RevCommのリサーチチームでインターンをしている中田亘です。 2022年9月21日にOpenAIからWhisperと呼ばれる音声認識器が一般に公開されました。今回は、Whisperの性能に関して調査を行ったので紹介します。 TL;DR🤩 Whisperとは 実験と結果 実験条件 認識精度 英語でのWER LibriSpeech test-clean test-other

            Whisperの音声認識精度および認識速度の検証 - RevComm Tech Blog
          • 画像認識の最新SoTAモデル「Noisy Student」を徹底解説!

            3つの要点 ✔️ その1  ImageNetでTop-1 Acc. 88.4 %を叩き出し、SoTAモデル。おまけに高いロバスト性を兼ね備える。 ✔️ その2  Self-trainingにおいてStudentに強いノイズをかけ、反復的にTeacherとStudentを入れ変える。 ✔️ その3  TeacherおよびStudentのベースモデルはEfficientNet(解説)を使用し、EfficentNet-L2という拡張モデルでSoTA Self-training with Noisy Student improves ImageNet classification written by Qizhe Xie, Minh-Thang Luong, Eduard Hovy, Quoc V. Le (Submitted on 11 Nov 2019 (v1), last revised 7

              画像認識の最新SoTAモデル「Noisy Student」を徹底解説!
            • 5 Things You Need to Do After Updating to Windows 11

              Just got a shiny new Windows 11 PC? Don't dive in just yet; be sure to get these things squared away first. Setting up your new Windows 11 system is pretty easy; all you need to do is click through various dialog boxes and adjust a few things. But don’t be deceived. While the entire process seems straightforward, you need to modify a few things to ensure it’s ready for use. Remember, Microsoft's d

                5 Things You Need to Do After Updating to Windows 11
              • 『イラストで読む AI 入門』読書メモ 01 : AI ブームの歴史 (パーセプトロン, バックプロパゲーション, ディープラーニング) - Qiita

                AI というネーミング AI は Artificial Intelligence (人工知能) の略で、 1956 年のダートマス会議で生まれた言葉。 アメリカの認知科学者の ミンスキー がダートマス大学で 『The Dartmouth Summer Research Project on Artificial Intelligence』(人工知能に関するダートマスの夏期研究会)という名前の学会を開催した。 ここで世界で初めて「人工知能」という言葉が使われた。 ↓「人工知能の父」と呼ばれる ミンスキー 氏 (写真は ウィキペディア『マービン・ミンスキー』 より) 『人工の知能』って、すごい名前を付けましたね! 人工の知能。強そう。 本に戻ります。 この命名からは、機械に言語を扱えるようにさせる自分たちの研究により、機械がいずれ人間の知能に追い付くのだという意気込みが感じられると思います。

                  『イラストで読む AI 入門』読書メモ 01 : AI ブームの歴史 (パーセプトロン, バックプロパゲーション, ディープラーニング) - Qiita
                • 和田卓人(t_wada)さんによる『TDDワークショップ』をマネーフォワードと共同で開催しました! - SMARTCAMP Engineer Blog

                  スマートキャンプで Biscuet を作っているエンジニアの中川です。 本記事は2月5日に弊社で開催したTDDワークショップについて紹介します! TDD: テスト駆動開発のこと。テスト駆動開発とは、テストファーストとして初めにテストコードを書き、その後テストをパスするコードを実装し、さらにその後コードをリファクタリングして良くする、というサイクルを回していく開発手法のこと。 今回のワークショップはマネーフォワードと共同開催し、合計20名のエンジニアが参加しました! また、講師としてテスト駆動開発の第一人者である和田卓人(@t_wada)さんにお越しいただきました。 本日はスマートキャンプ株式会社様および株式会社マネーフォワード様にお招きいただき、1日コースのTDDワークショップを開催させていただきました。午後の演習とコードレビューでは鋭い質問がたくさん飛び出し、議論が盛り上がりました。ご参

                    和田卓人(t_wada)さんによる『TDDワークショップ』をマネーフォワードと共同で開催しました! - SMARTCAMP Engineer Blog
                  • 7 Great Apple Watch Apps to Boost Your Productivity

                    If you have an Apple Watch, these apps help you keep track of tasks, bits of information, and much more. Whether you’re an Apple Watch owner or are thinking about making the purchase, chances are that you want the Apple Watch to improve your daily workflow and routine. With the explosion of apps in the Watch App Store, your wearable productivity options have never been greater. Here are the top Ap

                      7 Great Apple Watch Apps to Boost Your Productivity
                    • Order Moxal 250mg safely. Where to Buy Amoxicillin Guaranteed Shipping - Ask Lesko and Friends

                      Order Moxal 250mg safely. Where to Buy Amoxicillin Guaranteed Shipping Buy Moxal for Sale Cost Of Generic Moxal, How To Buy Moxal Online Tips BUY Moxal ONLINE! - CLICK HERE! buy original moxal 500mg http://order-norfloxacin-no-rx.soup.io high quality generic moxal online cheap http://naltrexone-50mg-buy.tumblr.com can you buy moxal online in usa generic moxal reviews where to buy buy moxal czech r

                      • IBMが顔認識市場から撤退を表明、「テクノロジーが差別と不平等を助長することを懸念」

                        by Steven Lilley IBMが「テクノロジーが差別と人種的不平等を助長するために使われている」という懸念を発表し、汎用(はんよう)的な顔認識技術の市場から撤退する方針を発表しました。 IBM CEO's Letter to Congress on Racial Justice Reform - THINKPolicy Blog https://www.ibm.com/blogs/policy/facial-recognition-susset-racial-justice-reforms/ IBM to withdraw from the facial recognition market out of profiling fears - CNET https://www.cnet.com/news/ibm-to-withdraw-from-the-facial-recogni

                          IBMが顔認識市場から撤退を表明、「テクノロジーが差別と不平等を助長することを懸念」
                        • Running LLaMA 7B and 13B on a 64GB M2 MacBook Pro with llama.cpp

                          Running LLaMA 7B and 13B on a 64GB M2 MacBook Pro with llama.cpp See also: Large language models are having their Stable Diffusion moment right now. Facebook's LLaMA is a "collection of foundation language models ranging from 7B to 65B parameters", released on February 24th 2023. It claims to be small enough to run on consumer hardware. I just ran the 7B and 13B models on my 64GB M2 MacBook Pro! I

                            Running LLaMA 7B and 13B on a 64GB M2 MacBook Pro with llama.cpp
                          • Inpaintingからディープラーニング、最新のGAN事情について学べる本を書いた - Qiita

                            3~4ヶ月かけてA4・195ページの薄くない薄い本を書きました。タイトルは『モザイク除去から学ぶ 最先端のディープラーニング』です。TensorFlow2.0全対応です。 Inpaintingとは 画像の一部を塗りつぶしてもっともらしく画像を復元するタスク。画像全体ではなく、白く塗りつぶした部分の生成を目標とします。 画像:https://github.com/JiahuiYu/generative_inpaintingより 関連: * GLCICで無かったことにしたいアレコレ(GANを使った画像生成を Globally and Locally Consistent Image Completion で理解してみる) * 【論文読み】Image Inpainting for Irregular Holes Using Partial Convolutions ※Inpaintingという言

                              Inpaintingからディープラーニング、最新のGAN事情について学べる本を書いた - Qiita
                            • エッジAIを加速する「Jetson」、次モデルは「Nano Next」と「Orin」に

                              エッジAIを加速する「Jetson」、次モデルは「Nano Next」と「Orin」に:GTC Digital(1/2 ページ) NVIDIAは「GTC Digital」の講演で組み込みAI開発プラットフォーム「NVIDIA Jetson」を紹介した。AIコンピュータの他、各種SDK、NVIDIAのパートナー企業の解説を行った。 NVIDIAは2020年3月22~26日に米国サンノゼで開催予定だったユーザーイベント「GTC(GPU Technology Conference) 2020」に替えて、新型コロナウイルス感染症(COVID-19)の感染拡大に対応した完全オンラインイベント「GTC Digtal」を開催している。GTC Digtalでは、同年3月下旬から4月23日までの約1カ月間でさまざまな講演がオンラインで無料で見られるようになっている。 本稿では、これらの中から、IoT(モノの

                                エッジAIを加速する「Jetson」、次モデルは「Nano Next」と「Orin」に
                              • ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発

                                2022年にロシアがウクライナ侵攻を始めて以降、ロシアは世界中の各国から制裁を受けています。世界的なテクノロジー企業であるAmazonが、ロシアに制裁が課されたあとに同国に顔認証技術を販売したと、Amazon Web Services(AWS)の元従業員がリークしました。 Amazon breached UK’s Russia sanctions, claims ex-employee at tribunal https://www.ft.com/content/f28377a1-432b-4f29-8544-e5ec7ac1cab9 Whistleblower claims Amazon violated UK sanctions by selling facial recognition tech to Russia https://www.engadget.com/whistlebl

                                  ロシアのウクライナ侵攻後にAmazonがロシア企業に顔認識技術を提供し制裁に違反したとAWSの元従業員が告発
                                • iOSで文字認識(Text Recognition)

                                  iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeTextというタイプを指定でき、テキストを検出することができます。 このCIDetectorTypeTextやCIFeatureTypeTextはiOS 9からあるものです。 しかしこちらは文字の「領域」を検出する機能です。何が書いてあるか、までは認識できませんでした。 そこで今まではTesseract[2]というオープンソースのOCRエンジンや、SwiftOCR[3]という(おそらく個人がメンテしている)OSSしか選択肢がなかったのですが、つ

                                    iOSで文字認識(Text Recognition)
                                  • 画像から説明文を生成するShow and Tellの論文要約 - Qiita

                                    Show and Tell: A Neural Image Caption Generator Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) https://arxiv.org/abs/1411.4555 本記事で読んだのはv2 ひとことまとめ どんなもの? 画像を入力して,画像の内容を説明した自然言語の文章を生成するネットワークNICの提案 先行研究と比べてどこがすごい? 画像のエンコードにCNN,デコードにRNNを使っていて,従来手法より性能が高い 技術や手法のキモはどこ? CNNとRNNを直接つなげることで,CNNからの視覚特徴と,RNNが扱う言語特徴を同じ埋め込み空間に

                                      画像から説明文を生成するShow and Tellの論文要約 - Qiita
                                    • トランプ政治再考――進化政治学と自己欺瞞の政治的リーダーシップ/伊藤隆太 - SYNODOS

                                      はじめに 共和党の大統領候補の指名を受け、ドナルド・トランプ(Donald John Trump)は、「誰も私よりもそのシステムをよく知らない、私だけがシステムを修正できる」と述べた(1)。トランプはバラク・オバマ前大統領(Barack Hussein Obama II)がアメリカ生まれではないと批判して、人種差別的なプロパガンダを広め、世界の覇権国の最高権力を掌握するに至った。詐欺の疑惑や度重なる破産にもかかわらず、アプレンティス(The Apprentice)での役柄にみられるよう、自己欺瞞(self-deception)――他者を騙すため、自分自身が過信すること――は彼を成功したビジネスマンとして有名にしたのである(2)。 しかし、なぜこうした嘘は現実からの明白な乖離にもかかわらず成功するのだろうか。『なぜリーダーは嘘をつくのか――国際政治で使われる5つの「戦略的なウソ」』において、

                                        トランプ政治再考――進化政治学と自己欺瞞の政治的リーダーシップ/伊藤隆太 - SYNODOS
                                      • ブラジルからの帰国者から検出された新型コロナウイルスの新規変異株について

                                        国立感染症研究所 2021年1月10日 PDF 英語版 要約 感染性の増加が懸念される変異株と共通する変異を一部に有する新たな変異株が、ブラジルからの帰国者から検出された。 当該変異株については遺伝子の配列に関する情報に限られており、感染性や病原性、検査法やワクチンへの影響等は現時点では判断が困難。 当該変異株の感染者は個室での管理下におき、感染源、濃厚接触者の追跡と管理、臨床経過等を含めた積極的疫学調査を行うことが望ましい。 変異株であっても、個人の基本的な感染予防策は、従来と同様に、3密の回避、マスクの着用、手洗いなどが推奨される。 本文 2021年1月6日、国立感染症研究所は、1月2日にブラジルから到着した渡航者4名から新型コロナウイルスの新規変異株を検出した。 当該新規変異株は、B.1.1.248系統*1に属し、スパイクタンパク*2に12箇所の変異を認める。感染性の増加が懸念される

                                        • PostgreSQL 12 Released!

                                          The PostgreSQL Global Development Group today announced the release of PostgreSQL 12, the latest version of the world's most advanced open source database. PostgreSQL 12 enhancements include notable improvements to query performance, particularly over larger data sets, and overall space utilization. This release provides application developers with new capabilities such as SQL/JSON path expression

                                            PostgreSQL 12 Released!
                                          • New WebKit Features in Safari 14.1

                                            Safari 14.1 for macOS Big Sur, iPadOS 14.5, and iOS 14.5 brings new WebKit features, APIs, performance improvements, and improved compatibility for web developers. Take a look. Flexbox Gap Support Safari 14.1 now supports the gap property inside Flexbox containers, along with row-gap and column-gap. Gaps in Flexbox make it possible for web developers to create space between Flex items without reso

                                              New WebKit Features in Safari 14.1
                                            • Deprecating the unload event  |  Web Platform  |  Chrome for Developers

                                              The unload event will be gradually deprecated by gradually changing the default so that unload handlers stop firing on pages unless a page explicitly opts in to re-enable them. Deprecation timeline We noted that unload behavior would likely be subject to changes as early as January 2019, when we announced our intent to implement a back/forward cache. In parallel to the implementation work, we cond

                                                Deprecating the unload event  |  Web Platform  |  Chrome for Developers
                                              • 機械学習のためのデータ収集に新たな希望!?半教師学習の最前線!

                                                3つの要点 ✔️ 一部のクラスにラベルが付与されていないデータセットで学習する半教師学習の手法 ✔️ Consistency regularizationと呼ばれる手法で仮ラベルを付与し精度を向上 ✔️ 既存のデータセット(CIFER-10)で95%の識別精度を達成 FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence written by Kihyuk Sohn,David Berthelot,Chun-Liang Li,Zizhao Zhang,Nicholas Carlini,Ekin D. Cubuk,Alex Kurakin,Han Zhang,Colin Raffel (Submitted on 21 Jan 2020) Comments: Published by arXi

                                                  機械学習のためのデータ収集に新たな希望!?半教師学習の最前線!
                                                • 【まとめ】ディープラーニングによる環境音の認識 - Qiita

                                                  とあるきっかけで、環境音の認識(歩く音や雨の音、掃除機の音など)について、 論文を調べたので、メモとして残しておきます。 せっかくなので、精度向上の歴史を振り返る形式で、書いていきます。 データセット 精度の基準となるデータセットをご紹介します。画像の認識では、ImageNetという圧倒的な データセットがあり、性能評価で用いられます。 一方、音の認識はImageNetほど巨大ではありませんが、ESC-50というデータセットが あります。今回の基準となるESC-50の概要は以下のとおりです。 犬の鳴き声やドアのノック音など50種類、2000個の音源を収録 音源の長さは5秒間 精度評価をするときは、学習用とテスト用に分けて(5-foldなど)それぞれ評価 音の前処理 画像の前処理は、通常255で割れば良く、非常に簡単です。 一方、音の前処理は通常logmelを用います。logmelで処理する

                                                    【まとめ】ディープラーニングによる環境音の認識 - Qiita
                                                  • 体の動きや音声入力でアプリケーションをハンズフリー操作したりプログラミングしたり文章を書いたりしてみる

                                                    この記事は、体の動きとか音声入力でアプリケーションを操作したり、プログラミングをするにはどうすればいいかということをいろいろ実験してみた記事です。 この記事には、実用性があるものと現実的に使うにはトレーニングが必要なものが混在しています。そのため、そこまで期待してはいけません。 この記事は、TalonとmacOSの音声入力で書いたものを手作業で修正しています。 マイクはBlue Microphones Yeticasterを使いました。 きっかけ t_wadaさんが老眼について書いていたのが、この記事を書いたきっかけの一つです。 プログラマ35歳定年説はとっくに過去のもので、35歳を過ぎても能力も報酬も伸び続けるし、生涯現役プログラマのロールモデルとなる方も増えてきた。ただ諸先輩方から聞いた話をまとめると、ベテランプログラマの前に立ち塞がるのは「老眼」で、こればかりは本当に恐ろしい。何か対

                                                      体の動きや音声入力でアプリケーションをハンズフリー操作したりプログラミングしたり文章を書いたりしてみる
                                                    • Adobeの永続ライセンス版「Lightroom 6」は崩壊しつつあるとの指摘

                                                      Adobeが開発・販売する「Adobe Photoshop Lightroom」は写真編集用のソフトウェアであり、2015年に永続ライセンス版の「Lightroom 6」が発売されました。ところが2020年12月に入って以降、「Lightroom 6で一部の機能を使おうとするとクラッシュしてしまう」といった報告が上がっており、「Lightroom 6は永続的とはいえない」と報じられています。 Lightroom Classic: v6.10 crashes in the facial recognition Modul | Adobe Photoshop Family https://feedback.photoshop.com/conversations/lightroom-classic/lightroom-classic-v610-crashes-in-the-facial-reco

                                                        Adobeの永続ライセンス版「Lightroom 6」は崩壊しつつあるとの指摘
                                                      • GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ

                                                        拙著『グラフニューラルネットワーク』が重版して第 3 刷となりました。皆さまありがとうございます! 拡散モデルと最適輸送でもやりましたが、漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。 本稿では、ICLR 2024(5/7 - 5/11 @ウィーン)で発表されたグラフニューラルネットワーク (GNN) 関連の研究動向を紹介します。 ICLR 2024 で発表された GNN 関連の論文は全部で 170 本です。凄まじい量ですね。ICLR 2024 では全て合わせて 2296 本の論文が採択されたので、7.4 パーセントが GNN 関連ということになります。この分量からも、GNN が活気ある研究対象であることが伺えます。 以下では、代表的なトピックについて

                                                          GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ
                                                        • PyCon JP 2021 で「絵を読む技術 Pythonによるイラスト解析」を発表しました - Hirosaji Tech Blog 🍙

                                                          オンライン/オンサイトのハイブリッド会場で開催されたPyCon JP 2021に、Hirosaji(エンジニア名義)とひろさじ(絵師名義)のハイブリッド名義で登壇してきました。 PyCon JP 2019 で登壇して以来、PyConには二回目の登壇です。これまでの登壇史上、最高の登壇体験でした。 今回は、登壇内容のまとめや印象に残ったセッションを、雑感を含めてまとめました。 イベント概要 概要:日本最大級のPythonユーザカンファレンス 日時:2021年10月15日(土)~ 2021年10月16日(日) 会場:オンライン(ZOOM + Discord)/オンサイト(ベルサール神田) 公式 HP:https://2021.pycon.jp/ 登壇内容 絵を読む技術 Pythonによるイラスト解析(Hirosaji / ひろさじ, 30min) 一言で言うと、「イラストで絵師が伝えたいことを

                                                            PyCon JP 2021 で「絵を読む技術 Pythonによるイラスト解析」を発表しました - Hirosaji Tech Blog 🍙
                                                          • すごすぎ!GPT-4oをPower Apps、Power Automateで楽しんでみよう! | ドクセル

                                                            スライド概要 ■ タイトル: すごすぎ!GPT-4oをPower Apps、Power Automateで楽しんでみよう! - 日付: 2024年5月25日 - スピーカー: 出戻りガツオ(De’modori Gatsuo) - 主催: ビリビリ☆Power Apps 同好会 ### スピーカープロフィール - 名前: 出戻りガツオ(De’modori Gatsuo) - 役職: Microsoft 365 コンサルタント、インドの青鬼 語り隊 隊長 - スキル: Power Apps、Power Automate、Python、Excel VBA、Google Apps Script、RPA、Power BI、SharePoint #### セッション内容 1. テーマ紹介 - GPT-4o(オムニ)について - Azure OpenAI APIの使用方法とその事前準備 - 利用コストと

                                                              すごすぎ!GPT-4oをPower Apps、Power Automateで楽しんでみよう! | ドクセル
                                                            • 9 Of The ‘World’s Worst Logos’ Fixed By Graphic Designer Emanuele Abrate

                                                              9 Of The ‘World’s Worst Logos’ Fixed By Graphic Designer Emanuele Abrate Emanuele Abrate is a graphic designer from Italy who recently took up an interesting challenge – he decided to give 9 of the ‘world’s worst logos’ complete makeovers. You’ve probably seen some of these logos posted on various meme pages since the dawn of the internet – and the designer finally brought them to the 21st century

                                                                9 Of The ‘World’s Worst Logos’ Fixed By Graphic Designer Emanuele Abrate
                                                              • Introducing speech-to-text, text-to-speech, and more for 1,100+ languages

                                                                Introducing speech-to-text, text-to-speech, and more for 1,100+ languages Equipping machines with the ability to recognize and produce speech can make information accessible to many more people, including those who rely entirely on voice to access information. However, producing good-quality machine learning models for these tasks requires large amounts of labeled data — in this case, many thousan

                                                                  Introducing speech-to-text, text-to-speech, and more for 1,100+ languages
                                                                • 顔認識と指紋認証でミリ秒単位で引き金をロックする世界初の「スマートガン」 - ナゾロジー

                                                                  近未来を扱ったSF映画やゲームには、生体認証付きの銃が度々登場してきました。 そしてこの技術は、今や現実のものとなっています。 アメリカ・コロラド州を拠点とするスタートアップ企業「バイオファイアー・テクノロジーズ(Biofire Technologies)」が、顔認証と指紋によるロック機能を備えたスマートガンを発表し、アメリカで予約注文が開始されたのです。 これによって銃の誤った使用を防ぎ、特に子供たちの命を守ることができるかもしれません。 Is this the future of gun safety? World’s first ‘Smart Glock’ with facial recognition and fingerprint unlock to launch for $1,500 https://www.dailymail.co.uk/sciencetech/article

                                                                    顔認識と指紋認証でミリ秒単位で引き金をロックする世界初の「スマートガン」 - ナゾロジー
                                                                  • 変顔を登録すると顔認証のセキュリティが強化される、との研究結果

                                                                    変顔を登録すると顔認証のセキュリティが強化される、との研究結果2021.03.29 07:0012,026 Andrew Liszewski - Gizmodo US [原文] ( 岩田リョウコ ) コンビニで支払いの度に変顔するのかな。 顔認証が普及して、PINナンバーやパスワードを覚える必要がなくなってきたのはすごく便利ですよね。AppleのFaceID=顔認証は、TrueDepthカメラシステムでユーザの顔の形状を正確に読み取るため、セキュリティツールとしてかなり高度な技術だと言われています。 たとえばカメラの前にその本人の顔の写真をかざしたとしても認証されない強いシステムなんです。でも抜け道ってあるんですよ。寝ている人や意識のない人の顔にメガネをかけさせて顔認証がアンロックできちゃうというリサーチ結果も出ているんです。 エンジニアの教授たちがそういったケースを回避するために提案した

                                                                      変顔を登録すると顔認証のセキュリティが強化される、との研究結果
                                                                    • 2020年1月1日以降に「日付を誤認識」する不具合、Splunkが公開

                                                                      Splunkは2019年11月27日(現地時間)、ITシステム運用管理のためのマシンデータ分析プラットフォーム「Splunk」で見つかった不具合の原因と対策について発表した。2020年に入ると同時に全製品で発生する恐れがある。特定の日付を過ぎると日付を誤認識して処理を誤るという点では「2000年問題」と同じパターンだといえる。 Splunkによると、今回公開したパッチを適用していないSplunkプラットフォームでは2種類の不具合が発生する。 2020年1月1日から、Splunkプラットフォームインスタンスは、日付に2桁の年を含むイベントのタイムスタンプを認識できなくなる。この基準を満たすデータに対して、不正確なタイムスタンプを付けてインデックスを作成してしまう 2020年9月30日午後12時26分39秒(UTC:協定世界時)から、Splunkプラットフォームインスタンスは、UNIX時間に基

                                                                        2020年1月1日以降に「日付を誤認識」する不具合、Splunkが公開
                                                                      • 凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発

                                                                        凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発高精度のくずし字AI-OCRを搭載し、古文書・古典籍をオンライン上で簡単に解読できるシステム。共同作業をサポートし、コロナ禍における学習や研究、イベントなどに活用可能 凸版印刷株式会社(本社:東京都千代田区、代表取締役社長:麿 秀晴、以下 凸版印刷)は、高精度のくずし字AI-OCRを搭載し、古文書・古典籍をオンライン上で簡単に解読できるシステム「ふみのはゼミ」を開発しました。 授業やイベントでの活用を想定したグループワーク支援機能により、歴史的資料のデジタルアーカイブ化を推進するとともに、コロナ禍における学習・研究の拡大に貢献します。 「ふみのはゼミ」を活用した共同解読作業のイメージ 本サービスは、凸版印刷が2015年から研究・実証試験を行ってきたくずし字OCRをさらに発展させ、凸版印刷総合研究所が開発したAI-OCRの導入による文字

                                                                          凸版印刷、くずし字解読支援システム「ふみのはゼミ」を開発
                                                                        • 60+ Logo Design Stats and Facts – New Fortune 500 List Research (2021) - One987 Creative Services

                                                                          Just how much do you know about logos? There are so many “best practices” in logo design that it’s easy to get lost in all that knowledge. But even the most experienced designers and biggest brand enthusiasts among us can always learn something new. That’s why we’ve done the research and are here to shake things up with the most up-to-date logo statistics from the Fortune 500 list. Along with insi

                                                                            60+ Logo Design Stats and Facts – New Fortune 500 List Research (2021) - One987 Creative Services
                                                                          • 謎に包まれた微生物「ユーグレナ藻」が初めて化石の中に発見される

                                                                            ユーグレナ藻とは、さまざまな生き物の融合体として知られる単細胞真核生物の一種で、植物のような光合成と、動物のような捕食とを合わせてエネルギーを得ています。ユーグレナ藻は約10億年前に誕生したと考えられつつも、化石記録はほとんど見つかっていませんでしたが、国際的な科学者チームが「発表済みの論文の中にユーグレナ藻の化石を発見した」と主張しています。 Recognition of an extended record of euglenoid cysts: Implications for the end-Triassic mass extinction - ScienceDirect https://www.sciencedirect.com/science/article/pii/S0034666723002129 Microfossils shed light on the long fo

                                                                              謎に包まれた微生物「ユーグレナ藻」が初めて化石の中に発見される
                                                                            • ImageNet:大規模なカラー写真の画像データベース

                                                                              連載目次 データセット解説 ImageNetは、1400万枚以上もあるほど大規模な、「カラー写真」の教師ラベル付き画像データベースである。その教師ラベルは、WordNet階層*1に基づいて付与されている。スタンフォード大学のフェイフェイ・リ(Fei-Fei Li)氏を中心とした研究グループが管理しており、世界中の研究者や教育/学びに役立ててもらうためのリソースとして公開されている。 *1 WordNetとは、英語の語彙(ごい)データベースであり、synsetと呼ばれる「同義語(synonyms)セット」がツリー階層構造でグループを形成しながら定義されているのが特徴である。ImageNetでは2万以上のsynsetが採用されている。 ImageNetの歴史的な重要性 ImageNetは、歴史的に非常に有名である。2012年に開催されたImageNetの大規模画像認識コンペ「ILSVRC(Im

                                                                                ImageNet:大規模なカラー写真の画像データベース
                                                                              • 再計算でニューラルネット学習時のメモリ消費を減らす - Preferred Networks Research & Development

                                                                                エンジニアの楠本です。深層学習で再計算と呼ばれる手法を使って学習時のメモリ消費を削減する研究や実装に取り組んでいるのでその紹介をしたいと思います。 背景 大規模なニューラルネットの学習ではしばしば誤差逆伝播(以下同様)で GPU のメモリ不足に陥ることがあります。 通常、誤差逆伝播ではパラメータについての勾配を求める際に必要な順伝播の計算結果を (途中の計算結果も含めて) すべて覚えた状態で勾配計算を行います。 一方で、例えばコンピュータビジョンの重要なタスクであるセグメンテーションや物体検出では入力画像として高解像度のものがしばしば扱われます。モデルについても高精度を達成するために複雑なネットワーク設計、すなわち層が深くまた中間表現のチャンネル数の多いネットワークが使われることが少なくありません。 このように入力やモデルが巨大である場合には記憶しておくべき途中の計算結果全体が巨大になり、

                                                                                  再計算でニューラルネット学習時のメモリ消費を減らす - Preferred Networks Research & Development
                                                                                • 音声認識とは | 基本知識、仕組み、ディープラーニングとの関係、活用事例 | Ledge.ai

                                                                                  サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                                                    音声認識とは | 基本知識、仕組み、ディープラーニングとの関係、活用事例 | Ledge.ai