並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 1704件

新着順 人気順

recognitionの検索結果321 - 360 件 / 1704件

  • 音声認識とは | 基本知識、仕組み、ディープラーニングとの関係、活用事例 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

      音声認識とは | 基本知識、仕組み、ディープラーニングとの関係、活用事例 | Ledge.ai
    • Engadget | Technology News & Reviews

      Some of our favorite Bose headphones and earbuds are back to all-time low prices

        Engadget | Technology News & Reviews
      • Large language models are having their Stable Diffusion moment

        Large language models are having their Stable Diffusion moment 11th March 2023 The open release of the Stable Diffusion image generation model back in August 2022 was a key moment. I wrote how Stable Diffusion is a really big deal at the time. People could now generate images from text on their own hardware! More importantly, developers could mess around with the guts of what was going on. The res

          Large language models are having their Stable Diffusion moment
        • 「マスク非着用者を顔認識AIで探し出す」ツールが新型コロナウイルスのまん延する中国で開発される

          2019年12月に中国の武漢で発生した新型コロナウイルス感染症は世界中に感染が拡大しており、中国当局は公共エリアでのマスク着用を強制しています。そんな中、中国の検索大手である百度(Baidu)が、マスクをつけずに外出している人を人工知能(AI)で識別して探し出すオープンソースツールを開発しました。 Baidu releases open-source tool to detect faces without masks · TechNode https://technode.com/2020/02/14/baidu-open-source-face-masks/ Baidu Releases AI to Identify People Who Don't Wear Masks Amid Coronavirus https://interestingengineering.com/baidu

            「マスク非着用者を顔認識AIで探し出す」ツールが新型コロナウイルスのまん延する中国で開発される
          • TechCrunch

            This restores, with some changes and protections, the rules passed back in 2015 allowing the FCC to enforce basic rules of connectivity and fairness in broadband.

              TechCrunch
            • お馴染みの機種も沢山!【アメリカ軍装備品】陸軍航空機識別訓練用カードセット(1977年)とは?0876 🇺🇸 ミリタリー US ARMY AIRCRAFT IDENTIFICATION TRAINING CARD SET(54TYPE)1977 - いつだってミリタリアン!

              今回は、1970年代のアメリ陸軍航空機識別訓練用カードセットを分析します。 まさかこんなものまで官給品で準備していたとは驚きでした。 さすがアメリカですね! 箱は傷んでいますが、カードはデッドストックですよ! 目次 1  アメリカ陸軍航空機識別訓練用カードセット(1977年)とは? 2  全体及び細部写真です! 3  その特徴とは? 4  製造とサイズのデータです! 5  まとめ スポンサーリンク スポンサーリンク 1  アメリカ陸軍航空機識別訓練用カードセット(1977年)とは? 日本の諺(ことわざ)で「百聞は一見にしかず」というものがあります。 これは「百回の説明を聞くより、自分で一回でも見た方が確かだ!」ということでした。 確かにそれは言えますね。 特に教育の場では、口で説明するより図なり写真なりを見せた方が理解が進んだり、早く覚えさせることができるかもしれません。 今回のモデルは、

                お馴染みの機種も沢山!【アメリカ軍装備品】陸軍航空機識別訓練用カードセット(1977年)とは?0876 🇺🇸 ミリタリー US ARMY AIRCRAFT IDENTIFICATION TRAINING CARD SET(54TYPE)1977 - いつだってミリタリアン!
              • It’s not wrong that "🤦🏼‍♂️".length == 7

                The string that contains one graphical unit consists of 5 Unicode scalar values. First, there’s a base character that means a person face palming. By default, the person would have a cartoonish yellow color. The next character is an emoji skintone modifier the changes the color of the person’s skin (and, in practice, also the color of the person’s hair). By default, the gender of the person is und

                • Parsing SQL - Strumenta

                  The tomassetti.me website has changed: it is now part of strumenta.com. You will continue to find all the news with the usual quality, but in a new layout. The code for this tutorial is on GitHub: parsing-sql SQL is a language to handle data in a relational database. If you worked with data you have probably worked with SQL. In this article we will talk about parsing SQL. It is in the same league

                    Parsing SQL - Strumenta
                  • Replit — CLUI: Building a Graphical Command Line

                    “Command line interfaces. Once that was all we had. Then they disappeared, replaced by what we thought was a great advance: GUIs. GUIs were - and still are - valuable, but they fail to scale to the demands of today's systems. So now command line interfaces are back again, hiding under the name of search. Now you see them, now you don't. Now you see them again. And they will get better and better w

                      Replit — CLUI: Building a Graphical Command Line
                    • MNTSQの契約書解析を支える技術|Yotaro Katayama

                      こんにちは!リーガルテックベンチャーのMNTSQの取締役をしている堅山と申します。 面接等で、そもそもリーガルテックってどんなタスクを解いているの?という疑問をいただくことが多いです。今回は、前回の記事に続き、MNTSQでどのような問題に取り組んでいるかを書こうと思います。 MNTSQでは、法律事務所向けに「法務デューデリジェンス」という業務を効率化するプロダクトを作っています。法務デューデリジェンスとは、M&Aなどをするにあたって、対象となる会社のリスクを法的な面から評価する作業です。具体的には会社の結んでいる契約書などの法的な効果を持つ書類をまるっと読み込んでリスクである内容をまとめていきます。ほとんどの契約書は紙で締結されていますので、これらをスキャンしてもらい、主にPDFなどでデータを受領します。ある程度のサイズの会社であればドキュメントの数は数千に達し、負荷のかかる作業です。多く

                        MNTSQの契約書解析を支える技術|Yotaro Katayama
                      • 口パクで長文の音声入力ができるメガネ型デバイス 立命館大が開発

                        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 立命館大学とデジタルスピリッツテック社の五十嵐雄也、双見京介、村尾和哉らが発表した論文「Silent Speech Eyewear Interface: Silent Speech Recognition Method using Eyewear with Infrared Distance Sensors」は、口パク(無声発話)による音声入力が行えるメガネ型デバイスと耳掛け型マイクデバイスを提案した研究報告である。 これまでにも口パクで音声入力できるサイレント・スピーチ・インタラクション(SSI)の研究は多数報告が上がっており、例えば、口パクで音声入力できるマスクやイヤフォン、顎下2カ所

                          口パクで長文の音声入力ができるメガネ型デバイス 立命館大が開発
                        • 出来栄えはほぼ完璧!ワンクリック起動で手軽な文字起こしアプリ「toruno」【今日のライフハックツール】 | ライフハッカー・ジャパン

                          音声認識・文字起こしアプリが人気です。無料・有料含め、すでに多くのアプリがリリースされており、ざっと数えただけでも20を超えます。 筆者の場合、メールや記事を書く際は「Win+H」で立ち上がる、Windows OSに備わっている機能を重宝しています。音声認識の精度が飛躍的に向上したのはつい最近のことですが、おかげでキーボード入力が減らせて便利。 一方、取材で録音したインタビューの書き起こしは、もっぱら「notta」を使用しています。こちらは有料で、月額使用料は2000円。1年分の一括払いでは40%オフとなり、月あたり1200円の金額となります。 ICレコーダーで録った音声ファイルはインポート機能で、オンライン取材では、リアルタイムでテキスト化できます。 ワンクリックで起動する手軽さ「toruno」さて、今回紹介するのは、それらとはやや別のコンセプトで開発された、リコーの「toruno(トル

                            出来栄えはほぼ完璧!ワンクリック起動で手軽な文字起こしアプリ「toruno」【今日のライフハックツール】 | ライフハッカー・ジャパン
                          • オランダ・ユトレヒト大学、採用・昇進の決定においてインパクトファクターによる評価を廃止へ(記事紹介)

                            Nature誌のオンライン版に、2021年6月25日付けで記事“Impact factor abandoned by Dutch university in hiring and promotion decisions”が掲載されています。オランダ・ユトレヒト大学が、採用・昇進の決定においてインパクトファクターによる評価を正式に廃止することを紹介しています。 2022年初頭までに、同大学の全学部において、インパクトファクターとは異なる指標に基づく評価が導入されるとしています。指標の例として、チームワークへの貢献、オープンサイエンスの推進への尽力を挙げています。 記事では、標準的な指標であるインパクトファクターに基づく評価の廃止が、同大学から他大学に移籍する教員に不利益をもたらす可能性についても指摘しています。今回の取組に携わる同大教授のPaul Boselie氏はこの指摘に対し、若手研究者

                              オランダ・ユトレヒト大学、採用・昇進の決定においてインパクトファクターによる評価を廃止へ(記事紹介)
                            • Google Cloud上でGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみた | DevelopersIO

                              こんちには。 データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。 この記事は、ブログリレー『Google CloudのAI/MLとかなんとか』の3本目の記事になります。 今回は、Vertex AIからGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみたいと思います。 Chirpについて 以下に詳しい説明があります。 Chirp: Universal speech model  |  Cloud Speech-to-Text V2 documentation  |  Google Cloud ChirpはGoogleの次世代音声認識モデルで、現在の音声モデルとは異なるアーキテクチャで学習させたモデルとなっているようです。 Google CloudではCloud Speech-to-Text V2における一つのモデルとして使用できます。その他

                                Google Cloud上でGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみた | DevelopersIO
                              • GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node

                                Vosk is an offline open source speech recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish. More to come. Vosk models are small (50 Mb) but p

                                  GitHub - alphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
                                • 料理の動画を見るだけでその料理を再現できる「ロボットシェフ」の実験に成功したことが報告される

                                  複数のレシピを学んだロボットに、そのうちの1つのレシピに関する料理動画を見せると、そのレシピを再現して調理を行う「ロボットシェフ」をケンブリッジ大学の研究チームが開発しました。また、このロボットシェフはレシピの再現だけでなく、オリジナルのレシピを考案したことが報告されています。 Recognition of Human Chef’s Intentions for Incremental Learning of Cookbook by Robotic Salad Chef | IEEE Journals & Magazine | IEEE Xplore https://doi.org/10.1109/ACCESS.2023.3276234 Robot 'chef' mimics recipes from food videos https://www.newswise.com/article

                                    料理の動画を見るだけでその料理を再現できる「ロボットシェフ」の実験に成功したことが報告される
                                  • [初心者向け] Amazon Polly を使って ChatGPT を体感してみる | DevelopersIO

                                    こんにちは、森田です。 本記事では、今話題の ChatGPT についてちょっと触ってみたいと思います。 やりたいこと 皆さんもご存知のように、ChatGPT は、自然に会話ができるAIとなっております。 また、OpenAI社は上記の ChatGPT 以外にも 音声認識を行うことができる Whisper も提供しております。 せっかくなので、これら2つを手っ取り早く体験できないかなと考え、 実際にユーザの話した音声を Whisper で認識して、ChatGPT で回答文を作成することにしてみました。 さらに、この回答文も、Amazon Polly を使って、読ませてみたいと思います。 構成 以下のような構成で作成します。 事前準備 OpenAI社のAPIを利用しますので、まずは、APIの発行まで済ませておきましょう。 https://platform.openai.com/signup 実行

                                      [初心者向け] Amazon Polly を使って ChatGPT を体感してみる | DevelopersIO
                                    • 描写の哲学ビギナーズガイド - obakeweb

                                      絵、写真、映画、アニメ、広告、ポスター、地図、ビデオゲーム、デザイン……。画像[picture]ないし画像的[pictorial]なものは、生活のいたるところにある。 本記事は、近年ますます盛り上がりを見せている「描写の哲学[philosophy of depiction]」についてのまとめです。 そもそも画像はなんなのか、なにをしているのか、なにがそんなに面白いのか。 「描写の哲学」とは、画像にまつわるあれこれを紐解こうとする、哲学・美学分野です。 今回はビギナーズガイドということで、哲学・美学が専門でない人にも①どんなトピックが争われていて、②どの論者がなにを主張しているのか、なんとなく分かっていただける内容を目指しています。 「描写の哲学」の紹介は割に進んでいて、日本語で読める文献も少なくない。よって、本記事はまとめのまとめ、サーベイのサーベイとしても使える。もっと踏み込んだ内容が知

                                        描写の哲学ビギナーズガイド - obakeweb
                                      • 【Kaggle】2020年に開催された画像分類コンペの1位の解法を紹介します - Qiita

                                        Kaggle Advent Calenderの14日目の記事です。13日目はあらいさんの記事「CompetitionだけではないKaggleの魅力」でKaggleのCompetition以外の部分を非常にわかりやすくまとめてくださっています。15日目はちずちずくんの記事「機械学習実験環境を晒す」で、こちらもとても勉強になりましたのでぜひご覧ください。 私の記事では2020年にKaggleで開催された画像分類コンペの1位の手法を振り返っていきたいと思います。コンペ終了後に金メダルだったチームが共有してくれる解法はどれも勉強になりますが、1位のチームはその中でも特に磨きがかかっているものが多いと思います。この記事ではコンペの概要や難しかったところをまとめつつ、金メダルの中でも特に差を分けて1位になったところを私なりに分析できればと思っています。 ホントは画像を含むすべてのコンペを紹介したかった

                                          【Kaggle】2020年に開催された画像分類コンペの1位の解法を紹介します - Qiita
                                        • “顔認識されない”使い捨てマスク AIがオーダーメイドで柄を作成

                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 イスラエルのBen-Gurion University of the NegevとイスラエルのTel Aviv Universityによる研究チームが開発した「Adversarial Mask: Real-World Universal Adversarial Attack on Face Recognition Models」は、カメラで捉えた顔を認識するシステムにおいて、検出されないようにする特殊なマスクだ。 紙製および布製のフェイスマスクに深層学習で計算し作成した敵対的なパターンを印刷することで実現する。実験において、このマスクを着用することで約96%以上の精度で誤認識させることがで

                                            “顔認識されない”使い捨てマスク AIがオーダーメイドで柄を作成
                                          • 運転版の"Sora"を作る: 動画生成の世界モデルTerraの開発背景

                                            1. はじめに Turing生成AIチームの荒居です。生成AIチームでは、完全自動運転の実現に向けて、現実世界の複雑な状況を理解し予測する動画生成AI、「世界モデル」の開発に取り組んできました。前回の私の記事では、その取り組みの中で調査したGAIA-1の紹介を行いました。今回は、Turingが開発した世界モデル"Terra"で利用している技術や課題・展望などについて紹介をしたいと思います。 この記事で解説している内容 世界モデルTerraは何ができるのか 世界モデルTerraはどのような仕組みで動いているのか どのような課題が残されているか Terraで生成した動画。Terraは運転環境に特化しており、車載カメラの一人称視点動画の生成を行うことができる 2. 世界モデルTerraは何ができるのか? Turingの世界モデルは大きく分けて二つのことができます。一つ目は短い動画を与えるとその続

                                              運転版の"Sora"を作る: 動画生成の世界モデルTerraの開発背景
                                            • 人文学のためのテキストデータ構築の国際デファクト標準、初の日本語による入門書 - digitalnagasakiのブログ

                                              https://bungaku-report.com/blog/2022/07/tei1.html 初めての日本語によるTEIガイドラインの入門書が刊行されました。『人文学のためのテキストデータ構築入門』[1]というタイトルで、株式会社文学通信によるものです。TEI ガイドラインは、人文学のためのテキストデータ構築におけるデファクト標準として国際的に普及しており、とくに欧米先進国ではこれに準拠したテキストデータの膨大な蓄積があるが、日本語文化圏においては諸般の事情により普及が進んでいなかったものです。日本語文化圏でも、TEI ガイドラインに取り組むにあたっては Web に様々な情報が各所に蓄積されて点在しており、検索すれば必要な情報は大体集まる形になっていました。とはいえ、Web の海に浮かぶそれらは、論文であったり、Web コラボレーションシステムに組み込まれたサイトであったり、英語で書

                                                人文学のためのテキストデータ構築の国際デファクト標準、初の日本語による入門書 - digitalnagasakiのブログ
                                              • 2020筑波大学学長選挙

                                                アメリカ国務省は7月1日、指宿昭一弁護士を人身売買と闘う「ヒーロー」として表彰しました。当会の代理人弁護士である指宿弁護士に心より祝意を表します。 国務省のセレモニーのビデオはこちらをご覧ください。 人身売買と闘う「ヒーロー」に指宿弁護士 技能実習生支援 米国務省(毎日新聞 7/2) Mr. Shoichi Ibusuki Honored as a Hero in the US Department of State’s 2021 Trafficking in Persons Report, July 1, 2021 The State Department honored Mr. Ibusuki in recognition of “his relentless persistence in advocating for the rights of foreign workers in

                                                  2020筑波大学学長選挙
                                                • 5 Ways Apple Is Securing Your Device Right Now

                                                  Apple is known for its strong security measures, but why? What does the company do to actually look after your devices? Apple devices are known for their high levels of security. If you’re worried about tracking, hacking, or malware, buying an Apple product is supposed to keep you safe from these threats. But what is it that makes Apple products different? Are they actually better designed? Or is

                                                    5 Ways Apple Is Securing Your Device Right Now
                                                  • PowerPoint Presentation

                                                    Executive Perspectives The Future of Sales and Marketing Is Here February 2022 Executive Perspectives 1. Metaverse market proxied by 'extended reality' - a term referring to all real-and-virtual combined environments and human-machine interactions generated by computer technology and wearables. Note: Augmented reality (AR) adds digital elements to a live view often by using the camera on a smartph

                                                    • イスラエル軍が顔認証システムや街中の監視カメラを展開してパレスチナ人の監視を加速している

                                                      近年は「地下鉄の運賃を顔認証で決済するシステム」や「学校の食堂での支払い処理を顔認証で行うシステム」など、さまざまな場面で顔認証システムの導入が進められている一方、プライバシーに関する問題も提起されています。そんな中、イスラエルとヨルダンの間に位置するヨルダン川西岸地区では、イスラエル軍がパレスチナ人を監視するために大規模な顔認証システムを展開していると、アメリカの日刊紙であるワシントン・ポストが報じています。 Israel escalates surveillance of Palestinians with facial recognition program in West Bank - The Washington Post https://www.washingtonpost.com/world/middle_east/israel-palestinians-surveillan

                                                        イスラエル軍が顔認証システムや街中の監視カメラを展開してパレスチナ人の監視を加速している
                                                      • TechCrunch | Startup and Technology News

                                                        StrictlyVC events deliver exclusive insider content from the Silicon Valley & Global VC scene while creating meaningful connections over cocktails and canapés with leading investors, entrepreneurs and executives. And TechCrunch…

                                                          TechCrunch | Startup and Technology News
                                                        • 実践!固有表現認識 ~Flairを使って最先端の固有表現認識を体験しよう~ - Ahogrammer

                                                          自然言語処理の分野で昔から研究され、実際に使われている技術として固有表現認識があります。固有表現認識は、テキスト中で固有表現が出現する位置を特定し、人名や地名などのラベルを付与するタスクです。情報抽出や質問応答、対話システムなどへの幅広い応用が可能なため、今でも盛んに研究され、使われている技術です。本記事では、日本語の固有表現認識をFlairと呼ばれるPythonパッケージを使って実現する方法について紹介します。 準備 本記事では Flair を使って固有表現認識のモデルを学習させます。Flairは最先端の自然言語処理のモデルを簡単に使い始められる形で提供してくれているパッケージです。その中で提供されている機能として、固有表現認識や品詞タグ付け、文書分類のモデルを学習するための機能があります。使い始めるために、以下のようにしてFlairをインストールしておく必要があります。 $ pip i

                                                            実践!固有表現認識 ~Flairを使って最先端の固有表現認識を体験しよう~ - Ahogrammer
                                                          • CHI2024を振り返って

                                                            ヒューマンコンピュータインタラクション研究のトップカンファレンスであるACM CHI2024がハワイで開催された (5/11–5/16)。会議に出た感想を残しておく。 AIの席巻ある程度予想はしていたがAI、LLMと人間とのインタラクションをトピックにした発表が激増していた。CHIはパラレルセッションで、同時に20セッションぐらいが並行して発表が行われている。同時刻に開催される複数のセッションタイトルにAIやLLMが入っていて、もはやすべてを見るのが不可能な状態になっていた。 AIと銘打っていないセッションでも、要素技術として機械学習を使っているものは多いので、体感では半分以上の研究発表が何等かの意味でAIを使っている感じだった。少し前までは機械学習としってもSVMやCNN、LSTMぐらいでtransformersを使っていたら新しいね、ぐらいだったのだが、LLMが状況を変えていて「誰でも

                                                              CHI2024を振り返って
                                                            • RICOH THETA + OpenCV で 360° 顔検出 - Qiita

                                                              はじめに こんにちは、リコーの @yomura_ です。 今回は RICOH THETA V に顔検出処理をさせてみました。 また、せっかくの 360° カメラなので、顔を検出した方向に応じて内蔵 LED の点灯色を変えるようにしてみました。 RICOH THETA プラグインについて THETA プラグインをご存じない方はこちらをご覧ください。 興味を持たれた方は Twitter のフォローと THETA プラグイン開発コミュニティ(Slack) への参加もよろしくお願いします。 準備 OpenCV 環境の準備 顔検出には画像処理ライブラリ OpenCV のバージョン 3.4.5 を使用しました。 THETA の中で OpenCV を動かすための環境は THETAの中でOpenCVを動かす【プレビューフレーム取得編】 の記事で詳しく紹介されています。今回はそちらの記事の環境とサンプルコー

                                                                RICOH THETA + OpenCV で 360° 顔検出 - Qiita
                                                              • Letter | Feminist Affirmation

                                                                We the undersigned organizations and individuals from across the world come together in this letter to emphasize our shared belief that to achieve justice, equality and liberation, we must combat and dismantle the patriarchal systems of power which continue to oppress and exclude many of us. ​ We affirm some key feminist principles and their alignment with issues pertaining to sexual orientation,

                                                                  Letter | Feminist Affirmation
                                                                • 2021/04/18 第6回全日本コンピュータビジョン勉強会「Transformer論文読み会」発表資料まとめ - takminの書きっぱなし備忘録 @はてなブログ

                                                                  ※(2021/04/19)shade-treeさんとlosnuevetorosさんの資料へのリンクが古かったため修正しました。 関東、名古屋、関西のコンピュータビジョン勉強会合同で開催している全日本コンピュータビジョン勉強会の6回目です。 今回は、Visionでも応用が進んできたTransformer縛りの論文読み会を行いました。 注目なテーマなだけに、たくさんの発表者/聴講者の方にご参加いただきました。ありがとうございます。 以下、リンク等をまとめます。 今回、発表資料の中には質疑応答用のSlackのみで公開されているものもありますのでご了承ください。 登録サイト kantocv.connpass.com Togetter togetter.com Youtube ※勉強会開始は動画開始から30分後 www.youtube.com 発表資料 発表者 論文タイトル 発表資料 Seitaro

                                                                    2021/04/18 第6回全日本コンピュータビジョン勉強会「Transformer論文読み会」発表資料まとめ - takminの書きっぱなし備忘録 @はてなブログ
                                                                  • G7 Leaders’ Statement | The White House

                                                                    We, the Leaders of the Group of Seven, acknowledge that the COVID-19 pandemic is a human tragedy and a global health crisis, which also poses major risks for the world economy.  We are committed to doing whatever is necessary to ensure a strong global response through closer cooperation and enhanced coordination of our efforts.  While current challenges may require national emergency measures, we

                                                                      G7 Leaders’ Statement | The White House
                                                                    • Appleの機械学習チームがAppleシリコンで機械学習モデルをトレーニング・デプロイするためのフレームワーク「MLX」をGitHubで公開

                                                                      GoogleやMeta、Microsoftなどの大手テクノロジー企業がAI開発を積極的に行っている一方、AppleはAIについて保守的であり、AI開発競争に出遅れているという見方もされています。そんなAppleが2023年12月、自社製プロセッサのAppleシリコン用の機械学習フレームワーク「MLX」をソフトウェア開発プラットフォームのGitHubで公開しました。 GitHub - ml-explore/mlx: MLX: An array framework for Apple silicon https://github.com/ml-explore/mlx Apple launches MLX machine-learning framework for Apple Silicon | Computerworld https://www.computerworld.com/artic

                                                                        Appleの機械学習チームがAppleシリコンで機械学習モデルをトレーニング・デプロイするためのフレームワーク「MLX」をGitHubで公開
                                                                      • 画像認識モデルの「盲点」を克服するための奇妙な画像ばかり集めたデータセット「ObjectNet」をMITとIBMの研究チームが公開

                                                                        人工知能(AI)を用いた画像認識モデルは、写真や映像の中に映り込む物体を正確に識別することを目的としたもので、自動運転車の外界認識機能などさまざまなものに応用されています。例えば自動運転車の場合、画像認識モデルの物体認識精度は自動運転車の安全性に直結してくるため、モデルの学習に使用するデータセットは非常に重要な役割を担うこととなります。そこで、マサチューセッツ工科大学(MIT)とIBMの研究者チームは、多種多様な物体を含んだ画像認識モデル向けのデータセット「ObjectNet」を作成しています。 This object-recognition dataset stumped the world’s best computer vision models | MIT News https://news.mit.edu/2019/object-recognition-dataset-stump

                                                                          画像認識モデルの「盲点」を克服するための奇妙な画像ばかり集めたデータセット「ObjectNet」をMITとIBMの研究チームが公開
                                                                        • 電気信号に変換せず光のまま考える!? 1秒間に20億枚の画像処理をするチップを開発! - ナゾロジー

                                                                          人間は目から映像を取り込んで脳で処理しますが、コンピュータにも同じことができます。 スマホの顔認証システムのように、カメラで画像を取得して、チップで処理しているのです。 そんなコンピュータの画像処理の分野に革新が訪れようとしています。 アメリカ・ペンシルバニア大学(UPenn)電気システム工学科に所属するファシッド・アシティアニ氏ら研究チームが、1秒間に20億枚の画像処理が可能なニューラルネットワークを開発したのです。 従来は光を電気に変換してから処理していましたが、光のまま処理できるシステムを作ることで、処理速度を大きく向上させています。 研究の詳細は、2022年6月1日付の科学誌『Nature』に掲載されました。 Penn Engineers Create Chip That Can Process and Classify Nearly Two Billion Images per

                                                                            電気信号に変換せず光のまま考える!? 1秒間に20億枚の画像処理をするチップを開発! - ナゾロジー
                                                                          • ~現役薬剤師がAIを触ってみた~ その相談はポジティブですか?、ネガティブですか? - Qiita

                                                                            はじめに 筆者の本職は薬剤師ですがご縁があってCOTOHAの中の人をやっております。薬局薬剤師歴5年目(やっと中堅に差し掛かったくらいかな?)pythonを学び始めて約3カ月の初心者です。 薬局薬剤師という仕事柄、患者さんからの相談を受けることがありますが皆様もプライベート、業務に関係なく相談を受けたときこんなことを思ったことはありませんか? それは・・・ 「真面目にかえすか、それともスルーするか!」(●´・ω・)a ェット… 薬局ではせっかく相談してくれたことを蔑ろにはできません、が、あまり長く話し込んでしまいますと業務が滞って他の患者さんに迷惑をかけてしまいます。 (待ち時間に対してのお叱りは本当に多いです。大変申し訳なく思っておりますm(__)m) それでも薬剤師なら時間がない中でもこんなことを思うはず。 ・なるべく多くの相談にのってあげたい!! ・落ちた気持ちを少しでも前向きにさせ

                                                                              ~現役薬剤師がAIを触ってみた~ その相談はポジティブですか?、ネガティブですか? - Qiita
                                                                            • Deep Metric Learningによる、ホテルや飲食店などの拠点検索改善

                                                                              1.2 なぜDeep Metric Learningにしたか 改善前のモデルでも特徴量を頑張って作れば解決できないことはないとは思います。「地名、ジャンル等に引っ張られて、拠点名指定を無視してしまう」パターンでは、クエリを解釈するロジックを入れ、地名だということを理解して地名部分のみを拠点の住所とマッチングさせて、それ以外を拠点名にマッチングさせて、という具合で特徴量を作れば正解できる可能性があると思います。しかし、これは一例で全体的に精度を上げるにはさまざまなケースを人が考慮して特徴量を作っていく必要があるので大変です。 そこで、学習データ(クエリと正解拠点のペア)が大量にあることを生かして、DNN(Deep Neural Network)がよしなに学習してくれるのに期待しました。また、プロダクト化することを考えると遅くとも数百ミリ秒以内で応答する必要があるので、クエリと拠点側をそれぞれ

                                                                                Deep Metric Learningによる、ホテルや飲食店などの拠点検索改善
                                                                              • Single-table vs. multi-table design in Amazon DynamoDB | Amazon Web Services

                                                                                AWS Database Blog Single-table vs. multi-table design in Amazon DynamoDB This is a guest post by Alex DeBrie, an AWS Hero. For people learning about Amazon DynamoDB, the idea of single-table design is one of the most mind-bending concepts out there. Rather than the relational notion of having a table per entity, DynamoDB tables often include multiple different entities in a single table. You can r

                                                                                  Single-table vs. multi-table design in Amazon DynamoDB | Amazon Web Services
                                                                                • OpenAIが画像読み取り可能なAI「GPT-4 Turbo with Vision」を一般公開開始、JSONモードや関数呼び出しをサポート

                                                                                  OpenAIが画像の読み取りに対応したマルチモーダルAI「GPT-4 Turbo with Vision」の一般公開を開始しました。 GPT-4 Turbo with Vision is now generally available in the API. Vision requests can now also use JSON mode and function calling.https://t.co/cbvJjij3uL Below are some great ways developers are building with vision. Drop yours in a reply 🧵— OpenAI Developers (@OpenAIDevs) ドキュメントのモデルのページを確認すると、「gpt-4-turbo-2024-04-09」の導入と同時に「gpt-4-tu

                                                                                    OpenAIが画像読み取り可能なAI「GPT-4 Turbo with Vision」を一般公開開始、JSONモードや関数呼び出しをサポート