並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 1570件

新着順 人気順

recognitionの検索結果81 - 120 件 / 1570件

  • Papers with Code - Machine Learning Datasets

    CIFAR-10 (Canadian Institute for Advanced Research, 10 classes) The CIFAR-10 dataset (Canadian Institute for Advanced Research, 10 classes) is a subset of the Tiny Images dataset and consists of 60000 32x32 color images. The images are labelled with one of 10 mutually exclusive classes: airplane, automobile (but not truck or pickup truck), bird, cat, deer, dog, frog, horse, ship, and truck (but no

      Papers with Code - Machine Learning Datasets
    • OSSなWeb会議アプリ(SkyWay Conf)に文字起こし機能を実装してみた - Qiita

      SkyWay ConferenceはSkyWayを利用したのブラウザ上で動作するWeb会議デモアプリです。OSSとして公開されています。 今回はSkyWay Confを改造して文字起こし機能をつけてみました! Web会議アプリに文字起こし機能がついてると、出先でイヤホンを忘れてもなんとかなるかもしれません。 議事録も自動で出来て素晴らしいですね。 左上の窓で文字起こし関連の操作が出来て、画面中央下部に書き起こされた文字が表示されるようにしました。 できたもの まずデモアプリはこちら。Chromeで開いてください! 文字起こし機能つきSkyWay Confのデモページ https://shinyoshiaki.github.io/skyway-conf ソースコードなど 文字起こし機能つきSkyWay Confのソースコード https://github.com/shinyoshiaki/s

        OSSなWeb会議アプリ(SkyWay Conf)に文字起こし機能を実装してみた - Qiita
      • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

        こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

          Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
        • WASMでOCR使ってみた

          これは SMat Advent Calendar 2024 の12/17分の記事です。 弊社では「SmartMat Cloud」というIoT重量計 x SaaSでモノの流れを可視化するサービスを提供しております。最近お客様がスムーズにオンボーディングできるように、スマホのweb appのプロトタイプを作っております。当時のスプリントのゴールは商品の初回登録の時はスマートマットのシリアル番号や製品バーコードを読み取って検索するプロトタイプを狙いました。 バーコードリーダーはnpmのzxing-wasmがデファクトスタンダードでしたがスマートマットのシリアル番号はOptical Character Recognition(OCR)が必要でした。 OCR in the browser OCRはtesseract.jsでしょう?と思いましたが、ocrsというプロジェクトが気になりました。 ocrs

            WASMでOCR使ってみた
          • 画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー

            画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recog

              画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー
            • 日本語自然言語処理のData Augmentationライブラリdaajaを作りました - 農園

              概要 こんにちは@kajyuuenです。 日本語自然言語処理のData Augmentationライブラリdaajaを作成しました。 この記事ではdaajaが実装しているData Augmentation手法についての解説とその使い方について紹介します。 ソースコードは以下のリポジトリで公開しています。 github.com また、このライブラリはPyPIに公開しているのでpip install daajaでインストールが可能です。 はじめに Data Augmentationとは Data Augmentationとは元のデータから新しいデータを生成し、データ数を増やす手法です。 日本語ではデータ拡張という名前で知られています。 ラベル付きデータを擬似的に増やすことによって、アノテーションコストを必要とせずにモデルの汎化性能や精度の向上が期待できます。 対応している手法 現在daajaは

                日本語自然言語処理のData Augmentationライブラリdaajaを作りました - 農園
              • コンピュータビジョン(CV)の動向 2021 | gihyo.jp

                はじめに 国立研究開発法人 産業技術総合研究所の人工知能研究センターに所属している、片岡裕雄と申します。研究者としてコンピュータビジョン(CV)やパターン認識に関する研究を行う一方で、研究コミュニティcvpaper.challengeを主宰して「CV分野の今を映し、トレンドを創り出す」ことにも挑戦しています。cvpaper.challengeには最新動向の日本語サーベイ資料や研究メンバーによる研究成果も載せています。今回の記事に書ききれない、より詳細な情報はぜひそちらをご覧ください。 今回の記事については、出身大学の大先輩・皆川卓也氏から話を受けて実現しました。皆川氏は2010年にコンピュータビジョンの業界動向を寄稿されているのですが、今回恐れ多くもその企画を受け継ぐことになりました。 それから11年、深層学習の隆盛とともに発展してきたCV分野の動向を述べるにはあまりにも紙面が限られていま

                  コンピュータビジョン(CV)の動向 2021 | gihyo.jp
                • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                  無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                    無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                  • BigQueryのアンチパターン認識ツールで独自のSQLリンターを開発しました - ZOZO TECH BLOG

                    こんにちは、株式会社ZOZOで25卒の内定者アルバイトをしている村井です。この記事では業務で取り組んでいる、BigQueryで使うSQLのリンターの作成方法について紹介します。 目次 目次 課題と解決策 課題 解決策 BigQueryのアンチパターン認識ツール ミニマムな使い方 日本語がSQL内に含まれている際の問題 アンチパターンを定義する リンターとしてBigQueryのアンチパターン認識ツールを使用する際に生じる課題と解決策 構成 APIサーバ化 Chrome拡張 動作例 まとめ 課題と解決策 課題 社内では様々なチームがSQLを書いており、動作はするものの良くない書き方をしている場合があります。そういった構文を検知して、前もって修正する必要があります。 解決策 BigQueryのコンソールで入力されたSQLの不正構文を検知、修正案を提示できるようにしました。 BigQueryのアン

                      BigQueryのアンチパターン認識ツールで独自のSQLリンターを開発しました - ZOZO TECH BLOG
                    • nerman: AllenNLP と Optuna で作る固有表現抽出システム - クックパッド開発者ブログ

                      事業開発部の @himkt です.好きなニューラルネットは BiLSTM-CRF です. 普段はクックパッドアプリのつくれぽ検索機能の開発チームで自然言語処理をしています. 本稿では,レシピテキストからの料理用語抽出システム nerman について紹介します. nerman の由来は ner (固有表現抽出 = Named Entity Recognition) + man (する太郎) です. クックパッドに投稿されたレシピから料理に関する用語を自動抽出するシステムであり,AllenNLP と Optuna を組み合わせて作られています. (コードについてすべてを説明するのは難しいため,実際のコードを簡略化している箇所があります) 料理用語の自動抽出 料理レシピには様々な料理用語が出現します. 食材や調理器具はもちろん,調理動作や食材の分量なども料理用語とみなせます. 「切る」という調理

                        nerman: AllenNLP と Optuna で作る固有表現抽出システム - クックパッド開発者ブログ
                      • 無実の男性が顔認識システムの誤りのせいで1週間投獄される

                        機械学習を用いた顔認識システムは地下鉄の運賃や食堂の支払いを自動で行うといったシステムのほか、政府による監視網や犯罪の捜査に用いられています。一方で、顔認識システムの正確性やプライバシー面での是非も議論されており、イタリア規制当局が一部の犯罪捜査・抑止目的以外には利用を禁止したり、アメリカの大都市が相次いで当局による使用を禁止したりしています。特に有色人種の認識で誤認を起こしやすいことが確認されており、2022年末ごろに無実の黒人男性が顔認識システムの間違いにより不当に逮捕されたケースを弁護士が発表しています。 JPSO used facial recognition to arrest a man. It was wrong. | Crime/Police | nola.com https://www.nola.com/news/crime_police/jpso-used-facial

                          無実の男性が顔認識システムの誤りのせいで1週間投獄される
                        • Kaggle Grandmasterになるまでの7年間の軌跡 - のんびりしているエンジニアの日記

                          皆さんこんにちは お元気でしょうか。冬だというのに、GPUと暖房で半袖装備でも過ごせています。 今年、長きにわたるMaster生活の終演を迎え、ようやくGrandmasterになることができました。 そこで、Grandmasterになるまでの経験をこちらに書き記しておこうと思います。 この記事はKaggle AdventCalendar2021カレンダー2、25日目になります。 qiita.com 著者の背景 Kaggleへの取り組み 1-3年目 4年目 IEEE's Signal Processing Society Avito Demand Prediction Challenge Home Credit Default Risk 5年目あたり 6年目 Global Wheat Detection 7年目 Shopee - Price Match Guarantee Hungry Ge

                            Kaggle Grandmasterになるまでの7年間の軌跡 - のんびりしているエンジニアの日記
                          • 記憶力を高める4つのルーティン。学習内容を強く覚えるカギは「1分間」の使い方にあり - STUDY HACKER(スタディーハッカー)|社会人の勉強法&英語学習

                            必死に勉強しているにもかかわらず、その内容をなかなか記憶できないという人はいませんか? じつは記憶力は、数秒から数分もかからない簡単な行動で高められます。今回は、勉強のときにぜひ実践してほしい、記憶力を高める4つのルーティンをご紹介しましょう。 1. 「1分間ライティング」を行なう 日本記憶力選手権大会6連覇という実績をもつ池田義博氏は、ひとつのテーマに関連した内容を1分間でひたすら書き出す「1分間ライティング」という方法をすすめています。池田氏によれば、きちんと書き出すことができた内容は、使える記憶として定着しているとのこと。逆に、書き出せなかった内容があれば、そこがすなわち要復習ポイントだとわかるのです。ちなみに「1分間」で書く理由は、試験本番を想定してすばやく思い出す訓練をするためだそう。 また、精神科医の樺沢紫苑氏は、書き出す=アウトプットするという作業自体が記憶を定着させると言い

                              記憶力を高める4つのルーティン。学習内容を強く覚えるカギは「1分間」の使い方にあり - STUDY HACKER(スタディーハッカー)|社会人の勉強法&英語学習
                            • Databases in 2024: A Year in Review

                              Like a shot to your dome piece, I'm back to hit you with my annual roundup of what happened in the rumble-tumble game of databases. Yes, I used to write this article on the OtterTune blog, but the company is dead (RIP). I'm doing this joint on my professor blog. There is much to cover from the past year, from 10-figure acquisitions, vendors running wild in the streets with license changes, and the

                                Databases in 2024: A Year in Review
                              • 実務で使う固有表現抽出 / Practical Use of Named Entity Recognition

                                ■イベント 
:自然言語処理勉強会 https://sansan.connpass.com/event/190157/ ■登壇概要 タイトル:実務で使う固有表現抽出 発表者: 
DSOC R&D研究員 高橋 寛治 ▼Twitter https://twitter.com/SansanRandD

                                  実務で使う固有表現抽出 / Practical Use of Named Entity Recognition
                                • DeNA目線で見る 音声変換の最先端 - Qiita

                                  Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? (2021年5月13日追記)七声ニーナをリリースしました。DeNAの音声変換をご体験ください。 DeNAのAIシステム部、音声チームの豆谷と申します。私は2020年10月に新卒入社しましたが、2021年の新卒組として記事を書きます。 私は今まで音声合成や距離学習の研究をしてきて、音声変換(voice conversion;VC)については入社後キャッチアップしています。本記事では、DeNAの音声チームが注目する最先端の音声変換技術を紹介し、ユーザの喜びと驚きを生み出したいDeNA視点を交えながら解説します。 想定する読者は、音声変換に興

                                    DeNA目線で見る 音声変換の最先端 - Qiita
                                  • Stripe、国内 B2B ビジネスからの多くの要望に応え、日本チームにより開発された銀行振込機能を統合ソリューションプラットフォームに新たに搭載

                                    Stripe、国内 B2B ビジネスからの多くの要望に応え、日本チームにより開発された銀行振込機能を統合ソリューションプラットフォームに新たに搭載 東京 ― インターネット向け経済インフラのプラットフォームを構築する Stripe は本日、日本で多くのご要望を頂いていた銀行振込機能の提供を開始したことを発表しました。これにより、スタートアップから大企業までのあらゆる規模の企業が、単一の Stripe API を介して国内の銀行振込を取り扱うことができるようになり、 単一のプラットフォームでお見積りから会計処理までの決済機能を含めた全てのビジネスプロセスを利用できるようになります。日本特有の決済方法であるコンビニ決済に続き、銀行振込機能も日本のチームによって開発されており、国内の B2B から B2C まで幅広い企業のニーズやご要望に合わせてカスタマイズされています。 コロナ禍の長期化により

                                      Stripe、国内 B2B ビジネスからの多くの要望に応え、日本チームにより開発された銀行振込機能を統合ソリューションプラットフォームに新たに搭載
                                    • GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

                                      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                        GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
                                      • 脳と心の科学の「ミッドライフクライシス」(京都大学情報学研究科 教授、ATR脳情報研究所 客員室長:神谷之康) #その心理学ホント?|「こころ」のための専門メディア 金子書房

                                        脳と心の科学の「ミッドライフクライシス」(京都大学情報学研究科 教授、ATR脳情報研究所 客員室長:神谷之康) #その心理学ホント? 私が学生だった1990年代前半、脳と心の科学の未来は輝いて見えた。80年代末から続いていた(第2次)ニューラルネットワークブームや、当時NatureやScienceに頻繁に掲載されていたサルの電気生理学研究の印象は強烈だった。「認知科学」や「認知心理学」の「認知」という言葉に、旧来の「心理学」や「生理学」にはない軽やかな響きを感じた。当時は、行動主義から認知科学への移行(「認知革命」)によって、観察可能な行動だけでなく、行動の背後にある認知プロセスについて研究できるようになったと言われていた(が、これが単純化された「建国神話」であることが後に分かってきた)(1)。90年代半ば以降、ニューラルネットワークブームは一時下火になる一方、脳イメージング技術の進展を背

                                          脳と心の科学の「ミッドライフクライシス」(京都大学情報学研究科 教授、ATR脳情報研究所 客員室長:神谷之康) #その心理学ホント?|「こころ」のための専門メディア 金子書房
                                        • 機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning –

                                          機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning – 論文紹介 概要 「Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning」は、米国のNIST(National Institute of Standards and Technology)が策定を進めている機械学習セキュリティに関するベストプラクティスのドラフトであり、機械学習システムの安全確保を目的として、機械学習にまつわるセキュリティを「攻撃」「防御」「影響」の3つの視点で分類している。 NISTIR8269はブログ執筆時点(2020年7月9日)でドラフト版であるが、「NIST SP8

                                            機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning –
                                          • Twilioを利用した障害時の自動連絡網システムについて - BASEプロダクトチームブログ

                                            この記事はBASE Advent Calendar 2020の5日目の記事です。 SRE Groupのngswです。 Eコマースプラットフォーム「BASE」における障害発生時に、社内関係者に連絡網に基づいて電話発信するシステムを構築しました。 このエントリでは、その導入までの経緯と具体的な当該システムの説明をします。 TL;DR 「BASE」で問題が発生した際に意思決定者に電話発信する周知システムを構築した 「導入前に考えたこと」をまず主題として書いた 参考URL記事のまま手順であるが、それでも導入時に詰まった事柄など落ち穂拾い的に追記した 謝辞 Twilio FunctionsとStudioを使って連続架電を行う - Qiita 大変わかりやすい記事であり、ほぼすべてを参考にさせていただいた。このQiita記事がなければ短期間で実現することは不可能であったと考える 導入に至る経緯 07月

                                              Twilioを利用した障害時の自動連絡網システムについて - BASEプロダクトチームブログ
                                            • みんなが優しくなれるテレワークのはじめかた - Qiita

                                              はじめに この記事は、シスコシステムズの有志による Cisco Systems Japan Advent Calendar 2020 の 12 日目として投稿しています。 2017 年版: https://qiita.com/advent-calendar/2017/cisco 2018 年版: https://qiita.com/advent-calendar/2018/cisco 2019 年版: https://qiita.com/advent-calendar/2019/cisco 2020 年版: その 1, その 2 TL;DR リモートワークが浸透するにつれて、こんなお悩みをよく耳にします Web 会議中に自宅の 私生活のノイズ が聴こえてくる💥 (掃除機や洗濯機) Web 会議の 品質がすごく悪い けれど、家族が NetFlix を再生 📺 していたのが原因らしい この

                                                みんなが優しくなれるテレワークのはじめかた - Qiita
                                              • 【レポート】コンテナだけどサーバーレス! AWS Lambda の最新機能をご紹介 #AWSSummit | DevelopersIO

                                                CX事業本部@大阪の岩田です。5月31日までアーカイブが視聴可能なAWS Summitですが、Developer Zoneという開発者向けの特設サイトが存在することをご存知でしょうか?公式サイトでは以下のように案内されています。 より多くの技術情報に触れたいとお考えの開発者の方向けに、エキスパートによるテクニカルトーク、ライブ解説付きのデモ、AWS Robot Delivery Challenge, AWS DeepRacer リーグなど、多彩なコンテンツを備えた特設サイト「Developer Zone」をご用意しました。 少しカジュアルな雰囲気の中、よりディープに AWS サービスを活用した開発のノウハウを知ることができます。テクニカルトーク、ライブ解説付きのデモでは、参加するお客様からのご質問にもその場でお答えしますので、ぜひご参加ください。 この記事はDeveloper Zoneのセ

                                                  【レポート】コンテナだけどサーバーレス! AWS Lambda の最新機能をご紹介 #AWSSummit | DevelopersIO
                                                • BERTによる日本語固有表現抽出の精度改善 〜BERT-CRFの紹介〜 - Sansan Tech Blog

                                                  こんにちは、DSOC R&Dグループ インターンの笛木正雄です。大学院では離散最適化の研究室に所属しています。インターンでは、日々、知らないことだらけで、色々なことを経験させていただき、伸びしろを実感する毎日です。 現在は、SansanやEightのニュース配信に使用されている固有表現抽出(文章中から組織名を抽出するために使用)と呼ばれる自然言語処理タスクに携わっています。今回は、これまで取り組んだ固有表現抽出における精度改善の手法を紹介したいと思います。ありがたいことに、この手法は現在、プロダクトで実際に稼働しているため、思い入れのある手法です。 また、今回の手法を含め、日本語固有表現抽出については、コード公開を予定しており、pipでインストールできるように現在進行中です。ご興味ある方は、お待ちいただき、合わせてご覧いただければ幸いです。 ※弊社のニュース配信における固有表現抽出タスクの

                                                    BERTによる日本語固有表現抽出の精度改善 〜BERT-CRFの紹介〜 - Sansan Tech Blog
                                                  • トップカンファレンスにおけるデータセットシフトと機械学習 - Ridge-institute R&D Blog

                                                    こんにちは,株式会社Ridge-iのリサーチチームの@machinery81です. 今回はNeurIPS2020で発表されたデータセットシフトを扱う機械学習に関連する論文を紹介します. 本記事は,Ridge-i主催の論文読み会で発表した以下の資料に基づいています. TL;DR 機械学習におけるデータセットシフト Covariate Shift Target Shift Concept Shift Domain Shift Sample Selection Bias Taxonomy of NeurIPS2020 papers about Dataset Shift 論文紹介 Rethinking Importance Weighting for Deep Learning under Distribution Shift Importance Weighting for Distribut

                                                      トップカンファレンスにおけるデータセットシフトと機械学習 - Ridge-institute R&D Blog
                                                    • プロダクト開発の貢献をアピールするための目標設計や認知活動 / Goal design and recognition activities to promote product development contributions.

                                                      エンジニア組織の成果を伝えたい!経営層や非エンジニア組織との会話、どうしてる? https://d-plus.connpass.com/event/331345/

                                                        プロダクト開発の貢献をアピールするための目標設計や認知活動 / Goal design and recognition activities to promote product development contributions.
                                                      • 無料でカメラを向けた花の名前を即座にAIが教えてくれるアプリ「ハナノナ」を使ってみた

                                                        花にカメラを向けると、AIが瞬間的に花の名前を教えてくれるiOSアプリ「ハナノナ」が公開中です。千葉工業大学 人工知能・ソフトウェア技術研究センターの研究プロジェクトで作られたもので、判定できる花の種類は770種類。無料で利用できるとのことなので、実際に使ってみました。 「ハナノナ app」をApp Storeで まずは上記URLにアクセスして「入手」をタップ。 「インストール」をタップし…… アプリを開きます。 利用規約に同意したら「同意して始める」をタップ。 カメラの使用は必須なので、「"ハナノナ"がカメラへのアクセスを求めています」に「OK」をタップ。 すると、すぐにカメラが起動します。さっそくツツジを見つけたのでカメラを向けてみると、ツツジ科の植物である「サツキ」だったことが判明しました。サツキはツツジと似ていますが、葉や花が微妙に違うとのこと。「100%」「93%」など、花の種類

                                                          無料でカメラを向けた花の名前を即座にAIが教えてくれるアプリ「ハナノナ」を使ってみた
                                                        • 単なる「雑学好き」で終わる人と、本当の教養を手に入れる人の差

                                                          『独学大全──絶対に「学ぶこと」をあきらめたくない人のための55の技法』著者の読書猿さんは昨年「独学」「執筆」に加えて「復刊」をライフワークとしていくことをTwitterで宣言した。この連載「読書猿が推す『良書復刊』プロジェクト」では、読書猿さんが推す復刊本や、復刊に関係する話を紹介していく。 2022年5月19日より、国会図書館による「個人向けデジタル化資料送信サービス」がスタートする。ごく簡単に説明すると「国会図書館デジタルコレクション所蔵の絶版本や雑誌が、自宅で読み放題になる無料サービス」だ。読書猿さんは、このニュースは全国の独学者にとっても福音であると話す。今回は、元司書でレファレンス担当だった書物蔵さんを対談相手に迎え、同サービスの使いこなし方、楽しみ方を語ってもらった。(取材・執筆/藤田美菜子) 第1回 元司書が語る!国立国会図書館の絶版本「読み放題解禁」がスゴい 膨大な資料を

                                                            単なる「雑学好き」で終わる人と、本当の教養を手に入れる人の差
                                                          • ユーザーインタフェースデザインのための10ユーザビリティヒューリスティックス

                                                            ヤコブ・ニールセンのインタラクションデザインのための一般的な原則。これらの原則は幅広い経験則であり、具体的なユーザビリティガイドラインではないため、「ヒューリスティックス」という。 10 Usability Heuristics for User Interface Design by Jakob Nielsen on November 15, 2020 日本語版2021年4月12日公開 この記事の最後で、ヤコブの10ユーザビリティヒューリスティックスの無料ポスター(英語)をダウンロードできる。 1.  システム状態の視認性 デザインは、妥当な時間内に適切なフィードバックを通じて、今、何が起こっているのかを絶えずユーザーに知らせる必要がある。 ユーザーが現在のシステムの状態を把握できれば、彼らは自分がそれまでに行ったインタラクションの結果を知り、次のステップを決定することができる。予測可能

                                                              ユーザーインタフェースデザインのための10ユーザビリティヒューリスティックス
                                                            • How to Use ChatGPT With Siri on Your iPhone

                                                              With ChatGPT being all the rage today, Apple users are likely wondering how to access it on their iPhones. For those of you who aren't aware, ChatGPT is an AI-powered chatbot that allows you to have human-like conversations. Although ChatGPT doesn't have an official mobile app, you can access its capabilities on your iPhone via Siri. So, if you're already interested, read on as we'll teach you how

                                                                How to Use ChatGPT With Siri on Your iPhone
                                                              • 生成AIと音声認識を組み合わせて会議アシスタントツールを作ったら生産性が大幅に向上した話

                                                                株式会社クラウドネイティブは、Azure OpenAIで自組織専用のChatGPTの構築を支援するサービスを展開しています。ChatGPTとAzure AD OpenAI Serviceの取り組みや事例、支援… IDチームの前田です。今日は生成AI(ChatGPT)と音声認識モデル(Whisper)を利用した会議アシスタントツールに関する投稿になります。 (追記) 作ったツールはGitHub上で公開しており、Dockerを利用してすぐに試せるようになってます。 https://github.com/cloudnative-co/mtg-ai-assistant 2023年8月30日現在Azure OpenAIにてWhisperが利用出来ていないため、OpenAI Whisper APIを利用した試験段階のものになります。近日中にAzure OpenAIにてWhisperが利用出来るとアナウ

                                                                  生成AIと音声認識を組み合わせて会議アシスタントツールを作ったら生産性が大幅に向上した話
                                                                • Mistral OCR | Mistral AI

                                                                  Mistral OCRIntroducing the world’s best document understanding API. Throughout history, advancements in information abstraction and retrieval have driven human progress. From hieroglyphs to papyri, the printing press to digitization, each leap has made human knowledge more accessible and actionable, fueling further innovation. Today, we’re at the precipice of the next big leap—to unlock the collec

                                                                    Mistral OCR | Mistral AI
                                                                  • ネコは「自分の名前」も「飼い主の声」も分かっていてあえて無視している - ナゾロジー

                                                                    ネコは飼い主が名前を呼んでも反応しないことが多いです。 これは、飼い主の声や自分の名前が分かっていないからなのでしょうか? 近年の日本の研究によって、実はネコは「飼い主の声」も「自分の名前」も分かっていたと判明しました。 ネコはあえて飼い主の呼び声を無視していたのです。 ツレない猫、答えないけど飼い主の声聞き分ける。科学的に証明 https://www.u-tokyo.ac.jp/focus/ja/press/p01_250327_02.html ネコは自分の名前を聞き分ける~ヒトの発する「自分の名前」と「他の名詞」や「同居ネコの名前」を区別する能力を実験的に証明~ https://www.sophia.ac.jp/jpn/news/PR/press0405.html Vocal recognition of owners by domestic cats (Felis catus) ht

                                                                      ネコは「自分の名前」も「飼い主の声」も分かっていてあえて無視している - ナゾロジー
                                                                    • Code Reviews 101 - The Basics | Sema

                                                                      Code improves with multiple reviews and revisions, and this process isn’t something that can be done alone. Spotting errors in code design is difficult at the best of times — and the closer you are to the work, the harder it can be to critique. That’s where code reviews come in. The beginning: introducing code reviewsWhat is a code review? Code improves with multiple reviews and revisions, and thi

                                                                        Code Reviews 101 - The Basics | Sema
                                                                      • RNNからTransformerまでの歴史を辿る ~DNNを使ったNLPを浅く広く勉強~ - arutema47's blog

                                                                        Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめる。 DNNは知ってるけどTransformerってなんだかわからない、って人におすすめです。 Abst. 画像認識にもTransformerが使われることが多く、DeepRLやGPT-3といったNLPモデルも身近になってきています。"Attention is 何?"と言えなくなってきたので勉強しました。 Feedforward NetworksからSeq2Seq, Attention機構からTransformer登場、そしてBERT GPTといった最新モデルまでの流れを広く浅く記述する予定。 またKaggle NLPコンペの上位解法から利用例を探る。 Tl;DR TransformerはSelf-Attentionという機構でデータ内の時系列的特徴を抽出でき、従来のRNNを始めとするNN

                                                                          RNNからTransformerまでの歴史を辿る ~DNNを使ったNLPを浅く広く勉強~ - arutema47's blog
                                                                        • styleguide

                                                                          Background Which Shell to Use Bash is the only shell scripting language permitted for executables. Executables must start with #!/bin/bash and minimal flags. Use set to set shell options so that calling your script as bash script_name does not break its functionality. Restricting all executable shell scripts to bash gives us a consistent shell language that’s installed on all our machines. In part

                                                                          • リックライダー「人と計算機の共生」 - 山形浩生の「経済のトリセツ」

                                                                            翻訳中の本に、影響力の強い文として出てきたので、座興でやってみた。んー、いまだとそんなにすごい感じではないのと、ChatGPTとか出てきて、人間計算機共生のありかたそのものの、歴史的前提が崩れ始めている感じではある。とはいえ、60年以上前の話だから…… むしろ、この中で出てくる、人間で拡張された機械、という概念の方が妥当性が高いんじゃないかとさえ思う。 人と計算機の共生 Man‑Computer Symbiosis J. C. R. リックライダー 山形浩生訳 (hiyori13@alum.mit.edu) IRE Transactions on Human Factors in Electronics, volume HFE-1, pages 4-11, March 1960 groups.csail.mit.edu 要約 人と計算機の共生は、人と電子計算機との協力的な相互作用の中で、予

                                                                              リックライダー「人と計算機の共生」 - 山形浩生の「経済のトリセツ」
                                                                            • Huaweiが中国のAI大手Megviiと協力して「ウイグル人アラーム」を開発していたことが機密文書から判明

                                                                              中国の通信機器大手Huaweiが、北京を拠点とする画像認識や人工知能(AI)のベンダーであるMegviiと共同で、ウイグル人を追跡する顔認証システムを開発していたと報じられています。 Huawei / Megvii Uyghur Alarms https://ipvm.com/reports/huawei-megvii-uygur Huawei tested AI software that could recognize Uighur minorities and alert police, report says - The Washington Post https://www.washingtonpost.com/technology/2020/12/08/huawei-tested-ai-software-that-could-recognize-uighur-minoritie

                                                                                Huaweiが中国のAI大手Megviiと協力して「ウイグル人アラーム」を開発していたことが機密文書から判明
                                                                              • 固有表現抽出のアノテーションデータについて - NLP太郎のブログ

                                                                                自然言語処理技術のなかでも固有表現抽出(Named Entity Recognition; NER)は情報抽出の処理をやろうとするときにとても役立つ。 応用は幅広く、会社名や個人名などの情報抽出処理、個人情報除去などのような抽出した情報に対する処理、代名詞の解析(照応解析・共参照解析)のような文脈解析処理などに用いられる。 最も簡単なNERの方法としては、辞書や形態素解析結果や正規表現などに基づくルールを用いて、単語列にラベリングする方法があるが、会社名など判断が難しいケースについては機械学習によってNERを行うことが有効なことが多い。機械学習ベースの既存の固有表現抽出器を使ってみたい場合には、GiNZAやKNPのようなNERモデルが同梱されているツールを使用してみるのがよい。 しかし公開モデルの性能では満足いかない場合に自分でモデルを構築しようとしても、公開データセットが見つけにくかった

                                                                                  固有表現抽出のアノテーションデータについて - NLP太郎のブログ
                                                                                • PyTorch vs TensorFlow in 2023

                                                                                  Should you use PyTorch vs TensorFlow in 2023? This guide walks through the major pros and cons of PyTorch vs TensorFlow, and how you can pick the right framework. PyTorch and TensorFlow are far and away the two most popular Deep Learning frameworks today. The debate over which framework is superior is a longstanding point of contentious debate, with each camp having its share of fervent supporters

                                                                                    PyTorch vs TensorFlow in 2023