「recognition」を検索 - はてなブックマーク

81 - 120 件 / 1576件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

recognitionの検索結果81 - 120 件 / 1576件

OSSなWeb会議アプリ(SkyWay Conf)に文字起こし機能を実装してみた - Qiita
- 65 users
- qiita.com/ShinYoshiaki
- テクノロジー
- 2020/06/12
SkyWay ConferenceはSkyWayを利用したのブラウザ上で動作するWeb会議デモアプリです。OSSとして公開されています。今回はSkyWay Confを改造して文字起こし機能をつけてみました！ Web会議アプリに文字起こし機能がついてると、出先でイヤホンを忘れてもなんとかなるかもしれません。　議事録も自動で出来て素晴らしいですね。左上の窓で文字起こし関連の操作が出来て、画面中央下部に書き起こされた文字が表示されるようにしました。できたものまずデモアプリはこちら。Chromeで開いてください！文字起こし機能つきSkyWay Confのデモページ https://shinyoshiaki.github.io/skyway-conf ソースコードなど文字起こし機能つきSkyWay Confのソースコード https://github.com/shinyoshiaki/s
- SpeechRecognition
- WebRTC
- SkyWay
- OSS
- あとで読む
- ライブラリ
- React
- ブラウザ
- web
Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
- 65 users
- tech.mirrativ.stream
- テクノロジー
- 2024/03/04
こんにちはハタです。最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります構築していく上で色々試行錯誤したのでそれが紹介できればなと思っていますどんなものを作ったか前提知識: 配信基盤前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージまとめ We are hiring! どんなものを作ったか今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行うシス
WASMでOCR使ってみた
- 65 users
- zenn.dev/smartshopping
- テクノロジー
- 2024/12/17
これは SMat Advent Calendar 2024 の12/17分の記事です。弊社では「SmartMat Cloud」というIoT重量計 x SaaSでモノの流れを可視化するサービスを提供しております。最近お客様がスムーズにオンボーディングできるように、スマホのweb appのプロトタイプを作っております。当時のスプリントのゴールは商品の初回登録の時はスマートマットのシリアル番号や製品バーコードを読み取って検索するプロトタイプを狙いました。バーコードリーダーはnpmのzxing-wasmがデファクトスタンダードでしたがスマートマットのシリアル番号はOptical Character Recognition(OCR)が必要でした。 OCR in the browser OCRはtesseract.jsでしょう？と思いましたが、ocrsというプロジェクトが気になりました。 ocrs
- wasm
- ocr
- あとで読む
- WebAssembly
- 開発
- まとめ
画像の中の文字を認識してくれるオープンソースのOCR「PaddleOCR」レビュー
- 64 users
- gigazine.net
- テクノロジー
- 2021/09/19
画像に含まれる文字をテキストデータ化する光学文字認識(OCR)は、請求書やレシート、名刺などの印刷物をデジタル化する手法として広く使われています。そんなOCRをディープラーニングフレームワークで実現したのが、オープンソースのOCRシステム「PP-OCRv2」のデモ版となる「PaddleOCR」です。 PaddleOCR - a Hugging Face Space by akhaliq https://huggingface.co/spaces/akhaliq/PaddleOCR GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle （practical ultra lightweight OCR system, support 80+ languages recog
日本語自然言語処理のData Augmentationライブラリdaajaを作りました - 農園
- 62 users
- kajyuuen.hatenablog.com
- テクノロジー
- 2022/02/14
概要こんにちは@kajyuuenです。日本語自然言語処理のData Augmentationライブラリdaajaを作成しました。この記事ではdaajaが実装しているData Augmentation手法についての解説とその使い方について紹介します。ソースコードは以下のリポジトリで公開しています。 github.com また、このライブラリはPyPIに公開しているのでpip install daajaでインストールが可能です。はじめに Data Augmentationとは Data Augmentationとは元のデータから新しいデータを生成し、データ数を増やす手法です。日本語ではデータ拡張という名前で知られています。ラベル付きデータを擬似的に増やすことによって、アノテーションコストを必要とせずにモデルの汎化性能や精度の向上が期待できます。対応している手法現在daajaは
コンピュータビジョン（CV）の動向 2021 | gihyo.jp
- 61 users
- gihyo.jp
- テクノロジー
- 2021/01/04
はじめに国立研究開発法人産業技術総合研究所の人工知能研究センターに所属している、片岡裕雄と申します。研究者としてコンピュータビジョン（CV）やパターン認識に関する研究を行う一方で、研究コミュニティcvpaper.challengeを主宰して「CV分野の今を映し、トレンドを創り出す」ことにも挑戦しています。cvpaper.challengeには最新動向の日本語サーベイ資料や研究メンバーによる研究成果も載せています。今回の記事に書ききれない、より詳細な情報はぜひそちらをご覧ください。今回の記事については、出身大学の大先輩・皆川卓也氏から話を受けて実現しました。皆川氏は2010年にコンピュータビジョンの業界動向を寄稿されているのですが、今回恐れ多くもその企画を受け継ぐことになりました。それから11年、深層学習の隆盛とともに発展してきたCV分野の動向を述べるにはあまりにも紙面が限られていま
無償入手可能な音声コーパス／音声データベースの一覧 - Qiita
- 61 users
- qiita.com/nakakq
- テクノロジー
- 2021/09/08
無償かつ入手しやすい音声データセットをメモしています。ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。コーパスを探すときに有用なサイトコーパス配布元サイト音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能緩いライセンスのコーパスでなくても良いときはここ自発的発話の日本語音声コーパスはだいたいここにある入手は要申請所属や責任者を記入する必要があるため、研究者や企業でないと厳しい？（この記事では音声資源コンソーシアムのコーパスは未掲載） Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス大量の日本語音声コーパスが配布されている音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情あなたにどうしても伝えたい30の音声コーパス
COVID-19における科学者の失敗とは何か【どのようにしてここまで来たのか、飛沫・エアロゾルとは何か？・どこまで行くのか？・呼吸器系感染症伝播に関する歴史的考察｜Covidの殺害を助けた60年前の科学的失敗】
- 59 users
- posfie.com
- 世の中
- 2021/05/19
エアボーン空気感染#COVIDisAirborne#covidCO2#bettermasks @AirborneKanki Linsey Marr先生 1⃣病気の感染におけるエアロゾルの『5μm』というカットオフはどこから来たのですか？ (本当は『〜100μm』であるべきです) 2⃣『6ft』ルールはどこから来たのですか？今回のプレプリントでは、その歴史を辿ってみました twitter.com/linseymarr/sta… 2021-05-17 12:59:34 Linsey Marr @linseymarr 1) Where did the 5-μm cutoff for aerosols in disease transmission come from? (It should really be ~100 μm) 2) Where did the 6' rule come fro
- science
- あとで読む
- 歴史
- COVID-19
- history
- 医療
BigQueryのアンチパターン認識ツールで独自のSQLリンターを開発しました - ZOZO TECH BLOG
- 59 users
- techblog.zozo.com
- テクノロジー
- 2025/01/30
こんにちは、株式会社ZOZOで25卒の内定者アルバイトをしている村井です。この記事では業務で取り組んでいる、BigQueryで使うSQLのリンターの作成方法について紹介します。目次目次課題と解決策課題解決策 BigQueryのアンチパターン認識ツールミニマムな使い方日本語がSQL内に含まれている際の問題アンチパターンを定義するリンターとしてBigQueryのアンチパターン認識ツールを使用する際に生じる課題と解決策構成 APIサーバ化 Chrome拡張動作例まとめ課題と解決策課題社内では様々なチームがSQLを書いており、動作はするものの良くない書き方をしている場合があります。そういった構文を検知して、前もって修正する必要があります。解決策 BigQueryのコンソールで入力されたSQLの不正構文を検知、修正案を提示できるようにしました。 BigQueryのアン
- BigQuery
- sql
- あとで読む
- tool
- ツール
nerman: AllenNLP と Optuna で作る固有表現抽出システム - クックパッド開発者ブログ
- 59 users
- techlife.cookpad.com
- テクノロジー
- 2020/11/06
事業開発部の @himkt です．好きなニューラルネットは BiLSTM-CRF です．普段はクックパッドアプリのつくれぽ検索機能の開発チームで自然言語処理をしています．本稿では，レシピテキストからの料理用語抽出システム nerman について紹介します． nerman の由来は ner (固有表現抽出 = Named Entity Recognition) + man (する太郎) です．クックパッドに投稿されたレシピから料理に関する用語を自動抽出するシステムであり，AllenNLP と Optuna を組み合わせて作られています．（コードについてすべてを説明するのは難しいため，実際のコードを簡略化している箇所があります）料理用語の自動抽出料理レシピには様々な料理用語が出現します．食材や調理器具はもちろん，調理動作や食材の分量なども料理用語とみなせます．「切る」という調理
無実の男性が顔認識システムの誤りのせいで1週間投獄される
- 59 users
- gigazine.net
- テクノロジー
- 2023/01/05
機械学習を用いた顔認識システムは地下鉄の運賃や食堂の支払いを自動で行うといったシステムのほか、政府による監視網や犯罪の捜査に用いられています。一方で、顔認識システムの正確性やプライバシー面での是非も議論されており、イタリア規制当局が一部の犯罪捜査・抑止目的以外には利用を禁止したり、アメリカの大都市が相次いで当局による使用を禁止したりしています。特に有色人種の認識で誤認を起こしやすいことが確認されており、2022年末ごろに無実の黒人男性が顔認識システムの間違いにより不当に逮捕されたケースを弁護士が発表しています。 JPSO used facial recognition to arrest a man. It was wrong. | Crime/Police | nola.com https://www.nola.com/news/crime_police/jpso-used-facial
- 機械学習
- あとで読む
- 警察
- 米国
- 人工知能
- 技術
- news
Kaggle Grandmasterになるまでの7年間の軌跡 - のんびりしているエンジニアの日記
- 58 users
- nonbiri-tereka.hatenablog.com
- テクノロジー
- 2021/12/26
皆さんこんにちはお元気でしょうか。冬だというのに、GPUと暖房で半袖装備でも過ごせています。今年、長きにわたるMaster生活の終演を迎え、ようやくGrandmasterになることができました。そこで、Grandmasterになるまでの経験をこちらに書き記しておこうと思います。この記事はKaggle AdventCalendar2021カレンダー2、25日目になります。 qiita.com 著者の背景 Kaggleへの取り組み 1-3年目 4年目 IEEE's Signal Processing Society Avito Demand Prediction Challenge Home Credit Default Risk 5年目あたり 6年目 Global Wheat Detection 7年目 Shopee - Price Match Guarantee Hungry Ge
記憶力を高める4つのルーティン。学習内容を強く覚えるカギは「1分間」の使い方にあり - STUDY HACKER（スタディーハッカー）｜社会人の勉強法＆英語学習
- 58 users
- studyhacker.net
- 学び
- 2021/02/18
必死に勉強しているにもかかわらず、その内容をなかなか記憶できないという人はいませんか？　じつは記憶力は、数秒から数分もかからない簡単な行動で高められます。今回は、勉強のときにぜひ実践してほしい、記憶力を高める4つのルーティンをご紹介しましょう。 1. 「1分間ライティング」を行なう日本記憶力選手権大会6連覇という実績をもつ池田義博氏は、ひとつのテーマに関連した内容を1分間でひたすら書き出す「1分間ライティング」という方法をすすめています。池田氏によれば、きちんと書き出すことができた内容は、使える記憶として定着しているとのこと。逆に、書き出せなかった内容があれば、そこがすなわち要復習ポイントだとわかるのです。ちなみに「1分間」で書く理由は、試験本番を想定してすばやく思い出す訓練をするためだそう。また、精神科医の樺沢紫苑氏は、書き出す＝アウトプットするという作業自体が記憶を定着させると言い
Databases in 2024: A Year in Review
- 56 users
- www.cs.cmu.edu/~pavlo
- テクノロジー
- 2025/01/02
Like a shot to your dome piece, I'm back to hit you with my annual roundup of what happened in the rumble-tumble game of databases. Yes, I used to write this article on the OtterTune blog, but the company is dead (RIP). I'm doing this joint on my professor blog. There is much to cover from the past year, from 10-figure acquisitions, vendors running wild in the streets with license changes, and the
- database
- DB
- あとで読む
- data
実務で使う固有表現抽出 / Practical Use of Named Entity Recognition
- 56 users
- speakerdeck.com/sansandsoc
- テクノロジー
- 2020/10/12
■イベント  ：自然言語処理勉強会 https://sansan.connpass.com/event/190157/ ■登壇概要タイトル：実務で使う固有表現抽出発表者：  DSOC R&D研究員高橋寛治 ▼Twitter https://twitter.com/SansanRandD
DeNA目線で見る　音声変換の最先端 - Qiita
- 56 users
- qiita.com/Kohki_Mametani
- テクノロジー
- 2020/12/11
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? （2021年5月13日追記）七声ニーナをリリースしました。DeNAの音声変換をご体験ください。 DeNAのAIシステム部、音声チームの豆谷と申します。私は2020年10月に新卒入社しましたが、2021年の新卒組として記事を書きます。私は今まで音声合成や距離学習の研究をしてきて、音声変換（voice conversion；VC）については入社後キャッチアップしています。本記事では、DeNAの音声チームが注目する最先端の音声変換技術を紹介し、ユーザの喜びと驚きを生み出したいDeNA視点を交えながら解説します。想定する読者は、音声変換に興
- 音声
- 機械学習
- あとで読む
- qiita
- 学習
Stripe、国内 B2B ビジネスからの多くの要望に応え、日本チームにより開発された銀行振込機能を統合ソリューションプラットフォームに新たに搭載
- 56 users
- prtimes.jp
- テクノロジー
- 2022/04/14
Stripe、国内 B2B ビジネスからの多くの要望に応え、日本チームにより開発された銀行振込機能を統合ソリューションプラットフォームに新たに搭載東京 ― インターネット向け経済インフラのプラットフォームを構築する Stripe は本日、日本で多くのご要望を頂いていた銀行振込機能の提供を開始したことを発表しました。これにより、スタートアップから大企業までのあらゆる規模の企業が、単一の Stripe API を介して国内の銀行振込を取り扱うことができるようになり、単一のプラットフォームでお見積りから会計処理までの決済機能を含めた全てのビジネスプロセスを利用できるようになります。日本特有の決済方法であるコンビニ決済に続き、銀行振込機能も日本のチームによって開発されており、国内の B2B から B2C まで幅広い企業のニーズやご要望に合わせてカスタマイズされています。コロナ禍の長期化により
- stripe
- あとで読む
- 開発
- ビジネス
- 日本
- api
- サービス
GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
- 56 users
- github.com/openai
- 学び
- 2022/09/17
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- OpenAI
- Whisper
- translate
- voice
- audio
- 機械学習
- Tech
- AI
脳と心の科学の「ミッドライフクライシス」（京都大学情報学研究科教授、ATR脳情報研究所客員室長：神谷之康） #その心理学ホント？｜「こころ」のための専門メディア　金子書房
- 55 users
- www.note.kanekoshobo.co.jp
- テクノロジー
- 2023/03/17
脳と心の科学の「ミッドライフクライシス」（京都大学情報学研究科教授、ATR脳情報研究所客員室長：神谷之康） #その心理学ホント？私が学生だった1990年代前半、脳と心の科学の未来は輝いて見えた。80年代末から続いていた（第2次）ニューラルネットワークブームや、当時NatureやScienceに頻繁に掲載されていたサルの電気生理学研究の印象は強烈だった。「認知科学」や「認知心理学」の「認知」という言葉に、旧来の「心理学」や「生理学」にはない軽やかな響きを感じた。当時は、行動主義から認知科学への移行（「認知革命」）によって、観察可能な行動だけでなく、行動の背後にある認知プロセスについて研究できるようになったと言われていた（が、これが単純化された「建国神話」であることが後に分かってきた）（1）。90年代半ば以降、ニューラルネットワークブームは一時下火になる一方、脳イメージング技術の進展を背
- 脳
- AI
- あとで読む
- 科学
- 心理
- 研究
機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning –
- 55 users
- jpsec.ai
- テクノロジー
- 2020/07/11
機械学習セキュリティのベストプラクティス – Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning – 論文紹介概要「Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning」は、米国のNIST（National Institute of Standards and Technology）が策定を進めている機械学習セキュリティに関するベストプラクティスのドラフトであり、機械学習システムの安全確保を目的として、機械学習にまつわるセキュリティを「攻撃」「防御」「影響」の3つの視点で分類している。 NISTIR8269はブログ執筆時点（2020年7月9日）でドラフト版であるが、「NIST SP8
Twilioを利用した障害時の自動連絡網システムについて - BASEプロダクトチームブログ
- 53 users
- devblog.thebase.in
- テクノロジー
- 2020/12/05
この記事はBASE Advent Calendar 2020の5日目の記事です。 SRE Groupのngswです。 Eコマースプラットフォーム「BASE」における障害発生時に、社内関係者に連絡網に基づいて電話発信するシステムを構築しました。このエントリでは、その導入までの経緯と具体的な当該システムの説明をします。 TL;DR 「BASE」で問題が発生した際に意思決定者に電話発信する周知システムを構築した「導入前に考えたこと」をまず主題として書いた参考URL記事のまま手順であるが、それでも導入時に詰まった事柄など落ち穂拾い的に追記した謝辞 Twilio FunctionsとStudioを使って連続架電を行う - Qiita 大変わかりやすい記事であり、ほぼすべてを参考にさせていただいた。このQiita記事がなければ短期間で実現することは不可能であったと考える導入に至る経緯 07月
- twilio
- あとで読む
みんなが優しくなれるテレワークのはじめかた - Qiita
- 52 users
- qiita.com/matagawa
- テクノロジー
- 2020/12/13
はじめにこの記事は、シスコシステムズの有志による Cisco Systems Japan Advent Calendar 2020 の 12 日目として投稿しています。 2017 年版: https://qiita.com/advent-calendar/2017/cisco 2018 年版: https://qiita.com/advent-calendar/2018/cisco 2019 年版: https://qiita.com/advent-calendar/2019/cisco 2020 年版: その 1, その 2 TL;DR リモートワークが浸透するにつれて、こんなお悩みをよく耳にします Web 会議中に自宅の私生活のノイズが聴こえてくる💥 (掃除機や洗濯機) Web 会議の品質がすごく悪いけれど、家族が NetFlix を再生 📺 していたのが原因らしいこの
【レポート】コンテナだけどサーバーレス！ AWS Lambda の最新機能をご紹介 #AWSSummit | DevelopersIO
- 52 users
- dev.classmethod.jp
- テクノロジー
- 2021/05/17
CX事業本部@大阪の岩田です。5月31日までアーカイブが視聴可能なAWS Summitですが、Developer Zoneという開発者向けの特設サイトが存在することをご存知でしょうか？公式サイトでは以下のように案内されています。より多くの技術情報に触れたいとお考えの開発者の方向けに、エキスパートによるテクニカルトーク、ライブ解説付きのデモ、AWS Robot Delivery Challenge, AWS DeepRacer リーグなど、多彩なコンテンツを備えた特設サイト「Developer Zone」をご用意しました。少しカジュアルな雰囲気の中、よりディープに AWS サービスを活用した開発のノウハウを知ることができます。テクニカルトーク、ライブ解説付きのデモでは、参加するお客様からのご質問にもその場でお答えしますので、ぜひご参加ください。この記事はDeveloper Zoneのセ
- コンテナ
- lambda
- aws
- あとで読む
- 開発
BERTによる日本語固有表現抽出の精度改善〜BERT-CRFの紹介〜 - Sansan Tech Blog
- 52 users
- buildersbox.corp-sansan.com
- テクノロジー
- 2021/09/21
こんにちは、DSOC R&Dグループインターンの笛木正雄です。大学院では離散最適化の研究室に所属しています。インターンでは、日々、知らないことだらけで、色々なことを経験させていただき、伸びしろを実感する毎日です。現在は、SansanやEightのニュース配信に使用されている固有表現抽出(文章中から組織名を抽出するために使用)と呼ばれる自然言語処理タスクに携わっています。今回は、これまで取り組んだ固有表現抽出における精度改善の手法を紹介したいと思います。ありがたいことに、この手法は現在、プロダクトで実際に稼働しているため、思い入れのある手法です。また、今回の手法を含め、日本語固有表現抽出については、コード公開を予定しており、pipでインストールできるように現在進行中です。ご興味ある方は、お待ちいただき、合わせてご覧いただければ幸いです。 ※弊社のニュース配信における固有表現抽出タスクの
プロダクト開発の貢献をアピールするための目標設計や認知活動 / Goal design and recognition activities to promote product development contributions.
- 50 users
- speakerdeck.com/oomatomo
- テクノロジー
- 2024/10/09
エンジニア組織の成果を伝えたい！経営層や非エンジニア組織との会話、どうしてる？ https://d-plus.connpass.com/event/331345/
トップカンファレンスにおけるデータセットシフトと機械学習 - Ridge-institute R&D Blog
- 50 users
- iblog.ridge-i.com
- テクノロジー
- 2021/03/10
こんにちは，株式会社Ridge-iのリサーチチームの@machinery81です．今回はNeurIPS2020で発表されたデータセットシフトを扱う機械学習に関連する論文を紹介します．本記事は，Ridge-i主催の論文読み会で発表した以下の資料に基づいています． TL;DR 機械学習におけるデータセットシフト Covariate Shift Target Shift Concept Shift Domain Shift Sample Selection Bias Taxonomy of NeurIPS2020 papers about Dataset Shift 論文紹介 Rethinking Importance Weighting for Deep Learning under Distribution Shift Importance Weighting for Distribut
- 機械学習
- あとで読む
無料でカメラを向けた花の名前を即座にAIが教えてくれるアプリ「ハナノナ」を使ってみた
- 50 users
- gigazine.net
- テクノロジー
- 2020/05/08
花にカメラを向けると、AIが瞬間的に花の名前を教えてくれるiOSアプリ「ハナノナ」が公開中です。千葉工業大学人工知能・ソフトウェア技術研究センターの研究プロジェクトで作られたもので、判定できる花の種類は770種類。無料で利用できるとのことなので、実際に使ってみました。「ハナノナ app」をApp Storeでまずは上記URLにアクセスして「入手」をタップ。「インストール」をタップし…… アプリを開きます。利用規約に同意したら「同意して始める」をタップ。カメラの使用は必須なので、「"ハナノナ"がカメラへのアクセスを求めています」に「OK」をタップ。すると、すぐにカメラが起動します。さっそくツツジを見つけたのでカメラを向けてみると、ツツジ科の植物である「サツキ」だったことが判明しました。サツキはツツジと似ていますが、葉や花が微妙に違うとのこと。「100％」「93％」など、花の種類
- 人工知能
- techfeed
- AI
- 花
- 植物
- カメラ
- あとで読む
- アプリ
Mistral OCR | Mistral AI
- 50 users
- mistral.ai
- テクノロジー
- 2025/03/07
Mistral OCRIntroducing the world’s best document understanding API. Throughout history, advancements in information abstraction and retrieval have driven human progress. From hieroglyphs to papyri, the printing press to digitization, each leap has made human knowledge more accessible and actionable, fueling further innovation. Today, we’re at the precipice of the next big leap—to unlock the collec
- OCR
- あとで読む
- 人工知能
- AI
単なる「雑学好き」で終わる人と、本当の教養を手に入れる人の差
- 50 users
- diamond.jp
- 政治と経済
- 2022/05/21
『独学大全──絶対に「学ぶこと」をあきらめたくない人のための55の技法』著者の読書猿さんは昨年「独学」「執筆」に加えて「復刊」をライフワークとしていくことをTwitterで宣言した。この連載「読書猿が推す『良書復刊』プロジェクト」では、読書猿さんが推す復刊本や、復刊に関係する話を紹介していく。 2022年5月19日より、国会図書館による「個人向けデジタル化資料送信サービス」がスタートする。ごく簡単に説明すると「国会図書館デジタルコレクション所蔵の絶版本や雑誌が、自宅で読み放題になる無料サービス」だ。読書猿さんは、このニュースは全国の独学者にとっても福音であると話す。今回は、元司書でレファレンス担当だった書物蔵さんを対談相手に迎え、同サービスの使いこなし方、楽しみ方を語ってもらった。（取材・執筆／藤田美菜子）第1回　元司書が語る！国立国会図書館の絶版本「読み放題解禁」がスゴい膨大な資料を
ユーザーインタフェースデザインのための10ユーザビリティヒューリスティックス
- 49 users
- u-site.jp
- テクノロジー
- 2021/04/12
ヤコブ・ニールセンのインタラクションデザインのための一般的な原則。これらの原則は幅広い経験則であり、具体的なユーザビリティガイドラインではないため、「ヒューリスティックス」という。 10 Usability Heuristics for User Interface Design by Jakob Nielsen on November 15, 2020 日本語版2021年4月12日公開この記事の最後で、ヤコブの10ユーザビリティヒューリスティックスの無料ポスター（英語）をダウンロードできる。 1. システム状態の視認性デザインは、妥当な時間内に適切なフィードバックを通じて、今、何が起こっているのかを絶えずユーザーに知らせる必要がある。ユーザーが現在のシステムの状態を把握できれば、彼らは自分がそれまでに行ったインタラクションの結果を知り、次のステップを決定することができる。予測可能
How to Use ChatGPT With Siri on Your iPhone
- 49 users
- www.makeuseof.com
- テクノロジー
- 2023/03/27
With ChatGPT being all the rage today, Apple users are likely wondering how to access it on their iPhones. For those of you who aren't aware, ChatGPT is an AI-powered chatbot that allows you to have human-like conversations. Although ChatGPT doesn't have an official mobile app, you can access its capabilities on your iPhone via Siri. So, if you're already interested, read on as we'll teach you how
- AI
- ChatGPT
- iPhone
- あとで読む
生成AIと音声認識を組み合わせて会議アシスタントツールを作ったら生産性が大幅に向上した話
- 49 users
- blog.cloudnative.co.jp
- テクノロジー
- 2023/08/30
株式会社クラウドネイティブは、Azure OpenAIで自組織専用のChatGPTの構築を支援するサービスを展開しています。ChatGPTとAzure AD OpenAI Serviceの取り組みや事例、支援… IDチームの前田です。今日は生成AI(ChatGPT)と音声認識モデル(Whisper)を利用した会議アシスタントツールに関する投稿になります。 (追記) 作ったツールはGitHub上で公開しており、Dockerを利用してすぐに試せるようになってます。 https://github.com/cloudnative-co/mtg-ai-assistant 2023年8月30日現在Azure OpenAIにてWhisperが利用出来ていないため、OpenAI Whisper APIを利用した試験段階のものになります。近日中にAzure OpenAIにてWhisperが利用出来るとアナウ
- ChatGPT
- Azure
- AI
- OpenAI
- あとで読む
- ツール
Code Reviews 101 - The Basics | Sema
- 48 users
- www.semasoftware.com
- テクノロジー
- 2022/04/15
Code improves with multiple reviews and revisions, and this process isn’t something that can be done alone. Spotting errors in code design is difficult at the best of times — and the closer you are to the work, the harder it can be to critique. That’s where code reviews come in. The beginning: introducing code reviewsWhat is a code review? Code improves with multiple reviews and revisions, and thi
RNNからTransformerまでの歴史を辿る～DNNを使ったNLPを浅く広く勉強～ - arutema47's blog
- 48 users
- aru47.hatenablog.com
- テクノロジー
- 2020/08/18
Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめる。 DNNは知ってるけどTransformerってなんだかわからない、って人におすすめです。 Abst. 画像認識にもTransformerが使われることが多く、DeepRLやGPT-3といったNLPモデルも身近になってきています。"Attention is 何?"と言えなくなってきたので勉強しました。 Feedforward NetworksからSeq2Seq, Attention機構からTransformer登場、そしてBERT GPTといった最新モデルまでの流れを広く浅く記述する予定。またKaggle NLPコンペの上位解法から利用例を探る。 Tl;DR TransformerはSelf-Attentionという機構でデータ内の時系列的特徴を抽出でき、従来のRNNを始めとするNN
- BERT
- NLP
- 機械学習
- Transformer
- 自然言語処理
- RNN
- attention
- あとで読む
styleguide
- 48 users
- google.github.io
- テクノロジー
- 2020/05/09
Background Which Shell to Use Bash is the only shell scripting language permitted for executables. Executables must start with #!/bin/bash and minimal flags. Use set to set shell options so that calling your script as bash script_name does not break its functionality. Restricting all executable shell scripts to bash gives us a consistent shell language that’s installed on all our machines. In part
- shell
- style guide
- bash
- sh
- ShellScript
- Google
Claude 3.5 SonnetでStable Diffusion XLによる画像生成を要件が満たされるまで繰り返すAmazon Bedrockの使用例 - NRIネットコムBlog
- 48 users
- tech.nri-net.com
- テクノロジー
- 2024/07/23
小西秀和です。 Amazon BedrockのAIモデルとして利用可能になったAnthropic Claude 3ファミリーでは画像認識機能が導入されました。そして、最新モデルのAnthropic Claude 3.5 Sonnetにも更に強化された画像認識機能が備わっています。これらのAnthropic Claudeモデルの画像認識機能、特にOCR(光学文字認識)の性能については、いくつかの簡単な試行と比較を実施してみたことがあります。詳細は以下の記事でご覧いただけます。 Using Amazon Bedrock for titling, commenting, and OCR (Optical Character Recognition) with Claude 3 Haiku Using Amazon Bedrock for titling, commenting, and OCR
- Claude
- あとで読む
- Bedrock
- GenAI
- Prompt Engineering
- AI
- Generative AI
- prompt
- AWS
リックライダー「人と計算機の共生」 - 山形浩生の「経済のトリセツ」
- 48 users
- cruel.hatenablog.com
- テクノロジー
- 2023/04/16
翻訳中の本に、影響力の強い文として出てきたので、座興でやってみた。んー、いまだとそんなにすごい感じではないのと、ChatGPTとか出てきて、人間計算機共生のありかたそのものの、歴史的前提が崩れ始めている感じではある。とはいえ、60年以上前の話だから……　むしろ、この中で出てくる、人間で拡張された機械、という概念の方が妥当性が高いんじゃないかとさえ思う。人と計算機の共生 Man‑Computer Symbiosis J. C. R. リックライダー　山形浩生訳 (hiyori13@alum.mit.edu) IRE Transactions on Human Factors in Electronics, volume HFE-1, pages 4-11, March 1960 groups.csail.mit.edu 要約人と計算機の共生は、人と電子計算機との協力的な相互作用の中で、予
- AI
- technology
- あとで読む
- 経済
- システム
- 思想
- 人工知能
- 生物
- science
固有表現抽出のアノテーションデータについて - NLP太郎のブログ
- 48 users
- kzinmr.hatenablog.com
- テクノロジー
- 2020/10/06
自然言語処理技術のなかでも固有表現抽出（Named Entity Recognition; NER）は情報抽出の処理をやろうとするときにとても役立つ。応用は幅広く、会社名や個人名などの情報抽出処理、個人情報除去などのような抽出した情報に対する処理、代名詞の解析（照応解析・共参照解析）のような文脈解析処理などに用いられる。最も簡単なNERの方法としては、辞書や形態素解析結果や正規表現などに基づくルールを用いて、単語列にラベリングする方法があるが、会社名など判断が難しいケースについては機械学習によってNERを行うことが有効なことが多い。機械学習ベースの既存の固有表現抽出器を使ってみたい場合には、GiNZAやKNPのようなNERモデルが同梱されているツールを使用してみるのがよい。しかし公開モデルの性能では満足いかない場合に自分でモデルを構築しようとしても、公開データセットが見つけにくかった
ネコは「自分の名前」も「飼い主の声」も分かっていてあえて無視している - ナゾロジー
- 48 users
- nazology.kusuguru.co.jp
- 暮らし
- 2021/08/14
ネコは飼い主が名前を呼んでも反応しないことが多いです。これは、飼い主の声や自分の名前が分かっていないからなのでしょうか？近年の日本の研究によって、実はネコは「飼い主の声」も「自分の名前」も分かっていたと判明しました。ネコはあえて飼い主の呼び声を無視していたのです。ツレない猫、答えないけど飼い主の声聞き分ける。科学的に証明 https://www.u-tokyo.ac.jp/focus/ja/press/p01_250327_02.html ネコは自分の名前を聞き分ける～ヒトの発する「自分の名前」と「他の名詞」や「同居ネコの名前」を区別する能力を実験的に証明～ https://www.sophia.ac.jp/jpn/news/PR/press0405.html Vocal recognition of owners by domestic cats (Felis catus) ht
- cat
- ねこ
- ネコ
- animal
- 猫
- Article
- 動物
PyTorch vs TensorFlow in 2023
- 47 users
- www.assemblyai.com
- テクノロジー
- 2021/12/15
Should you use PyTorch vs TensorFlow in 2023? This guide walks through the major pros and cons of PyTorch vs TensorFlow, and how you can pick the right framework. PyTorch and TensorFlow are far and away the two most popular Deep Learning frameworks today. The debate over which framework is superior is a longstanding point of contentious debate, with each camp having its share of fervent supporters