並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 2502件

新着順 人気順

文字起こし googleの検索結果81 - 120 件 / 2502件

  • 【テン年代総決算】オタク趣味、退職と転職、インターネットの歴史。2019年総合トップ100&過去10年間のランキング - 週刊はてなブログ

    週刊はてなブログでは約10日間に渡り「2010年代のはてなブログ」として、はてなブックマーク数による人気記事ランキングやスタッフによるおすすめ記事の「ベストセレクション」を1年分ずつ公開してきました。本記事ではその総集編として、「2019年総合ランキングトップ100」と、「過去10年間のベスト30」をあわせて紹介します。 2019年の注目エントリーと総合ランキングトップ100! 注目エントリー 暮らし 世の中 政治と経済 学び テクノロジー エンタメ アニメとゲーム おもしろ 年間ランキング総合トップ100(はてなブログ・匿名ダイアリー) 過去10年間のトップ30(はてなブログ・はてなダイアリー) 関連記事 各年の振り返り 週刊はてなブログスタッフによる“推し記事” はてなブックマーク年間ランキング 2019年の注目エントリーと総合ランキングトップ100! 平成から令和への改元、ラグビーW

      【テン年代総決算】オタク趣味、退職と転職、インターネットの歴史。2019年総合トップ100&過去10年間のランキング - 週刊はてなブログ
    • マッチングアプリ強者の統計をとってみた&機械学習モデルを作成してみた - Qiita

      序章 みなさんこんにちは。 マッチングアプリ使ってますか?! 私は最近マッチングアプリでマッチした方の一人といい感じです。 ところで、私の使っていたマッチングアプリは他の人気会員のデータが参照できました。 (おそらく100ライク以上もらっている人が表示されます。) それを見た私は悔しくてたまりませんでした。 「ライク、100ももらってないんだけど...」 「俺も100を超える男になりたい」 そう強く思いました。 同時に、どうすれば「100を超える男」になれるのか? そういう思いでデータを解析してみました。 データ収集 *機械学習のための著作権法改定により問題ないと解釈しております。 *データサイエンスはくそ初心者です。間違いがある可能性があります。 地道に他の会員データを手入力(Google Documentの文字起こしをフル活用)し、約60件のデータを集めました。 表示される他会員のデー

        マッチングアプリ強者の統計をとってみた&機械学習モデルを作成してみた - Qiita
      • superwhisperでの音声入力を試す

        superwhisperという、whisper.cppを使った音声入力ができるmacOSアプリケーションを最近使っています。 基本的にはggerganov/whisper.cppのモデルを使って、音声認識しながら文字入力ができるアプリケーションです。 特徴 Whisperの認識精度が高い かなり早く喋っても認識してくれる 日本語も認識してくれるモデルがある 日本語で喋って英語に翻訳してくれる機能もある オフライン対応 有料: サブスク と 買い切り の2種類のプランがある 無料で15分のトライアル、その後は選べるモデルが制限される 公式サイトのデモをみると、かなり早く喋っても認識してくれるのがわかります。 大抵の人にとっては、多分文字入力するよりしゃべったほうが早いぐらいの入力速度が出ると思います。 superwhisper 長文はそこまで得意じゃないけど、1行とか2行ぐらいの文章はかなり

          superwhisperでの音声入力を試す
        • 画像、音声、動画からAIが文字起こししてくれるLINE Botを作りました! - Qiita

          LINEに画像、音声、動画ファイル、YouTubeのURLを投げると、AIがすべて自動で文字起こし📝して返してくれる「文字起こすくん」というサービスを作りましたー!🙌 もう面倒な文字起こし作業からは解放されましょー💡 以下からLINEの友達登録できます!https://t.co/cvTfCQIGHb pic.twitter.com/My09VqwWz9 — 2z / AIメーカー開発者 (@2zn01) August 24, 2019 こんにちは、2z(Twitter: @2zn01 )です。 趣味でWebサービスの個人開発をしており、以下のサービスを開発・運営しています! ■AIメーカー https://aimaker.io/ ■waifu2x-multi https://waifu2x.me/ ■ツイレポ https://twirepo.com/ 今回作ったもの LINEに文字起

            画像、音声、動画からAIが文字起こししてくれるLINE Botを作りました! - Qiita
          • 【2024年】AWS全サービスまとめ | DevelopersIO

            こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開しているAWS全サービスまとめの2024年版です。 こんにちは。サービス開発室の武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2024年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2023年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 247個 です。 まとめるにあ

              【2024年】AWS全サービスまとめ | DevelopersIO
            • [あとで読む]2019年7月あとで読むトップ20リスト

              anond:20120303220901を見て何となく調べてみたくなった。デイリーのホットエントリに入っているものだけだから抜けがあると思う。 482あとで/3046users 【永久保存版】「お金がもらえる・戻ってくる制度や手当」をまとめてみた→リプ欄にも続々情報が集まって有能「行政がやるべきことを無償で…神」 - Togetter 372あとで/2421users 【永久保存版】Gitのあらゆるトラブルが解決する神ノウハウ集を翻訳した - LABOT 機械学習ブログ 329あとで/1559users 初心者が無料で勉強できる良教材いろいろまとめ - orangeitems’s diary 271あとで/1298users すべての新米フロントエンドエンジニアに読んでほしい50の資料 - Qiita 258あとで/2327users お金の話について|ヨッピー|note 256あとで/1

                [あとで読む]2019年7月あとで読むトップ20リスト
              • Pixel 6見てきた。Google初のスマホチップすげーわ

                Pixel 6見てきた。Google初のスマホチップすげーわ2021.08.06 11:30189,897 Sam Rutherford - Gizmodo US [原文] ( satomi ) Apple(アップル)のiPhoneとSamsung(サムスン)のGalaxyはどちらも軌道に乗るのに5年かかりました。 Pixelも登場からちょうど5モデル出した今が勝負どき。真打ちのフラッグシップでメインストリームに食い込むべくこの秋発売のPixel 6(噂は本当だった!)ではGoogle(グーグル)も大きなチェンジを用意しています。 発売に先駆けてGoogleデバイス&サービス部門上級VPのRick OsterlohさんにPixel 6の詳細と、同モデルに搭載になるGoogle独自開発のチップ(こっちの噂も本当)の話を伺ってきました。 本題の前に過去歴々のPixelをちょっと振り返ってみると

                  Pixel 6見てきた。Google初のスマホチップすげーわ
                • 「ブログで稼ぐ」の昔と今 - とまじ庵

                  数日前に「ブログの真実」を近々書くよ~っていう予告的な独り言的な記事を書かせていただきました。 tomag.hatenablog.com ということでみなさま楽しみにしていると思うので(ぇ?してない?)約束通り記事にしていこうと思いますw ブログバブルは夢のような時代 この記事に該当するブログの種類について 物販はクリックされても買われない時代へ 独自ドメインの優位性終了? 信じられるのはAdsenseだけ トップページは作り込んでも無駄 はてなブログの関連記事は優秀 まとめ ブログバブルは夢のような時代 今から7~8年前。西暦でいうと2016~2018年くらいの頃はブログバブルなんて呼ばれていて猫も杓子も「ブログで◯十万儲けました~♪」なんて雄叫びをあげていた時期。 はてなブックマークも全盛の頃でちょっと炎上系の記事を書いて100を超えるブクマが付きでもすれば数万のアクセスが殺到。それに

                    「ブログで稼ぐ」の昔と今 - とまじ庵
                  • 最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用して、Googleドキュメントに議事録などの自動文字起こしをしてもらう方法。

                    最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用してGoogleドキュメントに議事録などの自動文字起こしをしてもらう方法です。詳細は以下から。 以前、既に開発が終了したCycling ’74チームのSoundFlowerのように、特定のアプリからの音声を他のアプリに送るれる仮想オーディオデバイスをMac内に作成できる仮想オーディオ入出力ユーティリティ「BlackHole」を紹介したさい、WWDCのセッションや議事録をGoogleドキュメントの音声入力に接続することで簡単に文字起こしができるという事を教えていただいたので試してみてください。(コメントでのご指摘ありがとうございます) 設定 まず、文字起こしを行う音源が入ったMacにBlackHoleをインストールし、macOSのAudio MIDI設定アプリからBlackHoleの仮想オーディオデバイス

                      最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用して、Googleドキュメントに議事録などの自動文字起こしをしてもらう方法。
                    • Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた

                      2021年3月3日にリリースされたデスクトップ版Google Chrome 89の安定版で、ブラウザ上で再生される音声やムービーからリアルタイムで字幕を生成する「自動字幕起こし」機能が追加されたことが明らかになったので、実際にどんな感じなのか使ってみました。 Google's Live Caption feature rolling out for Chrome desktop users https://www.xda-developers.com/google-chrome-live-caption-feature-rolls-out-transcribe-speech-videos/ Google's Live Caption is now rolling out to Chrome on desktop | Android Central https://www.androidce

                        Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた
                      • AppleがWWDC24でパクったアプリまとめ

                        AppleはWWDC24でiOS 18・iPadOS 18・macOS Sequoia・watchOS 11などの最新OSと、iPhone・iPad・Macで使えるパーソナルAIのApple Intelligenceを発表しました。AppleがWWDC24で発表した最新OSや新機能の中には既存アプリの模倣も多く存在しているとして、海外メディアが「Appleがパクったアプリ」をまとめています。 The apps that Apple sherlocked at WWDC 2024 | TechCrunch https://techcrunch.com/2024/06/12/the-apps-that-apple-sherlocked-at-wwdc/ Here are the apps Sherlocked by Apple during WWDC 2024 - 9to5Mac https:

                          AppleがWWDC24でパクったアプリまとめ
                        • 【個人開発】動画の字幕・テロップ入れをAIで自動化するWebサービスを作りました - Qiita

                          こんにちは、2z(Twitter: @2zn01 )です。 趣味でWebサービスの個人開発をしており、以下のサービスを開発・運営しています! ■AIメーカー https://aimaker.io/ → 誰でも簡単にAIを作れるサービス ■ツイレポ https://twirepo.com/ → キーワードで話題のツイートを自動で収集したり、自動でリツイート・フォローができるサービス ■文字起こすくん https://text.aimaker.io/recognize-bot/ → 画像、音声、動画をアップするだけで簡単に文字起こし・書き起こしできるサービス 今回作ったもの 動画をアップロードするだけで、動画内の音声を認識して文字起こしを行い、自動で動画に字幕・テロップをつけてくれる「テロップメーカー」というサービスをリリースしました! ■URL https://text.aimaker.io

                            【個人開発】動画の字幕・テロップ入れをAIで自動化するWebサービスを作りました - Qiita
                          • ついにYouTubeがAIによる「自動翻訳吹き替え」機能を搭載へ

                            Googleの社内スタートアップ部門であるArea 120の一部である「Aloud」は、AIによる音声・ムービーの文字起こしや吹き替えを研究しています。YouTubeがAloudからAIによる自動翻訳吹き替えに関する研究チームを引き継ぎ、同機能を2024年までに搭載することを2023年6月22日に発表しました。 Aloud - dubbing for everyone https://aloud.area120.google.com/ YouTube is getting AI-powered dubbing - The Verge https://www.theverge.com/2023/6/22/23769881/youtube-ai-dubbing-aloud 実際にYouTubeの吹き替え機能がどんな感じなのかは、以下のムービーでチェックすることができます。 Aloud: Let

                              ついにYouTubeがAIによる「自動翻訳吹き替え」機能を搭載へ
                            • 「Google Keep」がアップデート! 文字起こし、録音、リッチテキスト、新機能は何がすごい?【今日のワークハック】 | ライフハッカー・ジャパン

                              「これ、マストだわ」モニター購入して気づいた、あったほうがいい周辺機器4選 #Amazon新生活セール

                                「Google Keep」がアップデート! 文字起こし、録音、リッチテキスト、新機能は何がすごい?【今日のワークハック】 | ライフハッカー・ジャパン
                              • 【Mac Info】 Macでかんたん文字起こし!「Google ドキュメント」で自動化しよう

                                  【Mac Info】 Macでかんたん文字起こし!「Google ドキュメント」で自動化しよう
                                • DropboxとZoomが連携強化 ビデオ会議の録音・録画・文字起こしをDropbox上に保存可能に

                                  Dropbox Japanは3月17日、クラウドストレージ「Dropbox」と、米Zoom Video CommunicationsのWeb会議ツール「Zoom」の連携機能を拡充したと発表した。Zoom上でWebミーティングを録音・録画すると、そのファイルをDropboxに保存できる新機能などに対応した。 同機能の他、Zoomが持つミーティング内容の文字起こし機能と連携し、参加者の会話を瞬時にテキスト化した上で、そのファイルをDropboxに保存できる機能も追加した。現時点での対応言語は英語のみ。 Dropboxは、格納しているテキストファイルの内容を認識し、全文検索できる機能も持つため、会議で話題になったキーワードを検索バーに入力すると、文字起こししたファイルを素早く発見できるという。 資料共有機能も強化。Zoomミーティングの参加者にDropbox内のコンテンツを共有する際、従来はZo

                                    DropboxとZoomが連携強化 ビデオ会議の録音・録画・文字起こしをDropbox上に保存可能に
                                  • Google Keep(グーグルキープ)の使い方を徹底解説!便利な機能が盛りだくさん | WEBマーケティングの専門ブログ|MARC BLOG

                                    みなさんはメモアプリを使用していますか? 「使ってはみたけどなんだか難しい」「結局紙に書いてしまう」という方も多いのではないかと思います。 今回ご紹介するGoogle Keep(グーグルキープ)はシンプルなので、直感的に使用できるのが特徴です。 ちょっとしたメモをするために使用するのも良いですし、便利な機能を使ってプライベートやビジネスに活用してみるのも良いですよ。 1. Google Keep(グーグルキープ)とは Google Keep(グーグルキープ)とは、Googleが提供するメモアプリです。WEBブラウザ上で使用することもできますが、iOS版、Android版のアプリが使用しやすいためおすすめです。 iOS版 Google Keep Android版 Google Keep メモアプリはStockやEvernote、最近話題になっているNotionなどたくさんの種類があります。そ

                                      Google Keep(グーグルキープ)の使い方を徹底解説!便利な機能が盛りだくさん | WEBマーケティングの専門ブログ|MARC BLOG
                                    • DeepLearningについて、最近作ったもの、書いたもの、勉強したこと

                                      こんにちは!逆瀬川 ( @gyakuse ) です。 今日は最近作ったもの、書いたもの、勉強したことを備忘録的にまとめていきたいと思います。 なぜ書くのか、なぜ学ぶのか DeepLearningの普及以降、Attention Is All You Need以降、Hugging Faceでの民主化以降、そしてStable DiffusionやChatGPTの登場以降、どんどんAGIへの距離が短くなってきています。未来は想定より大きく変わりそうです。どったんばったん大騒ぎのときはみんなが分かっておくべきことは効率的に共有すべきで、そのために書いています。書くためには論文等を読む必要があります。そしてそのためには基礎からしっかり学ぶことが大事です。次の一歩をみんなで歩んでいくために、学び、書いています。 間違ったことを言うかもしれませんが、それでも誰かのためになれば嬉しいです。あと、個人的にはこ

                                        DeepLearningについて、最近作ったもの、書いたもの、勉強したこと
                                      • SEOは2022年からこうなる!?ウェブライダーが考える「ソリューション思考」と「社会的信用の醸成」|松尾茂起(ウェブライダー)

                                        この記事は、日々検索集客を目指してコンテンツをつくり続けておられる個人・法人さんに向けて、2022年からのSEOにおいて意識したほうがよいことをまとめた約24,000字の記事です。 本記事は私、ウェブライダー代表の松尾の独自見解を多く含みます。 あくまでもひとつの考え方として、参考にしていただけるとうれしいです。 また、本記事は、先日オンライン開催され、のべ3,000名近い方が視聴された「SEOは2022年からこうなる!?ウェブライダーが考える2022年からのSEOセミナー」の内容の一部を文字起こしし、適宜内容を追加・編集したものです。 本記事では、2021年の検索結果の変化を振り返りながら、2022年からのSEOについて、ウェブライダー代表の松尾なりの見解を語っていきます。 最初にお断りをしておきます。 今回の話は、テクニック論を期待される方には、もしかすると「抽象的な話が多いな」と感じ

                                          SEOは2022年からこうなる!?ウェブライダーが考える「ソリューション思考」と「社会的信用の醸成」|松尾茂起(ウェブライダー)
                                        • 話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった

                                          インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに、実際の録音時間の何倍もかかってしまう。作業が終わるころには疲れてうんざりしていることもある。 筆者と同じように「骨の折れる文字起こし作業を何とか楽にこなしたい」と考える人は、洋の東西を問わず多いのかもしれない。最近はAI(人工知能)によって音声を解析して自動的に文字起こしするツールが国内外で増えてきた。中でも大きな注目を集めているのは、米OpenAI(オープンAI)の音声認識AI「Whisper」だ。 同社は米テスラ創業者のイーロン・マスク氏らが設立したAIの研究開発企業で、2020年に発表した言

                                            話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった
                                          • 【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】英語に少しでも困っている方向けに、外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。

                                            じゅじゅ @jujulife7 【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】 英語に少しでも困っている方向けに、 外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。 2022-10-22 20:50:18 じゅじゅ @jujulife7 【Otter】 ・高精度な英語のリアルタイム文字起こしアプリ(体感で精度80~90%)でマジで使い倒しています ・英語会議時に喋っている内容が即座に文字化されるので、このアプリがあると英語苦手でも安心して会議に望めます otter.ai/jp 2022-10-22 20:51:05 じゅじゅ @jujulife7 【grammarly】 ・スペルや文法ミスを校正してくれる校正ツール ・英語でメールを書くとき、レポート・資料作成する時に重宝しています ・DeepL+grammarly有

                                              【外資系企業でノンネイティブが生き残るために使っている英語関連ツール(最新)】英語に少しでも困っている方向けに、外資系で生き残るために使いまくっている英語関連のお勧めツールを下記スレッドにて紹介します。
                                            • 『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』ができるまで #voyagebook - t-wadaのブログ

                                              昨日(2020年8月7日)、書籍『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』(ハッシュタグ #voyagebook)が出版されました。この本は私(@t_wada)がVOYAGE GROUPに在籍する主要なソフトウェアエンジニアにインタビューし、その内容をラムダノートの編集者鹿野さん(@golden_lucky)が本としてまとめたものです。2020年代のウェブにおけるビジネスとソフトウェア開発の在り方を濃縮した1冊に仕上がっています。 書名:Engineers in VOYAGE 事業をエンジニアリングする技術者たち 著者:株式会社VOYAGE GROUP 監修、和田卓人 編 (A5判、224ページ、ISBN:978-4-908686-09-2、本体価格1,800(+税)円、電子版のみ1,000(+税)円) 発行:2020年8月7日 メインタイトルが『

                                                『Engineers in VOYAGE ― 事業をエンジニアリングする技術者たち』ができるまで #voyagebook - t-wadaのブログ
                                              • 平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital

                                                月間10万人が読んでいるCoral Insightsのニュースレターにご登録いただくと、Coral Capitalメンバーによる国内外のスタートアップ業界の最新動向に関するブログや、特別イベントの情報等について、定期的にお送りさせていただきます。ぜひ、ご登録ください! Coral Capitalのポッドキャストでは、かなりAIに編集作業を頼っています。英語でインタビューしていることから、日本語では未実現の最新技術を使ったサービスに触れる機会があるのですが、ここ1、2年は、その進化には目を見張るものがあります。 収録した音声を文字(テキスト)に変換する「文字起こし」の精度が上がった結果、もはや人間に依頼する意味はなくなりましたし、音声編集についても画期的な機能が登場しています。それは音声から文字起こしされたテキストを編集することで、それに対応する元の音声データも同時に編集可能である、という機

                                                  平均的な人間の能力を超えた―、常識や知識を獲得した大規模言語モデルが開く新ビジネス領域 | Coral Capital
                                                • Google Cloud Speech API vs. Amazon Transcribe - Qiita

                                                  文字起こしAPIガチンコバトル ググってざっと見れた範囲の「文字起こしAPI比較してみた」系記事では、数行(もしくは数分)レベルの非常に短い文字起こしを行いgood/badを述べているものが多いです。もしくはニュース動画のような"クリアすぎる音源"に対して行っているものも多いです。Amazon Transcribeについてバズっていたブログでも、英語での文字起こしで精度が高い話をしています。自然言語処理分野では英語の精度が高いのは知られているところですが日本語だとどうかというところが気になるところです。 自分が知りたいのは、 - 日本語の音源 - Podcastのように素人収録されたある程度ノイズが含まれた音源 - 1hくらいの長尺音源 - 複数人がクロストークしている音源 というような特徴を持った音声データに対してAPIだけでどこまで戦えるか(文字起こしできるか)だったので、いろいろ検証

                                                    Google Cloud Speech API vs. Amazon Transcribe - Qiita
                                                  • PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                                                    こんにちは! オフショア開発チームで通訳/翻訳をしているゆまです。 今回は長年の悩みだった「PDFの文字起こし」について、感動する出来事があったのでシェアさせてください。 ※手っ取り早く方法だけ知りたい方は、「Googleドライブで文字起こしする方法」からご覧ください! ある日の出来事 翻訳依頼が入りました。 しかし、原本がPDF…… しかもWordなどから生成されたものではなく、スキャンされた画像…… わかります……最終的に保管したい文書ってサイン済、捺印済の書類ですよね……。 これ、翻訳担当あるあるじゃないですか? 翻訳に限らず、コーポレートあるあるな気がするのですが、皆さんどうですか? けっこう前に締結した契約書をベースにしたい、でもWordファイルどっか行っちゃった、とか……。 原文、どうやって文字起こしする?手打ちする? さて、こういった状況の場合、どうやって文字起こししますか?

                                                      PDFから超簡単文字起こし!Googleドライブが優秀すぎた | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                                                    • 生成AIの活用事例 10選|masa_kazama

                                                      「テクノロジーで人々を適切な医療に案内する」をミッションに、医療プラットフォームを提供しているUbie株式会社の@masa_kazamaです。 この記事は#Ubieアドベントカレンダー5日目にエントリーしています。 今年は生成AI一色の1年でした。Ubieでは、生成AIをプロダクト活用と社内生産性向上の観点で取り組んでいます。(取り組みの詳細は、こちらの記事で紹介しています。) この記事では、社内生産性向上観点で、社内の業務プロセスに溶け込んでいて、なくてはならない使い方になっている事例を10個ご紹介します。その中のいくつかは、実際に生産性が倍以上になっていたり、外部委託のコストが半分になったりしています。この記事が、生成AIを活用している人や活用していきたい人のご参考になれば幸いです。 プロダクト活用にもいくつか事例が出ており、問診の内容を大規模言語モデル(LLM)を活用して要約する機能

                                                        生成AIの活用事例 10選|masa_kazama
                                                      • 文字起こしと日本語入力の未来

                                                        現在日本語を文字化するという手段は、キーボード入力を変換するためのIM(Input Method)が主力だが、開発できるのはOS提供会社と、ごく少数のサードパーティに限られる。 だが昨今、AI音声認識によるテキスト変換サービスが次々と登場し、テキスト作成にイノベーションをもたらしつつある。IM開発と違い、AI音声認識ではプレイヤーががらりと変わるというのが面白い。特にスマートスピーカーを展開している企業は常に音声データを解析しまくっているため、有利なのだろう。 Googleは直接コンシューマーユーザーにサービス提供しているが、AmazonはAWSの組み込みエンジンとして「Amazon Transcribe」を提供している。Appleは個人情報を持ちたくないだろうから、今のところ直接ビジネスをやるつもりはなさそうだ。 またベンチャーが多く参入しているのも、この世界の特徴である。国外企業もワー

                                                          文字起こしと日本語入力の未来
                                                        • OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog

                                                          地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 【IIJ 2022 TECHアドベントカレンダー 12/8(木)の記事です】 Whisperの追加学習に挑む2022年の冬 2022年アドベントカレンダー企画だそうです。 いかがお過ごしでしょうか。 私はもう興味を引くものに没頭するしか楽しみがないもんで、PCに向かってぼんやり面白いネタはないかなーと探す日々です。 最近はすっかりディープラーニングにズブズブで、とうとう数式かくのが面倒なあまり手書き入力のためのペンタブレットを買いました。てへ。 今回は9月から10月にかけてStabl

                                                            OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog
                                                          • Next.js + SvelteによるnoteのフロントエンドApp分割|note株式会社

                                                            ※ この記事は2021年6月21日に行われた「進化するフロントエンド2021 − 4プロダクトから学ぶSPA/PWAの技術と実践−」の登壇を文字起こししたものになります noteのフロントエンドの歴史 ではまず自己紹介をさせていただきます。フロントエンドエンジニアの山形と申します。よろしくお願いします。 去年の3月に入社したので、noteには1年3ヶ月くらいいます。趣味でコーヒーの焙煎とかやっています。 今回はnoteが抱えているフロントエンドの課題をどう解決していったのかを話していきたいと思います。 最初にnoteが今までどうやって実装されていたのか、その歴史を説明していきます。 初期のnoteはRuby on Railsのアセット上に構築されたSPAサイトで、フロントはAngularJSとCoffeeScriptで書かれていました。 この構成はかなりの問題を含んでいました。 1つ目はS

                                                              Next.js + SvelteによるnoteのフロントエンドApp分割|note株式会社
                                                            • 「Pixel 6」の「指紋認証が遅い」というツイートにGoogleがリプライ

                                                              ディスプレイ内センサーを採用した「Pixel 6」の指紋認証の反応が悪いというツイートにGoogle公式が返答。「強化されたセキュリティアルゴリズム」を採用したため、時間がかかると説明した。 「私は新Pixel 6が本当に気に入っているが、指紋認証が体験を台無しにしている」というユーザーの11月6日(現地時間)のツイートに、米Googleの公式Twitterアカウントが10分後に返答した。 Pixel 6シリーズの指紋認証は、背面ではなくディスプレイ内の光学式センサーによるものだ。Pixelシリーズでディスプレイ内センサーを採用するのはこれが初。 ユーザーのツイートは「ロック解除できるまでに6、7回トライしなければならないことがよくある。ソフトウェア更新で改善されるのを期待しているが、改善されなければこの端末をあきらめるかもしれない」と続く。 これに対しGoogleは「ご面倒をかけて申し訳

                                                                「Pixel 6」の「指紋認証が遅い」というツイートにGoogleがリプライ
                                                              • 100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明

                                                                OpenAIが、AIモデルのトレーニングに用いるために100万時間を超える分量のYouTube動画をダウンロードして利用していたことがThe NewYork Timesの指摘でわかりました。なお、YouTubeと同じ親会社AlphabetのもとにいるGoogleは、OpenAIの行為に気付いていましたが、自分たちも独自のAIモデルのトレーニングにYouTubeの動画を活用していたため、行動を起こさなかったとのことです。 How Tech Giants Cut Corners to Harvest Data for A.I. - The New York Times https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html Google reporte

                                                                  100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明
                                                                • M-1の漫才をデータで可視化すると、ミルクボーイ優勝の要因が見えてきた|Kosuke Fujita

                                                                  ゲセガーガーガーガーガーガーガーガーガー!! オウ、オウ!(ドュン、ドュン、ドュンン)オウ、オウ! どうもー @fujitako03 です!よろしくおねがいしますー これはBrainpad AdventCalendarの記事です。 今年のM-1、最高に面白かった!今年のM−1グランプリは皆さんご存知の通り、ミルクボーイが歴代最高得点を出しての優勝となりました。私も、コーンフレークのネタは自宅の机を叩きながら今年一番の大笑いをしました。 今年は歌ネタのニューヨークを皮切りに、鼓や扇子を使った漫才のすゑひろがりず、ツッコまないツッコミのぺこぱなど、とにかく漫才の幅が広かったように思います。「面白さ」だけでなく「新しさ」を求められるM-1グランプリは多様な漫才が見られて視聴者としてはとても楽しいのですが、その具体的な違いが何かと問われると、意外と難しいのではないでしょうか。そんなときはデー

                                                                    M-1の漫才をデータで可視化すると、ミルクボーイ優勝の要因が見えてきた|Kosuke Fujita
                                                                  • 音声文字起こし技術で業務効率化: Google Text to Speech と OpenAI Whisper の活用 - STORES Product Blog

                                                                    こんにちは、CTO室技術基盤グループの id:hogelog です。 STORES Product Blog でも多くの文字起こし記事がありますが、社内重要会議の文字起こしなど STORES 社内には様々なところで音声の文字起こし業務が存在します。そんな文字起こし業務ですが完全に人力で実施するのは作業コストがかなり高いです。今日はそのような業務を効率化する音声文字起こし技術とその変遷について紹介します。 Google Text to Speech の活用 以前 論より動くもの.fmを支える技術 〜Podcast初心者が使っているツール紹介〜 - STORES Product Blog でも紹介しましたが STORES 社内では Google Text to Speech が STORES 社内の様々な文字起こし業務に活用されてきました。 product.st.inc Google Text

                                                                      音声文字起こし技術で業務効率化: Google Text to Speech と OpenAI Whisper の活用 - STORES Product Blog
                                                                    • 録音しながら文字起こし。Googleの「レコーダー」がPixel 3aなどに対応

                                                                        録音しながら文字起こし。Googleの「レコーダー」がPixel 3aなどに対応
                                                                      • ブルアカ エデン条約3章 グローバル版セリフ比較 (ネタバレ注意)

                                                                        블루 아카이브의 핵심, "결국은 학원과 청춘의 이야기" | 웹진 인벤 - 인벤 https://m.inven.co.kr/webzine/wznews.php?idx=275674&iskin=webzine&lbTW=1bac9f62372f87ca6bd90c293c4a2d0 ブルーアーカイブ エデン条約3章 グローバル版のローカライズにあたり、クライマックスのセリフに変更が加えられている。 ニュアンスの調整目的のようだが、結構違う構成になっているように感じた。記事によると再録までしたらしい。 [블루 아카이브] 에덴조약 3장 히후미 일본서버/한국서버 대사 비교(エデン条約編 3章 ヒフミ 日本サーバー/韓国サーバー 代謝の比較 - YouTube https://www.youtube.com/watch?v=VVBUS1_GEKU 以下文字起こし 日本Ver グロ

                                                                          ブルアカ エデン条約3章 グローバル版セリフ比較 (ネタバレ注意)
                                                                        • 脊髄反射でクレベリン🙅‍♂️と言うんじゃなくて効果について調べた

                                                                          (投稿しようとしたら全然できなくて泣いた、リンク数でスパムフィルターって単純すぎるルールベースすぎませんか!) 水素水とかクレベリンとかNMRパイプテクターとか、いかにもエセ科学っぽいやつら、なんとなくエセ科学って判断してm9(^Д^)してる人が自分含めほとんどだと思うんだよ。結局「twitterで皆が言ってたから」レベルで、エセ科学/陰謀論信じる人と大差ないんじゃないかと思って、まずはクレベリンについて調べてみた。 調べたと言っても日本語の論文やらWebサイトを探しただけ、個人で実験するとか無理だし、僕は化学専攻だったわけじゃないし、英語苦手だし。 「こんな論文or調査があるよ」とか「いや、それはお前が完全に読み間違えてる」とかあれば指摘してくれると嬉しい。 クレベリンについて公式サイト ttps://www.seirogan.co.jp/cleverin/ 大幸薬品の製品、正露丸のメー

                                                                            脊髄反射でクレベリン🙅‍♂️と言うんじゃなくて効果について調べた
                                                                          • 「Android 13」は日本語の改行が自然に TextViewに新機能

                                                                            Googleは7月14日、現在ベータ版が配布されている「Android 13」の日本語関連機能として、アプリ内の文字表示などに使われる「TextView」での文節による改行と、IMEの未確定の変換候補をアプリ側が取得できるようになったと発表した。 単語ごとにスペースで区切る英語などと異なり、日本語は単語をつなげて文章とするため、アプリ内の表記など、単語の途中で改行されてしまうことがあるという。大抵の場合はこの動作で問題はないものの、見出しや中央寄せの場合、見栄えが悪くなってしまう。そこでAndroid 13は、TextViewに文節を保ったまま改行できるようになる機能を追加した。 変換候補の取得は、アプリで検索機能を提供する際を想定したもので、日本語での逐次検索が提供しやすくなるという。日本語の場合、例えばIMEで「かた」とひらがな入力している間は、アプリ内で漢字の「肩」を含むデータを検索

                                                                              「Android 13」は日本語の改行が自然に TextViewに新機能
                                                                            • オンライン英会話の強い味方!一緒に使うと効果的な無料アプリ「Otter」とは? - 塾の先生が英語で子育て

                                                                              オンライン英会話はコストも安く、効果も高い英語学習におすすめの方法のひとつです。 この記事では、オンライン英会話の効果を上げるために、オンライン英会話中に一緒に使うと効果的なアプリ「Otter」をご紹介します。 この記事を読んで、「Otter」を使ってみようかなと思っていただけるかもしれません。 「Otter」とは 「Otter」の活用法 「Otter」の利点 最後に 「Otter」とは 「Otter」は音声の文字起こしをしてくれるアプリです。 Otter Voice Meeting Notes AISense Inc. 仕事効率化 無料 apps.apple.com play.google.com 私もオンライン英会話の際に使用しています。 私は下記の記事を拝見させていただきその存在を知りました。 k-tai.watch.impress.co.jp 有料プランもありますが、無料プランでも

                                                                                オンライン英会話の強い味方!一緒に使うと効果的な無料アプリ「Otter」とは? - 塾の先生が英語で子育て
                                                                              • 【2024年1月】エンジニアなら読むべき技術書TOP5 - Qiita

                                                                                世界一流エンジニアの思考法 noteでも大人気! 米マイクロソフトのエンジニアが放つ最前線の仕事術 頭が先、手は後。一流の仕事のカギは順序にある。 ――楠木建(経営学者) 知的生産へのリスペクトがイノベーションの源泉だ。 ――落合陽一(メディアアーティスト) 「怠惰であれ!」「早く失敗せよ」―― 米マイクロソフトの現役ソフトウェアエンジニアの著者が、超巨大クラウドの開発の最前線で学んだ思考法とは? “三流プログラマ”でもできた〈生産性爆上がり〉の技術! ・試行錯誤は「悪」。“基礎の理解”に時間をかける ・より少ない時間で価値を最大化する考え方とは? ・「準備」と「持ち帰り」をやめて、その場で解決する ・マルチタスクは生産性が最低なのでやらない ・“脳の負荷を減らす”コミュニケーションの極意 ・コントリビュート文化で「感謝」の好循環を生む……etc. 仕事と人生を「自分の手でコントロールする

                                                                                  【2024年1月】エンジニアなら読むべき技術書TOP5 - Qiita
                                                                                • Googleドキュメント、スプレッドシート、スライドで便利な小技21選

                                                                                  Googleドキュメント、スプレッドシート、スライドで便利な小技21選2020.01.03 12:0037,446 David Nield [原文] ( mayumine ) 知らなかったら覚えてほしい。 Google ドキュメント、スプレッドシート、スライドは、どのコンピューターからでもアクセスできて、世界の人々の仕事の生産性を上げるツールに進化してきました。毎日使っている人も多いと思われるGoogleのツールですが、充分に活用できていると思いますか? これから紹介する21の小技で、劇的に作業効率を上げ、時間を短縮し、生産性が爆上がりするかもしれません。 1. URLから直接新規ファイルを作成するブラウザに直接、docs.new、sheets.new、 slides.new と入力することで、Googleドライブを起動せずにファイルを新規作成できるショートカットです。 ショートカットはい

                                                                                    Googleドキュメント、スプレッドシート、スライドで便利な小技21選