最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用してGoogleドキュメントに議事録などの自動文字起こしをしてもらう方法です。詳細は以下から。 以前、既に開発が終了したCycling ’74チームのSoundFlowerのように、特定のアプリからの音声を他のアプリに送るれる仮想オーディオデバイスをMac内に作成できる仮想オーディオ入出力ユーティリティ「BlackHole」を紹介したさい、WWDCのセッションや議事録をGoogleドキュメントの音声入力に接続することで簡単に文字起こしができるという事を教えていただいたので試してみてください。(コメントでのご指摘ありがとうございます) 設定 まず、文字起こしを行う音源が入ったMacにBlackHoleをインストールし、macOSのAudio MIDI設定アプリからBlackHoleの仮想オーディオデバイス
こんにちは! オフショア開発チームで通訳/翻訳をしているゆまです。 今回は長年の悩みだった「PDFの文字起こし」について、感動する出来事があったのでシェアさせてください。 ※手っ取り早く方法だけ知りたい方は、「Googleドライブで文字起こしする方法」からご覧ください! ある日の出来事 翻訳依頼が入りました。 しかし、原本がPDF…… しかもWordなどから生成されたものではなく、スキャンされた画像…… わかります……最終的に保管したい文書ってサイン済、捺印済の書類ですよね……。 これ、翻訳担当あるあるじゃないですか? 翻訳に限らず、コーポレートあるあるな気がするのですが、皆さんどうですか? けっこう前に締結した契約書をベースにしたい、でもWordファイルどっか行っちゃった、とか……。 原文、どうやって文字起こしする?手打ちする? さて、こういった状況の場合、どうやって文字起こししますか?
こんにちは、CTO室技術基盤グループの id:hogelog です。 STORES Product Blog でも多くの文字起こし記事がありますが、社内重要会議の文字起こしなど STORES 社内には様々なところで音声の文字起こし業務が存在します。そんな文字起こし業務ですが完全に人力で実施するのは作業コストがかなり高いです。今日はそのような業務を効率化する音声文字起こし技術とその変遷について紹介します。 Google Text to Speech の活用 以前 論より動くもの.fmを支える技術 〜Podcast初心者が使っているツール紹介〜 - STORES Product Blog でも紹介しましたが STORES 社内では Google Text to Speech が STORES 社内の様々な文字起こし業務に活用されてきました。 product.st.inc Google Text
音声データからの文字起こし。専門の業者がいるほど、手間と時間がかかるものです。ICレコーダーなどで録音した音声を聞きながら、ちょっとずつテキスト入力をしていくのが伝統的な方法ですが、かなり時間がかかります。 しかし、人間は進化する生き物。なんとGoogleドキュメントを使って、音声データから自動で文字起こしをする方法が編み出されているのです! そこでこの記事では、その方法を解説していきます。 Windows 10で自動文字起こしをする方法 用意するものは、音声データ、PC(WindowsでもMacでも可)、Googleドキュメントです。あとは少々の設定。たったこれだけで、音声データから自動で文字起こしができるようになります。 最初に、Windows 10での自動文字起こし方法について解説します。 サウンドの入出力の設定を変更する まずは「サウンド」コントロールパネルを開き「録音」タブを開き
AI 業界の進化が著しい昨今、AI の研究開発企業として名高い OpenAI から Whisper というとんでもない自動音声認識モデルの発表がありました。(2022/09/22)Whisper は 68 万時間かけてトレーニングされた自動音声認識モデルでなんとオープンソース化されています。 公開されているサンプルでは早口や K-POP、フランス語、アクセントのある会話などを問題なく処理できることが示されています。また日本語に関しても高い精度を保持していることがグラフから見て取れます。 Whisper の GitHub リポジトリより引用 この記事で行うこと この記事では Whisper を Google が提供する Colaboratory で利用し、文字起こしツールを作成していきたいと思います。 今回やりたいことは以下の 3 つになります。 音声データから文字起こしができる 文字起こし
事前にパソコンの「ステレオミキサー」を有効にする Googleが提供する無料のワープロソフト「Googleドキュメント」には「音声入力」機能があるのをご存じだろうか? 画面上部の「ツール」から「音声入力」を選択すると、パソコンに接続したマイクで喋った音声を文字に起こすことができる。実は、この音声入力機能を使えば、パソコンで再生したYouTubeなどの動画音声を「Googleドキュメント」に送って、動画の音声を文字に起こすことが可能なのである。 ただし、「Googleドキュメント」の音声入力に、パソコンで再生している動画の音声を回すには、パソコンにスピーカーを接続したうえで、サウンド設定から「録音」の「ステレオミキサー」を有効にする必要がある。この設定方法はちょっと複雑なので、下の写真を見ながら行おう。 もし、「ステレオミキサー」が表示されない場合は、対応するドライバーをインストールすること
ボイスレコーダーやスマホで録音した音声データを聞きながら、文書を作る「文字起こし」をもっと簡単に済ませることができれば、ビジネスシーンにおける〝時短〟につながるのではないでしょうか。 実はGoogleドキュメントなら、「ツール」から音声入力を選択するだけで、自動で文字起こしができます。 Google ドキュメントの文字起こし機能は基本無料で使える! Google ドキュメントは、ほとんどのGoogle系アプリと同様に、基本無料で利用可能。文字起こし機能も、無料で使えます。 ただし、保存できるデータ容量は1つのGoogle アカウントに対して15GBまで。保存容量は、GmailやGoogle フォトといったほかのサービスと共用になるので、データの管理には注意しましょう。 15GBでは足りないという場合は、ストレージ容量をアップグレードできる「Google One」への加入がおすすめです。 【
「IVS2023 KYOTO」内にて、次世代の起業家の登竜門とも言われる日本最大級のスタートアップピッチコンテスト「IVS LAUNCHPAD」が開催されました。本記事では、海外のピッチコンテストで10度以上優勝を経験しているPoeticsの山崎はずむ氏による、セールステックからより大きなAI API市場への展開ついての6分間のプレゼンテーションをお届けします。 「なぜ失注したのか」が見えない、営業のブラックボックス化 山崎はずむ氏(以下、山崎):はじめまして、Poeticsの山崎と申します。我々は電話・オンライン商談を解析するAI「JamRoll」を提供しています。 JamRollが解決する課題は、営業のブラックボックス化問題。成約・失注といった結果はSalesforceを見ればわかりますが、「なぜ失注したのか」というプロセスが見えないと改善策を打ち出せません。 一方で、成約や失注の原因
AI自動文字起こしサービスNotta、再進化。 | Google Meet・Microsoft Teams会議を自動文字起こしする新機能追加「Notta Bot」は3大Web会議 (Zoom, Google Meet, Microsoft Teams) を連携できるようになりました! MIND CRUISER LIMITED(代表取締役兼CEO: ライアン・チョウ、以下MIND CRUISER)は、58言語に対応したAI音声認識文字起こしサービス『Notta(ノッタ)』の「Notta Bot」機能はGoogle Meet・Microsoft Teams会議を自動文字起こしする新機能を追加しました。 「Notta Bot」をWeb会議に追加することで、会議内容を自動で録音し、リアルタイムで文字起こしをします。 「議事録を取るのに夢中になって、重要な会議内容を聞き逃してしまう…」 「議事録の作
グーグルから最新スマートフォン「Google Pixel 6a」が、7月28日に発売される。5月に開催された開発者向けのイベント「Google I/O 2022」で発表された製品で、現在auとソフトバンクのほか、「Google ストア」でも予約を受付中だ。Google ストアでの販売価格(税込)は5万3900円となっている。 Google Pixelシリーズは最新の「Android」OSを搭載し、グーグルの最先端のテクノロジーをいち早く体験できるスマートフォンだ。 なかでも製品名の最後に「a」がつくモデルは、最新OSのユーザー体験はそのままに、ハードウェアのスペックを抑えた廉価版と、筆者は認識していた。 しかし今回のPixel 6aは、上位モデルにあたる「Google Pixel 6/6 Pro」と同じチップセットである「Google Tensor」を搭載するなど、これまでとは少し様子が違
TD;TL Google Speech to Text APIとWeb Speech APIを併用することで実現する 音声検出のみWeb Speech APIを使い、文字起こし自体はGoogle Speech to Text APIを使うことで、ブラウザ文字起こしにおいてリアルタイム感と精度の高さを両立する 発端 現在開発中のプロダクトの中で、Speech to Textの仕組みを導入するために様々な方法を調べていました。 オンライン会議中の会話を文字起こししたり、アジェンダや議事録を一括で管理できるサービス「Telelogger」というサービスなのですが、コアとなる機能が会議中の会話の文字起こしです。 サービスはWebアプリケーションとして提供するため、ブラウザでの文字起こしを想定しています。 対象ブラウザをGoogle Chromeに絞った上で、最初はWeb Speech APIを試し
Google Pixelとは、Googleが発売したスマートフォンです。 実は、Google Pixelには、リアルタイムで文字起こしできる機能があることをご存知でしたか? 今回は、「Google Pixelで文字起こし」に焦点を当て、その概要や機能、利用シーン、注意点などについて解説します。 Google Pixelついて気になる方やGoogle Pixelでリアルタイム文字起こしがしたい方はぜひご一読ください。 Google Pixelとは?Google Pixelとは、Googleが提供しているスマートフォンです。 第1世代は2016年10月4日に発表され、同月20日にアメリカ合衆国等で発売されました。 中でも最新のPixel 7 は、2022年秋に発表されたAndroid搭載の最新スマートフォンです。 補足:Pixel 7 の主な特徴最新のPixel 7 は、Google Pixe
Googleの文字起こしアプリが日本語対応に! Pixel 6の音声認識力がすごいんだって… #Pixel6Launch2021.10.20 02:0033,633 嘉島唯 Googleさんありがとうございます……。 Googleから新しく発表されたPixel 6、Pixel 6 Proは、Google初のSoCであるTensorが載っています。これによって処理機能が大幅に向上。いろんなことができるようになりました。GoogleいわくTensorによって「もっとも高度な音声認識を実現」しているといいます。 なかでも最高なのがレコーダーアプリ。録音しながら自動的に文字起こしまでしてくれます。今まで英語のみで使える機能でしたが、Pixel 6からは日本語、フランス語、ドイツ語が対応しました。最高!!!! Image : Google文字起こしの方法は本当に簡単。デフォルトで入っているレコーダー
【圧倒的精度に感動】Googleドライブを使って本の画像から文字起こししてみた 私も紙の本を月10冊程度読んでいるのですが、そのときにいつも困るのが読書ノートの作成なんですよね。 読書後に印象に... 簡単に言えば、Googleドライブに保存した画像やPDFを右クリックから文字にできるという優れものです。 他にも同じような製品は出ているんですが、Googleの精度が高すぎてこれだけでいいかなってなってます。 ただし、Googleドライブを利用する際一つだけ不満がありました。 それは、『一括で処理することができないため、1つ1つGoogleドキュメントで開く必要がある』ということ。 文字起こししたい画像が20個あったら、20回右クリックしなければならないんです。 これは流石にイケてない。 そう思い、少しでも効率化できないか調べた結果、いい感じに一括で文字起こしできるスクリプトが作れたので共有
取材やインタビューをする際に、テープレコーダーや動画を回して議事録を取っているという方も多いと思います。 しかし、そのあとに待っているのが、文字起こし地獄。文字起こしをするだけで、かなりの時間を費やしてしまうこともしばしば・・・。 でも実はこの作業、Googleドキュメントというツールの音声入力を使うことで、簡単にラクできることをご存知でしょうか? ただ、このGoogleドキュメントの使う方法は、初期設定だけ少しめんどくさいんです。そこでこの記事では、画像付きでその初期設定方法を解説していければなと。 また、本記事で紹介している方法であれば、文字書き起こし時に起こる無音になる現象を回避することができるので、自分で音声を確認しながら自動文字起こしできるようになりますよ!
「Googleドキュメントを使って文字起こしできるの?」会議やインタビューの文字起こしをするときは、なるべく手作業の手間を省きたいですよね。今回は手軽に利用できるGoogleドキュメントの文字起こしの方法を解説します。本記事を読んでいただければ、Googleドキュメントを利用して今までよりも楽に文字起こしできるようになるでしょう。 Googleドキュメントとは?”Googleドキュメント”はGoogleが提供している文章作成ツールで、オンラインで文書の作成や編集ができます。端末本体ではなくインターネット上に保存するため、複数人が共同で編集することも可能です。Googleアカウントをお持ちであれば無料で利用できるので、気軽に使いやすいのがメリットといえます。 Googleドキュメントの「音声入力」は、パソコンやスマホのマイクに向かって話した内容を自動で文字入力する機能です。音声入力を起動しな
はじめに 初めまして、4月からアスクルに新卒入社しました、「みわすけ」です。 新卒エンジニアとして、まだまだ勉強中ではありますが、今回ヤフーさん主催の「Yahoo! JAPAN Internal Hack Day 17」というイベントに参加させていただきました。 HackDayとは テクノロジーを、もっと身近に、もっと楽しく。Hack Dayは、ものづくりの面白さを体験する祭典です。日本最大級のハッカソンや、注目のコンテンツを揃えた体験ブースなど、盛りだくさんのイベントを毎年開催しています。(https://hackday.jp より) その中で、我々アスクルチームは会議の議事録を取る行為をエンジニアリングで解決しようとなり、24時間で開発していきました。この記事ではその中で「発言を文字起こしする」部分に使用したGoogleのCloud Sppech-to-Textの使い方について解説しま
Google純正チップで全面強化。Pixel 6/ Pixel 6 Proは10月28日から発売です #Pixel6Launch2021.10.20 02:0016,811 嘉島唯 「ようやく」といった感じでしょうか。 GoogleがPixel 6、Pixel 6 Proを発表しました。予約は10月20日からで28日にで発売。価格はPixel 6が7万4800 円(税込)〜、Pixel 6 Proが11万6600 円〜です。取り扱いはGoogleストア、ソフトバンク、KDDI(Pixel 6のみ)。 Pixel 6シリーズでは、ついにGoogleが独自開発初のプロセッサ「Google Tensor」が搭載されました。チップからソフトまですべてをGoogleがデザインした初めてのスマートフォンになります。 サイズは大きく、バッテリーも心強くImage : GooglePixel 6は6.4イ
フィードバックを送信 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 これは 2023 年 1 月の Google SEO オフィスアワーの文字起こしです。サイト固有のヘルプを得るには、Google 検索セントラルのヘルプ コミュニティに質問を投稿することをおすすめします。 メタキーワードは重要ですか? Lizzi: メタキーワードは今でも SEO に役立ちますか? いいえ。役立ちません。Google がメタキーワードを使用しない理由については 2009 年のブログ投稿で詳しく紹介していますので、気になる場合はそちらをご覧ください。 ブランド名がそのまま表示されないのはなぜですか? Gary: Kajal さんからの質問です。「ブランド名は Quoality で、スペルは "Quebec Uniform Oscar Alpha Lima India Tan
Googleドキュメントの便利な使い方を紹介します。 今さら聞けないGoogleドキュメントの便利すぎる使い方 時間のかかる文字起こしをGoogleドキュメントで自動入力する方法 ボイスレコーダーやスマホで録音した音声データを聞きながら、文書を作る「文字起こし」をもっと簡単に済ませることができれば、ビジネスシーンにおける“時短”につながるのではないでしょうか。 実はGoogleドキュメントなら、「ツール」から音声入力を選択するだけで、自動で文字起こしができます。 【参考】https://dime.jp/genre/1226761/ Googleドキュメントの音声入力機能を使って議事録作成を効率化する裏ワザ 議事録の作成やテープ起こしが面倒……そんなあなたにぴったりのサービスがあることをご存じでしょうか。 「Googleドキュメント」はGoogleアカウントを持っていれば誰でも基本無料で使え
Googleのブラウザ「Chrome」で英語のライブキャプション(自動字幕起こし)機能を利用できるようになった。 Chromeを最新版にアップデートし、設定の「詳細設定」を開いて「ユーザー補助機能」で「自動字幕起こし」をオンにすると、ライブキャプション用のコンポーネントがダウンロードされる。 オンラインビデオ、ポッドキャスト、ネットラジオなど、Chromeで音声を再生するとライブキャプションのウィンドウがフロートし、音声の英語の文字起こしが表示される。音声チャットや、Chromeで再生するローカルのファイルでも利用できる。ローカルのコンテンツの場合、オフラインでも機能する。再生音声の音を消しても自動字幕起こしは継続するので、例えばヘッドホンを持っていなくて音を出せない時でも、自動字幕起こしを使って内容を確認できる。字幕はコンテンツの再生に合わせてデバイス内で生成され、自動字幕起こしのデータ
書籍や資料のアナログデータをPCに文字起こし。読めない他国語を日本語に翻訳。気になる商品を検索したい。レストランで出てきた知らない料理の名前を調べたい。 そんな時に役立つ「Googleレンズ」をご存じでしょうか。 【参照】Googleレンズ PCへの文字起こしが簡単に! Googleレンズを使えば、カメラで撮影するだけでアナログのテキストデータを簡単に文字起こしできます。 Googleレンズを起動して「文字」を選択。文字起こしをしたい書籍や書類にカメラを向けます。次に画面下部の〇ボタンをタップ。 次に「すべて選択」をタップします。 そして「パソコンにコピー」をタップします。 以上の操作ができたら、PCで「Chrome(ブラウザ)」を立ち上げ、GoogleレンズにログインしているGoogleアカウントと同じアカウントでログインしてみましょう。 スマホの画面にPCが表示されるので「選択」をタッ
風音屋では、データエンジニア、データアナリスト、データコンサルタントを募集しています。 書籍執筆者やOSSコントリビューターなど、業界を代表する20名以上のアドバイザーと一緒にベストプラクティスを追求できる環境です。 ぜひカジュアルトークをお申し込みください。 風音屋(@kazaneya_PR)代表 ゆずたそ(@yuzutas0)です。 この記事は、Google Cloud Champion Innovators Advent Calendar、BigQuery Advent Calendar、datatech-jp Advent Calendar 2023 24日目の記事となります。 2023年11月に、Google Cloud Next Tokyo ‘23 というカンファレンスで「大学におけるデータ分析の授業」について話をしました。 この記事は発表内容の文字起こしとなります。講演スライ
この記事でわかること Googleドキュメントで文字起こしをする方法 Googleドキュメントで文字起こしをする際に気をつけたいポイント より高い精度で文字起こしができるおすすめの文字起こしソフト6選 「スマート書記」を無料で14日間試してみる or 資料を請求する 日々の会議の議事録やインタビュー・商談のドキュメント作成などでまとめるためにも、文字起こしして文章を確認したいという方も多いかと思います。 ただ、自分で文字起こしをするのには、時間や労力がかかり大変な作業となってしまいます。文字起こしを手作業で行う人のなかには、「どうにかこの時間や労力を削減できないか」と考えている方も多いと思います。 そこで本記事では、普段利用されていることも多い「Googleドキュメント」で文字起こしをする方法についてご紹介します。 Googleドキュメントではどんな方法で文字起こしができるのか スマホ・P
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く