サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
都知事選
8089.co.jp
テレワークの導入によりZoomやSkype、Microsoft TeamsといったWeb会議ツールを使った会議や取材なども今は当たり前になってきているが、その際に発言内容をリアルタイムで文字化できると、会話ログの作成や議事録作成のスピードアップや省力化を図れるなど、もっと生産性を向上させることが可能だ。 前回は個人の方が開発されたWeb会議での発話をリアルタイムで文字に書き起こせる便利ツールを取り上げたが、今回はサービスとして提供されているもので 現在無料あるいは低価格で簡単に利用できる Zoom、Skype、Google Meet、Microsoft Teams等(以下、各種Web会議ツール)で利用できる リアルタイムで文字起こしができる という3点を満たすサービスの中から、3つを選んで紹介する。 ※本内容は、2020年7月13日現在の情報です。 → 情報を更新しました。本内容は、更新日
Web会議での発話をリアルタイムで文字に書き起こせる便利ツール2選。Zoomなどと併用可能! 2020.05.28 音声入力 Web会議ツールは無料版から有料版までいろいろとあるが、まだ音声・ビデオ会議の日本語でのライブ自動文字起こしや字幕表示には対応していないツールも多い。例えば人気のZoomでも音声認識による日本語ライブ自動文字起こしや字幕表示は対応が待たれる現状だ。 そこで今回は、ZoomなどのWeb会議ツールと併用可能な、Web会議での発話をリアルタイムで文字に書き起こせる便利ツールを2つ紹介したいと思う。どちらも個人の方が開発されたツールで、ソースコードはGitHubで公開されている。実際にWeb会議で使う際にはどう取り入れるかなど初めにいろいろと試めす必要があるかもしれないが、興味があればこれをきっかけにいろいろと試行錯誤してみてはいかがだろうか。 【目次】 音声認識で会話ログ
文章に読点を自動で挿入してくれるツール。操作はとても簡単で、テキストエリアに処理したいテキストを入力し、「予測」ボタンを押すだけだ。 使い道の例を挙げると、句読点と改行の自動挿入に対応していない音声認識サービスやアプリ等を使って音声の自動文字起こしを行った場合、認識結果のテキストは句読点や改行が一つもない全文がつながった文章になってしまう。 句読点や改行が全くない文章は、内容は高精度で起こせていても非常に読みづらいものだが、そのときはこのツールを使って読点を挿入すると、ぐっと読みやすくなるのでおすすめだ。 なお、句点と改行については、除去するツールはあるのだが、自動で挿入してくれるツールは今のところ見つけられていない。
WindowsやMacで音声認識を使って録音音声を文字化したいと思っても、無料で使えるものには音声入力の機能しかなく、それで録音音声の文字化を試してもうまく認識されなくて、残念に思ったことはないだろうか。 そんなときにはこの方法をお試しあれ。うまく文字化できるかどうかは音声によるが、音声認識に適した音声であれば、録音音声でも音声入力の機能を使ってサクサク文字化を行うことが可能だ。 なお、今回の内容は次のエントリーの補足となるので、興味のある方はこちらもどうぞ。 【参考】音声認識を使って効率的にテープ起こしをする、現在の個人的おすすめ Googleドキュメントについては(3)を参照。 今はさまざまな音声認識ソフト/アプリ/サービスがあるが、長時間の音声を扱ったり例えばその後に修正等をして納品物として仕上げたりするのは、やはりパソコンで作業したい場合が多いだろう。ただ、WindowsやMacで
テープ起こしは、録音された音声を聞きながらそれを文字化(テキスト変換)する作業あるいは仕事で、「音声起こし」、「文字起こし」、「書き起こし」と呼ばれることもある。 録音の内容を文字化したいと思っても、手書きであれ、タイピングであれ、それを全て手作業で行うのはとても大変。何とか楽にテープ起こし(音声の文字化)ができないものかと考える人は多いだろう。 この悩みを解決する可能性を秘めたツールの一つが音声認識だ。ちなみに、音声認識とは人間の声などをコンピューターに認識させること。現在はさまざまな音声認識ソフトやサービスがあり、「音声入力」や「録音音声の文字化」を行うことができる。 「録音音声の文字化」というと、自動的にコンピューターが録音の内容を起こしてくれるの?! と期待するかもしれない。ただ、この機能、現状では音声を選ばないと使い物にならないというのが正直な感想。とはいえ、一部の音声はうまく起
「“音声認識を使って効率的にテープ起こしをする”をテーマに、現在の代表的な音声認識ソフトやサービス、テープ起こしをする際におすすめのもの、音声認識を使ってテープ起こしを効率的にする方法などについて、まとめる」 次の表は(1)でも紹介した、代表的な音声認識ソフトやサービスをまとめたものだ。スタンドアロン型のものだと選択肢は少なく対応環境も限られるが、クラウド型のものも含めるとユーザーは多くの選択肢からその環境や用途に合ったものをチョイスできるようになる。 機密情報を含んだ音声を起こす場合は(2)で述べたように基本的にオフラインで音声認識が使えるスタンドアロン型のものをおすすめするが、クラウド型のものはその仕組みからスタンドアロン型のものより高精度な認識が期待できるだけでなく、無料あるいは安価で使用できるものも多い。特に機密情報を含んだ音声でもなく、またクラウド型の音声認識を使っても問題ないと
テープ起こしに生かせる?音声認識製品・サービス、最新情報(2) ―Voice Rep Pro― 2014.02.06 音声入力 「録音音声の書き起こしができる製品・サービスが新登場、その実力やいかに?」 2013年11月、録音音声の書き起こしができる製品・サービスが新たに登場した。「Voice Rep Pro(ボイスレップ プロ)」(株式会社GING)と「VoXT(ボクスト)」(株式会社アドバンスト・メディア)だ。 音声認識の精度も上がりその機能が身近になってきた今、テープ起こしも音声認識で楽にできるんじゃないかと思っている人は多いだろう。実際のところはどうなのか。これらの新しい製品・サービスについて、今回は実際の使用感や精度などをレビューしたい。 なお、今回取り上げる製品・サービスの最大の特徴は、インターネットを介したものだということ。メリットも多いが、その裏には多くのリスクも潜んでいる
「音声認識の第2次ブームといわれる今に至るまでには何が起こっていたのか。開発を進める主な企業の歴史から音声認識技術の変遷を追う」 前回までの記事はこちら ≫ニュアンス・コミュニケーションズ ≫アップル ≫グーグル ≫マイクロソフト ≫アドバンスト・メディア ≫フュートレック この連載の最後となる今回は株式会社レイトロン(以下レイトロン)という日本企業について紹介したい。 ■レイトロン レイトロンは1992年に設立した大阪の会社。独立系のLSIデザイン会社で、さまざまな企業の依頼を受けて用途に合わせたASIC(特定用途向けIC)やLSIを設計開発している。 音声認識については、北海道大学の宮永研究室との共同研究により、雑音環境下に強いロバスト音声認識専用のハードウェアエンジン(LSI)を開発。2007年には、このLSIが使われた「Chapit(チャピット)」と呼ばれる音声認識コミュニケーショ
「音声認識ソフト等を使って楽にテープ起こしができないか、その方法を模索する」 1回目は音声認識ソフトの録音音声の書き起こし機能について、2回目はYouTubeの自動字幕付与機能について取り上げたが、結果としてテープ起こしで依頼されるような音声をそのままこれらの機能で書き起こせるかというと、現状では難しいと感じた。 どちらの機能においても、基本的に音質の良し悪しと、話者の声や状況(話し方の癖や複数話者での会話など)に認識精度がかなり左右されてしまうからだ。結局、音声としては、音質がよく、基本的に一人が適度な速さではっきりとしゃべっているようなものが一番認識されやすい。 音声認識を利用してすでに録音された会議やインタビューなどの音声を書き起こしたいといった場合、今のところはやはり録音された音声の復唱という方法が一番確実なのかもしれない。今回は録音音声の復唱という方法について考えてみたい。 音声
「音声認識ソフト等を使って楽にテープ起こしができないか、その方法を模索する」 突然だが、テープ起こしをしたことがあるだろうか。テープ起こしとは、会議・講演・セミナー・インタビューなどで録音・録画された内容を聞き取り、原稿に書き起こすことだ。議事録を作成するためなど、そのような録音された音声を文字化したいという要望は多い。 しかし経験のある方は分かると思うが、それはとても骨が折れる作業である。そのため、その作業を請け負うテープ起こし専門の会社も数多く存在するが、テープ起こしを依頼する側も依頼される側も、例えば音声認識技術を利用することで楽にテープ起こしができないかと一度は考えたことがあるのではないだろうか。 ということで、現状ではその音声の性質からどうしても人の手で行われることが大半であるテープ起こしだが、音声認識技術も進化してきた今、身近な音声認識ソフト等で楽にテープ起こしができないだろう
「音声認識ソフト等を使って楽にテープ起こしができないか、その方法を模索する」 前回は代表的な音声認識ソフトの「録音音声の書き起こし機能」を使用することで楽にテープ起こしができないかを考察した。結果としては、残念ながらテープ起こしで依頼されるような音声をこの機能によって直接認識させることは仕様的にも難しく、現状ではやはり厳しいという結論に至った。 とはいえ、仕様を満たした音声であればこの機能で問題なく書き起こしはできるので、音声をそのまま直接認識させると厳しいが、認識できるような音声にしてやればいいのではないか、と感じている。 そう考えると、真っ先に思い付く方法としては、やはり自分の声での復唱ではないだろうか。高い精度で認識させるには、それが最良の方法だろう。だが、個人的にはやはり自動的にテープ起こしができたらうれしい。音声認識技術の進化が感じられる今、その技術の利用で何とか楽にテープ起こし
「音声認識の第2次ブームといわれる今に至るまでには何が起こっていたのか。開発を進める主な企業の歴史から音声認識技術の変遷を追う」 CPUやメモリの進化、通信回線の広帯域化、またクラウドの登場などをきっかけに音声認識の第2次ブームといわれている今、パソコンやスマートフォンに音声認識技術が組み込まれるほか、音声で操作できる家電なども続々と登場している。また、前回の記事で紹介したようなヒト型コミュニケーションロボットの開発も着々と進んでいる。 さまざまなニュースからは夢のように思われていた機器(マシン)と人が本当に対話できる世界もそう遠くないのかもしれないと感じられるが、音声技術の歴史は古く、人工知能のようにガイドしてくれるサービスの裏側には1960年代ごろからの約50年近い技術開発の積み上げがある。 その長い年月の間には何が起こっていたのか。音声認識技術の開発を進めている主な企業に焦点を当て、
「ドラゴンスピーチを使っていく上で感じた認識率を高めるポイントやコツ、また録音データの文字化におけるポイントなどについて紹介する」 今回は「ドラゴンスピーチ11 日本語版」について、調べたり検証したりした中で感じた音声の認識率を高めるポイントをご紹介したいと思う。状況によっていろいろと変わると思うが、よければ参考にしてほしい。 【プロファイルについて】 前回プロフィルについて少し触れたが、プロファイルとは声質、文章スタイルの特徴、使用する音声デバイスの情報、トレーニングの情報などを記録した一連のファイルで、ドラゴンスピーチはそれらの情報を音声の認識に役立てている。 ■まず、ヘッドセットマイク利用時はトレーニングをスキップできるが、認識精度を求めるならトレーニングは行った方がよい。 トレーニングの仕組みは、文章と音声を照らし合わせ、話者の声の高さ・トーン・癖等を学習させるというもの。そのため
2021.06.23 AI/音声認識関連の最新カオスマップ[2020-2021年版] カオスマップは、特定の業界に絞ってサービスやプロダクトをカテゴライズして一覧化したもので、業界地図ともいわれている。今はさまざまな業界のカオスマップが存在しているが、ここではAI/音声認識関連のカオスマップをいくつか紹介したい。 各カオスマップは、それぞれの企業が独自調査を行い独自の視点で作成しているものであり、網羅性・正確性を保証するものではないが、カオスマップを見ることで業界のプレーヤー(企業 […] 2021.03.23 初心者/初級者向けの無料英語学習アプリ・おすすめ[2021年3月] 今回は、無料で使える初心者/初級者向けの英語学習アプリを探している方に向けて、個人的におすすめだと思うアプリを紹介したい。なお、アプリは最終更新が2020年以降のものに限定し、厳選した。 今はさまざまな英語学習アプ
「多くの点でグレードアップしている「ドラゴンスピーチ11」。 その中でも特に録音データの文字化に焦点を当てて紹介する」 ドラゴンスピーチの新バージョンがついに発売された。ドラゴンスピーチは米ニュアンス・コミュニケーションズが開発した音声認識ソフトで、国内では2005年にリリースされた「ドラゴンスピーチ2005」以来、約7年ぶりのバージョンアップとなる。 最新版の主な特長は、次のようなもの。最近のニーズに対応したバージョンアップとなっている。 ●旧バージョンの2倍となる約100万語の音声認識辞書の搭載 ●事前学習が不要で、インストール後すぐに使える(ヘッドセットマイク利用時のみ) ●日本語だけでなく英語の音声認識も可能 ●音声でパソコンの操作やインターネットの検索・投稿などの操作が可能 ●Bluetoothマイクや、iPhoneやAndroid携帯をワイヤレスマイクとして使用可能 ●指定のフ
※ 土日祝祭日の営業はお休みです。 ※ 18時以降に届いた音声データは翌営業日からの納期カウントとなります。 ※ 録音時間の端数は切り上げとなります。 ※ 料金が8,000円を下回る場合、8,000円(税抜)をミニマムチャージとしてご請求させて頂きます。
このページを最初にブックマークしてみませんか?
『【東京反訳】』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く