タグ

日本語と音声認識に関するvccのブックマーク (3)

  • iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)

    アプリや専用デバイスを使った、日語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識テクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日語対応の自動文字起こしアプリ コミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records(シャムロック・レコード)の代表兼エンジニアである青木秀仁氏が開発を手がけている。 モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/

    iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)
  • 会話が見える! 世界最速の「リアルタイム字幕」にびっくり

    会話が見える! 世界最速の「リアルタイム字幕」にびっくり:水曜インタビュー劇場(瞬時公演)(1/5 ページ) 2月某日、幕張メッセ(千葉市)。記事のネタを探すために、記者はとあるセミナーを聴講していたところ、大きなモニターに釘付けとなった。 モニターには、登壇者の発言がリアルタイムで文字になって映し出されていたのだ。「ITmedia ビジネスオンラインって最高ね」と発言すると、瞬時に「ITmedia ビジネスオンラインって最高ね」と表示される。それだけではない。日語の横で、英語のスペルも次々に並んでいたのだ。 よーく見ると、ところどころで“おかしな日語”も登場する。例えば、「ITmedia ビジネスオンラインって再考ね」といった感じで。しかし、しばらくすると、正しい日語に変わっていくのだ。 気になる、気になる。どうやってリアルタイムに文字を起こしているのか。最新のテクノロジーを駆使し

    会話が見える! 世界最速の「リアルタイム字幕」にびっくり
  • 理想は“1人で制作できるニュース番組”--ソニー「ニュースマネージャー」の狙い

    ソニーは、文字のニュース原稿を音声とCGに変換し、自動で読み上げる「ニュースマネージャー」の実証実験を、渋谷の大型街頭ビジョン「ソニービジョン渋谷」で実施。その試みや狙いについて聞いた。 ニュースマネージャーは、文字情報として入力されたニュース原稿をソニーのボイステクノロジー(音声対話技術)を応用して自然な音声発話に変換。さらにCGで生成されたデジタルアナウンサーの表情と連動させて読み上げる、ニュースの提供に特化したアプリケーションとして開発されたもの。 実証実験では、共同通信デジタルが提供するニュース原稿を、アニメ制作で知られるA-1 Picturesがデザイン・監修したデジタルアナウンサーが読み上げるというもので、実社会での有用性や、自動読み上げによるニュースの伝わり方などの検証が目的。約2分程度の番組を1日9回放送し、この実験は8月6日から22日までの17日間行われた。 ニュースを読

    理想は“1人で制作できるニュース番組”--ソニー「ニュースマネージャー」の狙い
    vcc
    vcc 2016/08/30
    文字情報として入力されたニュース原稿をソニーのボイステクノロジーを応用して自然な音声発話に変換。さらにCGで生成されたデジタルアナウンサーの表情と連動させて読み上げる。
  • 1