2017年10月3日のブックマーク (2件)

  • 21世紀の文字起こし(2) - the code to rock

    以前に書いた記事からだいぶ間が空いてしまったけど、 note103.hateblo.jp 今回はその続編というか、スピンオフ的な経過報告。 ちなみに、一つ前の記事でも件の環境設定に関することを書いているので、よろしければどうぞ。 note103.hateblo.jp 目次 目次 今回の課題 1. 再録音の有効性 1-1. 再録音(元音声を聴きながらシャドウイングで新たな録音すること)は必要か? 1-2. もし元の録音データのままでも使えるとすれば、どの程度の録音状態なら許容範囲か? 動画比較 テキスト比較 波形比較 1-3. 悪音質のデータを再録音したら、どの程度仕上がりが改善されるのか? 波形比較 1-4. 再録音した音声ファイルから音声入力をするのと、直接マイクに向かってしゃべりながら音声入力をするのとでは、どちらの方が精度が高いか? 2. 音声入力時の再生速度の最適化 2-1. 音

    21世紀の文字起こし(2) - the code to rock
  • 21世紀の文字起こし - the code to rock

    気づき そもそも文字起こしとは そもそも文字起こしとは(2) 音声入力による文字起こしの実践法(Mac) 1. 素材音声の再録音 2. Soundflowerの準備 3. Mac内部で再生+聞き取り 4. 音声ファイルが終わるまで再読み込みなどのケア まとめ 〜そしてtextlint編へ〜 続編 気づき 少し前にこのようなことに気がついた。 ひえーすごい発見をした。音声入力で文字起こし作業をナシにできないかなあ、と思って対談の音声データをiPhoneのそばで大音量で再生したけど全然認識せず。ですよねー、と一旦諦めた後にふとイヤホンで聴きながらシャドウイング的に自分で喋ったらだいぶテキスト化された(笑)これはいいのでは— Hiroaki Kadomatsu (@note103) 2016年7月6日 「いずれそうなるだろう」とは思っていたが「まだしばらく先のことだろう」とも思っていた現実が、想