ブックマーク / note103.hateblo.jp (6)

  • 21世紀の文字起こし(3) 〜 Cloud Speech-to-Text 編 〜 - the code to rock

    ここまでのあらすじ 免責事項 Cloud Speech-to-Text の使い方 参考資料 音声ファイルを作る サンプリングレートの変更 ステレオをモノラルに FLAC形式に変換 Google Cloud Platformにアカウント登録 新規プロジェクトを作成 音声ファイルをアップロードする APIの有効化 & サービスアカウントキーの作成 Cloud Shell にJSONファイルをアップロード Pythonファイルの準備 実行 結果と講評 ハマりどころ 料金 録音時の注意点(より正確に起こすために) まとめ ここまでのあらすじ 少なからぬ人々が直面する文字起こし(音声を文字に変換する作業)について、手動でパチパチやっていくのはけっこうつらいものがあるので、なんとか自動化できないか? というこのシリーズ。 気がつけば最初の記事はちょうど2年前の今頃に書いていて、続編はその半年後。で、そ

    21世紀の文字起こし(3) 〜 Cloud Speech-to-Text 編 〜 - the code to rock
    kinushu
    kinushu 2019/03/10
  • 21世紀の文字起こし(2) - the code to rock

    以前に書いた記事からだいぶ間が空いてしまったけど、 note103.hateblo.jp 今回はその続編というか、スピンオフ的な経過報告。 ちなみに、一つ前の記事でも件の環境設定に関することを書いているので、よろしければどうぞ。 note103.hateblo.jp 目次 目次 今回の課題 1. 再録音の有効性 1-1. 再録音(元音声を聴きながらシャドウイングで新たな録音すること)は必要か? 1-2. もし元の録音データのままでも使えるとすれば、どの程度の録音状態なら許容範囲か? 動画比較 テキスト比較 波形比較 1-3. 悪音質のデータを再録音したら、どの程度仕上がりが改善されるのか? 波形比較 1-4. 再録音した音声ファイルから音声入力をするのと、直接マイクに向かってしゃべりながら音声入力をするのとでは、どちらの方が精度が高いか? 2. 音声入力時の再生速度の最適化 2-1. 音

    21世紀の文字起こし(2) - the code to rock
    kinushu
    kinushu 2017/01/11
  • 21世紀の文字起こし - the code to rock

    気づき そもそも文字起こしとは そもそも文字起こしとは(2) 音声入力による文字起こしの実践法(Mac) 1. 素材音声の再録音 2. Soundflowerの準備 3. Mac内部で再生+聞き取り 4. 音声ファイルが終わるまで再読み込みなどのケア まとめ 〜そしてtextlint編へ〜 続編 気づき 少し前にこのようなことに気がついた。 ひえーすごい発見をした。音声入力で文字起こし作業をナシにできないかなあ、と思って対談の音声データをiPhoneのそばで大音量で再生したけど全然認識せず。ですよねー、と一旦諦めた後にふとイヤホンで聴きながらシャドウイング的に自分で喋ったらだいぶテキスト化された(笑)これはいいのでは— Hiroaki Kadomatsu (@note103) 2016年7月6日 「いずれそうなるだろう」とは思っていたが「まだしばらく先のことだろう」とも思っていた現実が、想

    kinushu
    kinushu 2016/07/11
  • textlintで日本語テキストの文字校正を試してみた - the code to rock

    はじめに 導入 textlintrcを設置 最初のつまずき prh を使ってみる | 2度目のつまずき 追記: 絶対パスにも対応して頂きました prh を使ってみる(2) | 辞書を選ぶ 結果をテキストファイルに書き出す 追記: [39m[32m などを消す方法 コードを書く tx.sh textlint_pretty_error_tidy.pl Vimから使えるようにする 展望とまとめ はじめに textlintについては少し前から時々名前を聞くなと思っていましたが、自分に関わりがありそうなものとして意識したきっかけは、@t_wada さんによる以下のツイートだったと思います。 とある技術文章のレビューをする際に、細かな言い回しの修正を逐一指摘する代わりに textlint を入れてもらったら、文章がみるみる良くなってきているのをリアルタイムに見ている。 textlint は偉大だ。—

    textlintで日本語テキストの文字校正を試してみた - the code to rock
    kinushu
    kinushu 2016/06/14
  • コマンドラインからMacのゴミ箱へ捨てる - the code to rock

    このところ超忙しいので、時間捻出のためにプログラミングに関わることはしない&それに類するブログとかも書かない、という禁を自らに課していたのですが、どうしても後で忘れそうな件、忘れたくない・・(というか調べ直したくない・・)という気持ちの方が上回ったのでザザッ!と書いてしまいます。 せっかくなので(?)目次機能も使ってみよう。 結論 経緯 設定 オプション 結論 以下で紹介されているツールを使います。 rcmdnk.github.io 続編記事もありました。 rcmdnk.github.io 詳しくはそれらを見て頂くとして、以下では後から自分でいろいろ思い出しやすいように、エッセンスだけメモしていきます。 経緯 コマンドラインから不要なファイルやディレクトリを削除しようと思ったら、普通は「rm」を使うと思いますが、これだといわゆるMacのゴミ箱には入らないので、ああ復活させたいな、と後から

    コマンドラインからMacのゴミ箱へ捨てる - the code to rock
    kinushu
    kinushu 2016/02/15
  • idobataライフ。またはSlackとの違い - the code to rock

    最近はPerl入学式のサポーター陣のやり取りに idobata を使っています。 https://idobata.io/ 少し前に Perl入学式 in大阪のサポーターである@nqounetさんもidobata関連の記事を書かれていました。 Perl入学式に関するツイートをIdobataに通知するボットを作った | IT Office Nishimiyahara 講義資料の作成や各種工程管理はGitHubのプライベートリポジトリを使っていますが、issueのコメント欄だけだとスピーディーな意見交換をしづらいので、その部分をこうしたチャットツールで補完している感じです。 idobata あれこれ 今回の記事ではidobataに関する簡単な説明を列記します。 しかし詳しい使い方を解説するとかではありません。 「このTips、ほうぼうで説明してるよな・・」と思うことがいくつかあるので、それをまと

    idobataライフ。またはSlackとの違い - the code to rock
    kinushu
    kinushu 2015/11/17
  • 1