タグ

音声に関するfield_combatのブックマーク (6)

  • media-processors/packages/noise-suppression at develop · shiguredo/media-processors

  • 21世紀の文字起こし(3) 〜 Cloud Speech-to-Text 編 〜 - the code to rock

    ここまでのあらすじ 免責事項 Cloud Speech-to-Text の使い方 参考資料 音声ファイルを作る サンプリングレートの変更 ステレオをモノラルに FLAC形式に変換 Google Cloud Platformにアカウント登録 新規プロジェクトを作成 音声ファイルをアップロードする APIの有効化 & サービスアカウントキーの作成 Cloud Shell にJSONファイルをアップロード Pythonファイルの準備 実行 結果と講評 ハマりどころ 料金 録音時の注意点(より正確に起こすために) まとめ ここまでのあらすじ 少なからぬ人々が直面する文字起こし(音声を文字に変換する作業)について、手動でパチパチやっていくのはけっこうつらいものがあるので、なんとか自動化できないか? というこのシリーズ。 気がつけば最初の記事はちょうど2年前の今頃に書いていて、続編はその半年後。で、そ

    21世紀の文字起こし(3) 〜 Cloud Speech-to-Text 編 〜 - the code to rock
    field_combat
    field_combat 2018/08/02
    もうマイクとか録音環境とかのほうがキモになってくるなって印象
  • Kawaz - ラウドネス管理してますか?【KawazAdventCalendar 12/6】

    みなさん、こんにちは。SHiNKA (@shinka_cb) です。日12月7日でありますが、 12月6日のKawaz Advent Calendarを担当してます。遅くなってしまいすみません。 というわけで、今回の話題はゲームのラウドネスです。 長い!難しい!今北産業 ゲームにおける全体の音量調整はユーザービリティーの観点からも重要です。 他のゲームと比較してあまり音量差が発生しないようにしましょう。 最近は、ユーザーが感じる主観的な音量感を表す指標としてラウドネスというものが使われています。 とは言え、まだまだゲーム間の音量差の問題は完全に解消はされておらず今後も解決すべき課題となっています。 ※あ、4行になってしまった・・・ なぜ今になってゲームの音量管理に気をつけないといけないのか? 放送業界では地上波デジタル放送を導入したころから番組やCMの音量ばらつきが問題に アナログ放送で

    field_combat
    field_combat 2017/09/12
    最近はPS4で映画観ることも多いけど、頻繁に音量変えるな。ゲームの方が音圧高めな印象。音量変えられるのも多いけど。
  • IBM スマートな社会を支えるITインフラストラクチャーを提唱 - Japan

    2009年12月22日 2009年12月18日 2009年12月17日 2009年12月16日 2009年12月15日 2009年12月14日 2009年12月11日 2009年12月10日 2009年12月10日 2009年12月04日 2009年12月01日 2009年11月30日 2009年11月27日 2009年11月26日 2009年11月26日 2009年11月26日 2009年11月25日 2009年11月25日 2009年11月19日 2009年11月18日 2009年11月18日 2009年11月17日 2009年11月17日 2009年11月13日 2009年11月13日 2009年11月12日 2009年11月11日 2009年11月10日 2009年11月10日 2009年11月10日 2009年のプレスリリース一覧 ここに掲載されている情報は、発表日時点の内容です

    field_combat
    field_combat 2009/10/27
    ほえー
  • VDS : the Voice Delivery System

    Voice Delivery System ホームページ音声読み上げサービスを提供しています。音声読み上げサービスは、インターネットに誰もが使いやすい手すりをつけるをコンセプトにサービスを提供しています。 vds(Voice Delivery System) 私たちは「インターネットに手すりをつける」をビジョンにvdsサービスを提供します。vdsはホームページやウェブアプリケーションのテキスト情報をリアルタイムに音声変換し利用者に届けます。vdsを利用することでホームページを見るメディアから聞くメディアに成長させる画期的なサービスです。また、特殊なアプリケーションを必要とせず、日語を基とし多言語(オプション)にも対応したユニバーサルなサービスです。 vdsは30カ国以上の言語であらゆるWebサイトやWebアプリケーションを「見る」に加え、なめらかな音声読み上げによる「聴く」ことを可能に

    field_combat
    field_combat 2008/08/01
    文字列送れば、読み上げてくれるAPI
  • api.satoru.net

    ホームCodereaderLIbre softwarekatyushaシンガポ問合せ 東京ノースサイドブログ東京ノースサイドブログへようこそMore PostsKeePass2とSeaFileOSMFJ社員総会OmegaTで英辞郎辞書をつかう(最新情報)OpenStreetMap WikiをOmegaTで効率的に翻訳する方法HikingでOpenStreetMapを活用なんという事でしょう!!投稿のしかたすら忘れた・・・のか??放置している間に何をしてたかというと別のサイト作ってましたFilezilla on UbuntuがFTPSでエラー/パッチ投稿あなたの活動レベルはどんなレベル? 最高のチーム ×要求されたテームは見つかりませんでした。

    field_combat
    field_combat 2007/09/06
    テキストを渡すとmp3の音声にして返してくれたり、顔認識のapiなどなど
  • 1