boxheadroomのブックマーク / 2020年5月25日

Building Tools v1.0 alpha - 建物を簡単にモデリング出来る無料のBlenderアドオン！

Unreal Engine アセットアセット-Asset UNote - レベル内にフィードバック用メモと座標を残す事が出来るUnreal... 2025-09-18 Edouard Boudet氏による、レベル内にフィードバック用メモと座標を残す事が出来るUnreal Engine 5向けの無料プラグイン「UNote」がリリースされています！続きを読むイベント-Event CGWORLD MASTER CLASS ONLINE vol.18 - 今回... 2025-09-17 CGWORLDによる大型オンライン学習イベントの第18回目『CGWORLD MASTER CLASS ONLINE vol.18』が2025年9月20日～21日の2日間、オンライン開催されます！今回は「アニメーション」に特化したセッションが多数用意されているそうですよー！！！続きを読むイベント-Eve

boxheadroom 2020/05/25

リンク

Praatの音声アノテーション（.TextGrid）を自動生成 - Qiita

(2018年3月13日追記) .labファイルと.TextGridファイルのフォーマットについて補足を追加しました。 (2018年7月18日追記) segment_julius.plがjuliusを読み込めなかった場合の対処法を紹介したページのリンクを追加しました。はじめに Praatでは、音声波形に対し「この区間は○○の音を出している」という目印（アノテーション）を付けることができます。しかし、音声がたくさんある場合、アノテーションを全て手で付けるのは非常に時間がかかります。そこで、「Julius 音素セグメンテーションキット」を用いてアノテーションを自動生成する方法を紹介します。（注意）以下で紹介するのは、発話した（喋った）内容が分かっている場合にしか使えません（セリフを読んでもらった等）。発話内容から分析する必要がある場合は、別の方法をご検討ください。使用した環境 ub

boxheadroom 2020/05/25

リンク

自動セグメント — 苦労する遊び人の玩具箱 1 ドキュメント

音声認識機として julius を使う場合、一般には、”何を言っているのか” を単語で認識したい、或いは、”ある単語を言っている時間” を取得したい場合の二つに分かれるかと思います。一方、あまり使用されることはないかもしれないですが、私個人的にはよく使う目的として、 “既に収録が済んだ音声データがあるとして、これが何を言っているのかも分かっている場合に具体的に開始何秒までが何の音であるのかを音素レベルで欲しい” という場合もあります。こういう作業をコーパス屋は音素アライメントとか言ったりします。 Julius では上記のような目的用に調整された環境を用意しているので、とても助かります。このページでは上記の目的を達成する方法について説明します。 Speech Segmentation Toolkit using Julius¶ 上記目的を達成するためのセットとして “Speec

boxheadroom 2020/05/25

リンク

GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine

boxheadroom 2020/05/25

リンク

Juliusの単語・音素セグメンテーションキットのサンプルをMacで実行する - Qiita

概要大語彙連続音声認識エンジン Juliusを使うと，音声ファイルに含まれる音素の開始・終了時間を自動認識できる（これを音素自動ラベリングと呼ぶ [1]）．音素自動ラベリングを活用すると例えば，カラオケで見るような「歌唱の進行に合わせて表示されている歌詞の色を変える」アプリケーションが作れる． Juliusの「単語・音素セグメンテーションキット」を使うと，音素自動ラベリングを手軽に試すことができる．本稿ではセグメンテーションキット付属のreadme通りにサンプルを実行する際の手順を，注意すべき事柄と共にまとめました．準備以下の2つのどちらかの手法でJuliusをインストールします． Juliusを手動インストールする JuliusをHomebrewを使ってインストールする手法によってJuliusの設定が異なります．例えばAudio inputのprimary A/D-in dr

boxheadroom 2020/05/25

リンク

JuliusとJulian/音素自動ラベリング - Miyazawa’s Pukiwiki

はじめに † 連続音声ファイルに含まれる音素（分節音）の開始・終了時間を、大語彙連続音声認識エンジン Julius*2 を利用して自動認識する（音素自動ラベリング、アノテーション）方法について説明しています。最初に用意するもの Julius＋単語・音素セグメンテーションキット（下でインストールします）下記の教科書「IT Text 音声認識システム」（IPA音響モデル・言語モデルが収録されています）自動ラベリングを行いたい音声ファイルと、発話内容の書き下しファイル本ページでは日本語話し言葉コーパス（CSJ）に収録されたファイルを使用しています。CSJでは、音声ファイルは .wav 形式、書き下しファイルは Praat標準の形式*3 で提供されています。 Praat （書き下しファイルにPraat標準の形式を使う場合のみ）教科書「IT Text 音声認識システム」, 情報処理学会【

boxheadroom 2020/05/25

リンク

Praat - Miyazawa’s Pukiwiki

boxheadroom 2020/05/25

リンク

青空朗読 | 青空文庫に所蔵されている本を朗読しています

本サイトはスクリーンリーダーに対応するようにページを改編しました。これからも目の不自由な方が音声読み上げソフトを使い朗読を楽しんでいただけるように改善していきます。朗読がどなたにも心休まる豊かな時間になることを願って。まだ、不十分な点があると思います。使いづらいところがありましたらこちらまでお知らせください

boxheadroom 2020/05/25

リンク

GLSLで音を作る - らくとあいすの備忘録

こんにちは、らくとあいすです。つぶやきGLSLというというTwitterハッシュタグをご存じでしょうか？詳しくはハッシュタグを実際に見てもらうか、ブタジエンさんの記事*1をみると雰囲気をつかめると思いますが、簡単に言えば１ツイートの中に収まるGLSLシェーダーを書き、生成されたGIF画像と共にツイートする遊びです。さて、普通シェーダーは絵作りのために用いられるものですが実は音を作ることも出来ます(？)　正確には、音の波形を表す配列(=テクスチャ)を生成するのにシェーダーを用い、それを読み取って音を出す仕組みが提供されています*2。ここではこのようにGLSLシェーダーを用いて作られた音楽のことをGLSLサウンドと呼びます。最近このGLSLサウンドをつぶやきGLSLでやってみたところ、ありがたいことに多くの反応を頂けたのでその解説やGLSLサウンドの初歩的なところを書いていこうと思います

boxheadroom 2020/05/25

リンク

第１回　GLSLで音を作るために - らくとあいすの備忘録

こんにちは。らくとあいすです。以前「GLSLで音を作る」という記事を書いたところ、ありがたいことに色々と反響をいただきました。 raku-phys.hatena blog.com せっかくなので、より詳しい記事を書いていこうと思ったのですが、私も始めたばかりということもあって日々色々なやり方が変わっていきます。なので、長編の記事として、「これを読めばわかる」といったようなものが書きづらいといった状況にあります。そこで今回から、GLSLサウンドに関連したちょっとしたお話を何回かに分けて(思いついたときに...)書いていこうと思います。(続くことは保証しません) 例によって今回も twigl.app のサウンドシェーダーを開きつつ読み進んでいただければと思います。 GLSLサウンドにおける時間の捉え方 GLSLサウンドでは、あらゆる部分が時間の関数となります。 GLSLで絵を作る場合は、縦

boxheadroom 2020/05/25

リンク

GitHub - nmchan/waidayo

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

boxheadroom 2020/05/25

リンク

せっき～のゲーム屋さんドルアーガの塔　乱数の工夫の正体

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。ＣＥＤＥＣの講演「ゲーム世界を動かすサイコロの正体～往年のナムコタイトルから学ぶ乱数の進化と応用」より、乱数を使ったドルアーガの塔の迷路生成のアリゴリズムについて紹介です。講演内容は、こちらです http://sekigames.gg-blog.com/Entry/288/ 講演者の方も、「ナムコの乱数を取り上げるなら、ドルアーガの塔をせざるえない」という程、外せない内容との事です「このテーマだけで講演時間を全て使っても説明しきれない」（講演では、時間の関係で触りのみでしたのである程度、せっき～の解釈で補完しています） -------------------------------------------------------------------

boxheadroom 2020/05/25

リンク

M5StackをBluetoothキーボードとして動かしプレゼン操作する

ESP32系はBluetoothマウスやキーボードとして動作させる事が出来る。少し前は処理の組み込みがやや面倒であったが、最近は便利なライブラリも出てきている。今回はM5Stackを使って、Bluetoothキーボードとして動かし簡単なパワーポイント操作マシンとして動かしてみる。 Bluetoothキーボードとして動かすために、下記ライブラリをインストールしておく。残念ながら2020/4/9時点ではライブラリマネージャからはインストールできないので、zip形式でインストールする。 https://github.com/T-vK/ESP32-BLE-Keyboard 後は簡単。beginで初期化してpress/releaseを呼び出すだけ。M5Stackには3つボタンがあるので、それぞれを押した際にHome、Page Up、Page Downを送信する様にしてみた。ボタン長押し等でさらに違

boxheadroom 2020/05/25

リンク

はてなブックマーク

タグ

2020年5月25日のブックマーク (13件)

Building Tools v1.0 alpha - 建物を簡単にモデリング出来る無料のBlenderアドオン！

Praatの音声アノテーション（.TextGrid）を自動生成 - Qiita

自動セグメント — 苦労する遊び人の玩具箱 1 ドキュメント

GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine

Juliusの単語・音素セグメンテーションキットのサンプルをMacで実行する - Qiita

JuliusとJulian/音素自動ラベリング - Miyazawa’s Pukiwiki

Praat - Miyazawa’s Pukiwiki

青空朗読 | 青空文庫に所蔵されている本を朗読しています

GLSLで音を作る - らくとあいすの備忘録

第１回　GLSLで音を作るために - らくとあいすの備忘録

GitHub - nmchan/waidayo

せっき～のゲーム屋さんドルアーガの塔　乱数の工夫の正体

M5StackをBluetoothキーボードとして動かしプレゼン操作する

お知らせ

今週のはてなブックマーク数ランキング（2026年5月第2週）

今週のはてなブックマーク数ランキング（2026年5月第1週）

月間はてなブックマーク数ランキング（2026年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス