BBCの偽情報検証チームが、ロシアのウクライナ侵攻を受けて拡散されたコンテンツを例に、その方法を解説する。
こんにちは AIチームの戸田です 今回は最近リリースされたHuggingFaceをベースにした音声処理用のツール、HuggingSoundを使って音声認識を試してみます。 HuggingSoundはHuggingFaceが公式に出しているものではなく、リオデジャネイロ大学のJonatas Grosman氏が個人的に開発しているライブラリで、今年に入ってリリースされたばかりの新しいライブラリです。 日本語の音声認識モデルはGrosman氏がこのライブラリを使ってCommon Voice、 CSS10、 JSUTをfine-tuningしたものを公開してくれていますが、本記事ではイチからfine-tuningを試してみたいと思います データ準備 学習に使用するデータは声庭で公開されているデータを利用します。声庭は有志でアノテーションを行っている公開音声データで、利用・修正・再配布が自由なオープ
ValveはSteamのハードウェア&ソフトウェア調査2022年3月分を公開した。その中のデータが興味深いものとなっている。日本語ユーザー数が、大きく増えているのである。 こちらのレポートは、Valveが毎月公開している調査。Steamクライアントを導入すると、調査の案内が表示される。そちらの招待に承諾したユーザーが調査対象となり、ユーザーから収集したさまざまなデータが月次で公開されている。 OSのバージョンや使っているグラフィックボードなど、調査対象は多岐にわたる。その中には「言語」のカテゴリも存在している。2022年3月の調査結果を見てみよう。ユーザーが使う言語が割合として示されており、英語ユーザー36.11%。簡体字ユーザーが26.23%と並ぶ。そして注目したいのは、日本語ユーザーの割合だ。2022年3月の日本語ユーザー数は2.34%。順位としては全言語のなかで8位。一見地味に見える
こんにちは、ABEJAの真壁孝嘉(@Takayoshi_ma)です。変数Aと変数Bにどれくらいの関連性があるの?このデータから何が言える?みたいなニーズって至る所にあるかと思います。その時に活用される様々な数学的指標たち、(自分含め)名前を知ってるだけだと危険だよなあって場面が近頃多い気がしたので、改めてメモ的な意味でブログを書いてみました。前半に(ピアソンの積率)相関係数に関する注意点を列挙したのち、後半にそれ以外の数学的指標の概要を列挙していこうと思います。 尚、このブログで度々登場する相関係数とはピアソンの積率相関係数を表すこととします。 相関係数の注意点 相関係数の概要 相関関係と因果関係は異なる概念 無相関であることと、独立であることは異なる概念 相関係数は外れ値に影響されやすい 選抜効果 相関係数の標準誤差 標本相関係数は母相関係数の不偏推定量ではない 2つの指標の関連度を測る
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く