サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
数学
shuhoyo.hatenablog.com
乃木坂46の結成10周年を記念して(?)、ここまでの全楽曲の歌詞を自然言語処理的なアプローチで分析してみる。 分析といっても個人的に使ってみたかった手法を適用してみる題材として歌詞のテキストデータを使おう、というところから始まっているので、その結果に対して分析的な解釈は与えられていないかもしれない。 したがって、タイトル負けというか「何を歌ってきたか」に対して解を与える内容になっていないかもしれないということは悪しからず。 歌詞のテキストデータは歌詞サイトからスクレイピングしてきた。 1つディレクトリを作成して曲ごとにtxtで保存する。 ※スクレイピングした歌詞は著作権のあるものなので私的な情報解析目的にとどめる ※スクレイピング対象サイトに過度な負荷をかけないようにアクセス間隔を数秒空ける work_dir/ ┗ nogizaka46_lyrics_text/ ┣ 13日の金曜日.txt
(この記事は数理物理 Advent Calendar 2018 - Adverter 12日目の記事です.) 普段は代数幾何学と統計的学習理論についてやっているのですが, 何かしらでアドベントカレンダーを書きたいなと思っていたところにちょうどよいものを発見し参加させていただいた次第です。数理物理がテーマということで, うまく物理学と関連付けられないかなと考えた結果, 少し前から勉強し始めた情報幾何学とその統計物理学への応用について簡単に書いていこうと思います。(自分自身の勉強メモという側面もあるので一部厳密性を損なった書き方をします...) 概要 確率分布全体の集合を幾何学的空間とみなし情報幾何学の概念を用いて, 「一様分布についてハミルトニアンの期待値が一定になるという制約条件下でエントロピーが最大になる確率分布はカノニカル分布である」ということを導きます。すなわち最大エントロピー原理を
このページを最初にブックマークしてみませんか?
『shuhoyo.hatenablog.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く