タグ

ブックマーク / mathcommunication.hatenablog.com (2)

  • 形態素解析 MeCab(1) - 数学、ときどき統計、ところによりIT

    与えられた任意の文に対して、意味を持つ最小単位の音素(これを形態素と言います)に分解して、音素の品詞を判別する処理を形態素解析と言います。今回は形態素解析を行うツールである MaCab の使い方についての個人的なメモです。 インストール 以下の記述は全て Windows の場合のものです*1。 公式サイトのダウンロードの項目に "Binary package for MS-Windows" とあるので、そこから実行形式のバイナリーパッケージ(mecab-0.996.exe)を入手して下さい。 インストーラー実行後、使用する文字コードを選択*2すれば、ファイルの生成が開始されます。ソースコードを使ってインストールする場合は別途、辞書ファイルをダウンロードする必要がありますが、Windows 用のバイナリーパッケージには辞書ファイルが予め付いているのでインストール直後から使用可能な状態になって

    形態素解析 MeCab(1) - 数学、ときどき統計、ところによりIT
    El_Fire
    El_Fire 2017/08/16
  • テンソルがなかなか理解されない3つの理由 - 数学、ときどき統計、ところによりIT

    大学の理学部(数物系)、工学部などの出身者であれば、テンソルという言葉を少なくても1度は耳にしたことがあると思います。重要な概念にも関わらず、どうしてテンソルは理解されないのか、その原因について考えてみたいと思います。 いろいろなテンソル テンソルと最初に出会うのは、全学共通科目(昔でいう教養科目)の力学に登場する慣性モーメントテンソルあたりでしょう。専門学部(理学部の物理学科や工学部)に進むと、電磁気学の電磁場テンソル、連続体力学や構造力学の応力テンソル、一般相対論のアインシュタインテンソル、場の量子論のボソンフォック空間やフェルミオンフォック空間と至る所に登場します。数学では代数学、幾何学、解析学、分野を問わず登場します。統計学でも多次元の確率変数のモーメント*1を定義するのに必要となります。また最近では機械学習の分野でも見かけるようになりました。 このように八面六臂の大活躍をするテン

    テンソルがなかなか理解されない3つの理由 - 数学、ときどき統計、ところによりIT
    El_Fire
    El_Fire 2017/01/29
  • 1