タグ

2015年12月11日のブックマーク (5件)

  • 厶とは (シとは) [単語記事] - ニコニコ大百科

    厶単語 4件 シ 5 0pt ほめる 掲示板へ 記事編集 漢字として掲示板厶とは、耜の形をした漢字である。カタカナのムにそっくりだがム関係。 漢字として 厶 Unicode U+53B6 JIS X 0213 1-50-51 部首 厶部 画数 2画 ⼛ Unicode U+2F1B 意味 私の初文であり、わたくし、私有という意味がある。また日ではござると読む。〔説文解字〕には「姦衺なり」とある。共有の田に対して私有の田を姦邪としている。 某と同じ音であり、意味も同じとする説もある。 字形 諸説ある。〔説文〕は「韓非曰く『蒼頡字を作るや、自ら營むを厶と爲す』」と〔韓非子・五蠹〕を引用し、自ら営むことを表す記号であるとする。〔韓非子〕にはこの後に「私に背く。之れを公と謂ふ」と公について述べる。これは八+厶から、厶に背く(八=背く)ということで公であるという解釈である。しかし公の下の字形は甲骨

    厶とは (シとは) [単語記事] - ニコニコ大百科
    a-lucky
    a-lucky 2015/12/11
    OCRの敵
  • Augmented Expected Mutual Information

  • scipy.sparseでの疎ベクトルの扱い – はむかず!

    Pythonで疎行列を扱うライブラリであるscipy.sparseについて、自分がハマってきたところをまとめてみようと思う。とくに、行列よりもベクトルとして扱ったとき(つまり行または列の数が1のとき)の注意点をまとめる。 基的なことばかりなのかもしれないが、日語の情報は少ないので、それでも役に立てるかもと思いました。まあ自分の勉強ノートみたいなもんです。 基 scipy.sparseで提供される疎行列の形式はいくつかあるが、ここではとくにCOO(COOdinate)形式、LIL(LInked List)形式、CSR(Compressed Sparse Rows)形式、CSC(Compressed Sparse Columns)形式について取り上げる。 それらの違いについて、詳細は家のドキュメントを参照して欲しいが、すごく大雑把にまとめると、 CSR, CSC形式は、同じ型同士の掛け

  • scipy.sparseで疎行列の行列積

    scipyにはscipy.sparseという疎行列の生成を扱うパッケージとscipy.sparse.linalgという疎行列の線形代数を扱うパッケージが存在する。しかし、この2つのリファレンスをいくら読んでも粗行列の行列積については触れていないので、公式ドキュメントと以下のスレッドを元に補足してみた。 [SciPy-User] Sparse matrices and dot product sparse_matrixの扱いかた scipy.sparseにはいくつかのフォーマットがあるが、基的には生成時にlil_matrixを使用し、それをcsr_matrixに変換して計算するというのが効率的なようだ。 import scipy.sparse as sp # generate 1000x1000 sparse matrix, whose components are initialized

    scipy.sparseで疎行列の行列積
  • マルチコアで形態素解析を行う2(multiprocessing編) - Kesinの知見置き場

    前回の続きで今回はPython形態素解析をマルチコアで行うプログラムを実際に書いてみます。 私自身multiprocessingモジュールはまだ全然理解できていませんが、並列に実行するプログラムを書くには Processクラス Poolクラス を使う必要があるようです。おそらくProcessが元でPoolクラスはそれを使いやすくしたものだと思います。ここではPoolクラスを使います。 Poolクラスは指定した数だけプロセスを立ち上げ、実行させたい関数と引数を放り込むことで裏で自動的にプロセスごとに振り分けてくれる仕組みのようです。リファレンスによると方法はいくつかありますが、ここではmap()を使います。map()は1つの関数に対してリストの引数を1つずつ与えながら並列に実行させます。 今回のサンプルではファイルパスが格納されているリストを渡して、並列に実行する関数の中でファイルの中身の

    マルチコアで形態素解析を行う2(multiprocessing編) - Kesinの知見置き場