gensimでLDAやらtfidfをする際に何かと必要になるgensimのDictionaryですが、大抵の場合それらの手法を適用する際にさらっと流されることが多いように感じたのでDictionaryについてのみ纏めました。あくまで内容としては公式サイトの説明を実際に試したものを載せている程度ですが、何かの参考になれば幸いです。(2018/12/25 dfsとnum_nnzを修正) 環境 gensim (3.4.0) Python 3.6.5 Mac 10.13.5 辞書作成 とりあえず辞書がないことには始まらないので、公式の例を借りてDictionaryを作成します。 >>> from gensim.corpora import Dictionary >>> texts = [['human', 'interface', 'computer']] >>> dct = Dictionary