タグ

関連研究とアルゴリズムに関するhsato2011のブックマーク (3)

  • TeXでのアルゴリズム(擬似コードの記述) algorithms パッケージ - 大人になってからの再学習

    昨日のエントリーでLaTeX環境の導入について紹介した。 今回は少しマイナーな話になってしまうが、LaTeXで次のようなアルゴリズムを表現する方法について紹介する。 「TeXインストーラー3」のような標準的なインストーラには、このようなアルゴリズムを美しく出力するためのパッケージが含まれていないことが一般的なので、後から必要なものを個別に追加することになる。 今回は、algorithms というパッケージを使用する。 これは次のページからダウンロードできる。 ■CTAN directory: /macros/latex/contrib/algorithms http://tug.ctan.org/tex-archive/macros/latex/contrib/algorithms/ 上記Webページの上部にある「zip file」のリンクからファイルをダウンロードして解凍する。 その後、

    TeXでのアルゴリズム(擬似コードの記述) algorithms パッケージ - 大人になってからの再学習
  • 欠損値 - 機械学習の「朱鷺の杜Wiki」

    欠損値 (欠測値; missing value), 欠損データ (missing data)† アルゴリズムへの入力で,ある対象の全ての特徴や,一部の特徴の値がない場合. 欠損していると,特徴の値は分からないが,欠損していること自体が情報となる場合もある.例えば,年齢が欠損していれば,ある程度以上の年齢と予測できる. ↑ 欠損値の扱い† 欠損値のある特徴を,全ての対象について無視したり,欠損値のある対象のデータを除外したりする 「欠損値」という値にする 手作業で適切な値を選んで補完する 処理するアルゴリズムで,あまり影響の出ないような定数で置換する 同じ特徴の欠損していない値の平均や中央値などの統計量で置換する 別の情報や,他の観測された情報基づきを用いて,最尤推定などの統計的推定を行う 欠損した特徴を潜在変数とみなし,EMアルゴリズムなどを適用 時系列などの場合は,前後の値から補間する

    hsato2011
    hsato2011 2016/07/20
    欠損値の扱いについて
  • 機械学習によるデータ分析まわりのお話

    Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem... NLP コロキウム https://nlp-colloquium-jp.github.io/ で発表した際のスライドです。 論文: https://arxiv.org/abs/2205.01954 GitHub: https://github.com/joisino/wordtour 概要 単語埋め込みは現代の自然言語処理の中核技術のひとつで、文書分類や類似度測定をはじめとして、さまざまな場面で使用されていることは知っての通りです。しかし、ふつう埋め込み先は何百という高次元であり、使用する時には多くの時間やメモリを消費するうえに、高次元埋め込みを視覚的に表現できないため解釈が難しいことが問題です。そこで研究では、【一次元】の単語

    機械学習によるデータ分析まわりのお話
  • 1