ブックマーク / ja.wikipedia.org (3)

  • tf-idf - Wikipedia

    情報検索の分野において、tf–idf (または、 TF*IDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量(数値)である[1]。また、tf-idfは情報検索や、テキストマイニング、ユーザーモデリング(英語版)における重み係数(英語版)にもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究

  • ロブ・パイク - Wikipedia

    ロバート(ロブ)・C・パイク(英: Robert "Rob" C. Pike、1956年 - )は、カナダ出身のソフトウェア工学者でありソフトウェア作家。ベル研究所でのUNIX開発、その後の Plan 9 と Inferno というオペレーティングシステムの開発で知られる。また、Limbo というプログラミング言語の作者でもある。また、UNIX用のグラフィカル端末 Blit の開発も行った。それ以前の1981年、彼は世界初のUNIX用ウィンドウシステムのコードも書いている。 長年にわたって、彼はテキストエディタを数々開発している。特によく知られているのは、sam と Acme である。パイクはブライアン・カーニハンと共に『UNIXプログラミング環境』と『プログラミング作法』という2冊の著書を著している。また、ケン・トンプソンと共にUTF-8の開発を行った。パイクは細かいプログラムも開発して

    ロブ・パイク - Wikipedia
    ryota-murakami
    ryota-murakami 2016/01/26
    ソフトウェア工学者に私もなりたい!(どうやってなるのかは知らない)
  • malloc - Wikipedia

    malloc(マロック, エムアロック)、calloc、reallocは、動的メモリ確保を行うC言語の標準ライブラリの関数である[1][2][3]。確保したメモリの解放にはfree関数を使用する。 mallocが使用する実際のメモリ確保機構には様々な実装がある。それらの性能は、実行時間と要求されるメモリの両面で様々である。 原理[編集] C言語は通常メモリを「静的メモリ確保」か「自動メモリ確保」で管理する。静的変数は主記憶上にプログラムが存在する期間中ずっと確保されている。自動変数(局所変数)は通常コールスタック上に確保され、対応するサブルーチンが実行中の間だけ存在する。しかし、いずれの方法も限界があり、確保できるメモリ量(変数のサイズ)はコンパイル時に決められてしまう。必要なサイズが実行時でないと判明しない場合、例えばディスク上のファイルから任意のサイズのデータを読み込むような場合、固定

    ryota-murakami
    ryota-murakami 2015/12/19
    実行中ちょうど良い量のメモリに可変に用意するための機構
  • 1