[B! C++] zsiarreのブックマーク

zsiarre id:zsiarre

C++に関するzsiarreのブックマーク (2)

モダン C++ プログラミング - 日本語公開記事 - Confluence
このドキュメントはサイボウズ社内のトレーニング用に作成したものです。作成時点では C++11 はまだあまり利用できない状況でしたので、C++98 ベースの記述になっています。いずれ更新を予定しています。モダンの定義モダンとはテンプレートメタプログラミング（TMP）を駆使することです。嘘です。宗教論争に意味はないので、ここでは「最近の C++ の仕様・機能を理解し、C より実装効率が良く不具合の少ない」プログラミング技法を「モダン C++ プログラミング」と定義します。つまり、不具合が少なく、かつ C にはもう戻れなくなるような効率の良さを達成するものです。学習効率（ROI）が極めて良くないような技法（例えば TMP）は、この定義では除外されます。勉強方法お勧めの順序は以下。決して全部を読もうとしないこと。 C++ Language Tutorial のような、あっさりした
zsiarre 2013/12/19
C++

programming
リンク
Hadoopを使わずにWikipediaのテキスト処理を400倍高速化 - tsubosakaの日記
タイトルは釣りです。id:mamorukさんの書いたHadoop で Wikipedia のテキスト処理を900倍高速化 - 武蔵野日記を読んで、そもそも1G程度のデータの単語頻度を数えるのに858分もかかるんだっけと思い、id:nokunoさんの資料を読んでみると単語頻度を求める際に a b a aみたいなデータを a 3 b 1に変形するのにsortしたファイルをuniq -cで処理するということをやっていた。これはあまり効率のよい方法ではなくて行数をNとしたときにO(N log N)の計算時間となる(文字列比較はO(1)でやれることにする)。これに対して、単語の頻度をハッシュ表で保存すると理想的な条件の元ではO(N)の計算時間で頻度を求めることが出来、より高速に計算することが可能となることが期待される。また、単語数をWとしたとき、C++のmapのような二分探索木を使ってもO(N
zsiarre 2012/08/02
C++
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx