タグ

2011年11月5日のブックマーク (9件)

  • 「ビッグデータ」に対するサーチエンジンからのアプローチ

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 「ビッグデータ」の処理テクノロジとしては、構造化データ向きのRDBMS、非構造化データ向きのHadoopという使い分けが定石的考え方になりつつある。しかし、企業内には大量の文書という非構造化データもある。このデータを処理する(より正確に言えばユーザーが活用可能にする)テクノロジとしてサーチエンジンを忘れてはならない。そもそも、MapReduce等のGoogleの「ビッグデータ」処理基盤もサーチエンジンがその起源だ。 「ビッグデータ」時代のサーチの重要性 大規模ウェブサービスプロバイダーや通信事業者、そして無線タグを活用する小売業や運送業などを除く一般的企業内の非構造化データは、今のところMicrosoft OfficeファイルやEメール

    「ビッグデータ」に対するサーチエンジンからのアプローチ
  • sshを使いこなすための7つの設定 - 射撃しつつ前転 改

    五月病が抜け切らないIT系新入社員に贈るシリーズ第1段。 ~/.ssh/configにはいろいろな設定が書けるが、周囲を見渡した限り、あまり活用されているようには見受けられない。そこで、今回は便利な設定をいくつか集めてみた。 長いホスト名に短い名前をつける Host exp1 HostName verrrryyy.looooong.hostname.example.jp ssh verrrryyy.looooong.hostname.example.jpの代わりにssh exp1でログインできるようになる。 ちなみに、zshの場合、configファイルに登録されたホスト名はsshコマンドを打つときに補完されるので更に便利。 特定のホストへログインするときのユーザ名や鍵をカスタマイズする Host github.com User tkng IdentityFile ~/.ssh/id_rsa

    sshを使いこなすための7つの設定 - 射撃しつつ前転 改
  • clangでソフトウェアをビルドしC++を知る - 射撃しつつ前転 改

    clangというのはllvm向けのC/C++/Obj-Cのためのフロントエンドで、最近はGoogle ChromeとかFirefoxもコンパイルできるレベルにまで成熟してきているらしい。 いくつかのブログで紹介されているのを見ても、ふーん、ぐらいにしか思っていなかったのだが、あんな大規模なソフトウェアがコンパイルできるというのは、考えてみるとすごいことである。大事なことなので強調しておくが、すごいことである。十分に実用的なレベルに到達していることだ。ビルドも早いし生成されたコードもg++と同程度には速いというし、試してみる必要がある。 という訳で、いくつか実際にソフトウェアをビルドしてみた。試してみた限りでは、 libstdc++のtr1/unordered_mapがビルドできない C++のコーナーケースで、clangが許容しないものが多い といった問題があったが、割とどれもすんなりとコン

    clangでソフトウェアをビルドしC++を知る - 射撃しつつ前転 改
  • http://cai.cs.shinshu-u.ac.jp/sugsi/Lecture/HowToUnix/5-1.html

    5-1 どんな環境でも使えるライン・エディタ - edエディタ - ed,正規表現,スクリーン・エディタ,ライン・エディタ ファイルに文章を作ったりプログラムを作成できます。キーボードから文章やプログラムを1行ずつ入力していきます(下図)。 また,ファイルの内容を編集することもできます。たとえば,上のプログラム中の point という語をすべて ppp に変更することも簡単にできます。 ここで紹介するエディタは ed という名のエディタです。ed を使ってファイルを作成したり編集するにはまず次のように入力します。 % ed ファイル名 ここで,指定したファイルがシステムにないファイルの場合は,新規にファイルを作成することになり,画面に ? とファイル名が表示されます。また,すでにあるファイルを指定すると,この指定ファイルを編集することになり,画面にファイル中の文字数が表示されます。 このフ

  • tmpfsってやっぱ凄げ? : 404 Blog Not Found

    2006年02月18日15:53 カテゴリiTech tmpfsってやっぱ凄げ? コメント&TBありがとうございます。Linuxについては私も知らないので、ついつい「BSD的ジョーシキ」でOSを推し量っちゃう傾向が私にはあるので。 革命の日々! tmpfs は当に容量が動的なのか あと、404 Blog Not Foundさんはわりと惜しい所をついているのだがtmpfsはmallocが使うのと同じしくみをつくうので、mallocと同じ挙動になる。が正しい。 しかし、残りの1%の違いは非常に重要に思えるので、entryを作成した次第。 その後の検索の結果、以下のページを発見。太字は弾による。 dW : Linux : 共通テーマ: アドバンスト・ファイルシステム・インプリメンター・ガイド: 第2回 動的なファイルシステム・サイズ 読者の皆さんは、/mnt/tmpfsにマウントされたtmp

    tmpfsってやっぱ凄げ? : 404 Blog Not Found
  • naoyaのはてなダイアリー - tmpfs は本当に容量が動的なのか

    Linux には tmpfs という便利なファイルシステムがあります。 $ mount -t tmpfs -o size=64m tmpfs /dev/shm $ mount -t tmpfs -o size=64m /dev/shm /var/tmpとすると、/var/tmp がディスク上ではなくメモリ上に作られたファイルシステムとして mount されます。なので、/var/tmp は I/O 時にディスクI/Oが一切発生しない高速なディスクとして使えると。いわゆる RAM ディスク。(もちろんサーバーの電源を落とすと保存したファイルは消えます。) この tmpfs はなかなかに便利で、キャッシュとかそういうものでディスクにおいてたものここ置くと、ディスク I/O がカットできて超高速になります。はてなでは MySQL のスレーブの MyISAM のファイルを tmpfs において、オ

    naoyaのはてなダイアリー - tmpfs は本当に容量が動的なのか
  • googletest - Google C++ Testing Framework - Google Project Hosting

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    googletest - Google C++ Testing Framework - Google Project Hosting
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • C言語・C++言語用テスティングフレームワーク - Cutter

    最新リリース 2019-09-13にリリースされた1.2.7が最新です。 [ダウンロード] [変更点] Cutterとは Cutterは書きやすさ・デバッグのしやすさを重視したC言語・C++言語用のテスティングフレームワークです。メンテナンスしやすく、利用効果の高い単体テスト(ユニットテスト)の開発を支援します。 また、テストを苦痛ではなく、楽しいものにすることも重視しています。スクリーンショットはテスト結果の通知機能を利用している様子です。文字としてテストのパス・失敗を伝えるだけではなく、視覚的にも通知することで、テスト結果をわかりやすくします。わかりやすいので、頻繁にテストを実行したくなります。この機能はnotify-sendコマンド(Linuxや*BSDなどの場合)またはgrowlnotifyコマンド(macOSの場合)を利用します。 動作環境 CutterはDebian GNU/L