タグ

2012年2月19日のブックマーク (15件)

  • 情報系修士にもわかるダブル配列 - アスペ日記

    最近話題の「日本語入力を支える技術」を途中まで読んだ。 3章がものすごく気合いが入っている。 trie(トライ)というデータ構造の2つの実装、「ダブル配列」と「LOUDS」について詳しく説明がされている。 ダブル配列については、ぼくは以前論文を読んで勉強しようとしたのだが、その時は難しくてあきらめた覚えがある。しかし、このの説明を読むことで理解ができた。 ありがたい。 感銘を受けたので、このを教材に友達と2人勉強会をした。 この2人勉強会というのは、ぼくが復習を兼ねて友達に教えるというのがだいたいのスタイル。 しかし、いざやってみるといろいろと難しい。 次のようなところでひっかかるようだ。 例のサイズが小さく、イメージを喚起するのが難しい。 最初の図のノード番号と、最終的なダブル配列上の位置が異なるため、混乱する。 単語終端について言及がないので、どのノードが単語を表しているかがわから

    情報系修士にもわかるダブル配列 - アスペ日記
  • soleami (ソレミ)の使い方〜Solrの立ち上げからログの可視化まで〜 - 株式会社ロンウイット

    Apache Solrが出力するクエリログを可視化するツールsoleamiの使い方をご紹介します。稿ではもっとも一般的な使い方を想定し、SolrをTomcat上にデプロイして使う場合について解説します。 おおまかな手順は、以下の通りです(すでにTomcat上で稼働しているSolrをお持ちの方や弊社サブスクリプション・パッケージのお客様は、手順4.からお読みください)。 Tomcatのダウンロード Solrのダウンロード 文字化け対策 solrconfig.xmlの編集 SolrのTomcatへのデプロイと起動 検索を実行 soleamiでログを可視化 なお、Linux/Macの環境を前提に話を進めます。Windowsの場合はcygwinなどを使いながら、置き換えて読み進めてください。 またユーザsolrがログインディレクトリ/home/solrの下にworkというディレクトリを作成し、そ

    soleami (ソレミ)の使い方〜Solrの立ち上げからログの可視化まで〜 - 株式会社ロンウイット
    kamipo
    kamipo 2012/02/19
  • Count-Min Sketch のライブラリを公開しました

    2012-02-17 Count-Min Sketch のライブラリを公開しました written by Susumu Yata. はじめに 先日 groonga プロジェクトでの利用を目的として開発しているライブラリ Madoka を公開しました.Madoka は Count-Min Sketch という手法をライブラリ化したものであり,文書集合に含まれるキーワードの頻度を求める,クエリの頻度を求める,などの用途に使うことができます. s-yata/madoka - GitHub Documentation - Madoka ライブラリの使い方についてはドキュメントに書いてあるので,こちらは Count-Min Sketch と Madoka の特徴をまとめた内容になっています. Count-Min Sketch 頻度を求めることが目的であれば,ハッシュ表による連想配列を使うのが,おそら

    Count-Min Sketch のライブラリを公開しました
    kamipo
    kamipo 2012/02/19
  • 布団の捨て方

    実は布団は粗大ゴミの第1位です。どうやって捨てようか、皆さんも悩まれたことが多いのでは・・・布団は基的に粗大ゴミ扱いです。 化繊の布団の捨て方 基的に粗大ゴミ(燃えないゴミ扱い)になります。 綿の布団の捨て方 綿製の布団であれば自治体によっては、資源ゴミとしてリサイクルが出来ます。 捨てる前に 打ち直しという昔ながらの布団の再生方法もあるので検討してみてはいかがでしょうか。定期的に打ち直しをすることによって長く使え環境にも優しい。 定期的に布団の丸洗いをするとかもいいでしょう。ふんわりと柔らかに生まれ変わります。 打ち直しと丸洗いは寝具店で行なっていますしインターネットでも注文できます。 自宅でのケア ご自宅でのケアのポイントは晴れた日の10時から14時ごろまで布団を干し、その後布団に掃除機をかけホコリ・ダニなどを吸い取るというのが一番良いでしょう。 布団たたきは布団の傷む原因にもなり

    布団の捨て方
    kamipo
    kamipo 2012/02/19
  • Plack アプリで遅延ロードされるモジュールを見る

    アプリケーションで利用するモジュールは、できる限り先読み(preload)しておきたい。先読みしておけば、アプリケーション全体のメモリ消費が抑えられるし、遅延ロード(Lazy Load)のコストがなくなります。 モジュールの先読みは、例えば以下のように行います。 starman --preload-app MyApp app.psgi or starman -MFoo -MFoo::Bar -MBaz::DBI app.psgi あえて遅延ロードするという場合を除いて、先読みは行って損はないはず(小さいアプリだと、効果は小さいですお ^-^)。 Plack::Middleware::Debug::LazyLoadModules 明示的に use するモジュール群のピックアップはたやすい。なにせ明示されているから。しかし、暗黙に遅延ロードされてるモジュールやライブラリは調べてみると多く見つか

    Plack アプリで遅延ロードされるモジュールを見る
    kamipo
    kamipo 2012/02/19
  • Ameroadのオークション出品で問い合わせが多いのでFAQ書くよ:村上福之の「ネットとケータイと俺様」:オルタナティブ・ブログ

    落札されました。ありがとうございました。 ここで、売られているameroadというサイトについて、問い合わせが多いので、テキトウに答えます 即決価格で買いたいという人が、何人か来ているので、あるひ一瞬で終わるかもしれません。 開発言語と構成: PHP+Apache+MySQL。すごい軽いので移管は楽チンです。落札者には現在のサーバーお渡しします。 AmeroadとGumroadの設計思想の違い: セキュリティはある程度は守る Gumroadはリンクが漏れるとコンテンツがタダでダダモレですが、AmeroadはURLが漏れてもダダモレになりません。 ダウンロード時にユーザーのTwitterのログイン情報を見てます。要するに買ったことがある人のTwitter-IDじゃないダウンロードできません。 だれが売っているのか明確にする。 Ameroadは出品者のTwitter-IDや販売数を公開してます

    Ameroadのオークション出品で問い合わせが多いのでFAQ書くよ:村上福之の「ネットとケータイと俺様」:オルタナティブ・ブログ
  • MySQL :: MySQL 8.0 リファレンスマニュアル :: 9.2.3 識別子の大文字と小文字の区別

    MySQL において、データベースはデータディレクトリ内のディレクトリに対応しています。 データベース内の各テーブルも、データベースディレクトリ内の少なくとも 1 つ (ストレージエンジンによってはそれ以上) のファイルに対応しています。 トリガーもファイルに対応しています。 この結果、基になるオペレーティングシステムで大文字と小文字が区別されるかどうかが、データベース名、テーブル名、およびトリガー名で大文字と小文字が区別されるかどうかに影響します。 つまり、このような名前は Windows では大文字と小文字が区別されませんが、ほとんどの種類の Unix では大文字と小文字が区別されます。 特に重要な例外は、Unix ベースであるが、大/小文字を区別しないデフォルトのファイルシステムタイプ (HFS+) を使用する macOS です。 ただし、macOS は UFS ボリュームもサポート

    kamipo
    kamipo 2012/02/19
  • unicornのタイムアウト時にもRailsのログをちゃんと出力させる - 昼メシ物語

    unicornはconfで timeout 20 とかやっとくと、20秒以上かかったらそのworkerが殺される。それはいい。問題はその殺され方にあって、タイムアウトしたunicorn workerはmasterにKILLシグナルで強制的に殺される。KILLで殺されてしまうと、worker側でtrapして安全に終了処理をすることができない。 一番困るのは、Railsloggerは(production環境のデフォルトだと)リクエストが終了するまでバッファリングしているので、リクエストの途中でKILLされてしまうとloggerがflushされない。つまり、unicornのタイムアウト時には、リクエストのログは一切production.logには出力されない。異常時のログが出ないとか、まじで困ると思うんだけど、みんなどうしてんだろ。 これに対処するためにはunicornのコードに手を入れるの

    unicornのタイムアウト時にもRailsのログをちゃんと出力させる - 昼メシ物語
  • Jubatus : Distributed Online Machine Learning Framework¶

    Jubatus English Japanese

  • Tumblr Architecture - 15 Billion Page Views a Month and Harder to Scale than Twitter - High Scalability -

    « Sponsored Post: Percona Live, AiCache, Next Big Sound, ElasticHosts, Red 5 Studios, Logic Monitor, New Relic, AppDynamics, CloudSigma, ManageEngine, Site24x7 | Main | Stuff The Internet Says On Scalability For February 10, 2012 » With over 15 billion page views a month Tumblr has become an insanely popular blogging platform. Users may like Tumblr for its simplicity, its beauty, its strong focus

  • GitlabをUbuntu11.10 Serverに導入 - ike-dai's blog

    Githubのような環境をクローズドな環境に構築できるOSS Gitlabを試してみました。 Gitのリポジトリを集中的に管理するのには非常に便利だと思います。 今までviewgitとかでGitリポジトリをWebで見せれるようにしたりしていましたが、 全然UIもいいし、CommentやIssue機能など使い方次第でかなり便利に活用できそうです。 以下、インストールした際のログを残しておきます。 あまりまだ情報が少ないので、結構苦戦しました。 今回は、Ubuntu Server 11.10 64bitにインストールしていきました。 https://github.com/gitlabhq/gitlabhq ここのREADMEを参考にインストール 必要なもの OS:Ubuntu,Debian MW:Ruby 1.9.2,Rails 3.1.0,sqlite,git,gitosis,pygment

    GitlabをUbuntu11.10 Serverに導入 - ike-dai's blog
  • Apache 2.2.15から入った mod_reqtimeout を Reverse Proxyで使う場合の注意点 - blog.nomadscafe.jp

    slowloris対策として、Apacheの2.1.15から入ったモジュールにmod_reqtimeoutというのがあります。 RequestReadTimeout header=10 body=30 このように設定することで、headerの受信が10秒以内、bodyの受信が30秒以内に完了しない場合、「408」エラーとできます。簡単で便利そうですね 公式ドキュメント http://httpd.apache.org/docs/2.2/en/mod/mod_reqtimeout.html ただし、 Apacheをreverse proxyとして使用している場合はTimeoutにならず、リクエストの一部がproxy先に送られるという問題があるので注意が必要というか、はまったのでその話。 ちなみに、すでにBugzillaには上がっているけど、2.2系ではまだ対応完了してない https://is

  • IndexedDBに関する覚書 (2011年12月版) – mzsm.me

    厳密に言うと違う部分もありますが、こんなイメージだとざっくりと理解しておいてください。 DBへの接続 ではここから実際のコードを使って説明していきます。 まず、2011年4月のWDの仕様(以前の仕様)でDBへ接続するには次のように書きます。 //Chrome16, Chrome18(canary), Firefox 8 で動作します var dbName = 'mzsmTest'; //データベース名 var idb; var dbConnect = indexedDB.open(dbName); console.log(dbConnect); //-> {IDBRequest} dbConnect.onsuccess = function(e){ idb = e.target.result; //IDBDatabaseオブジェクト console.log('DB接続完了'); }; db

  • 「Pull Request」 はオープンソースに限らず使える優れた開発フローだ - 肉とビールとパンケーキ by @sotarok

    チーム開発において、「チケット/Issue」「TDD」「コードレビュー」など、ソースコードの変更に対する効果的な開発フローについてよく考えるのだけど、なんにしてもこのあたりは非常に課題が多く、各社各コミュニティで色々なやり方が模索されているポイントだと思う。 で、まぁご多分に漏れず僕もよく考えるわけだけど、現状その過程で Pull Request こそが非常に効果的なのではないか、と思うので、ちょっとまとめてみようかと思う。 もちろん、言うまでもないようなことだよ、という人もいるかもしれないけど、そういう人がたくさんいると、非常に喜ばしいことだね。 Pull Request とは GitHub でこう呼ばれているので、こう呼ぶことにするが、ここでは、複数のリポジトリ/ブランチ間でのオープンな patch のやりとりのことだと考える。 あと、自分が使っているのが Git なので、ここでは G

    「Pull Request」 はオープンソースに限らず使える優れた開発フローだ - 肉とビールとパンケーキ by @sotarok
    kamipo
    kamipo 2012/02/19
  • highscalability.com の Tumblr のアーキテクチャについての記事を読んだ - @kyanny's blog

    High Scalability - High Scalability - Tumblr Architecture - 15 Billion Page Views a Month and Harder to Scale than Twitter を読んだ。すごく面白かった。 Kindle で引用したところを中心にメモ。 Tumblr のソーシャルグラフの特徴 The graph for Tumblr users has hundreds of followers. This is different than any other social network and is what makes Tumblr so challenging to scale. Tumblr だと follower が数百人いるユーザーはザラにいる。 follower の多いユーザーの post は多くのユーザ

    highscalability.com の Tumblr のアーキテクチャについての記事を読んだ - @kyanny's blog
    kamipo
    kamipo 2012/02/19