タグ

ブックマーク / d.hatena.ne.jp (128)

  • 長文日記

    pcod
    pcod 2013/07/01
    いい話
  • いままでいくら買い物したの? 〜楽天市場編〜 - developer’s delight

    こちらのエントリを見て面白いなと思いまして、楽天市場も使ってる僕としてはぜひ楽天市場も試してみたい、ということで作ってみました。と言っても、オリジナルをちょこっと直しただけですが。もしよろしかったらどうぞ。オリジナルのエントリ同様、まずログインして購入履歴のページに行きます。楽天市場の場合は、https://order.my.rakuten.co.jp/ です。そして、これまたオリジナルのエントリ同様、こちらをアドレスバーに貼り付けます。 javascript:(function(){var d=document;var s=d.createElement('script');s.src='https://gist.github.com/kkawamura/5714202/raw/868f7922b438000d6957de87ec747dced66cd11a/aitter_rakuten

    pcod
    pcod 2013/06/06
  • 長文日記

  • 圧縮された redis の dump をチェックするときのメモリリーク - Standard ML of Yukkuri

    仕事で必要だったので redis のパッチを書いた.https://github.com/antirez/redis/pull/146memcached のように key をいっぱい redis に突っ込むとメモリリークしてるせいで dump のチェックが困難になるよーということがありました. key の名前のために確保した領域が free されていない. 即マージされたので, この間リリースされた 2.4.2 で解決してるはずです.redis の dump は圧縮すると非常にコンパクトになりますが, 中身を把握しづらくなりデバッグが面倒になるというデメリットがあります. 圧縮された dump ファイルの中身を見てどうにかするプログラムを書きたいという要望があり, redis-check-dump をベースにプログラムを書く際に見つけた次第. 圧縮自体は lzf_d.c lzf_decom

    pcod
    pcod 2011/11/06
  • ジゴワットとは 映画の人気・最新記事を集めました - はてな

    【jigowatt】 ギガワット(電力の単位、10億ワット)のこと。 映画「バック・トゥ・ザ・フューチャー」の1シーンに登場した、 One point and twenty-one jigowatt*1 という、デロリアンが1回のタイムスリップに必要な電力量についての台詞が由来となっている。 これは、同作品の共同脚を担当したボブ・ゲイルがギガワットの綴りを「gigawatt」でなく「jigowatt」だと思い込んでいた為に脚に書き込んでしまったスペルミスなのだが、日語版の翻訳者*2が考えなしに「ジゴワット」と片仮名で字幕化してしまった為、映画を見た者に混乱をもたらした。 ただし、実際に英語圏では「giga」を「ジゴ」に近い音で発音する事もあるらしく、ボブ・ゲイルが綴りを勘違いしていたのも、それが理由であるという。 現在では、フィクションの世界における架空の単位として使われる事も多い。

    ジゴワットとは 映画の人気・最新記事を集めました - はてな
    pcod
    pcod 2011/10/25
  • 本当に必要なN-gramは2割しかない - nokunoの日記

    Entropy-based Pruning of Backoff Language Modelsを読んだ.単語N-gramはとてもよくできていて言語モデルとしての性能はかなりのものなのだが,なんの枝刈りもせずに中規模〜大規模なデータに適用しようとするとサイズが馬鹿でかくなってしまう.そのための対策としてよくあるのが語彙のサイズを制限する方法と,N-gramの頻度が一定以下のものを切り捨てるという方法(後者の場合は語彙も自動的に制限される).Google語N-gramなども頻度20以上のものが配布されており,効率よくデータサイズを減らすためには頻度でカットオフする方式がよく使われていると思う(語彙だけだとかなり制限しないとサイズが減らない).しかしカットオフしすぎると性能はかなり落ち込むので,うまい方法はないものかと考えられたのがこの論文の手法である.N-gramのデータには頻度の高い

    pcod
    pcod 2011/09/15
  • 【速報】Microsoft Speller Challengeに入賞しました - nokunoの日記

    わーいわーい Microsoft Research - Speller Challenge ツイートする

    pcod
    pcod 2011/06/18
    かっこいい
  • youpy対策とは コンピュータの人気・最新記事を集めました - はてな

    文字列 "youpy" を条件に個別の処理を記述すること。qwikWeb の対策が初出 要出典 転じて、ユーザによって処理内容を変えること。 実際の開発における用法: 「なんか異様にたくさん投稿するユーザさんがいますね……」「youpy対策しといて」 「特定ユーザさんの使い方が想定外で、あまりにも長いSQLが……」「そもそもその SQL は最適化できない?」「それをやるとちょっと時間かかりそうです」「じゃあyoupy対策で」 このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

    youpy対策とは コンピュータの人気・最新記事を集めました - はてな
    pcod
    pcod 2011/06/08
  • 就職も進学もあるんだよ - Standard ML of Yukkuri

    株式会社はてなエンジニアとして入社しました. 同時に奈良先端科学技術大学院大学の博士後期課程に進学しました.私はエンジニアリングが大好きで, 大学院で研究がしたいと考えるようになったのも, それが大きく影響しているのだと思います. 小さなエンジニアリングの積み重ねによりサービスの品質を上げ, この便利なサービス(機能)は中でどのような仕組みになっているのだろう, と言わせたいです.また, 大学院で身につけた専門分野の知識をディスカッションなどを通じて役立てることができたら幸いです. そしていずれは社内で「自然言語処理と機械学習のことなら俺に聞け」と言えるようになれたらいいですね....ところで, 入社の前日が論文締切りだったことも手伝って, 初日からさっそく居眠りをしてしまいました. ごめんなさい.

    pcod
    pcod 2011/04/03
  • imHo

    ようこそゲストさん ブログトップ 記事一覧 ログイン無料ブログ開設 imHo

  • EMアルゴリズムによるスペル訂正エンジン - nokunoの日記

    以下の論文が面白かったので紹介したいと思います。Learning a Spelling Error Model from Search Query Logs Noisy Channel Modelによるスペル訂正エンジンスペル訂正には標準的なNoisy Channel Modelを使うことができます(最近は識別モデルも流行りのようです)。A Spelling Correction Program Based on a Noisy Channel ModelNoisy Channel Modelでは、入力が与えられたときの訂正候補の確率を以下のようにモデル化します。言語モデル はコーパスやクエリログから単語N-gram、文字N-gramなどを推定し、スムージングして利用することが一般的です。エラーモデル は入力と出力候補の編集距離をもとに計算することが多いです(他に共起頻度やクリックログを利

  • MacBook Air 11インチ欲しい!とは はてなの人気・最新記事を集めました - はてな

    年も開けて2011年。心機一転、新しくブログを始めたり、あらためてブログを再開しようと意気込んでいる方も多いのではないでしょうか。 ブログ新生活応援キャンペーンとして、話題のMacBook Air 11インチが当たるプレゼントキャンペーンを実施いたします。2011年は、新しいマシンといっしょにブログを書いてみませんか?

    MacBook Air 11インチ欲しい!とは はてなの人気・最新記事を集めました - はてな
  • 【お絵かき楽しす】ピクシブ株式会社に行ってきM@star【社員犬かわゆす】 - もんじゃのひみつきち

    イベントレポートお久しぶりです、カッパのボンとみひさです。昨日、ピクシブ株式会社におじゃましてきたのですが、めちゃめちゃ楽しかったので簡単にまとめておきます。ピクシブのカラフルできれいなオフィスで、例の社員犬チョビとふれあったり、okamaのpixivたんクリアファイルももらうことができて、幸せでした。 「お絵かき楽しす」を実現する、ピクシブの事業ピクシブ、なんかめちゃめちゃいろいろサービスつくったりイベントやったりしてるな〜とは思っていたのですが、説明を聞いてるとほんと、pixivをはじめ、ニュース配信、iPhoneアプリ、イベント開催、の出版、お絵かきチャットなどなど、「お絵かきが楽しくなる場をつくる」を理念に基づいてかなり勢力的に展開してる感じでした。 圧倒的な開発速度社員数35名、うち技術職7割とお聞きしましたが、社員の方々が仕事をしているフロアを見渡すと、確かに30名ちょっとく

    pcod
    pcod 2010/12/17
  • NLP関係のリソースまとめ - nokunoの日記

    先日オープンソースのtrieライブラリについてまとめましたが、それ以外にも家での開発に使えるリソースが増えてきました。 コーパス WikipediaコーパスTwitterコーパスBaiduコーパスWebコーパスWikipedia対訳コーパスオープンソース対訳コーパスMS-IMEコーパス 辞書 WikipediaタイトルはてなキーワードIPAdicUnidicalt-cannadicSKK評判辞書

    pcod
    pcod 2010/12/16
  • nokunoの日記

    nokuno Software Engineer at a Web Company. Interested in Natural Language Processing, Machine Learning, and Data Mining. Skillful in C/C++, Python, and Hadoop.

    pcod
    pcod 2010/10/27
    お疲れ様でした!
  • 未踏説明会で発表してきM@ster 〜漫画で読む未踏ユース〜 - モリキチのひみつきち

    イベントレポート香川大学で行われたIPA未踏説明会で、私の開発システムと未踏での経験についてお話させていただきました。 今回の発表資料をつくる直前に宮崎駿監督の「ぼくは紙とペンさえあればいい」みたいなコメントを読んで感動した私は、いきおい余って、気がついたらこんなのをつくってしまっていた。後悔はしてない。 → 漫画で読む未踏ユース(PDFファイル) この後藤PMの待受画像が欲しい人は、わっふるわっふると書き込んでください。

    pcod
    pcod 2010/07/13
  • ma<s>atokinugawaの日記

    ma<s>atokinugawaの日記

  • SVMによる予測変換 - nokunoの日記

    Google日本語入力のOSS版であるMozcが公開されたので、ソースコードを読んでみました。Google Japan Blog: Google 日本語入力がオープンソースになりました mozc - Project Hosting on Google Code変換アルゴリズムや学習のロジックに関しては、id:tkngさんが早速ブログにまとめていますので、そちらを読むとよいと思います。また何か気づいたことがあったら書いてみたいと思います。Mozc(Google日本語入力)のコードを読んだメモ - 射撃しつつ前転 Mozcのコードで個人的に興味深かったのは予測変換のアルゴリズムでした。私はもともと修論の時に予測変換の研究をしていて、予測変換のトレードオフという問題に取り組んでいました。予測変換は、単純に考えると候補の頻度が高ければ高いほど良いのですが、それだけだと常に最も短い候補が出力されてし

  • 2009 UCSD/FICO Data Mining Contest とか - Standard ML of Yukkuri

    http://mill.ucsd.edu/index.php?page=Results学部生からポスドクまでを対象としたUCSD主催のデータマイニングコンテストに参加してました. チーム名は smly で一人チーム. NAIST からは他にも論理生命学講座の先輩方のチーム west が参加していて, 彼等がひとつのタスクで優勝したようです. おめでとうございます. 二ヶ月ほどの期間で競われるコンテストなのですが, いろいろあって実質的な参加期間は二週間程度で, 入賞もできなかったという微妙な結果でした. たしかこの頃は研究会やYANSの発表ネタをがんばっていた気がする. でも来年は入賞して賞金をとりに行きます. 賞金が欲しい.タスクは E-commerce のトランザクションデータが与えられ, その中に含まれる異常なトランザクション(正例)を分類するという単純な二値分類で, easy と

    pcod
    pcod 2009/08/09
  • 静岡にいったことはありますか - 空中キャンプ

    帰りの電車のなかでおかしな男に絡まれた。きっかけは、閉まりかけのドアにわたしが飛び込んだことだ。むりに入ったので、閉まるときに、ひじのあたりががつんとドアにぶつかった。すると、近くにいた土木作業員風の若い男(坊主頭、ピアス)がわたしに向かって、「迷惑なんだよ、オイ」「オマエみたいな奴がいるとむかつくんだよ」と悪態をつきはじめた。もとはといえばわたしが悪いのだが、ややこしいことになった。 しばらく無視をしていたが、「聞こえてるんだろう、テメー」「オイ、このやろう」などと言い続けるので、しかたなく急いで別の車両に移動した。もう、まいったなあ。ところが、移動したとなりの車両でしばらく立っていると、あろうことか、そいつもわたしを追ってくるではないか。どうしていいかわからない。男は「逃げんじゃねえ、オイ、テメー」と因縁をつけてくる。うーん、ややこしすぎる。しばらくうしろを向いて立っていたが、さすがに

    pcod
    pcod 2009/06/06