こちらのエントリを見て面白いなと思いまして、楽天市場も使ってる僕としてはぜひ楽天市場も試してみたい、ということで作ってみました。と言っても、オリジナルをちょこっと直しただけですが。もしよろしかったらどうぞ。オリジナルのエントリ同様、まずログインして購入履歴のページに行きます。楽天市場の場合は、https://order.my.rakuten.co.jp/ です。そして、これまたオリジナルのエントリ同様、こちらをアドレスバーに貼り付けます。 javascript:(function(){var d=document;var s=d.createElement('script');s.src='https://gist.github.com/kkawamura/5714202/raw/868f7922b438000d6957de87ec747dced66cd11a/aitter_rakuten
仕事で必要だったので redis のパッチを書いた.https://github.com/antirez/redis/pull/146memcached のように key をいっぱい redis に突っ込むとメモリリークしてるせいで dump のチェックが困難になるよーということがありました. key の名前のために確保した領域が free されていない. 即マージされたので, この間リリースされた 2.4.2 で解決してるはずです.redis の dump は圧縮すると非常にコンパクトになりますが, 中身を把握しづらくなりデバッグが面倒になるというデメリットがあります. 圧縮された dump ファイルの中身を見てどうにかするプログラムを書きたいという要望があり, redis-check-dump をベースにプログラムを書く際に見つけた次第. 圧縮自体は lzf_d.c lzf_decom
【jigowatt】 ギガワット(電力の単位、10億ワット)のこと。 映画「バック・トゥ・ザ・フューチャー」の1シーンに登場した、 One point and twenty-one jigowatt*1 という、デロリアンが1回のタイムスリップに必要な電力量についての台詞が由来となっている。 これは、同作品の共同脚本を担当したボブ・ゲイルがギガワットの綴りを「gigawatt」でなく「jigowatt」だと思い込んでいた為に脚本に書き込んでしまったスペルミスなのだが、日本語版の翻訳者*2が考えなしに「ジゴワット」と片仮名で字幕化してしまった為、映画を見た者に混乱をもたらした。 ただし、実際に英語圏では「giga」を「ジゴ」に近い音で発音する事もあるらしく、ボブ・ゲイルが綴りを勘違いしていたのも、それが理由であるという。 現在では、フィクションの世界における架空の単位として使われる事も多い。
Entropy-based Pruning of Backoff Language Modelsを読んだ.単語N-gramはとてもよくできていて言語モデルとしての性能はかなりのものなのだが,なんの枝刈りもせずに中規模〜大規模なデータに適用しようとするとサイズが馬鹿でかくなってしまう.そのための対策としてよくあるのが語彙のサイズを制限する方法と,N-gramの頻度が一定以下のものを切り捨てるという方法(後者の場合は語彙も自動的に制限される).Google 日本語N-gramなども頻度20以上のものが配布されており,効率よくデータサイズを減らすためには頻度でカットオフする方式がよく使われていると思う(語彙だけだとかなり制限しないとサイズが減らない).しかしカットオフしすぎると性能はかなり落ち込むので,うまい方法はないものかと考えられたのがこの論文の手法である.N-gramのデータには頻度の高い
わーいわーい Microsoft Research - Speller Challenge ツイートする
文字列 "youpy" を条件に個別の処理を記述すること。qwikWeb の対策が初出 要出典 転じて、ユーザによって処理内容を変えること。 実際の開発における用法: 「なんか異様にたくさん投稿するユーザさんがいますね……」「youpy対策しといて」 「特定ユーザさんの使い方が想定外で、あまりにも長いSQLが……」「そもそもその SQL は最適化できない?」「それをやるとちょっと時間かかりそうです」「じゃあyoupy対策で」 このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。
株式会社はてなにエンジニアとして入社しました. 同時に奈良先端科学技術大学院大学の博士後期課程に進学しました.私はエンジニアリングが大好きで, 大学院で研究がしたいと考えるようになったのも, それが大きく影響しているのだと思います. 小さなエンジニアリングの積み重ねによりサービスの品質を上げ, この便利なサービス(機能)は中でどのような仕組みになっているのだろう, と言わせたいです.また, 大学院で身につけた専門分野の知識をディスカッションなどを通じて役立てることができたら幸いです. そしていずれは社内で「自然言語処理と機械学習のことなら俺に聞け」と言えるようになれたらいいですね....ところで, 入社の前日が論文締切りだったことも手伝って, 初日からさっそく居眠りをしてしまいました. ごめんなさい.
以下の論文が面白かったので紹介したいと思います。Learning a Spelling Error Model from Search Query Logs Noisy Channel Modelによるスペル訂正エンジンスペル訂正には標準的なNoisy Channel Modelを使うことができます(最近は識別モデルも流行りのようです)。A Spelling Correction Program Based on a Noisy Channel ModelNoisy Channel Modelでは、入力が与えられたときの訂正候補の確率を以下のようにモデル化します。言語モデル はコーパスやクエリログから単語N-gram、文字N-gramなどを推定し、スムージングして利用することが一般的です。エラーモデル は入力と出力候補の編集距離をもとに計算することが多いです(他に共起頻度やクリックログを利
イベントレポートお久しぶりです、カッパのボンとみひさです。昨日、ピクシブ株式会社におじゃましてきたのですが、めちゃめちゃ楽しかったので簡単にまとめておきます。ピクシブのカラフルできれいなオフィスで、例の社員犬チョビとふれあったり、okamaのpixivたんクリアファイルももらうことができて、幸せでした。 「お絵かき楽しす」を実現する、ピクシブの事業ピクシブ、なんかめちゃめちゃいろいろサービスつくったりイベントやったりしてるな〜とは思っていたのですが、説明を聞いてるとほんと、pixivをはじめ、ニュース配信、iPhoneアプリ、イベント開催、本の出版、お絵かきチャットなどなど、「お絵かきが楽しくなる場をつくる」を理念に基づいてかなり勢力的に展開してる感じでした。 圧倒的な開発速度社員数35名、うち技術職7割とお聞きしましたが、社員の方々が仕事をしているフロアを見渡すと、確かに30名ちょっとく
Google日本語入力のOSS版であるMozcが公開されたので、ソースコードを読んでみました。Google Japan Blog: Google 日本語入力がオープンソースになりました mozc - Project Hosting on Google Code変換アルゴリズムや学習のロジックに関しては、id:tkngさんが早速ブログにまとめていますので、そちらを読むとよいと思います。また何か気づいたことがあったら書いてみたいと思います。Mozc(Google日本語入力)のコードを読んだメモ - 射撃しつつ前転 Mozcのコードで個人的に興味深かったのは予測変換のアルゴリズムでした。私はもともと修論の時に予測変換の研究をしていて、予測変換のトレードオフという問題に取り組んでいました。予測変換は、単純に考えると候補の頻度が高ければ高いほど良いのですが、それだけだと常に最も短い候補が出力されてし
http://mill.ucsd.edu/index.php?page=Results学部生からポスドクまでを対象としたUCSD主催のデータマイニングコンテストに参加してました. チーム名は smly で一人チーム. NAIST からは他にも論理生命学講座の先輩方のチーム west が参加していて, 彼等がひとつのタスクで優勝したようです. おめでとうございます. 二ヶ月ほどの期間で競われるコンテストなのですが, いろいろあって実質的な参加期間は二週間程度で, 入賞もできなかったという微妙な結果でした. たしかこの頃は研究会やYANSの発表ネタをがんばっていた気がする. でも来年は入賞して賞金をとりに行きます. 賞金が欲しい.タスクは E-commerce のトランザクションデータが与えられ, その中に含まれる異常なトランザクション(正例)を分類するという単純な二値分類で, easy と
帰りの電車のなかでおかしな男に絡まれた。きっかけは、閉まりかけのドアにわたしが飛び込んだことだ。むりに入ったので、閉まるときに、ひじのあたりががつんとドアにぶつかった。すると、近くにいた土木作業員風の若い男(坊主頭、ピアス)がわたしに向かって、「迷惑なんだよ、オイ」「オマエみたいな奴がいるとむかつくんだよ」と悪態をつきはじめた。もとはといえばわたしが悪いのだが、ややこしいことになった。 しばらく無視をしていたが、「聞こえてるんだろう、テメー」「オイ、このやろう」などと言い続けるので、しかたなく急いで別の車両に移動した。もう、まいったなあ。ところが、移動したとなりの車両でしばらく立っていると、あろうことか、そいつもわたしを追ってくるではないか。どうしていいかわからない。男は「逃げんじゃねえ、オイ、テメー」と因縁をつけてくる。うーん、ややこしすぎる。しばらくうしろを向いて立っていたが、さすがに
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く