「Hatena Engineer Seminar #2」で発表した資料です

2013年1月16日、はてなダイアリーは誕生から10周年を迎えました。2003年1月16日に50人ほどのベータ版サービスとして開始したはてなダイアリーも、現在では多くの方に利用いただくブログサービスに成長しました。10周年を迎えることができたのも、ご利用いただいているユーザーの皆さまのおかげです。ありがとうございます! 感謝の気持ちを込めて、抽選で30名様に「はてなグッズ福袋」が当たるプレゼントキャンペーンを実施いたします。下記 キャンペーン応募要項 に従い、はてなダイアリーに、はてなダイアリーでの思い出や、今後のブログサービスへの思いなどを投稿してください 本文に応募キーワード「はてなダイアリー10周年おめでとう!」を忘れずに!(キーワードがないとエントリーされません) はてなダイアリー、はてなブログ、どちらでも応募できます ※両方から応募すると当選確率が2倍に! ブックマークでも参加で
人力検索はてなのアイデアを思い付いて、会社を作ろう!と思ったときに、本当にアイデアがうまくいくと思ってくれた人は誰もいませんでした。 検索エンジンでうまくキーワードを組み合わせて知りたい情報を探す、みたいな超絶(?)テクニックを、父親やこれからインターネットを始める人が全員習得しなくてはいけないのか、と思うと僕は気が遠くなりました。もっと人に優しい検索手段がないとダメだ!インターネットはもっと楽しく便利にできる!と思い、そのための方法を夢中で考えました。 他の人に文章で訊ける、という人力検索のアイデアを思い付き、質問を有料にして手数料で儲ける、というビジネスモデルを考えました。周りの人は誰もうまくいくとは思ってくれませんでした。身近な人で、一緒に手伝ってくれる人でさえ、「まあこいつがやるなら一緒にやるか」くらいの感じでした。 結果的には周りの人間が正しかったです。人力検索サイトをオープンし
昨日は退職の挨拶にブックマークや Twitter などで多数のコメントをいただきました。改めて、自分がたくさんの人に支えられていることを実感し、自分は幸せ者だなと感じました。本当にありがとうございます。 いただいたコメントで「次はどこへ」というご質問を多数いただきましたので、報告させてください。 本日より、グリー株式会社で働きます。 グリーのサービスのビジョンは「インターネットを通じて、世界をより良くする。」というメッセージに集約されています。 インターネットが本格的に世の中に普及してすでに10年以上の年月が立ちますが、まだまだ、それが秘める体験は世の中の人々に届いていないと感じます。ここ何年かの間に、ブログや SNS、ソーシャルゲーム、ソーシャルメディアなどの大きなトレンドがあって、その中で各サービスがその体験を補完する形で立ち上がってきました。 これから10年20年、自分がやるべきこと
概要 Perlの非同期処理システムとしてTheSchwartz / Gearmanを非常に便利に使っているのですが、いい感じにワーカープロセスを管理したかったので、WorkerManagerなるものを作ってみました。作ったのは実は1年以上前なのですが、ようやくの公開です。 基本は、Apacheのpreforkモデルを踏襲しています。特徴は、 子プロセスを複数起動させて、ジョブを並列実行 一定回数のジョブを実行したら、子プロセスを再作成 クラスを定義するのみでジョブを実行 TheSchwartz / Gearmanの切り替えを最低限の変更で実現 ワーカープロセスの安全な停止(プロセス停止の際に、実行中のジョブの終了後に終了) ジョブの実行時のタイムスタンプをジョブ投入からの遅延をログに保存 というあたりです。preforkモデルなので、あまりモダンな設計ではないですが、gdbでのデバッグの容
いまやオバマ大統領も使っているTwitter(ツイッター)。はてなユーザーさんやスタッフの間でもかなりヘビーに使っている人が多く、どんどん人気が上がっているようです。 そんなTwitterとの強力な連携機能が、はてなブックマークから登場しました。なんとつぶやきスペースに「B!」とURLを書くだけで、そのURLがブックマークできてしまう機能です。 それではせっかくですので、この2年間で3回しかTwitterでつぶやいたことがなかった私が、Twitter連携機能を使ってブックマークしてみたいと思います。 1.設定変更する まずは自分のはてブの設定ページにできた「外部サイト連携」タブで、Twitterとの連携を設定します。 2.つぶやく そして、Twitterのつぶやきスペースに、はてブしたいURLやタブ、コメントをこんな感じで書きます。(例:[hatena]ここがコメント B! http://
MeCabは形態素解析のためのソフトウェアです。日本語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日本語や、正しく書かれた日本語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術は形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解
株式会社はてな様 社内運用1Uラックサーバー向け スイッチパネル製作 平成21年3月、弊社のお問い合わせフォームから一通の御連絡が入りました。 内容を拝見すると、「自社開発ツールに用いるプリント基板製造を対応出来ますか?」というお話。 得意分野というか、本業で有る内容の為、「対応可能です」と即時お答えを返信しました。 概要からの見積を多岐企業へのお問い合わせを行われた結果、FCAを委託先へ選定して頂いたとの事。 非常に光栄です。 お客様ご理解の下、製造に関する内容を当トピックスページとして公開させて頂く事に成りました。 お問い合わせ先は、人力検索 など 有益なツールを盛り込み、一風変わったポータルサイトを提供されている、 株式会社はてな の エンジニア 吉田様からでした。 はてな ポータルサイト 吉田様 blog ■対象とされるサーバー製品の説明と製造基板の目的■ タ
2009年06月27日 はてなブックマーク有料版でのアフィリエイトが、激しく儲からない件 月280円を払ってはてなブックマークプラスに入って、5日ほど経過した。 私にとって、最大にして唯一の魅力な機能は、はてなブックマークのブクマページに含まれる商品リンクからの売上を自分のアフィリエイト売上に出来る事なのだ。 分かりにくい人のためにキャプチャー載せる。 上記の赤い点線で囲んだ部分「tabbataさんからのおススメ商品」をクリックして、アマゾンに飛んだ後の売上が自分のアフィリエイトの売上にカウントされるのである。 これなら、月額280円の費用を払っても、投資回収は余裕だな〜、いいアイデアだな〜、さすが「はてな」さんだな、と思って加入してみた。(AutoDiscoveryフンフンの設定では、少し手こずった。。) さらに、アマゾン側のトラッキングコードも分け(コチラを参考にさせて貰いました。)き
はてなでは以前から自社製サーバを使用しているのですが、今年の春に、新たに自社製1Uハーフサーバを開発しました。 最近、タワー型だとメーカー製でもかなり安価なサーバがあるのですが、データセンターでの運用を考えると1ラックへの集積度が問題になってくるので、必然的にラックマウント可能なサーバが求められます。1Uサーバの中で価格対性能比のよいものを探すと、まだまだはてな的に使いやすいサーバが少ないので、今回このような1Uラックマウント可能なサーバを自社開発しました。 さてこのサーバの特徴としては、 ケーブル類がフロントアクセス 組み立て簡単 いけてるインフラアルバイトのid:hxmasakiが組み立てると15分 1ラックに60台以上搭載可能 もちろん、電源容量との兼ね合いもあります ディスクのホットスワップが可能 低消費電力 お値段据え置き 以前の自社製サーバとほぼ同価格 といったところがあげられ
はい!こんにちはこんにちは!! もうすぐ梅雨ですね! 2009年も半ばって感じです…! 2009年といえば…、 そう! マネタイズですね!! はてなのマネタイズ!! マネーだいじ…! だってお金がなくなっちゃうと、みんなの大好きなはてなもなくなっちゃうもんね…。 そうそう、ところで! ぼくさっきGoogleで検索していて、ちょっとしたことに気がついちゃったんですが! 今日はちょっとそれを、ここにメモしておきますね! ↓ほらこれ、 site:b.hatena.ne.jp エゴサーチしよう - Google 検索 はてなが URLの末尾にタイトルの文字列を含めてる。 あれれ…、前からこうだったっけ…! URLにキーワード文字列を含めてやるのって今のところものすごく強力なSEOのひとつで、 Amazonとかもその手法をつかっているからか、 本のタイトルなんかで検索すると、よくAmazonが一番上
適当な単語群を含む辞書があったとします。「京都の高倉二条に美味しいつけ麺のお店がある」*1という文章が入力として与えられたとき、この文章中に含まれる辞書中のキーワードを抽出したい、ということがあります。例えば辞書に「京都」「高倉二条」「つけ麺」「店」という単語が含まれていた場合には、これらの単語(と出現位置)が入力に対しての出力になります。 この類の処理は、任意の開始位置から部分一致する辞書中のキーワードをすべて取り出す処理、ということで「共通接頭辞検索 (Common Prefix Search)」などと呼ばれるそうです。形態素解析、Wikipedia やはてなキーワードのキーワードリンク処理などが代表的な応用例です。 Aho Corasick 法 任意のテキストから辞書に含まれるキーワードをすべて抽出するという処理の実現方法は色々とあります。Aho Corasick 法はその方法のひと
« PerlからGNTP(Growl Notification Transport Protocol)で送信出来るモジュール書いた。 | Main | はてなウンコスター » 貧乏なので買えません。 カラースターショップ - はてな ソース // ==UserScript== // @name poor man's hatena color star // @namespace http://mattn.kaoriya.net/ // @description poor man's hatena color star // @include http://* // @include https://* // ==/UserScript== (function() { // extend version of $X // $X(
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く