タグ

ブックマーク / d.hatena.ne.jp/nokuno (24)

  • 未踏出すときに考えたアイデア - nokunoの日記

    この記事を読んで,4年前に未踏に応募したときのアイデアの候補を思い出しました. Social IME(採用) AjaxによるソーシャルDTM(作曲)サイト データマイニングによるゲームバランスの自動調整 ケータイカメラを利用した棚認識・共有システム Ajaxシンクライアント 他にも色々ありましたが恥ずかしいので秘密にしておきます.ツイートする

    totttte
    totttte 2011/10/01
  • 論文の読み方 - nokunoの日記

    id:echizen_tmさんの良エントリに触発されて書いてみます.未知の分野の論文を読むときの10のポイント - EchizenBlog-Zwei基的には私もid:echizen_tmさんの書いた10のポイントに沿った読み方をしています.ひとつ付け加えるなら,論文を調べる前にやるべきことがあるケースについて.0. 論文を読む前に定番の書籍(技術書・教科書)がある場合はそちらを先に読む.実装よりの分野の場合はライブラリを使ってみたりソースコードを読んでみたりするのもいい.また各ポイントについてちょっと補足するとすると,こんなところでしょうか. 調べる論文は英語に絞る 学部生のときは日語論文も調べましたし,今でも日語処理関係は日語で読むこともありますが,少し読んでみればいわゆる「地雷」が多いことに気付くでしょうから,自然とその分野のトップカンファレンスに行き着くことが多いと思います.

    totttte
    totttte 2011/09/05
  • 【書籍】NoSQLデータベースファーストガイド - nokunoの日記

    最近読んでいます。通称ささたつ。ブログにもたびたびお世話になっております。「NoSQLデータベースファーストガイド」を執筆しました - (゜∀゜)o彡 sasata299’s blog内容については、gihyoの連載を元にサンプルアプリケーションなどを充実させた構成になっているようです。連載:NoSQLデータベースを試してみる|gihyo.jp … 技術評論社簡単に目次から抜粋すると以下のような内容です。簡単な紹介や分類だけでなく、サンプルからどのNoSQLにはどんなユースケースに向いているのかが分かるようになっていて、とても良いと思います。またパフォーマンスについても細かく検証されており、NoSQLを使う際に参考になります。 NoSQLの分類 key-valueストア ドキュメント指向データベース 列指向データベース NoSQLデータベースの紹介 memcached Tokyo Tyr

    totttte
    totttte 2011/05/17
  • C++を鍛え直す - nokunoの日記

    関数全体をtryで囲む int main() try { // 関数内のすべての例外をキャッチできる ... } catch () { ... } 無名名前空間C言語ではグローバル変数にstaticを付けるとファイル内変数になりましたが、C++では無名名前空間を使うことで同じ事を明示的に書くことができます。 namespace { // この中の変数は他のファイルから参照できない int i; } newのバリエーションデフォルトのnew演算子はメモリ確保に失敗するとstd::bad_alloc型の例外を投げるようになっていますが、std::nothrowを使うとNULLを返すようにできます。これは便利! int* p = new(std::nothrow) int; delete p; ※Effective C++によると、nothrow型のnewはメモリ確保に失敗しても例外を投げないも

    totttte
    totttte 2011/05/14
    すげー。しらなかった 関数全体をtryで囲む >int main() try {
  • 4月のはてなブックマークが多かったエントリまとめ - nokunoの日記

    totttte
    totttte 2011/05/01
    翻訳記事がすごい。
  • プログラミングコンテストチャレンジブックを読みながらダイクストラ法を実装したよ - nokunoの日記

    前回のベルマンフォード法から時間があいてしまいましたが、プログラミングコンテストチャレンジブック(通称アリ)を読みながらグラフの最短経路を求めるためのアルゴリズム、ダイクストラ法を実装しました。 ベルマンフォード法 - nokunoの日記ダイクストラ法 - Wikipedia ダイクストラ法ではグラフ中のノードを次の3つに分類します。 未探索 探索済み 次の探索候補この「次の探索候補」の中から最もコストの小さいノードを選んで探索済みとし、その隣接ノードのコストを更新するというのがダイクストラ法の根のアルゴリズムとなります。 最初の実装それでは実装を見ていきましょう。まず最初の実装では次に探索済みとなる要素を線形探索しているためあまり効率的ではありません。 #include using namespace std; #define MAX_E 20 #define MAX_V 7 #d

    totttte
    totttte 2011/04/14
  • 【速報】まだ生きてます!@成田空港 - nokunoの日記

    シリコンバレーに飛び立つ予定でしたが地震の影響で欠航になり、まだ日にいます。ということで昨日の動きを説明します。 11:05-13:40 高速バスで成田空港へ 13:40-14:45 ユナイテッド航空のカウンターでチェックイン。荷物を預けて航空券を受け取る。両替も済ませる。 14:45 地震発生 14:45-19:00? 近くのホテル内のカフェで事を取りながら時間をつぶす 19:00?-現在(4:00) 成田空港で毛布にくるまりながら夜を明かす 地震時の状況overlastさんと合流して最後の寿司をべようとしたところで地震発生。Twitter初めはゆっくりとした揺れで「外国人はびっくりしますね〜」などと笑っていたのですが、なかなか揺れが収まらないなと思い始めたところで大きな揺れが来ました。ショップやレストランがあるエリアにいたため、器などが床に落ちて割れる音などが鳴り響き、これはま

    totttte
    totttte 2011/03/13
  • Googleのエンジニアに必要とされるスキルセットは何か? - nokunoの日記

    以下のQuoraの翻訳です。この質問に対して、秘密主義で知られるGooglerたちが答えているのがいいですね。What are the skill-sets needed to be a Google Engineer? - QuoraGoogleエンジニアに必要とされるスキルセットは何か? 回答1ほとんどのプログラマはブラックボックスを使用しています。データベースはブラックボックスです:SQLを与えると、答えが返ってきます。コンパイラもまたブラックボックスです:ソースコードを与えると、実行バイナリ(またはエラーメッセージ)が返ってきます。たくさんのプログラマがこれらのブラックボックスを所与のものとして扱うことでハッピーになります。よりよいプログラマは、そのなかで何が起こっているのかを不思議に思い、中身を開けてみてみるのです。私が言いたいのは、Googleエンジニアに必要とされているス

    totttte
    totttte 2011/02/11
  • HadoopがJavaではなくC/C++で実装されていたらどう違っていたか? - nokunoの日記

    Quoraでこんな質問を見つけたので適当に翻訳してみました。Would Hadoop be different if it were coded in C/C++ instead of Java? How? - Quora 回答1実際のところ難しいけど、考えてみるのは楽しいね。 実行時間は速くなると思うけど、それが決定的な違いになるかどうかはわからない。 セキュリティやいくつかの機能は実装しやすくなるかもしれない 他のプログラミング言語への対応はしやすくなる。Java/Pipes/Streamingを選ぶ代わりに、コンパイルしてリンクすればいい。 コード量は非常に大きくなる。エラーチェックのためにね。 コードベースが大きくなれば、開発スピードは遅くなる。Hadoopが今のように成長したかどうかわからない。 Pigは登場しただろうか? 私にはそうは思えない。回答2は略 回答3C/C++とJa

    totttte
    totttte 2011/02/01
  • 【ネタバレ】映画 ソーシャル・ネットワークを見てきました - nokunoの日記

    というわけで、劇場版ザッカーバーグこと映画ソーシャル・ネットワークを観てきました。フェイスブックの創業者、マーク・ザッカーバーグがフェイスブックを作りだす過程を描く。プログラマやハッカーとして天才的な能力を持つマークが、凡人離れした情熱を傾けてサイトを作っていく様子を、ジェシー・アイゼンバーグは独特のマシンガントークや不審な挙動などで、見事に表現している。フェイスブックの共同創始者でもあり、マークの友人として、フェイスブックを愛していたはずが、最終的にマークを訴えるエドゥアルドを演じたアンドリュー・ガーフィールドの抑えた演技も素晴らしい。監督のデヴィッド・フィンチャーは独創的な天才と、彼を理解できない凡人たちの織りなす古典的な悲劇を、極めて現代的な題材を通して見事に描き出した。あらすじ 解説 ソーシャル・ネットワーク - goo 映画映画全体としては創業者ザッカーバーグに焦点が当てられてい

    totttte
    totttte 2011/01/29
  • 何かを学ぶときの心構えについて - nokunoの日記

    何かを学ぶときの心構えについて考えたので、ここに書き残すことにしました。何かを学ぶと言っても段階というものがあるので、準備段階からはじめて段階別に分類してみました。 準備は重要始める前の準備はそれなりに重要です。始めるのに必要な資格なしには、いざというときに困ったことになるかもしれません。しかし、怖いからと尻込みしては何も始まりません。また、偶然のいたずらで前提条件を満たしていたり、準備を飛ばすことができる場合があります。そういうときは、その幸運を存分に生かすと良いでしょう。 少しだけ前を見据える意気揚々とはじめてみても、いざはじめてみるとおっかなびっくりになってしまうことも少なくありません。そういうときは、自分の足元ばかりをみているか、その逆にずっと上のほうを見てしまっていませんか? 自分の進行方向を確認して、少し前方を見据えるようにすれば、先に何があるのかを確認できますし、そのための行

    totttte
    totttte 2011/01/07
    きゅん
  • そろそろHadoopについてひとこと言っておくか - nokunoの日記

    もうこの手の話題は出尽くした感がありますが、最近Hadoopについて考えることが多いので、エントリにしてみます。なお、ここではベーシックなMapReduce+HDFSのことをHadoopと呼ぶことにします。 HadoopとはHadoopとは言わずと知れたGoogleMapReduce/GFSのオープンソースのクローンです。MapReduceではプログラマはMapとReduceという2つの関数を書くだけで、並列分散処理をすることができます。これは(1) データを実際に持つマシンにプログラムを配布する (2) MapとReduceをつなぐShuffleフェーズでキーをグループ化してソートする、(3) 障害時のフェールオーバーやレプリケーション、といった処理をフレームワーク側が受け持つことによって、プログラマ側の負担を減らすものです。GFSに対応するHDFSにはファイルをクラスタに分散して保存

    totttte
    totttte 2011/01/03
  • nokunoの日記

    nokuno Software Engineer at a Web Company. Interested in Natural Language Processing, Machine Learning, and Data Mining. Skillful in C/C++, Python, and Hadoop.

    totttte
    totttte 2010/10/30
    バグ数を査定に使う会社の人の話、僕も昔聞いたことあるけど、そこでは全てのバグは「誤記」とか「要望改善」と書かれていてなんか面白いことになってたと言っていた。
  • そろそろYahoo! JAPANとGoogleの提携について一言いっておくか - nokunoの日記

    大変ですね 参考文献:最速インターフェース研究会 :: そろそろはてな京都移転について一言いっておくか

    totttte
    totttte 2010/08/02
  • Google N-gram V.S. Baidu N-gram 〜ケータイウェブは本当にエロいのか?〜 - nokunoの日記

    近年検索エンジンのBaiduは不自然言語処理コンテストなるものを開催し、今日が締切のはずだったのだが24時間延長されたらしいことを聞いてBaiduコーパスをダウンロードしたid:nokunoは仕事帰りの電車で思いついたアイデアを30分ほどで実装してみたところそれなりに面白い結果がでたので応募してみることにした。そもそもBaiduのコーパスはエロいというのを最初に誰かが言ったら@mhagiwaraさんがこんなツイートをしたことに話は遡る。インターネットがエロいのは誰でも知っている。けれど、ケータイウェブが特別にエロいのか? については寡聞にして知らなかったため、検証してみることにした。今回はケータイウェブがエロいかどうかを検証するため、以下のコーパス(N-gramデータ)を相互に比較することとした。Baidu N-gram(Baidu絵文字入りモバイルウェブコーパス) 今回のメインターゲット

    totttte
    totttte 2010/07/21
    ちょwww 魔法のiらんどとかでも調べたら、差があるのかな。
  • UNXIのncursesでCUIゲームプログラミング - nokunoの日記

    ふと思い立ったので(笑)、CUIでのゲームの作り方を調べてみました。UNIXだとncurses/cursesを使えば、ある程度のアクション性のあるゲームはできます。ncursesCUIにおいて,スクリーンや,キー入力,カーソルなどを管理するライブラリです.マウスも使えます。マウスncursesではマウスの操作を検知できるらしい.ただしSVr4以前とか4.4BSD以前ではできないようだ. 入力に関しては普通にgetchとかやると入力待ちが発生してしまうのですが、nodelay関数を使うことでバッファに入力がないときは待たないようにできるようです。ただし、キーやマウスは押した瞬間しか判定できないので、これで普通のシューティングを作るのは無理そうです。そもそもキーを離したときのイベントは、SSHでは送られていないような気もします。 出力に関しては特に難しいところはありませんが、clear()だと

    totttte
    totttte 2009/04/21
  • 「かんたん特許検索」がすごい件 - nokunoの日記

    サポート掲示板で特許関係の書き込みがあり、それは勘違いだったので良いのですが、特許検索システムを探していて凄いヤツを見つけてしまったので、紹介します。 かんたん特許検索 | 無料・簡単操作で特許検索これまでの特許検索は専門家向けの難しいものでした。もっと誰でも気軽に使えるようにしたい!そこで「もっと簡単に」「もっと身近に」をコンセプトに生まれたのが「かんたん特許検索」です。まるでグーグルのようなトップページ。 検索結果。要約もうまく抽出できます。 あるキーワードに関する出願人の出願数ランキングもあります。 出願件数の推移もわかりやすくグラフ化できます。 2年前に未踏で調べたときはこんな便利なものなかったぞ! というわけで日語処理関係をちょっと調べてみました。マイクロソフトのIMEに関する特許(PDF)従来のユニグラムへのバックオフがもたらす品質の低下を防止することができる言語モデルを作成

    totttte
    totttte 2009/03/07
    これは便利
  • 就職活動を振り返る 後編 - nokunoの日記

    昨日のエントリの続きです。前回は大学4年生のときの就職活動について書きました。今回は昨年大学院のときの就活について書きますが、まだ内定先を公開したくないので、社名は出しません。 研究室に配属になってから、私の興味はWeb業界に移っていきました。単純にWeb業界はゲーム業界よりも10年程若く、まだまだ成長産業であるという認識がありました。コンテンツを職人芸的に作ることの大変さを少しだけ理解して、コンテンツはユーザーが作るものだというWebの流儀に将来性を感じていました。東方関係のWebサイトをやっていたときは、意外と多くのアクセスが集まり、Webが持つ威力について少し体験していました。はてなダイアリーを始めたのもその頃です。そして未踏でSocial IMEをやることになり、1年間集中して開発を行いました。未踏期間中は就職活動をする余裕がなかったので、動き出したのは12月からでした。 就活では

    totttte
    totttte 2009/02/18
  • 就職活動を振り返る 前編 - nokunoの日記

    最近後輩が就職活動をがんばっているので、自分の就職活動の経験について書いてみて、少しでも役に立てばと思います。まず大学時代の就職活動についてですが、大学院に進学するつもりだったのであまり活動せずに、記念に1社だけ志望しました。 それが任天堂です(時効なので社名入り)。私は大学でゲーム制作をするサークルに入り、ゲーム制作を通してプログラミングを学びました。4年生のころもとびまりさの開発中で、ゲーム会社を受けるのは自然なことのように思われました。ご存知のようにゲーム業界はハイスペック競争が下火になって、任天堂の天下が始まろうとしていたころでした。そこで任天堂を志望したのですが、任天堂のゲームが好きというわけではありませんでした。女性や高齢者にもターゲットを広げたのがDSやWiiの戦略ですから、そのゲーム自体をオールドゲーマーである自分が好きになるのは難しいと思いました。そもそも、任天堂は倍率が

    totttte
    totttte 2009/02/18
    試験内容がおもしろい!!!
  • Google 日本語Nグラムがロングテールになっている件について - nokunoの日記

    研究室のミーティング資料を公開しました。後半、Google語Nグラムの解析を行った結果を書いています。「頻度の高い1万語が97%を占める」というのは興味深いデータだと思いました。 #先ほどまで非公開設定になっていたようです。すみませんでした。っていうか誰か突っ込んでくださいよw

    totttte
    totttte 2008/07/14
    >頻度の高い1万語が97%を占める」というのは興味深いデータだと思いました