タグ

2011年12月24日のブックマーク (14件)

  • 2011年下半期読書猿ブログ内ベストセラー

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    2011年下半期読書猿ブログ内ベストセラー
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • 大規模データ処理勉強会 〜「大きな」データと対峙する(仮称)〜に参加してきた - 糞糞糞ネット弁慶

    クレジットカード現金化詐欺【業界人が教える口コミ情報】 【ユーザ】「ライフサイエンス分野の大規模データ・現場での課題とこれから」 (ライフサイエンス統合データベースセンター/DBCLS @iNut) スライド(pdf) SQL, NoSQL, アルゴリズムの話無し DBCLSの説明 データベースとは 研究成果が公開される場としてのDB 公共の汎用研究リソースとしてのDB ex. PubMed(論文) ex. 集団疫学(数千の時系列データ) ex. 大規模塩基配列データ 生命科学系のデータの特徴 メタデータの重要性 維持管理必要 実装者と実行者の関係 dryとwet 大規模塩基配列データ 量が多い: 7kb→1Tbに パーソナルゲノム NGSデータ 画像データ: 50TB シグナル強度: 2〜10TB 中間ファイル: 1.5TB 中間ファイル: 45TB 結果: 5TB 宅急便で送るほうが早

    大規模データ処理勉強会 〜「大きな」データと対峙する(仮称)〜に参加してきた - 糞糞糞ネット弁慶
  • Transfer Learning for Behavioral Targeting(WWW 2010) 読んだ - 糞糞糞ネット弁慶

    背景 行動ターゲティング広告では似た嗜好をユーザをセグメンテーションし,セグメントごとに適した広告を提示したい. じゃあどんなデータからやるのか,ってなると普通に考えてユーザiが広告jをクリックした回数を要素に持つ行列かユーザiがクエリjを入力した回数を要素に持つ行列かのどっちかを使おうという話になる. 一番理想的なのはをそのまま使いたいが,そもそもユーザは広告なんかほとんどクリックしない.じゃあ代わりにを使うかというとちょっと苦しいし,データの質とスパースさのトレードオフ.というのが行動ターゲティング広告研究の現場. 提案手法 Translated Learning*1と呼ばれる手法がある(らしい.今回はじめて知った).これは source の feature に行列をかけて target の feature に変換してやるみたいなノリ. 今回はそれに似たアイデアを使う.具体的には変換行

    Transfer Learning for Behavioral Targeting(WWW 2010) 読んだ - 糞糞糞ネット弁慶
  • 最近のCPUの同期性能を調べてみた - maropuのメモ墓場

    この前調べごとをしているときにpthread_spinlockなるものがあることを知った. その時にpthread_mutex_lockとどちらを使えばいいんだろう?と疑問に思ったので少し調べてみた. 結果から言えば,たいていの場合はpthread_mutex_lockで良い,という安易な結果になってしまった. /*--- 以下詳細 ---*/ 一般論ではロック期間が短いときにspinlockのほうが良い、といわれるので期間が短いロックにおける簡単な性能評価を行った. 使ったプログラムは以下. https://github.com/maropu/lockbench 単一アドレス上に存在する値を同期的にインクリメントするだけの簡単なプログラム.評価指標はthread数(# of threads/x-axis)を変化させた場合の,clock()が返す単体tickあたりの平均インクリメント回数(

    最近のCPUの同期性能を調べてみた - maropuのメモ墓場
  • #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足

    TokyoNLP 第8回に のこのこ参加。主催者の id:nokuno さん、発表者&参加者のみなさん、そして会場を提供してくださった EC ナビさん改め VOYAGE GROUP さん& @ajiyoshi さん、お疲れ様でした&ありがとうございました。 今回は「∞-gram を使った短文言語判定」というネタを発表。「短文言語判定」って、要は「このツイートは何語?」ってこと。 こちらが資料。 ∞-gram を使った短文言語判定 View more presentations from Shuyo Nakatani そして実装したプロトタイプ ldig (Language Detection with Infinity-Gram) とモデル(小)はこちらで公開。 https://github.com/shuyo/ldig 言語判定とは「文章が何語で書かれているか」を当てるタスクで、以前一度

    #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足
  • DSIRNLP#2で発表しました「作ろう!簡潔ビットベクトル」 - EchizenBlog-Zwei

    DSIRNLP#1に続いて今回の#2も発表の場をいただきました。今回は簡潔データ構造、とくに最も基的なデータ構造である簡潔ビットベクトルについて発表しました。@overlastさん、@kimurasさん、@rindai87さんをはじめ関係者、参加者の皆様どうもありがとうございました。 twitterでも紹介しましたが発表資料リンクを置いておきます。 発表資料:作ろう!簡潔ビットベクトル 第2回 データ構造と情報検索と言語処理勉強会 #DSIRNLP - [PARTAKE] DSIRNLP#1で発表しました「TRIEにトライ!〜今日からはじめるTRIE入門〜」 - EchizenBlog-Zwei なお質疑では以下のようなものがありました。 ・popcountを使った二分探索をするときのpopcount値はいつ持っておくの? =>直前の64bit毎の線形探索時に使ったものを残しておいて使い

    DSIRNLP#2で発表しました「作ろう!簡潔ビットベクトル」 - EchizenBlog-Zwei
  • 話題の新技術、簡潔データ構造の入門用資料をまとめてみた - EchizenBlog-Zwei

    最近私の周辺で簡潔データ構造に興味を持つ人が増えてきた。簡潔データ構造といえばGoogle日本語入力でも使われている話題の新技術。自然言語処理界隈で機械学習の次にブームになるのはこれだ!と個人的に思っている。 というわけで入門用の資料をまとめてみた。 簡潔データ構造では、すべての基礎である簡潔ビットベクトルがあって、その上に応用として簡潔木(LOUDSなど。Google日本語入力で利用されている)、簡潔文字列(ウェーブレット木など。FM-Indexに利用されている)がある。最近ではこれらより複雑なデータ構造に対する簡潔構造も研究されている。 ということをふまえて以下の資料を読むと良い。 Efficient dictionary and language model compression for input method editors Taku Kudo et al. Google

    話題の新技術、簡潔データ構造の入門用資料をまとめてみた - EchizenBlog-Zwei
  • ALSIP2011に参加して簡潔データ構造の話を聴いて来ました - EchizenBlog-Zwei

    香川県高松市にて開催されたALSIP2011(Second Workshop on Algorithms for Large-Scale Information Processing in Knowledge Discovery)に参加してきた。 簡潔データ構造で有名なRajeev Raman先生、NIIの定兼先生、PFIの岡野原さんが招待講演をして下さるということで以前から注目していた。 招待講演に加えて興味深い10の発表がありとても楽しめた。私の勉強不足もあって初めて知ることが非常に多く勉強になった。簡単に内容をメモしておく(理解不足のため間違ったことを書いていたらすみません)。 今回の会議で最も興味深かったのがgrammer-based compressionというもので、これは例えばX=ababという文字列があったときにX1=a,X2=b,X3=X1X2,X=X3X3という感じで

    ALSIP2011に参加して簡潔データ構造の話を聴いて来ました - EchizenBlog-Zwei
  • ハネムーンで行ったタヒチの海が素晴らしすぎた件 - 元RX-7乗りの適当な日々

    行ってから随分時間がたってしまったのですが、結婚のエントリから1週間後の6/4〜6/11の間にハネムーンでタヒチ(主にボラボラ島)に行ってきました。 タヒチ(フランス領ポリネシア)のボラボラ島といえば「死ぬまでに一度は訪れたい世界の名所29ヶ所 - GIGAZINE」でも紹介されている通りリゾート地の名所です。 ※ ↑写真: 死ぬまでに一度は訪れたい世界の名所29ヶ所 - GIGAZINE より タヒチは、奥さんがずっと行ってみたかった場所(とにかく水上コテージに泊まりたかった、と。)で挙げていたのと、リゾートなんてハネムーンのタイミングぐらいしか行かないかもなー、と思っていたのもあって、すんなり新婚旅行の場所は決まりました。 というわけで、せっかく行って来たのと、とにかく最高のロケーションだったので、写真中心のログというかハイライトを残しておきます。(写真が多いので時間のある時にお願いし

    ハネムーンで行ったタヒチの海が素晴らしすぎた件 - 元RX-7乗りの適当な日々
  • 社内で発表したChefの紹介LTの資料を公開しました - 元RX-7乗りの適当な日々

    私の勤めている会社では半期に一回、研究課題レポートの制度があるのですが、そこで審査の過程を経て、受賞するとインセンティブが出ます。で、見事Chefをネタに受賞できたわけなんですが、その代わり、受賞すると皆の前で発表しなくてはいけないという決まりがありまして。。。 # 何気に前回も受賞・発表したんですけどね。 で、その様子は会社のエンジニアブログで紹介されているのですが、そこで公開するために発表資料をSlideShareにアップしたところ、想像以上にブクマがついていたので、ここでも紹介しておきます。うひ。 サーバの構築作業や運用管理を自動化する「Chef」 (CADC研究レポート発表LT) from Yuuki Namikawa この資料、あくまでLT用なので内容は薄いです(汗) そして、版権的に問題がありそうなネタ画像を仕込んでいたのですが、それも外して公開しているので、当に普通で申し訳

    社内で発表したChefの紹介LTの資料を公開しました - 元RX-7乗りの適当な日々
  • 第2回DSIRNLP勉強会で発表してきました - 射撃しつつ前転 改

    佐藤さんに誘われてDSIRNLP勉強会で発表してきました。 最近社内で高村輪講をやっていて、自分自身改めて良い勉強になったこと、以前TokyoNLPでランク学習の話をした際にはもしかしたら聴衆の半分ぐらいを置き去りにしてしまっていたのではと最近気づいたことなどから、今回はSVMって案外怖くないよね、みたいなことを順を追って説明してみる話にしてみました。既に知ってる人にとっては明らかに退屈な話だったと思いますが、分かりやすかったで賞的なものをいただけたので、わかりやすく、というところはある程度うまくいったのかなと思います。 発表資料はspeakerdeckに上げました。→機械学習と最適化の基礎 以下自分の発表についての感想と反省。 他の人の発表の最中に資料を作ってるとどうしても話が半分ぐらいしか聞けないので事前に作ってくるべき。 ただ今回は風邪のせいもあり仕方がなかった。 nokunoさん

    第2回DSIRNLP勉強会で発表してきました - 射撃しつつ前転 改
  • DSIRNLPで発表させていただきました - Negative/Positive Thinking

    12/10にmixiさんで行われたDSIRNLP勉強会で発表させていただきました 聴きにきていただいた方ありがとうございました スライド資料 http://www.slideshare.net/phyllo/ngram-10539181 自然言語処理はじめました - Ngramを数え上げまくる View more presentations from phyllo 発表で以下のコメントをいただきました 「有効なダイエット法を見つけるツールの進捗は?」 現在鋭意製作中です。すいません。 「Suffix ArrayはメモリじゃなくてHDDで作成することができますよ」 試してみます!

    DSIRNLPで発表させていただきました - Negative/Positive Thinking
  • Negative/Positive Thinking

    はじめに 焼きなまし法について、問題へ適用する際のメモ。 焼きなまし法とは Simulated Annealing, SA 物理現象の焼きなましのコンセプトを組み合わせ最適化問題の探索過程に導入した、確率的近似解法の一つ 現在の解の近傍から良い解に移動することを繰り返す「局所探索」に対して、悪くなる解への移動を繰り返し回数や悪化の度合いに依存する確率で許すことで、局所最適解から脱出することがポイント 以前のメモ http://d.hatena.ne.jp/jetbead/20111014/1318598381 http://d.hatena.ne.jp/jetbead/20120623/1340419446 疑似コード x:=初期解, T:=初期温度, R:=初期イテレーション回数 while 終了条件 do begin for i:=1 to R do begin y:=近傍解の一つ(y

    Negative/Positive Thinking