タグ

2013年9月24日のブックマーク (22件)

  • ロジスティック回帰 - Wikipedia

    ロジスティック回帰(ロジスティックかいき、英: Logistic regression)は、ベルヌーイ分布に従う変数の統計的回帰モデルの一種である。連結関数としてロジットを使用する一般化線形モデル (GLM) の一種でもある。1958年にデイヴィッド・コックス(英語版)が発表した[1]。確率の回帰であり、統計学の分類に主に使われる。医学や社会科学でもよく使われる[要出典]。 モデルは同じく1958年に発表された単純パーセプトロンと等価であるが、scikit-learnなどでは、パラメータを決める最適化問題で確率的勾配降下法を使用する物をパーセプトロンと呼び、座標降下法や準ニュートン法などを使用する物をロジスティック回帰と呼んでいる。 概要[編集] ロジスティック回帰モデルは以下のような形式である。x が入力で、pが確率(出力)、αとβがパラメータ。

    ロジスティック回帰 - Wikipedia
  • SanRin舎 » ソーシャル・ネットワーク

    You don’t get to 500 million friends without making a few enemies. オフィシャルサイト:http://www.socialnetwork-movie.jp/ 監督:デビッド・フィンチャー 評価:☆☆☆ ネタバレ有り。 英語版のオフィシャルサイトの方が充実しているなぁ。うまく連携取れてないのかねぇ。 Facebook創設にまつわるドキュメンタリー的な映画。 ドキュメンタリー的な映画なので、めちゃくちゃ面白いというわけではなく、だからといってつまんなかったというわけでもない。途中、Napsterという音楽共有ソフトを作った人(ショーン・パーカー)が出てきて、Facebookにからむ。彼が出てきたおかげでストーリーが面白くなったかなと思う。 映画は彼女に振られて怒ったマークが、女の子の写真をハーバード大のコンピューターをハッ

  • アプリが応援される仕組みづくり!ホリエモンプロデュースのグルメアプリ「テリヤキ」がスタートダッシュに成功する理由 | アプリマーケティング研究所

    ホリエモンこと堀江貴文さんが、 「テリヤキ」というキュレーション型のグルメアプリのリリースを予定されています。 この「テリヤキ」は簡単にいうと、 選ばれし通(キュレーター)が当に旨いを思うお店を選んで紹介する、 というアプリのようです。 11/3リリース予定らしく、 現在は着々と進行中の状況のよう。 それでこの「テリヤキ」ですが、 リリース時にスタートダッシュでアプリのDLを伸ばすことに成功しそうだなあと考えています。 なぜなら、 アプリのDLを獲得するための戦略というか、 企画自体がマーケティングを兼ねているからです。 「堀江さんが有名」というところは、当然真似できない部分ですが、 参考になるところを簡単にまとめてみたいと思います。 1、アプリの制作過程をあえて公開している。 テリヤキでは、アプリの制作の進行状況をFacebookページで公開しています。 既に6900人ものいいねが集

    アプリが応援される仕組みづくり!ホリエモンプロデュースのグルメアプリ「テリヤキ」がスタートダッシュに成功する理由 | アプリマーケティング研究所
  • モバイル対応Webアプリケーションのキャッシュ戦略

    近年、モバイルブラウザ上でアプリケーションを作るにあたり、JavaScriptでも不安定な回線上で動作する設計が求められるようになってきました。 ここでは、「オフラインファースト」をはじめとする、モバイルなどの回線が不安定な状況を想定したWebアプリケーション設計に関して、キャッシュ方法やよく使われるAPIなどを紹介したいと思います。 「オフラインファースト」とは2012年ごろから提唱されていた、「回線がオフラインになることを前提にアプリケーションの設計を行う思想」のことで、オフライン前提に設計することにより回線状況によらないサービス提供や、効率的な通信をベースにした高速な動作を目指すものです。 それではここからはキャッシュ方法とそれぞれ向いているコンテンツの紹介を行います。 読み込みデータのキャッシュ ApplicationCacheやlocalStorage、オンメモリキャッシュなどを

    モバイル対応Webアプリケーションのキャッシュ戦略
  • Re* Programming » c#

    今回、中国出身の Designer 王雅さんと一緒に制作した 「寄席の箱」 を SNACKS Vol.2 で展示しました。 実は、王さんは私が学校の授業(IoT)で教えていた生徒なのですが、卒業デザインで発表した内容の世界観がとても良いなと思っていました。 せっかくなので卒業制作とは別に展示やコンテストに出せるものにしないかと声をかけたのでした。 // 一応補足しておくと学校の卒制の合否判定は私の担当では無く、また卒業制作提出後のやり取りです 彼女は、日のデザインと漫才がとても好きで来日し、1年足らずで日語のやり取りがほとんど出来るぐらいになっていました。 お笑いを知るには歴史から(?)ということで漫才について色々と調査し、その流れの中で寄席や漫才、お笑いにはテレビが非常に大きな関わりを持っており、欠かせないものであると感じ、その時代背景とともにお笑いの歴史をブラウン管に映し表現したい

  • FINDJOB!終了のお知らせ | FINDJOB!

    FINDJOB! 終了のお知らせ 2023年9月29日にFINDJOB!を終了いたしました。 これまでFINDJOB!をご利用いただいた企業様、求職者様、様々なご関係者様。 大変長らくFINDJOB!をご愛顧いただき、誠にありがとうございました。 IT/Web系の仕事や求人がまだ広く普及していない頃にFind Job!をリリースしてから 約26年間、多くの方々に支えていただき、運営を続けてまいりました。 転職成功のお声、採用成功のお声など、嬉しい言葉もたくさんいただきました。 またFINDJOB!経由で入社された方が人事担当になり、 FINDJOB!を通じて、新たな人材に出会うことができたなど、 たくさんのご縁をつくることができたのではないかと思っております。 2023年9月29日をもって、FINDJOB!はその歴史の幕を下ろすこととなりましたが、 今後も、IT/Web業界やクリエイティブ

    FINDJOB!終了のお知らせ | FINDJOB!
  • 株式会社ブランディングワークス|Web・SEO・ブランディングを総合支援

    SEO対策・コンテンツマーケティングの 戦略立案から実行までを総合支援 上場企業から中小企業まで幅広く支援しています。 事業者ごとに合わせて最適なWeb戦略を提案、実行支援しています。SEOコンサルティング・コンテンツマーケティング支援を中心に、伴うWeb修正やコンテンツ制作まで一気通貫した支援が可能です。実績のあるパートナー会社と連携してその他Webマーケティング(広告運用・SNS・メディアのマネタイズetc.)も幅広くもカバーしております。

    株式会社ブランディングワークス|Web・SEO・ブランディングを総合支援
  • YAPC::Asia Tokyo 2013: 「本当にあったレガシーな話」と最近のlivedoorBlogの改修 : D-7 <altijd in beweging>

    はい、というわけで自分のトークです: 昨年12月頃から関わってるlivedoorBlogのコードを触っていた時の憤りをスライドにぶつけてみました。 追記:スライドに「ログにマーカーをつける」というのは、(コード読んでないけど)多分こちらのエントリにあるLog::Minimal::Indentとだいたい同じ感じのヤツです ところでWeb上で見かける感想の中でこんなのがありました: 今年個人的に一番衝撃的だったのはやっぱ、livedoor blogのPlack化です。技術的な側面もさることながら、ああいう近視眼的には何のメリットもないし、逆にデメリットの方が大きそうな案件にリソースを割くジャッジができる会社としての姿勢が当に凄いなと。 実はビジネス的にも意味はあるんだなー。 なかなか書くことができなかったんだけど、その内容というのがこちらと→ ブログのお引っ越し機能を大幅に強化しました! (

    YAPC::Asia Tokyo 2013: 「本当にあったレガシーな話」と最近のlivedoorBlogの改修 : D-7 <altijd in beweging>
  • Engadget | Technology News & Reviews

    Pick up the 9th-gen iPad with two years of AppleCare+ for only $298

    Engadget | Technology News & Reviews
  • 完璧に分かる!「google アナリティクス」の得する設定と使い方まとめ31

    作成:2013/09/24 更新:2014/11/01 SEO対策 > 毎月、ECサイトや情報サイトなどアクセス解析保守を9社ほど作らないといけません。ここらでおさらいを兼ねて、Googleアナリティクスを扱ううえで必要なことを整理しようと思います。今回は成果を上げるうえで「知らないと損する」ことをまとめました。 エンジニア速報は Twitter の@commteで配信しています。 もくじ 外部連携(初期) 1.複数サイトを一つで管理 2.すべてを一元管理 3.ウェブマスター連携 4.AdWords連携 5.アドセンス連携 共通設定(初期) 6.プロファイル 7.フィルタ 8.IP除外 9.Cookie除外 トラッキング設定(初期) 10.トラッキング設定 11.時間/曜日/日付 12.集客/キーワード/ページ 13.流入/属性/閲覧開始/トレンド 計測方法と基知識 14.ディメンション

    完璧に分かる!「google アナリティクス」の得する設定と使い方まとめ31
  • 誤り許容カウント法(lossy count method)のサンプルプログラム

    誤り許容カウント法(lossy count method)のサンプルプログラム 2010-05-12-1 [Programming][Algorithm] 1行1ラベル形式で、 1万種類のラベルを持つ、 100万行のデータがあるとします (ラベルの頻度分布はジップの法則にだいたい準拠するとします)。 各ラベルの頻度をハッシュを使ってカウントするとなると、ハッシュエントリ1万個分のメモリ容量が必要になります。(1万じゃたいしたことないな、という人はもっと大きな数に置き換えて読んでください。) しかし、カウント後に高頻度のものしか使わないということも多いと思います。例えば頻度5000以上のもののみ取り出してあとはいらない、とか。 そうなると、全部のラベルのカウントデータを最後まで保持するのは無駄に思えます。 そこで登場するのが「誤り許容カウント法(lossy count method)」。 低

    誤り許容カウント法(lossy count method)のサンプルプログラム
  • 大規模データで単語の数を数える - ny23の日記

    大規模データから one-pass で item(n-gram など)の頻度を数える手法に関するメモ.ここ数年,毎年のように超大規模な n-gram の統計情報を空間/時間効率良く利用するための手法が提案されている.最近だと, Storing the Web in Memory: Space Efficient Language Models with Constant Time Retrieval (EMNLP 2010) とか.この論文では,最小完全ハッシュ関数や power-law を考慮した頻度表現の圧縮など,細かい技術を丁寧に組み上げており,これぐらい工夫が細かくなってくるとlog-frequency Bloom filter (ACL 2007) ぐらいからから始まった n-gram 頻度情報の圧縮の研究もそろそろ収束したかという印象(ちょうど論文を読む直前に,この論文の7節の

    大規模データで単語の数を数える - ny23の日記
  • 超大規模テキストにおけるN-gram統計 - Negative/Positive Thinking

    はじめに 超大規模なテキストデータでのN-gram統計を取る場合、そもそもデータがメモリにのらなくてSuffixArrayを使ったカウントも無理だったりする。近似値でよい場合、効率的な方法があると知ったのでちょっとメモ&試してみた。 与えられるデータ 大量のデータがストリーム形式で与えられるとする 高速にどんどん与えられる 例えば、データパケット監視やtwitterなど カウントしたいデータの種類が膨大 種類をメモリに保持するのが無理 ストリームデータにおける頻度カウント法 正確なカウントは難しいが、近似的に頻度カウントを行うことができる Sticky Sampling Algorithmは解釈が間違っているかもしれない Sticky Sampling Algorithm カウントする要素をサンプリングで選ぶ方法 保持するのは以下の2つのペアの集合 e : 要素(例えばN-gram) f

    超大規模テキストにおけるN-gram統計 - Negative/Positive Thinking
  • FluentdとRedisを使ったランキング機能の実装 | SmartNews開発者ブログ

    ゴクロの大平です。ごくろうさまです。 Redisは高速で、かつデータの永続化や、複数のデータ型によるストア(list,set,sorted set等)も対応しており、機能的が豊富ということから愛用者の多いKVS実装の一つだと思います。 特に私のようなアプリケーションエンジニアの人間にとってはデータ型のバリエーションの豊富さが便利さを感じる部分で、たとえばlistを用いてタイムライン的な情報や履歴情報の管理、sorted setを用いてランキング情報の管理、などのようにアプリケーションの需要の多くにRedisが対応することができます。 これらの情報を登録する際のフローとしては自作のアプリケーションから直接、というケースが多いと思いますが、せっかくFluentdのような便利なlog collector実装があるので、FluentdとRedisを組み合わせる事でカジュアルに情報の蓄積を行いたい

  • クイックソート - Wikipedia

    クイックソート(英: quicksort)は、1960年にアントニー・ホーアが開発したソートのアルゴリズム。分割統治法の一種。 個のデータをソートする際の最良計算量および平均計算量は (ランダウの記号)である。他のソート法と比べて一般的に最も高速だと言われている[2]が、対象のデータの並びやデータの数によっては必ずしも速いわけではなく、最悪の計算量はである。安定ソートではない。 アルゴリズム[編集] クイックソートは以下の手順で行われる。 ピボットの選択:適当な値(ピボット(英語版)という)を境界値として選択する 配列の分割:ピボット未満の要素を配列の先頭側に集め、ピボット未満の要素のみを含む区間とそれ以外に分割する 再帰:分割された区間に対し、再びピボットの選択と分割を行う ソート終了:分割区間が整列済みなら再帰を打ち切る 配列の分割方法の一例として、以下のようなものが考えられる: 配列

    クイックソート - Wikipedia
  • 乱択アルゴリズム - Wikipedia

    乱択アルゴリズム(らんたくアルゴリズム)、ランダム・アルゴリズム(英: randomized algorithm)または確率的アルゴリズム(かくりつてきアルゴリズム、(英: probabilistic algorithm)は、その論理の一部に無作為性を導入したアルゴリズムである。通常のアルゴリズムでは自然数を順番にあてはめるような決定的な部分で、乱数による非決定的な選択を入れることで、「平均的に」よい性能を実現することを目的とすることがある。形式的には、乱択アルゴリズムの性能はランダムビット列で決定される確率変数となる。その期待値を期待実行時間[1]と呼ぶ。最悪の場合に関して「無視できる」ほどに低い確率であることが、一般に、この類のアルゴリズムが効果的である要件となる。 乱択アルゴリズムが使われる背景[編集] n 個の要素からなる配列から「a」という要素を探す問題を考える。この配列の各要素

  • 質問に答えていくとやりたいことの優先順位を決めてくれる『The Prioritizer』 | POP*POP

    やりたいことはたくさんあるけど優先順位が決められない・・・。 そう思うことはよくありますよね。そこで便利そうなツールをご紹介。シンプルですが、なかなか使えるのではないでしょう。 「The Prioritizer」を使えば、二択の質問に答えていくだけでやりたいことの優先順位をつけてくれます。もともとはお金の使い道を決めるためのツールのようですが、他にも応用できそうです。 » The Prioritizer では使い方をご紹介。そんなに難しいものではないですよ。 ↑ まずこちらにやりたいことを入力します。15項目まで入れられます。 ↑ 入力し終えると「どちらがより大切ですか?」と聞いてきます。さくさく答えていきます。 ↑ 回答を終えると一瞬で優先順位を計算してくれました。 やりたいことを大事な順にならべるのは意外に難しいものです。ただ、このように二択の質問にすることによってぐっと答えやすくなり

    質問に答えていくとやりたいことの優先順位を決めてくれる『The Prioritizer』 | POP*POP
  • Primer

    Primer is a set of guidelines, principles, and patterns for designing and building UI at GitHub. It provides a shared language and standardized approach to delivering cohesive experiences.

    Primer
  • Incidents (On Change)

    意思決定に必要なのは、次の3つのどれか、あるいは、それらの組み合わせ。 情熱 論理 説得力 (1)は、なんかしらんけどとにかく情熱で押し通す主観的な立場。(2)は、用意周到に準備し、メリット・デメリットを正確に把握する客観的な立場。(3)は、(1)(2)の不在や不足を、プレゼン能力によりカバーする立場。 決定させる側、する側のそれぞれの人々によって、その中のどれに偏るかは異なるだろうけど、結果的に意思決定ができればその配合は任意でよさそう。問題は、意思決定をするかどうかなのだから。 得意なこととかに継続的に打ち込むことはもちろんよいことなんだけど、自分にとって全然できないことに取り組み始めるみたいなことを意識的にやっていかないと、いわゆる「老害」になるんだと思う。なので私は、常に自分が不得意なことを新たに始めるということを意識してやっています。たとえばVimとかね…。 学習によって自己を変

  • MySQL: 意外と知らない?障害発生時の復旧方法について | QK

    障害発生!!!どうする!?でも・・MySQLだと、レプリケーション(スレーブ→マスターの昇格))でほぼなんとかなっちゃうのであまり使われることはないとは思いますが、実はロードフォワード(roll forward)回復もできちゃうんすよwwというほぼ僕のメモです。 表題で「意外と知らない?」なんて書いちゃいましたけど、知らないのはきっと私だけ・・。でも、そんなMySQLのロールフォワード手順をまとめてみました。 ロールフォワードとは、ログファイルに残っているチェックポイント後の処理を再現し、障害直前の状態にまで戻すことができる機能のひとつです。商用DBでは、まず入っているでしょうといった機能です。ORACLEでもSQL SERVERでもIBM DB2でもちゃんと実装しております、IBM DB2のロールフォーワード手順については以前、某F氏が手順をまとめてくれました(http://www.s-

  • MySQLのバイナリログを使ったロールバック(リストア)を行ってみる | レンタルサーバー・自宅サーバー設定・構築のヒント

    MySQLのバイナリログを使ったロールバック(リストア)を行ってみる

  • 住太陽の「SEO 検索エンジン最適化」

    SEO(Search Engine Optimization: 検索エンジン最適化)とは、自社のウェブページがGoogleやBingなどの検索結果で上位に表示されるようにウェブサイトの内外を改善する取り組みです。このSEO実践ガイドでは、SEOの意味や仕組みから自分で実施する方法や手順までを詳しく、初心者にもわかりやすく解説しています。 SEO(検索エンジン最適化)とはSEOとは自社のウェブページがGoogleやBingなどの検索結果で上位に表示されるようにウェブサイトの内外を改善する取り組みです。SEOを実施することで、自社の事業領域に関心の高い見込み客を効率的に、無料で集客できます。SEOは次のような取り組みを通じて実施します。 見込み客が必要としている役立つコンテンツをウェブサイト上で提供する。その情報を見込み客が検索エンジンで見つけやすいように最適化する。その情報が見込み客にとって

    住太陽の「SEO 検索エンジン最適化」