タグ

2017年4月18日のブックマーク (8件)

  • 週刊少年ジャンプの短命作品を,機械学習で予測する (前編:データ分析) - Qiita

    1. はじめに 週刊少年ジャンプ(以下,ジャンプ)は,日で最も売れている漫画雑誌1です.言うまでもなく,私は大ファンです. ジャンプ編集部の連載会議は非常にシビアです.ジャンプ作家の奮闘を描いたフィクション漫画「バクマン。」では,編集部が毎号の読者アンケートをもとに各漫画の人気を評価し,掲載順や打ち切り作品を決定する様子が描かれています2.連載開始から10週以内(単行約1冊分)で連載が打ち切られてしまうことも珍しくありません.とても厳しい世界です. 記事では,機械学習を使って,短命作品(10週以内に終了する作品)の予測を行います.究極の目標は,ジャンプ編集部より先に打ち切り作品を予測し,好みの作品が危ない場合はアンケートを出して打ち切りを回避することです3.我々は読者アンケートの結果を知ることができないので,掲載順の履歴を入力とし,短命作品か否かを出力する多層パーセプトロン4をTen

    週刊少年ジャンプの短命作品を,機械学習で予測する (前編:データ分析) - Qiita
    sucrose
    sucrose 2017/04/18
  • Pixivがpawooを始めた理由は使命感なんかじゃないだろ

    この文章は怪文書なので、真に受けるときっと怪我をするよ。 BazzFeedが「この火が消えないうちに」pixivが「マストドン」にいち早く企業として参入したわけなんて記事を出していたけど、PixivがやりたかったのはただTwitterのパイを奪うことだ。 そもそもPixivは以前から、TwitterLINEなどの短文投稿型SNSを真似た機能を追加している。6年ほど前に追加された「ひとこと投稿」、ほとんど使われていない死に機能になっているけれど、文字数は140文字、Twitterと同じだ。Twitterを意識したものであることは想像に難くない。 コメント欄で利用できるスタンプ、あれもLINEスタンプからだろう。こちらはそれなりに利用されているようである。 これらをパクリ云々する気はない。機能の模倣はある程度どんなプロダクトにもあることだし、明確に何かの権利を侵害しているとは言い難いだろう。

    Pixivがpawooを始めた理由は使命感なんかじゃないだろ
    sucrose
    sucrose 2017/04/18
  • 人間の目で見抜けないURL偽装がフィッシング詐欺に悪用される可能性、Firefoxでの対策はコレ

    通信の安全を保証するプロトコル「HTTPS」が採用されているURLの表記が正しければ、それが正規サイトだと認識するのは自然なことですが、ブラウザのURL表記上からは見抜けないフィッシング詐欺の危険性が指摘されています。このフィッシング詐欺は「homograph attack(ホモグラフ攻撃)」を進化させた手法を用いており、ブラウザに内在する脆弱性を突いたもので、人間が画面表示から詐欺サイトであることを見抜くことは不可能。現実問題として「ブラウザ側の対応を待つしか対策法はない」と言える状況です。 This Phishing Attack is Almost Impossible to Detect On Chrome, Firefox and Opera http://thehackernews.com/2017/04/unicode-Punycode-phishing-attack.htm

    人間の目で見抜けないURL偽装がフィッシング詐欺に悪用される可能性、Firefoxでの対策はコレ
    sucrose
    sucrose 2017/04/18
  • Adamのパラメータ設定 - exochronosのブログ

    CNNの学習で大事なOptimizerの性質について整理します。 Optimizerの選択を間違えると、大きく2つの問題点が起こります。 学習速度が遅い 最終的な学習後も当の最小値に落ち着かない 特に後者は重要です。CNNのようにパラメータ数が多く、しかも対称性が非常に高い状況では、どのパラメータを重点的に変化させて学習を進めるかが重要なポイントとなり、最終的なネットワークの質にまで大きな影響を与えます。 このエントリでは、最新のOptimizerであるAdamの仕組み、およびパラメータ設定による上記2ポイントへの影響について考察します。 Adamの仕組み まずはwikipediaからAdamのパラメータ更新について引用してみたのが以下です。 tは現在のepoch、ωが更新されるパラメータ。◯は各要素ごとの積とのこと。mtやvtもすべて、「各パラメータ毎に」それぞれの値を持っていることが

    sucrose
    sucrose 2017/04/18
  • MySQL with InnoDB のインデックスの基礎知識とありがちな間違い - クックパッド開発者ブログ

    こんにちは、サービス開発部の荒引 (@a_bicky) です。 突然ですが、RDBMS の既存のテーブルを見てみたら「何でこんなにインデックスだらけなの?」みたいな経験はありませんか?不要なインデックスは容量を圧迫したり、挿入が遅くなったりと良いことがありません。 そんなわけで、今回はレコードを検索するために必要なインデックスの基礎知識と、よく見かける不適切なインデックスについて解説します。クックパッドでは Rails のデータベースとして主に MySQL 5.6、MySQL のストレージエンジンとして主に InnoDB を使っているので、MySQL 5.6 の InnoDB について解説します。 InnoDB のインデックスに関する基礎知識 インデックスの構造 (B+ 木) InnoDB では B+ 木が使われています。B+ 木は次のような特徴を持った木構造です。 次数を b とすると、

    MySQL with InnoDB のインデックスの基礎知識とありがちな間違い - クックパッド開発者ブログ
    sucrose
    sucrose 2017/04/18
  • StanでAizu Online Judgeの難易度・習熟度を推定したい(1:モデル式) - くじらにっき++

    シリーズ一覧 kujira16.hateblo.jp kujira16.hateblo.jp はじめに Aizu Online Judge (AOJ) という競技プログラミングの練習サイトがあります。 AIZU ONLINE JUDGE: Programming Challenge 解けるか解けないかくらいのちょうど良い難易度の問題に取り組むことが一番成長につながるはずなので,それぞれ問題の難易度やそれぞれのユーザの習熟度を定量的に評価して推薦システムを作りたい気分になります。AOJの 各ユーザのページ にはこれまでの正答数やレーティングが表示されていますが,この2つの値はユーザの習熟度とは必ずしも一致しません。簡単な問題ばかり解いていれば正答数は伸ばせますし*1,レーティング*2は回答者が少なくて簡単な問題を中心に解いていればかなり大きく伸びるためです。そのため,問題の難易度やそれぞれの

    sucrose
    sucrose 2017/04/18
  • 自然言語処理における前処理の種類とその威力 - Qiita

    自然言語処理に前処理は不可欠です。テキストは文字の羅列であり構造化されていないため、そのままでは処理するのが難しいです。特にWebテキストの中には HTMLタグ や JavaScript のコードといったノイズが含まれています。このようなノイズは前処理して取り除かなければ期待する結果は得られないでしょう。 出典: Deep learning for computational biology 記事では自然言語処理における前処理の種類とその威力について説明します。説明順序としては、はじめに前処理の種類を説明します。各前処理については、1.どんな処理なのか、2.なぜその処理をするのか、3.実装方法(なるべく) という観点から説明します。種類について説明した後、前処理の威力を測るために前処理をした場合としなかった場合での文書分類の結果を比較します。 前処理の種類と実装 この節では以下に示す5つ

    自然言語処理における前処理の種類とその威力 - Qiita
    sucrose
    sucrose 2017/04/18
  • 実際に運用してみてわかった、大規模Mastodonインスタンスを運用するコツ - pixiv inside

    おはようございます、ImageFlux開発責任者のharukasanです。3日前の4月14日、ピクシブではPawooが急にリリースされることになりまして、ここ数日はずっとPawooサーバにログインしていました。このPawooサーバ、既にピクシブの監視体制に入っており、アラート受信後インフラエンジニアが障害対応できる仕組みを整えています。案の定、リリース直後の15、16日は週末にもかかわらずアラートを受け取ることになり、サーバにはりつくことになったわけです。どんなシステムであろうとアラートを受け取ったら対応する、それが我らインフラエンジニアです。 pawoo.netの構成 さて、それではまずPawooの構成を見ていきましょう。digすればわかりますがpawoo.netAWS上に構成されています。数百台以上の物理サーバを常時運用しているピクシブであっても、さすがにこんなにはやく物理サーバは用

    実際に運用してみてわかった、大規模Mastodonインスタンスを運用するコツ - pixiv inside
    sucrose
    sucrose 2017/04/18