タグ

2015年11月2日のブックマーク (11件)

  • Azure MLのテキストアナリティクスを使って日本の会社を分類してみる

    Azure MLのティストアナリティクスを使って、日の会社を分類してみます。と言っても、日語の業務内容から分類するには、日語文章を形態素解析が必要なため少し面倒なので、もっと簡単な方法で簡易的に試してみます。 日語会社名から分類 日の会社名は漢字で構成されている場合が多いため、使われている漢字から業種を推測することができます。日人の大人でも、業務内容の知らない会社の業種を完璧に当てることは難しいのですが、漢字の意味を知っていればそれなりに判断することができます。 今回は漢字の意味を知らないAzure MLに、会社名をもとに業種を分類させてみようと思います。Azure MLには、教師あり学習として日経225の会社名と業種を渡して学習させました。 日経225の会社一覧からデータの作成 会社一覧のデータは、業種がわかるものが必要です。今回は日経225インデックスの銘柄一覧サイトの情報

    Azure MLのテキストアナリティクスを使って日本の会社を分類してみる
  • nico-opendata - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

    nico-opendata niconicoでは、学術分野における技術発展への寄与を目的として、 研究者の方を対象に各種サービスのデータを公開しています。 ニコニコ動画コメント等データセット (株)ドワンゴ及び(有)未来検索ブラジルと国立情報学研究所が協力して研究者に提供しているデータセットです。 ニコニコ動画コメント等のデータが利用可能です。 利用申請フォーム※国立情報学研究所へリンクします ニコニコ大百科データ (株)ドワンゴ及び(有)未来検索ブラジルと国立情報学研究所が協力して研究者に提供しているデータセットです。 ニコニコ大百科のデータが利用可能です。 利用申請フォーム※国立情報学研究所へリンクします Nico-Illustデータセット Comicolorization: Semi-Automatic Manga Colorization Chie Furusawa*、Kazuyu

    nico-opendata - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
  • DOMContentLoaded周りの処理を詳しく調べてみました - Qiita

    利用者が一定数いるIE6,7,8を除いて、現在利用されているほぼ全てのブラウザで標準仕様として扱えるようになっています。2006年ごろから登場したjQueryの$(document).readyは有名ですが、この存在もDOMContentLoadedが正式に取り入れられるきっかけの1つになっています。 2. jQueryのreadyとの違い HTML5で定義されているDOMContentLoadedとjQueryの$(document).readyは、DOMツリーの構築が完了したことを判定するという点で役割は一緒といえます。ただ、jQueryは古いバージョンのブラウザをサポートするためにDOMContentLoadedを使わないready判定の実装を行っていました。 1. jQuery Core 1.0のready判定(1.0から1.2.1まで) jQyer Core 1.0を見るとIE/

    DOMContentLoaded周りの処理を詳しく調べてみました - Qiita
  • CentOS7にdockerをインストール - Qiita

    勉強の一環でdockerを調べており、その際の手順を覚書で残していきたいと思います。 ちなみに使用しているOSは「CentOS7」です。 dockerのインストール yum install -y docker dockerサービスの起動 systemctl start docker dockerサービスの有効化 systemctl enable docker DockerレジストリからDockerイメージをダウンロードする docker pull {イメージ名} : {タグ名} ダウンロードしたDockerイメージの一覧を確認する docker images Dockerコンテナを作成・実行する docker run [オプション][--name {コンテナ名}] {イメージ名}[:{タグ名}][コンテナで実行するコマンド][引数] 主なオプション -d : バックグラウンドで実行する(後

    CentOS7にdockerをインストール - Qiita
  • ISUCON5 で準優勝してきた #isucon

    予選に引き続き、チーム白金動物園として rosylilly, mirakui と ISUCON 5 の決勝に参加した。 なんと 2 位を獲得した。やったぜ! いや fujiwara 組に負けたのは悔しいけど。 分担は予選とあんま変わってなくて、mirakui がインフラ・分析、rosylilly が実装 (あと博打)、わたしが実装とインフラを良い感じにやっていた。 やったこと 白金動物園の解答コードは予選含めて shirokanezoo/isucon5 に push したのでそれを見つつ、最終的に何が変化したかの話を書く。細かい試行錯誤とか、時系列での話は最後に「タイムライン」としてまとめてのせておきました。 利用言語は主に Ruby。補助的に Go で書いたフォワードプロキシサーバーを入れた。 diff 見る限り +2102 -54 lines なんだってさ。 app.rb に対しては

  • JavaScriptの配列を特定の順番にソートする方法

    JavaScriptで作った配列の順番を特定の順番に入れ替えたい時があったので、ソートして入れ替える方法を調べました。 sort関数 ソートする関数が用意されていますので、sort関数を使います。パラメーターを入れないとアルファベット順になります。 //配列 var station = ["Shinjyuku","Ikebukuro","Shibuya","Ueno"] //配列をソート station.sort(); //出力用 alert(station); // Ikebukuro,Shibuya,Shinjyuku,Ueno ちなみに配列の中身が数字の場合だと・・・ var number = [50000,40,900,3000] number.sort(); alert(number); // 3000,40,50000,900 アルファベット順なので、このような並びになります。

    JavaScriptの配列を特定の順番にソートする方法
  • ISUCON5 で優勝しました - 酒日記 はてな支店

    ISUCON5、予選を無事通過して10/31(土)に開催された選に参加し、優勝しました。 チームは ISUCON 1 の時の初代「fujiwara組」再結成ということで、@songmu, @sugyan とのカヤックの元同僚メンバーです。 最初に、毎回素晴らしいイベントを開催、運営していただいている @941 さんをはじめとした運営チームの皆様、出題の @tagomoris さん、@kamipo さん、他すべての協力いただいた皆様に感謝を申し上げます。当にありがとうございました! 競技開始からベンチ実行まで 作った #isucon pic.twitter.com/5RZkPUsaPu— fujiwara (@fujiwara) 2015, 10月 31 ロゴがなかったので作った。 競技開始、まずは3台で相互にsshできるようにするのに一瞬戸惑う。port 22は開いていて、会場からは接

    ISUCON5 で優勝しました - 酒日記 はてな支店
  • LaravelとNginxの快速仕立て、キャッシュを添えないで…

    タグ: Laravel4 Laravel5 注意: 前の記事は完全に削除しました。同じ記事をタイトルを変更し公開します。 記事を書く前にNginxをいろいろいじっており、その時fastcgiのキャッシュを使うとクッキーも含まれることに気づいていました。この対策をしなくてはと思いながらも、別の要件が解決できたため、この記事を作成しましたが、この問題を解決するのを忘れていました。 fastcgiキャシュは、fastcgi側から送られてくる情報をそのまま保存するだけです。Laravelはセッションクッキーを特に意識しなくても付けます。いくら暗号化されているとはいえ、クッキーを含んだキャッシュが返されると、その保存されているセッション情報が他のユーザーに届きます。これはセキュリティリスクです。 そのため、Nginxのデフォルトでは、クッキーが含まれている場合、キャッシュしないようになっています。そ

  • MySQLテストデータを自動生成&インポートする、PHPライブラリ「MagicalGirl」を公開 | LIVESENSE made*

    テスト・開発に使用するデータ生成の必要性 動作確認テストや開発時に使用するデータベースのデータ、どのように準備していますでしょうか?毎回手動で作成している、番環境から持ってくる。これらは一番良くない例ですよね。 毎回手動で作成していては、開発環境構築の度に、テスト実行の度に作業コストがかかり、オペレーションミスも発生しやすくなります。知っていないと用意できないデータ項目などもあるでしょう。それらを毎回一つ一つ確認するのは大変な作業です。 番環境のデータを使用することが危険であることは言うまでもないと思います。個人情報を扱っているシステムであれば、情報保護の点から大変なリスクを犯す行為です。メールアドレスを保存してあるシステムであれば、オペレーションミスにより不要なメールを実際に送信してしまう危険性も伴います。 特に、動作確認の際に自動テストを実行する場合、想定通りのデータが入って

    MySQLテストデータを自動生成&インポートする、PHPライブラリ「MagicalGirl」を公開 | LIVESENSE made*
  • そのデータ分析待って!まずはわくわくする統計学本から数字のセンスを身につける。

    Amazonアソシエイト ここ2-3年、統計学や機械学習が劇的に増えたと思います。2014, 2015のガートナーのハイプサイクルからもわかると思いますが、ビックデータや機械学習などのデータ分析に関する事柄などは過渡期を少し過ぎたあたりになります。過渡期に執筆が増え今まさに販売されてきているといったところでしょうか。 そこで今回はいきなりデータ分析に取り組む前に、まずはわくわくするところから数字のセンスを身につけよう、ということでいくつかおすすめとなる統計学を紹介させていただきます。そして、最後にビジネス×統計学やデータサイエンティスト入門のためのも一覧として載せています。 うーん、カイザー・ファングさんの、ナンバーセンスは表紙から刺激的ですね。 THE 鉄板!まずは、西内啓さんから。説明不要な気がしますが、今年話題になったのはJリーグのアドバイザー契約になりますね。西内啓さんを

    そのデータ分析待って!まずはわくわくする統計学本から数字のセンスを身につける。
  • Docker入門-基礎編 いまから始めるDocker管理【2nd Edition】

    Docker入門-基礎編 いまから始めるDocker管理【2nd Edition】 JAWS-UG コンテナ支部 Docker 入門 #2 2015年10月30日(金) http://jawsug-container.connpass.com/event/20924/ ※コンテナ支部での発表スライドですが、内容は Docker に対して興味のある方、すべてを対象としています。前回のバージョンそのままではなく、説明の追加など、現在の状況にあわせて、ほぼ全面的に書き直しています。Read less

    Docker入門-基礎編 いまから始めるDocker管理【2nd Edition】