タグ

2015年11月30日のブックマーク (17件)

  • scikit-learn によるナイーブベイズ分類器 - Qiita

    ナイーブベイズの概要 ナイーブベイズ分類器は特徴ベクトル間に条件付き独立性を仮定したベイズ定理に基づく分類器です。現実の問題では特徴を表す素性同士に何らかの相関が見られるケースが多々ありますが、独立性仮定によって計算量を簡素化・削減し、高速でそこそこの精度を誇る分類器を実装することができます。 ベイジアンとヒューリスティクス これらを鑑みるとそもそも元より高精度を期待できる分類器ではないですし、諸々の論文等では比較対象として負けるための分類器とまで言う声も聞かれるほどです。多くは独立性を仮定するべきではない問題に適用しているからで当たり前なのですが、筆者の私見としてはナイーブベイズはヒューリスティックな問題に高い実用性を発揮すると思います。例えばテキストマイニングといった完全性を追い求めるのがなかなか難しい分野において、高速である程度の正解率を叩きだす分類器として実用性能が高いでしょう。

    scikit-learn によるナイーブベイズ分類器 - Qiita
  • scikit-learnでCross Validation - Qiita

    詳しいことはWikipediaに書いてある。 Cross Validationはモデルの妥当性を検証する方法のひとつ。一般的に開発用のデータは訓練データと検証データに分かれる。 しかし、このまま行ってしまうと折角の訓練データが減ってしまうことになる上に、訓練データの選び方によって汎化性能が下がってしまう可能性がある。 Wikipediaに書いてあるもののホールド・アウト検定がこれに当たる。一般にはこれはCross Validationにはあたらない。 ここに書いてあるK-分割交差検定がこれに当たる。K-分割交差検定では開発用のデータをK個に分割しK-1個を訓練用に、残りの一つを検証用に使いモデルの正当性を計算する。 これにより使える訓練データが増えると同時に、これらを訓練データを変えることにより、汎化性能を上げることができる。 scikit-learnで具体的にどのように行うのか書いてみた

    scikit-learnでCross Validation - Qiita
  • Yahoo! JAPAN Techのカレンダー | Advent Calendar 2014 - Qiita

    About reserved postingIf you register a secret article by the day before the same day, it will be automatically published around 7:00 on the same day. About posting periodOnly articles submitted after November 1 of the year can be registered. (Secret articles can be registered anytime articles are posted.)

    Yahoo! JAPAN Techのカレンダー | Advent Calendar 2014 - Qiita
  • JJUG CCC 2015 Fall ( #jjug_ccc ) - セッション資料の一覧 - 地平線に行く

    JJUG CCC 2015 Fall に行ってきました! 今回は、ちょうどJava 8 と 9 のちょうど間、ということで Java 自体の話よりもその周辺の話、特にライブラリの話が多かった気がします*1。 こういう話がきけるのが Java らしい(ライブラリが豊富な Java ならでは)ですね。 すぐにライブラリ使ってみよう!というとそんなことはないのですが、そのライブラリが持つ考え方を聞ける*2というのがとても貴重で楽しかったです。 さて、毎回のことですが*3、残念ながら時間がかぶってしまって参加できなかったセッションもあったので、あとで読むために現時点で発表者の方が公開されている資料一覧をまとめしました。*4 (あとで JJUG CCC 2015 Fall のページにもリンクが載ると思うんですが、とりあえず自分の方で調べました) Room A+B+C+D keynote-1 基調講演

    JJUG CCC 2015 Fall ( #jjug_ccc ) - セッション資料の一覧 - 地平線に行く
  • Chainer version 1.5への対応に苦労する方へ - のんびりしているエンジニアの日記

    皆さんこんにちは お元気ですか。私は元気です。 最近、ChainerのVersionが1.5へUpgradeしましたが… 従来までと異なり、GPUへの対応が大変です。 なぜ、大変になったか? Cythonへの対応 調べた限りだとCythonです。従来まではctypesを使って 行っていたのですが、ctypesはボトルネックとなっていたようです。 このボトルネックをCythonを使って解消したことから、発生している諸々のエラーです。 h5pyへの対応 あっさり解消できますが、外部ライブラリが必要になります。 これは学習済みモデルを保存する為に使われるようです。 基コンパイルコマンド apt-get install libhdf5-dev sudo pip install -U chainer 失敗した人はハマった箇所を見てみましょう。以下に私がハマった箇所を記載していきます。 開発者のun

    Chainer version 1.5への対応に苦労する方へ - のんびりしているエンジニアの日記
  • Hiroharu Kato

    Education Ph.D. in Information Science and Technology, the University of Tokyo (Oct 2016 – Sep 2020) M.S. in Information Science and Technology, the University of Tokyo (Apr 2012 – Mar 2014) B.S. in Engineering, the University of Tokyo (Apr 2008 – Mar 2012) Experience Researcher, Preferred Networks, Inc. (Dec 2018 – Present) Engineer, Sony Corp. (Apr 2014 – Nov 2018) Publications Rethinking Direct

  • 長文日記

    長文日記
  • サポートベクターマシン 〜パターン認識〜 - ナンバーズ予想で学ぶ統計学

    サポートベクターマシンの説明 サポートベクターマシン(Support Vector Machine: SVM)とは機械学習における教師あり学習の パターン認識 のアルゴリズムのひとつである。 パターン認識とは「何らかの入力が与えられたときに、 その入力パターンを解析して適切なカテゴリに分けること」。 「顔であるかないか」といったふたつに分類する画像認識や、「どの文字であるか」といった文字認識(複数の分類)などに用いられる。 教師データとして与えられたデータを分類したあとに、未知のデータ(学習しなかったデータ)をうまく分類するのが SVM の役目。 画像認識の例: 歪んだ文字が撮影された写真(画像データ)と、その文字が何であるかという問題と回答を SVM に学習させる。つまりあらかじめ識別、分類した結果をコンピュータに覚えさせる。 この学習を繰り返す。 未知の写真(画像データ)を SVM に

  • Gradient Checkingを実装した - のんびりしているエンジニアの日記

    皆さんこんにちは お元気ですか?私は凍えています。 今日はGradient Checkingを紹介します。 Gradient Checking 機械学習の実装を行っていると、 勾配の計算をする箇所が出ることが多いです。(Back Propagationなど) 簡単な計算をするには適当に手で計算したものを実装すればよいですが だんだん当に合っているのかわからないとか、実装方針変えた場合でも等価になるのかなど 不安になってくる箇所が出てきます。(多分) そんなときにGradient Checkingを使いましょう。 数式 をパラメータに基づく関数J(関数J、パラメータの内容は自分で定義、構築してください) と定義すると以下がGradient Checkingを実装する式となります。 EPSILONは小さい定数です。大体0.0001程度が良いそうです。 プログラムとして上記式を構築するには、右

  • Googleが提供する機械学習ライブラリ TensorFlow を1時間で試してみた デザイン会社 ビートラックス: ブログ

    Google機械学習のライブラリTensorFlowをオープンソースとして公開した。すでにGoogleの写真検索や音声認識技術に使用されているもので、大きな注目を集めている。AmazonやFacebookも機械学習システムをオープンソースとして公開している。 オープンソースのライセンスは、Apache 2.0だ。簡単にいうと使っていることを明記さえしておけば商用でも利用可能である。 今後、様々なサービス、研究機関等で機械学習が使われていくことが増えると予想される。機械学習AIは基盤技術としてすべての産業に影響を及ぼすことから、今後見逃せない動きである。 参考: 人工知能 (AI) はどこまで進歩しているのか – 4つの知能レベルと実商品例 –人工知能 (AI) ができる3つのこと – 消える職業と生まれる職業 –TensorFlowのインストール今回は、機械学習に馴染みがない人がまずT

    Googleが提供する機械学習ライブラリ TensorFlow を1時間で試してみた デザイン会社 ビートラックス: ブログ
  • @IT:Snortでつくる不正侵入検知システム 第1回

    ※ご注意 稿の内容を検証する場合は、必ず影響を及ぼさない限られた環境下で行って下さい。また、稿を利用した行為による問題に関しましては、筆者および株式会社アットマーク・アイティは一切責任を負いかねます。ご了承ください。 「IDS」という言葉をご存じだろうか。IDSとは「Intrusion Detection System」の略で、日語では「侵入検知システム」と訳される。この連載ではフリーのIDSであるSnortを題材に、IDSのインストールから運用までを解説していきたいと思う。 IDSとは何か 「IDSとは一体何なのか」。そう疑問に思った方は少なくないであろう。簡単にいえば、「ネットワークを流れるパケットに対してあるパターンに合致しているか否かを判定し、合致している場合はあらかじめ定められた処理を行う」ものである。 「あらかじめ定められた処理」とは具体的にどのような処理なのかというと、

    @IT:Snortでつくる不正侵入検知システム 第1回
  • homebrewとは何者か。仕組みについて調べてみた - Qiita

    はじめに いつも使っているMac book。 パッケージマネージャーはbrewを使っています。 いつも何気なく使っているbrewですが、よくわかっていないのにネットの情報をコピペ→実行してしまうときがあります。 今回はそんなhomebrewについてちょっと調べてみました。 homebrewとは?パッケージ管理システムとは? wikipediaによるとこうなっています。 「Mac OS Xオペレーティングシステム上でソフトウェアの導入を単純化するパッケージ管理システムのひとつである」 実行ファイルや設定ファイル、ライブラリetcを一つのファイルとしてまとめているものをパッケージと呼びます。 パッケージ管理システムとはこのパッケージのインストール(アンインストール)作業を一元的管理するものです。パッケージやライブラリの依存関係などが管理できます。 ちなみにパッケージ管理には、 バイナリを取得す

    homebrewとは何者か。仕組みについて調べてみた - Qiita
  • OpenJDK: jol

    JOL (Java Object Layout) is the tiny toolbox to analyze object layout schemes in JVMs. These tools are using Unsafe, JVMTI, and Serviceability Agent (SA) heavily to decoder the actual object layout, footprint, and references. This makes JOL much more accurate than other tools relying on heap dumps, specification assumptions, etc. Links Source Repository Mailing List (archive) Bugs

  • Java文字列メモ(Hishidama's Java String Memo)

    一文字:char [/2010-06-20] 不変の文字列:String [/2023-09-24] 可変の文字列:StringBuffer/StringBuilder [/2023-09-24] StringWriter(PrintWriter)/PrintStream [/2009-02-14] StringJoiner [2014-03-19] コードポイントの例 [2017-01-28] 文字のStream [2014-04-29] 文字列の結合 [2007-07-01] 単独の結合の実行時間 ループ内結合の実行時間 +演算子の実態 [/2008-01-27] 結論 [/2014-04-29] 文字列の比較方法 [2008-04-16] 文字列比較の書き順 [2008-05-02] 半角カタカナ・全角ひらがな変換 [2012-06-15] 半角英数変換 [2014-04-29] c

  • Garbage First Garbage Collection (G1 GC) #jjug_ccc #ccc_cd6

    * 2015/12/01 12:40 修正 * P.65 の1段落目の表現を修正しました。(不要オブジェクトが閾値を上回る -> 生存オブジェクトが閾値を下回る) 表現だけ見ると内容は一緒なのですが、オプションで指定可能な閾値の意味を考慮すると修正前の文章は誤りでした。 Introduction of G1 GC at JJUG CCC 2015 Fall. http://www.java-users.jp/?page_id=2056Read less

    Garbage First Garbage Collection (G1 GC) #jjug_ccc #ccc_cd6
  • 楽天トラベル: 伊豆高原 癒しの薫りと美肌の湯 Dog Pension R65 宿泊予約

    こちらの宿泊施設は楽天トラベルボーナスプログラム対象で、お客様の国内宿泊回数に応じてポイントアップが適用されます。また楽天トラベルへサービス利用料を支払うことにより、原則同条件の他の施設よりも上位に表示されています。(ヘルプページ参照)

    楽天トラベル: 伊豆高原 癒しの薫りと美肌の湯 Dog Pension R65 宿泊予約
  • 検索結果【楽天トラベル】

    エリアで絞り込む 全国 (1652) 北海道(79) 東北(112) 北関東(114) 首都圏(231) 伊豆・箱根(168) 神奈川県(26) 静岡県(142) 熱海(15) 伊東(9) 伊豆高原(62) 東伊豆・河津(13) 下田・南伊豆(24) 西伊豆・戸田・土肥・堂ヶ島(8) 伊豆長岡・修善寺・天城湯ヶ島(11) 静岡・清水 富士・富士宮 御殿場・沼津・三島 焼津・藤枝・御前崎・寸又峡 浜松・浜名湖・天竜 掛川・袋井・磐田 甲信越(256) 北陸(75) 東海(261) 近畿(220) 山陽・山陰(90) 四国(40) 九州(119) 沖縄(55)

    検索結果【楽天トラベル】