タグ

ブックマーク / blog.livedoor.jp/tak_tak0 (4)

  • 機械学習モデルを推定する方法 : 研究開発

    「White-box」とは、訓練されたモデルをローカルでダウンロードして使用すること 「Monetize」とは、ユーザーがモデルへのブラックボックスアクセスを他のユーザーに課金すること 4 Extraction with Confidence Values まず信頼性の値を返す予測APIに注目した抽出攻撃方法 ここでは logistic regressions (LR), neural networks, and decision trees を、対象としている。 4.1 Equation-Solving Attacks 多くの機械学習モデルは、入力xと実数値モデルパラメータの連続関数としてクラス確率を計算している この場合、このクラス確率を示すAPIは、未知モデルパラメータの方程式として見ることができる サンプル (x, f(x)) を敵に提供する事になる 4.1.1 Binary lo

    機械学習モデルを推定する方法 : 研究開発
  • RのH2Oで学習したモデルを保存する方法 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 RでのH2OではRを終了すると学習したモデルが保持されません。 最初の内は全然気にしてなかったんですが、h2o.deeplearningは結構時間かかりますし 何度もやってるとモデルを保存、読み込みしたくなります。 何故かそういうことに言及する人が全然いないのですが マニュアルによると h2o.download_pojoという関数があるらしいので 使ってみようとしたら エラー: 関数 "h2o.download_pojo" を見つけることができませんでしたという事だったんですが、 しかしdownloadという名前で保

    RのH2Oで学習したモデルを保存する方法 : 研究開発
  • 形態素解析しない特徴語抽出 : 研究開発

    このコーパスは 2000〜2012年発行の書籍タイトル 電撃文庫 富士見ファンタジア文庫 角川スニーカー文庫 ファミ通文庫 スーパーダッシュ文庫 ガガガ文庫 MF文庫J GA文庫 計1350タイトル 1350とは、コーパスの規模は全然大したことないです。テキストで45Kbyteしかありません。 の数はもっと多数ありますが、シリーズタイトルは一つに統合しました。 → シリーズタイトルの名寄せ これは思ったより相当厄介な問題で研究テーマにもなり得そうですが... 当はタイトルの一覧はこれだけ取得しました。 ジャンプコミック 講談社コミックス サンデーコミックス ガンガンコミックス カドカワコミックス チャンピオンコミックス モーニングKC アフタヌーンKC イブニングKC ジェッツコミックス ビッグコミックス ビームコミックス アクションコミックス YKコミックス KCデザート フラワーコ

  • 文体による個人識別法 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 人が記述する文章には人それぞれに固有の特徴があり、 声紋、指紋、網膜、DNAなど、バイオメトリクス(生体認証)と同様に個体識別が可能になるという考えがあります。 少なくとも、筆跡鑑定程度には個人性が現れてきます。 この研究は元は文書(主に古典文学)の著者が誰であるのかを判別するために取り組まれてきて 古い歴史があるのです。 著者判別に有効な特徴量の推定 吉田篤弘 延澤志保 平石智宣 斎藤博昭慶應義塾大学大学院 情報処理学会研究報告  情報学基礎 2001(86) 文献の真贋問題は有史以来人類が向き合ってきた問題の一つ

  • 1