タグ

機械学習に関するpetitvioletのブックマーク (11)

  • やる夫で学ぶ機械学習シリーズ · けんごのお屋敷

    これは、機械学習に関する基礎知識をまとめたシリーズ記事の目次となる記事です。まとめることで知識を体系化できて自分自身の為にもなるので、こういうアウトプットをすることは大事だと思っています。ただ、普通にブログ記事を書くのも面白くないので、ちょっといつもとは違う方法でやってみようというのが今回のシリーズ記事。 2 ちゃんねるのキャラクターが登場人物として出てきて、彼らが会話して話が進んでいく「やる夫で学ぶシリーズ」という講義調の形式のものがあります。個人的にはやる夫で学ぶシリーズや 数学ガール のような会話形式で話が進んでいく読み物は読みやすいと思っています。さらに、先日みつけた やる夫で学ぶディジタル信号処理 という資料がとてつもなくわかりやすく、これの真似をして書いてみようと思い至りました。記事中のやる夫とやらない夫のアイコンは http://matsucon.net/material/m

  • 機械学習の分類の話 · chezou/notebooks · GitHub

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    機械学習の分類の話 · chezou/notebooks · GitHub
  • dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。

    dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
  • word2vec利用のおぼえ書き - kensuke-miの日記

    理論的なことはほとんどわかってない. だけど,単語n-gramをembeddingsと呼ばれるベクトル表現にしてくれることだけはわかっている. そのうち,しっかり勉強しますから...そのうち... とりあえず,「toolとして使う.」を第一目標にしてみた. word2vecについて Google projectの公式ページ python interfaceのページ python interfaceの使い方 word2vec体について Google projectの公式ページで入手可能. 大体はここに書いてある説明のとおりにやっていけば良いのだが,pre-trainedのモデルファイルの利用がちょっと気になる. pre-trainedの利用方法 kensuke-mi@pine12:~/opt/word2vec$ ./distance pre_treained/freebase-vector

    word2vec利用のおぼえ書き - kensuke-miの日記
  • 意見(評価表現)抽出ツール

    目次 意見(評価表現)抽出ツールとは 高度言語情報融合フォーラム(ALAGIN)で公開されているモデルデータと辞書データについて 新着事項 ご利用にあたっての注意事項 ダウンロード ツールの実行環境 意見(評価表現)抽出ツールの動作確認方法 モデルデータの生成 このパッケージに含まれているディレクトリ・ファイル 解析精度 参考文献 著作権&ライセンス 付録 意見(評価表現)抽出ツールとは ツールは、国立研究開発法人情報通信研究機構 旧知識処理グループ 情報信頼性プロジェクトによって開発されたもので、1行につき1文が書かれたテキストファイルを入力として、機械学習を使って何らかの事象に対する意見や評判および評価(以下、これらをまとめて「評価情報」と呼びます)がテキスト中のそれぞれの文に存在するかどうかの判定を行い、その文に評価情報が存在すると認められた場合、以下の情報を出力するツールです。

  • 教師なしLDAでTwitterのスパム判別をしてみる(予備実験編) - 病みつきエンジニアブログ

    ※普通は「教師なしLDA」という言い方はしないです モチベーション 元々は、TwitterからURLつきのツイートを取りたかった。某ニュースアプリがTwitter上で(?)話題になっているニュース記事を(法的な是非があるとはいえ)配信しており、そんな感じのマイニングがしたかった。 ただ、普通に「http,https」でTwitter上で検索すると、量が膨大だった。加えて、ほとんどがスパム。なーにが「このサイトすごすぎwwwww」じゃ。 ということで、検索の段階でスパミーなキーワードを取り除き、純度の高いURL投稿マイニングをしたいわけだが、キーワードは既知なものには限らない。例えば「無料」とか「アフィリエイト」とかがスパムなのはそうなんだけど、「パズドラ」とか「魔法石」とか、未知のキーワードとか出てきた時に対応できない。 そこで、教師なし学習のアプローチを使って、スパムなキーワードを抽出す

    教師なしLDAでTwitterのスパム判別をしてみる(予備実験編) - 病みつきエンジニアブログ
  • ベイズ推定と最尤推定の違い

    事後確率: ある事象Dが発生した場合、仮説Hiが正しい確率。条件付き確率で、P(Hi | D)と書きます。

  • IPython環境を整えましょう - すこしふしぎ.

    あけましておめでとうございます! 新年あけましておめでとうございます.年末は祖父宅@宮城でゴロゴロしておりました. ビバ寝正月です.まどまぎサントラをエンドレスで流して梶浦音楽に酔いしれています. 気づけばブログリレーもかなり続いてますね.3ヶ月くらい経つのでしょうか. 果たして2014年もノンストップで駆け抜けるのでしょうか? それともだれかが焼き肉になってしまうのでしょうか? ...自分でないことを祈るばかりです. データ分析入門買ったよ さて唐突ですが,自分は学部授業では機械学習に一番感動しました. 機械がデータを理解する,ってロマンがありますよね. 授業ではコンピュータビジョンとして画像認識が多かったのですが, "ただの画素値の集合"のなかから特定物体を見つけたり,同系統に分類したりするって,ほんとにすごいことだと思います. 人間ってなんでこんな簡単に画像中からモノを分類できるんで

    IPython環境を整えましょう - すこしふしぎ.
  • Pythonによる機械学習実験の管理

    Python をつかったアルゴリズムの実験で,実験条件の設定や,その記録など実験管理,epydoc を用いたソフトの文書化,そして gxp を使ったクラスタ環境下での実行について簡単に紹介します. Tokyo.Scipy #1 http://partake.in/events/3ab83ec0-e987-4956-b726-faf7777a2c83Lire moins

    Pythonによる機械学習実験の管理
  • テキストマイニングのための機械学習超入門 二夜目 パーセプトロン - あんちべ!

    一夜目はパターン認識と機械学習の概要を学びました。今夜は、識別部で用いられる機械学習の基的な線形識別器である「パーセプトロン」を具体的に学びたいと思います。「線形識別器?パーセプトロン?何それ?」字面は厳しいですが、手を動かしてみると意外と簡単に理解できます。今夜からは数式をバリバリ使っていきますし、手を動かしていただきます。「必ず」手元にペンと紙を用意してください。そうは言ってもパーセプトロンが一体何なのか、機械学習の中でどのような位置づけなのかがわからないと混乱するかもしれません。パーセプトロンの説明へ入る前に、機械学習の3つのアプローチをご紹介します。 ●機械学習の3つのアプローチ - 識別関数、識別モデル、生成モデル 機械学習は大きく分けて識別関数、識別モデル、生成モデルという3つのアプローチがあります。 識別関数 := 入力データを見て、特定のクラスに属するよう識別(代表的な手

    テキストマイニングのための機械学習超入門 二夜目 パーセプトロン - あんちべ!
  • 数式をnumpyに落としこむコツ

    Tokyo.SciPy #2 にて発表した、数式(あるいは数式入りのアルゴリズム)から実装に落とす場合、何に気をつけるのか、どう考えればいいのか、というお話。 対象は、どうやって数式をプログラムすればいいかよくわからない人、ちょっとややこしい数式になると四苦八苦してしまい、コードに落とすのにすごく時間がかかってしまう人、など。 ここでは実行速度についてはひとまずおいといて、簡潔で間違いにくい、ちゃんと動くコードを書くことを目標にしています。

    数式をnumpyに落としこむコツ
  • 1