[B! 機械学習][python] masahiko_of_joytoyのブックマーク

GitHub - oreilly-japan/deep-learning-from-scratch-3: 『ゼロから作る Deep Learning ❸』(O'Reilly Japan, 2020)

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

masahiko_of_joytoy 2019/11/18

リンク

pythonによる日本語前処理備忘録 | ブログ一覧 | DATUM STUDIO株式会社

はじめにこんにちは。DATUM STUDIOの安達です。最近社内で日本語のテキストを用いた自然言語処理でよく質問を受けるのですが、前処理についてはそこそこ同じような内容になるため、本記事では社内共有の意味も込めて前処理に関して用いてきた＆用いれそうな手法を列挙します。比較的同じ内容を扱った既存の記事としては以下のようなものもあり、読者の方はこれらも参考にされて要件に合わせて取捨選択してください。自然言語処理における前処理の種類とその威力 – Hironsan自然言語処理の前処理・素性いろいろ本記事における使用言語、環境は以下の通りです。・osx 10.13.6・anaconda 5.2.0・python 3.5.2Table of contents ・形態素解析段階での前処理・文字表現の正規化　・URLテキストの除外　・Mecab + neologd 辞書による形態素解析・形

masahiko_of_joytoy 2019/01/19

リンク

Pythonに関するオススメの書籍/サイト/サービス/Podcast/イベントの情報をシェアします - フリーランチ食べたい

Pythonをこれから勉強したい or 最新情報のキャッチアップがわからない、という方に tskubapy.connpass.com つくばPythonもくもく会 No.2を開催しました！参加者の方の中にはこれからPythonを始めたい、という方もいらっしゃったので、今まで自分が勉強してきた中で役に立ったものをリストアップして、LTしました。自分は機械学習系のエンジニアをしていて、そっちの方向で学んでいることも多いので、「言語について」と「機械学習/データ解析」という分け方をして紹介したいと思います。「機械学習/データ解析」に関してはPythonに関係するものだけに絞っています。書籍に関してはたくさん挙げられても迷ってしまうと思ったので、本当は他にもたくさん素晴らしい書籍があるのは理解しつつ、「あえて選ぶなら」を載せています。学習する上で注意すること勉強する教材を選ぶ上で個人的

masahiko_of_joytoy 2018/11/19

リンク

テキストに含まれた情報を有向グラフに変換する話（一）：可視化の章 - Qiita

こんにちは。理系大学院で修業中のスーパーケロケロです。趣味で自然言語解析（NLP）の勉強をしています。最近、テキストに含まれた情報を有向グラフに変換するPythonライブラリーnaruhodoを作ったので、ライブラリーの紹介も兼ねて、テキストを有向グラフに変換する話を少ししてみたいと思います。 naruhodoのGithubリポジトリはこちら、最新バージョンはです。自然言語解析の流れ自然言語解析を料理に例えれば、入力されたテキストは収穫待ちのコムギのようで、そのままでは使えない。このコムギを形態素解析で脱殻し（形態素単位で分離）、さらに词类（Part-Of-Speech）や依存構造解析で小麦粉にしてから（文法情報の付与）、ようやくパンのような美味しい食べ物が作れる（実際の応用）。テキストが処理されるごとに、使える情報が増えて、応用の幅が広げるわけです。文＝＞木、文章＝＞有向グラフ

masahiko_of_joytoy 2018/06/20

リンク

scikit-learnとgensimでニュース記事を分類する - Qiita

こんにちは、初心者です。適当なニュース記事があったとして、ニュースのカテゴリを推測するみたいな、よくあるやつをやってみました。Python3.3を使いました。何をやるの？データセットはlivedoorニュースコーパスを使いました。 http://www.rondhuit.com/download.html#ldcc クリエイティブ・コモンズライセンスが適用されるニュース記事だけを集めてるそうです。トピックニュース、Sports Watch、ITライフハック、家電チャンネル、MOVIE ENTER、独女通信、エスマックス、livedoor HOMME、Peachy というクラスがあります。データは、1記事1テキストファイルの形式で、クラス別のディレクトリにいっぱい入っています。これを学習して、未知の文章に対して、お前は独女通信っぽい、お前は家電チャンネルっぽい、みたいに、分類が

masahiko_of_joytoy 2018/03/10

リンク

dfltweb1.onamae.com – このドメインはお名前.comで取得されています。

このドメインはお名前.com から取得されました。お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。

masahiko_of_joytoy 2017/11/17

リンク

画像の特徴点を抽出する - Qiita

いろいろな画像を見比べて、「あの画像に写ってるのアレは、この画像に写ってるコレと同じかな？」なんてことを、機械的にやるとしたら、という話。 OpenCVに頼る難しいことは考えないで、OpenCVに頼る。自分で考えるよりも、世界中の賢い人々が考えてくれた成果物を利用するべきなのだ。というわけで、早速、 OpenCV: Feature Detection and Descriptionを参照して、お勉強を始める。画像を用意する適当な著作権フリーっぽい画像もないし、自分で撮影するのも面倒なので、今回は以下の画像を適当に作った。このutsu1.png(游明朝)と、utsu2.png(ヒラギノ角ゴシック)を使うことにする。特徴点の抽出まずは、http://docs.opencv.org/master/da/df5/tutorial_py_sift_intro.html に従い、utsu

masahiko_of_joytoy 2017/04/22

リンク

Pythonの数値計算ライブラリ NumPy入門

Scientific Computing Tools For Python — Numpy NumPy は Pythonプログラミング言語の拡張モジュールであり、大規模な多次元配列や行列のサポート、これらを操作するための大規模な高水準の数学関数ライブラリを提供する。(via Wikipedia) これまで知識があいまいだったNumPyについて、もう一度おさらいしたいと思います。NumPyはSciPyと併せて科学技術計算でよく利用されています。また、高速に行列演算ができるのでOpenCV(コンピュータビジョンライブラリ)でもNumPyを利用したPythonインタフェースが提供されるようになりました。 OpenCVのPythonバインディングについては去年のエントリーでも取り上げていますので参考までに。 * さくらVPSにOpenCVをインストールしてPythonから使う [2017/04/2

masahiko_of_joytoy 2016/03/22

リンク

はてなブックマーク

タグ

関連タグで絞り込む (12)

機械学習とpythonに関するmasahiko_of_joytoyのブックマーク (8)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス