はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    ブラックフライデー

『「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記』

  • 人気
  • 新着
  • すべて
  • ペルシア語の文字入力 - 「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記

    3 users

    kensuke-mi.hatenablog.com

    誰得な内容ですが..ペルシア語を正しくコンピューターで扱う話. これがきちっと守れないと,「検索した単語が出てこない!」とか「レポート書いたけど,間違いだらけじゃないか!」という原因になるので,きちっと守りましょう.というお話です. 実はアラビア語入力システムとペルシア語入力システムは細部が異なります.ネイティブの方も混合させていることが多いですが,せっかくルールが制定されているので.この機会に知って正しい入力できるようにしましょう.じゃないと困ることになりますよ(ぼくみたいなへっぽこエンジニアが). 1 まずしっかりペルシア語入力モードを設定しましょう windows, Mac OS*, Linuxすべてにおいてアラビア語入力システムとペルシア語入力システムは別に用意されています.「形が似てるからいいじゃん」なんてのはダメです!形は似ていても別の文字.日本語の「黒」と簡体字の「鄢」は似て

    • テクノロジー
    • 2017/03/31 16:51
    • Rのエスケープ文字はダブルのエスケープ - 「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記

      3 users

      kensuke-mi.hatenablog.com

      URLの文字分割したい時など、?とかの特殊記号が登場する。 しかし、単純に?でstrsplit関数を使うと、文字が全部分解されてしまう。Fu*k これは?がメタ文字として扱われているためで、?を文字として扱って分割するにはエスケープを2つもつけないといけない。 以下、コード例 > test_vec <- "id5573746623646?dhdhcdsvcydsucusdv" > strsplit(test_vec, split="?") [[1]] [1] "i" "d" "5" "5" "7" "3" "7" "4" "6" "6" "2" "3" "6" "4" "6" "?" "d" "h" "d" "h" "c" "d" "s" "v" "c" "y" "d" "s" "u" "c" "u" "s" "d" "v" > strsplit(test_vec, split="\?")

      • 世の中
      • 2016/11/16 17:32
      • Pythonから利用するWordnet - 「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記

        3 users

        kensuke-mi.hatenablog.com

        Wordnetとは...プリンストン大学が開発している語データーベースっていう説明でいいのかなあ, 一応,wikipediaの記事を載せておくWordNet 日本語版wordnet(NICTが開発している)だと,日本語で解説されているページがけっこうある.例えばこんなの けど,英語版wordnetの使い方を日本語で解説した記事.というのはほとんど見つからない.ましてや,Python言語から英語版wordnetの使い方を解説した記事なんて見つからなかった. 仕方がないので,英語で探して,英語で読む. すると,こんな解説スライドがあった.どこかの大学の授業スライド?なのかな? どうも,Pythonからwordnetを利用する時には,nltkライブラリで簡単に扱えるらしい. スライドと同じ内容を,ちょっとだけ覚書を残しておく. クエリ語の同義語を得る >>> from nltk.corpus i

        • テクノロジー
        • 2016/05/11 16:51
        • python
        • プリキュアとセーラームーンはどちらの方がサザエさんに近いのか? - kensuke-miの日記

          3 users

          kensuke-mi.hatenablog.com

          この記事ではこんなことを書くよ テキストマイニング的に次元削減とプロットする話 t-SNEとかいうイケてる名前のアルゴリズム プリキュアとセーラームーンはどっちの方がいいか はじめに 計算機分野に所属する人たちは時々、本当に間抜けなことを真面目に取り組もうとします。 例えば、自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみるとか眼鏡っ娘分類器を作る話とか。 ぼくも多分に漏れず、間抜けなことをよく取り組もうとします。 きっと、データサイエンティストと言っているけど、実際は、データマゾヒストなのですね。 さて、きょう、取くんで見る課題は「プリキュアとセーラームーンはどっちの方がサザエさんに近いのだろう?」というお題です。 実にどーでもいいお題ですが、簡単に答えられる人もそうそういないでしょう。 Googleにも聞いてみましたが、満足な答えは得られませんでした。 それで

          • テクノロジー
          • 2016/02/04 16:07
          • SVD
          • 機械学習
          • データ
          • 文書分類タスクでよく利用されるfeature selection - kensuke-miの日記

            14 users

            kensuke-mi.hatenablog.com

            "Bias Analysis in Text Classification for Highly Skewed Data"(Lei and Huan)を読んでいて、「文書分類タスクでよく使われるfeature selectionは4つある。Information GainとChi-squared testとOdds ratioとBi-Normal Separationだ」みたいなことが書いてあった。 自分の中で、あんまりわかってないまま使ってる感があったので、しっかり調べてみた。 Information Gain Information GainはよくIGとか省略される。 IGは要は、「クラスとの関連性がでかい単語ほど大きい値になるよ」というやり方。 簡潔にまとめると、 単語数×クラス数のクロス集計表をつくる。クロス表は(termが出現 or Not)×(クラス=c or Not)の4要素

            • テクノロジー
            • 2015/11/15 23:04
            • 自然言語処理
            • 機械学習
            • あとで読む
            • LDAで,トピックと文書の生成確率を考える - 「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記

              4 users

              kensuke-mi.hatenablog.com

              ある時,「LDAのトピックと文書の生成(同時)確率」を求めるにはどうすればいいですか?と聞かれた. 正確には,LDAで生成されるトピックをクラスタと考えて,そのクラスタに文書が属する確率が知りたい.できれば,コードがあるとありがたい.とのことだった. うーん,LDAの式をがんばって眺めてたのはもう1年も前のことだしなあ.とぼくの鈍い頭はすぐには動かない. そこで,自分用過去ログをあさってみると,「Latent Dirichlet Allocation(LDA)を用いたニュース記事の分類 | SmartNews開発者ブログがわかりやすいよ!」と書いてあったので,これで復習. このページにも書いてあるのだが,i番目の文書の背後にあるトピックkの確率(i番目の文書をトピックkが生成する確率)はtheta_i,kによって求めることができる. じゃあ,実際にtheta_i,kを表示できるようにすれば

              • テクノロジー
              • 2014/06/26 17:19
              • Gensimを使ったトピック単語抽出 LSAを使ったトピック語抽出まで - 「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記

                5 users

                kensuke-mi.hatenablog.com

                以前,ちょろっとだけGensimを使ったことがあったんだけど,久しぶりに本格的に使うことになりそうなので,メモに残しておく Gensimでのコーパスの作り方 - kensuke-miの日記 gensim 文章をベクトル空間にする方法 - kensuke-miの日記 インストールができてないよぉふぇぇ,って人は解説してくださっている方がいるので,そっちを見ればいいと思う Python GensimでLDAを使うための前準備・パッケージのインストール - Hive Color LSAって何だよぉふぇぇ,って人は「文章を与えると,重要っぽい語を返してくれるアルゴリズム」って解釈しておけばいいと思う. ちなみに,日本語での訳語は「潜在的意味インデキシング」という,機械学習一般ではLSIと呼び,LSAって呼ぶのは自然言語処理分野だけらしい. と,いうわけで前提がしっかり整理できたところで,実際にさく

                • テクノロジー
                • 2014/03/10 19:55
                • 機械学習
                • python
                • gensim
                • word2vec利用のおぼえ書き - 「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記

                  4 users

                  kensuke-mi.hatenablog.com

                  理論的なことはほとんどわかってない. だけど,単語n-gramをembeddingsと呼ばれるベクトル表現にしてくれることだけはわかっている. そのうち,しっかり勉強しますから...そのうち... とりあえず,「toolとして使う.」を第一目標にしてみた. word2vecについて Google projectの公式ページ python interfaceのページ python interfaceの使い方 word2vec本体について Google projectの公式ページで入手可能. 大体はここに書いてある説明のとおりにやっていけば良いのだが,pre-trainedのモデルファイルの利用がちょっと気になる. pre-trainedの利用方法 kensuke-mi@pine12:~/opt/word2vec$ ./distance pre_treained/freebase-vector

                  • テクノロジー
                  • 2014/03/03 17:07
                  • word2vec
                  • Python
                  • 機械学習
                  • LIBLINEAR用のスケーリングスクリプトとグリッド探索スクリプト - 「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記

                    3 users

                    kensuke-mi.hatenablog.com

                    LIBLINEARとは線形分類に特化した分類器である. 簡単な説明とか,使い方は検索すればすぐ出てくると思うが, LIBLINEARを用いた機械学習入門(単語分割) あたりはわかりやすいと思う. 一応,公式ページも載せておく. LIBLINEAR -- A Library for Large Linear Classification で,LIBLINEARに限ったことではないのだが,分類器を学習させるには,一般にハイパーパラメータのチューニングが必要になる.SVMの場合はCパラメータのチューニングが必要になるのだが,まあ理論的なことは黄色い本でも読んでもらいたい. このCパラメータのチューニングには,ふつうはグリッド探索というやり方が使われる. やってることはとっても単純で, 「ある範囲のCパラメータでどんどん学習とテストを繰り返して,一番いい精度が出ている時のCパラメータがベスト.」

                    • テクノロジー
                    • 2013/12/03 09:52

                    このページはまだ
                    ブックマークされていません

                    このページを最初にブックマークしてみませんか?

                    『「ヨーロッパ風のオレかっこいい」って思ってる愛知県民の日記』の新着エントリーを見る

                    キーボードショートカット一覧

                    j次のブックマーク

                    k前のブックマーク

                    lあとで読む

                    eコメント一覧を開く

                    oページを開く

                    はてなブックマーク

                    • 総合
                    • 一般
                    • 世の中
                    • 政治と経済
                    • 暮らし
                    • 学び
                    • テクノロジー
                    • エンタメ
                    • アニメとゲーム
                    • おもしろ
                    • アプリ・拡張機能
                    • 開発ブログ
                    • ヘルプ
                    • お問い合わせ
                    • ガイドライン
                    • 利用規約
                    • プライバシーポリシー
                    • 利用者情報の外部送信について
                    • ガイドライン
                    • 利用規約
                    • プライバシーポリシー
                    • 利用者情報の外部送信について

                    公式Twitter

                    • 公式アカウント
                    • ホットエントリー

                    はてなのサービス

                    • はてなブログ
                    • はてなブログPro
                    • 人力検索はてな
                    • はてなブログ タグ
                    • はてなニュース
                    • ソレドコ
                    • App Storeからダウンロード
                    • Google Playで手に入れよう
                    Copyright © 2005-2025 Hatena. All Rights Reserved.
                    設定を変更しましたx