タグ

2014年5月20日のブックマーク (12件)

  • Mecabに人名辞書を追加 - Qiita

    Mecabに新しい単語を追加したくなることは多々あるはず。 今回は人名の例で解説する。 人名追加に必要となる知識 重要なリンク Mecab公式「単語の追加方法」 http://mecab.googlecode.com/svn/trunk/mecab/doc/dic.html 人名辞書一覧 http://www.mwsoft.jp/programming/munou/ime_dictionary_link.html#person 辞書の追加先 まず、システム辞書として追加するか、ユーザー辞書として追加するかが問題となる。 人名辞書の項目は大抵万を超えるので、解析速度のことを考え、システム辞書に追加するのが妥当と考えられる。 辞書更新が頻繁でないときや, 解析速度を落としたくない時は, 直接 システム辞書を変更するのがよいでしょう. mecab-ipadic があるディレクトリに移動 foo.

    Mecabに人名辞書を追加 - Qiita
    hoPPen
    hoPPen 2014/05/20
  • テキストマイニングの前処理。名詞抽出、ストップワード除去、珍しい単語の除去

    pythonを使ったテキストマイニングの前処理メモ。名詞を抽出し、ストップワードや珍しい単語を除去する方法。 名詞を抽出し、ストップワードや珍しい単語を除去する テキストマイニングにおける定番の前処理らしいです。pythonで試してみました。 もっと膨大な文章集合を実践的に扱う場合は、「10%以上の文章にでてきた単語を除去」とかもやるみたいです。正解があるわけではなく、扱うデータと目的に合わせて適宜変えるとよいと思います。 #coding:utf-8 import MeCab def extractKeyword(text): u"""textを形態素解析して、名詞のみのリストを返す""" tagger = MeCab.Tagger() encoded_text = text.encode('utf-8') node = tagger.parseToNode(encoded_text).n

    hoPPen
    hoPPen 2014/05/20
  • rubyで自分のツイートデータから頻出語を見つける - くろの雑記帳

    ふと自分のツイートデータを使って頻出語リストを作ってみたいなと思ったのでやってみました。 環境 Mac OS X 10.9.1 (Mavericks) ruby 2.0.0 必要なものをインストールする MeCab MeCab(めかぶ)とはオープンソースの形態素解析エンジンで、これを使うと、文字列を単語ごとに区切ることができます。 (例: 「今日はいい天気ですね」→「今日 | は | いい | 天気 | です | ね」) mecab用の辞書ファイルとともにインストールします。 $ brew install mecab-ipadic mecab gem 'natto' MeCabをrubyから使うために、今回は'natto'というgemを使います。 $ gem install natto ツイートデータをダウンロードする Twitterの設定画面の下のほうに、全ツイート履歴のダウンロードをリ

    rubyで自分のツイートデータから頻出語を見つける - くろの雑記帳
    hoPPen
    hoPPen 2014/05/20
  • 【いま会いたい人リスト第四弾】株式会社ウサギィに遊びに行ってきた - razokulover publog

    だいぶ時間が空いてしまったのだけど、先日株式会社ウサギィに遊びに行ってきた。 どうしてウサギィに行ったのかいうといま会いたい人リストに挙げたkazoo04さんに会いに行くため。 kazoo04さんを知らない人も多いと思うので、ここでニコニコ大百科の紹介文を引用すると、 Twitterと勤務先を主戦場に闘うエンジニア。親しみやすいキャラクターと懐の深さからTwitterで多くのフォロワーを集め、かずー氏クラスタという独特のクラスタを周囲に形成している。 もともとは機械学習を愛しウサギィと日エンジニアを繋ぐ有能なエンジニアだったが電車にメイド服を忘れたから台無しになった。でも楽しそう。 小器用。絵も描くし動画も編集するしクリエイティブなことは一通りできるんじゃいかという憶測を呼びかねないくらいの勢い。ウサギィのインテリアもかずー氏が選んだりしたらしい。あと後述の「わかるウケる神」をTシャツ

    【いま会いたい人リスト第四弾】株式会社ウサギィに遊びに行ってきた - razokulover publog
    hoPPen
    hoPPen 2014/05/20
  • ClippingMagic

    Trained on millions and millions of real world images, not artificial lab data, the Clipping Magic Auto-Clip AI background remover handles so much more than just a few cherry-picked foreground categories. And the learning hasn't stopped. As the AI background editor is exposed to more and more photos, its ability to handle yours continues to improve. The only background removal editor in the world

    ClippingMagic
    hoPPen
    hoPPen 2014/05/20
  • デザイナがエンジニアリング(プログラム)を学ぶコツ | fladdict

    最近、色々な方と「表現とエンジニアリングの融合」について、お話を伺ったりしたことからのまとめ。 なぜ表現者はテクノロジーを学習するのが苦手か 表現とエンジニアリングができるハイブリッドな製作者は、理系あるいはエンジニア出身の人間が多い。逆にアーティストや(グラフィック)デザイナーのバックグラウンドから、ハイブリッド型へと移行する人は相対的に少ない。 基的には、エンジニアのほうが「系統立てて学習する」という点で、ノウハウと教育がある。いわゆる「美的センス」といわれるようなモノであっても、いちどロジック化して自分なりに消化さえできてしまえば、エンジニアは表現やデザインもエンジニアリングの一貫として学習することができる。(逆に、スキルをブレイクダウンして学習するぶん、「作れるけど作りたいものがない」になりがちではある。) 明確なビジョンが学習を阻害する 一方アーティストやデザイナが、なぜテクノ

    hoPPen
    hoPPen 2014/05/20
  • HTML Imports: ウェブのための #include - HTML5 Rocks

    Stay organized with collections Save and categorize content based on your preferences. Explore our growing collection of courses on key web design and development subjects. An industry expert has written each course, helped by members of the Chrome team. Follow the modules sequentially, or dip into the topics you most want to learn about.

    HTML Imports: ウェブのための #include - HTML5 Rocks
    hoPPen
    hoPPen 2014/05/20
  • エンジニアがクリエイティブ業界で働くべき最大の理由|バスキュール 古川亨のキャリア論 | キャリアハック(CAREER HACK)

    なぜ、広告・クリエイティブの業界はエンジニアに人気が無いのか?デジタルを駆使したインタラクティブな広告が盛り上がっているし、ニーズも高まっている…が、エンジニアが圧倒的に足りていない。この問題の根とは?解決の糸口はあるのか?バスキュールのテクニカルアーキテクト、古川亨さんと共に考えてみた。 若いエンジニアにとって「クリエイティブ業界」は選択肢になるか? WEB制作の枠に収まらず、「面白い仕掛け」を生み出すクリエイティブカンパニーが今、注目されている。CAREERHACKでは「次世代クリエイターの理想像」を追うべく、さまざまな会社を取材してきた。そこで感じたのが、この業界全体の盛り上がりと、つくり手となる人材(特にエンジニア)が不足している点だ。 スタートアップ、フリーランス、自社プロダクトの開発など、キャリアの選択肢が広がっていくなかで、エンジニアにとって「クリエイティブ業界」は選択肢に

    エンジニアがクリエイティブ業界で働くべき最大の理由|バスキュール 古川亨のキャリア論 | キャリアハック(CAREER HACK)
    hoPPen
    hoPPen 2014/05/20
  • ネットベンチャーを8年間やってきて学んだ20のこと

    こんにちは、ピクスタ代表の古俣です。 僕は8年半前に今の会社を起業して、なんとか事業を軌道にのせて、 今では日最大の素材プラットフォーム「PIXTA」をつくり上げることができました。 そして、それまでの過程で多くの学びがありました。 最近では自分の経験を元に、起業したい人にアドバイスをしたりしていますが、 今回、これまでの経験から得た学びをまとめてみたいと思います。 1. 「何をやるのか」を考える方法 起業に際しては、何をやるのかが最も重要です。 かのソフトバンク孫社長も「登りたい山を決める。これで人生の半分が決まる」とおっしゃっています。 では、それをどう見つけるのか? 僕がオススメするのは、自分の原体験にもとづいて分野を決め、それからビジネスモデルを考えるというものです。 スティーブ・ジョブスは、養父がエンジニアという家庭環境で育ち、PCやハード製品に人生を捧げ、孫正義は、17歳のと

    ネットベンチャーを8年間やってきて学んだ20のこと
    hoPPen
    hoPPen 2014/05/20
  • ソフトウエアパターンの世界

    Copyright © 2004-2024 Impress Corporation. An Impress Group Company. All rights reserved.

    hoPPen
    hoPPen 2014/05/20
  • サルでもわかる 逆引きデザインパターン

    デザインパターンは「良い設計の虎の巻」 デザインパターンとは簡単に言うと「良い設計の虎の巻」です。 プログラミングや設計をしていると、以前経験したことがある、 似たような問題に出くわすことがよくありますよね。 そのような問題の解決法にわかりやすい名前を付けて、 カタログ化(虎の巻化)したものがデザインパターンです。 デザインパターンは虎の巻ですので、 知っているのと知らないのでは設計や効率に大きく差がついてきます。 先人たちの「設計に関する試行錯誤の結果」であるデザインパターンを、 効果的に再利用しない手はありません。 デザインパターンにはいくつか種類があります。 表1 デザインパターンの種類 カタログ名 説明

    hoPPen
    hoPPen 2014/05/20
  • ユニクロ『UTme!』の権利帰属に関する利用規約が凄い

    1枚1,990円で自分だけの「UT」が作れるという、ユニクロのオリジナルTシャツ作成アプリ「UTme!」。 http://utme.uniqlo.com/ 一見、便利かつ素晴らしいものに見えるこのサービス。 しかし、その利用規約には恐るべき内容が記載されているのであった。 続きを読む

    ユニクロ『UTme!』の権利帰属に関する利用規約が凄い
    hoPPen
    hoPPen 2014/05/20