タグ

2017年4月17日のブックマーク (4件)

  • 自然言語処理における前処理の種類とその威力 - Qiita

    自然言語処理に前処理は不可欠です。テキストは文字の羅列であり構造化されていないため、そのままでは処理するのが難しいです。特にWebテキストの中には HTMLタグ や JavaScript のコードといったノイズが含まれています。このようなノイズは前処理して取り除かなければ期待する結果は得られないでしょう。 出典: Deep learning for computational biology 記事では自然言語処理における前処理の種類とその威力について説明します。説明順序としては、はじめに前処理の種類を説明します。各前処理については、1.どんな処理なのか、2.なぜその処理をするのか、3.実装方法(なるべく) という観点から説明します。種類について説明した後、前処理の威力を測るために前処理をした場合としなかった場合での文書分類の結果を比較します。 前処理の種類と実装 この節では以下に示す5つ

    自然言語処理における前処理の種類とその威力 - Qiita
  • JavaScript is not available.

    Something went wrong, but don’t fret — let’s give it another shot.

    JavaScript is not available.
  • なぜ日本は高度教育を受けた高機能人材を排除したがるのか - 狐の王国

    「学芸員はがん。連中を一掃しないと」 山地方創生相 という記事。さすがにひどすぎて はてなブックマークでもぼこぼこにコメントされてるのではあるが、さてこの発言、既視感があると思わなかっただろうか。 よくわからないのだが、なぜか日の組織は官民問わず専門家というものを軽視する傾向がある。GoogleApple のような高度教育を受けた人材を活かした企業というのもほとんど見られないし、先日も3倍以上の報酬を提示されて香港に転職した人が話題だった。 新聞が書く記事は専門家が見たら笑っちゃうような間違いだらけだし、かといって専門家の監修を呼ぶということもない。政策提言などを見てもエビデンスを無視したおかしな「専門家」が跳梁跋扈している。 思い起こしてみると、日の大企業が崩壊して外資に買われた途端に黒字化できたり、経営危機になぜか優良部門を売却しようとしたり、どうも国内トップの判断がおかし

    なぜ日本は高度教育を受けた高機能人材を排除したがるのか - 狐の王国
  • 知能を上げる方法

    わたしの知っている知能の高い人たち(wais-iiiでIQ140~くらい出す人たち)はみんな興味のないことが全然できない。 好きなことばっかりやってて、どうでもいいことに対してはすごく冷淡。 でこれまでわたしは彼らのそういう性質は知能の代償なのかなって思ってたんだけど、実は因果の向きが逆で、好きなことしかできないから彼らは知能が高いんじゃないかって思うようになった。 そう考える理由をちょっと説明してみたい。 まず人類の学問の体系は、だいたいどんな分野であれ似たような方法論に依っている。 物理学でも文化人類学でも計算機科学でもやっていることはだいたい同じだ。 で、知能というのはそこで共通する一般的な思考の枠組み、ものの見方だと思われる。 少なくとも知能検査で測られる知能っていうのは、そういう性質を抽象して測るために作られているはずだ。 そしてこの方法論を学ぶには、浅く広く物事を知るよりも、ひ

    知能を上げる方法