Trackback - http://f.hatena.ne.jp/gorilla-boots/20081201221740
去る1月22日木曜日、twitterで集まった、id:cooh(@cooh) id:gotto-s(@gottos) id:Iketaki(@Iketaki) id:quolc(@quolc) id:shitu(@shitu) の五人の高校生で、ピクシブ株式会社に社会科見学に行ってきました。 今回の会社見学はtwitter上での id:cooh とpixivさんのtwitterアカウントとの交流を発端として実現しました。そのときの経緯は次のような感じ。 くー @cooh株式会社ピクシブを見学したいな。高校生の職業体験的に。 (2008-12-22 02:57:33)link pixiv / pixiv Inc. @pixiv@cooh ぜひぜひ。集団(5,6人)くらいで着ていただけると話しやすいです。 (2008-12-22 02:58:31)link くー @cooh@pixiv っ
昨日の晩あたりから、形態素解析したい気分だったのでやってみました。 形態素解析というのは以下のようなもの。 対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を情報源として用い、自然言語で書かれた文を形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの品詞を判別する作業を指す。 形態素解析 - Wikipedia 圧縮新聞にも使われているそうです。 「圧縮新聞」を作った - phaの日記 今回は、MeCab(和布蕪)という形態素解析エンジン利用させて頂きました。 Ubuntu環境で実験しましたが、大抵同じような作業で動くと思います。文字コードの指定のみ適時読み替えてください。 ファイルの取得 MeCab本体(mecab-0.97.tar.gz)、辞書ファイル(mecab-ipadic-2.7.0-20070801.
ゼミ用資料 関係のない方はスルーしてください グーグル様に聞けばすばらしい資料がいっぱい出ますが、とりあえず出たやつをまとめました。 無料のものから商用向けまで非常に多くの形態素解析エンジンが開発されている。 形態素解析とは? 対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を情報源として用い、自然言語で書かれた文を形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの品詞を判別する作業を指す。 自然言語で書かれた文を、形態素(言語で意味を持つ最小単位)に分割する技術です。この際、辞書 (「品詞」などの情報つきの単語リスト)中の情報を参照することで、「品詞」、「活用形」、「読み」等の情報を得ることが可能です。 工藤 拓[MeCab 汎用日本語形態素解析エンジン]http://www.jtpa.org/files/M
「やきそばかおるのページ」 ●「お気に入りに追加」はコチラをクリック 「死ぬまでテレビに出ていて欲しいタレントNo1」高田純次氏の発言を集めました。 制作:やきそばかおる 高田純次さん 大活躍情報 ★「アメトーークDVD2」に「高田純次と仲間たち」収録 ★「愛の修羅バラ」(よみうりテレビ:日曜11時40分)大活躍出演中! ★「PS」(中京テレビ)大活躍出演中! ★「高田純次・河合美智子の東京パラダイス」(文化放送ほかネット)大活躍出演中! ★幻の名作「高田純次 無責任社員物語」シリーズDVD 発売中 ※当サイトは「高田純次.bot」とは、一切関係ありません。 ★「アメトーーク」で高田純次さんが大活躍された回に当サイトが紹介されました。 ●「高田純次検定」をつくりました。 12月17日:10語追加 (無断転載禁止:2004年より更新中) ・「こんにちは。いつもステキな高田純次です」 ・「ごめ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く