データ整形ツールのインストール 英語 データ整形を行う環境を整える 品詞タグづけ器のインストール 実際の整形手順と逆になりますが、まず品詞タグづけ器からインストールします。 ここでは、品詞タグづけ器 TreeTaggerを用いることにします。 TreeTagger の配布ページ にある"Parameter files for PC (Linux and Windows, Latin1 character set)"とある項目の、 English parameter file(english-par-linux-3.1.bin.gz) と Windows version の TreeTagger 本体(tree-tagger-windows-3.1.zip) とをダウンロードしてください。 ダウンロードしたファイルを展開します。まず、TreeTagger 本体である tree-tagger-
2008-09-01 RecentDeleted 2008-07-18 MenuBar FrontPage CPPLAPACKのインストール方法 2007-07-13 自然言語処理ツール 2006-10-02 関連行列計算プログラム 2006-07-27 プリンタの使い方 2006-07-23 担当講義/知識システム論/2006 2006-07-22 Linuxメモ 担当講義 ChaSen † 奈良先端科学技術大学院大学松本研究室にて開発された、日本語形態素解析器です。使い方などは、同梱のReadmeに詳しく書いてありますので、よく読んで使ってください。品詞体系として、IPA品詞体系を使用しています。 UNIX版は辞書は別配布ですが、Windows版はコンパイル済みの辞書が付属しています。UTF-8を使うためには辞書を変換する必要があるので、中国語を扱う人は、ぜひ辞書のコンパイルもできるよ
#!/usr/bin/env python # -*- coding:utf-8 -*- """ feature_vector.py % python feature_vector.py file import feature_vector result = feature_vector.analyse(text) """ import MeCab def analyse(text): while node: surface = node.surface.decode('utf-8') node = node.next return feature_vector if __name__ == '__main__': import sys filename = sys.argv[1] file = open(filename).read() feature_vector = analyse(
Sony Musicの楽曲がiTunes Storeで購入できるようになり、ネットの音楽サービスが変化の兆しを見せる中、日本でもブラウザのアドオンを使ってPandoraが利用できるようになった。 Pandoraは2005年に登場した米国のインターネットラジオで、日本では2007年にアクセスが制限され利用できなくなった。Pandora最大の特徴は、自分好みの曲を自動で選んでくれるところ。「Music Genome Project」というアルゴリズムにより、聴きたい曲を次々と再生してくれる。 例えば、検索窓に「Pharrell」というアーティスト名を入力して曲を再生させる。その曲を最後まで聴くか「▶▶|」ボタンでスキップすると、次はCommonの曲が再生される。そしてN.E.R.D. → Neptunes → Kanye West → Jay-zと続く。自分の好きなアーティストを入力してみると
ふっくらつやつやのごはんに、ホカホカと湯気の立つみそ汁――好きなメニューはいろいろあるけれど、私たちを一番“ほっ”とさせてくれるのは、やはりシンプルな「和食」ではないでしょうか? これだけは押さえておきたい、基本の和食レシピを紹介します。 ■ おいしい「ごはん」の炊き方 まずはこれがなければ始まらない、ごはんの炊き方です。 ▽ ふっくらツヤツヤに炊き上げるには?美味しい「ごはん」の炊き方 - はてなニュース 家でお米をとぐ際、ゴシゴシと力を入れてといでいませんか? 力を入れすぎると米粒が割れて味が損なわれてしまうので、たっぷりの水でサッと洗う程度でOKです。上記の記事では炊飯器で上手にごはんを炊くコツや、老舗料亭・京都吉兆嵐山本店の総料理長、徳岡邦夫さんが教える鍋を使ったおいしい炊き方を紹介しています。 炊き方はもちろん、お米の保存状態も味を大きく左右します。おいしく保存する方法については
他人から褒められると運動技能の成績がよくなるという実験結果を、名古屋工業大学などの研究グループがまとめ、「褒めて伸ばすということばが科学的に証明できた」としています。 実験を行ったのは名古屋工業大学などの研究グループです。 グループでは右利きの男女48人を対象に、左手を使ってキーボードで5桁の数字を30秒間にわたって、できるだけ多く何度も入力する運動技能の実験を行いました。実験は12回行われ、実験の後、48人は「他人から褒められる」と、「他人が褒められるのを見る」、それに「自分の成績を見るだけ」の3つのグループに分けられたということです。 そして、翌日にも同じ実験を行うと、他人から褒められたグループは、入力回数の成績が20%よくなっていた一方、ほかの2つのグループは、いずれも14%程度の伸びにとどまっていたということです。 名古屋工業大学、テニュア・トラック准教授の田中悟志さんは「運動機能
A module treetaggerpoll.py, available in the repository near the wrapper, allows to use several taggers within a multiprocessing context (text tokenizationis realized in Python script), to achieve maximum use of your computing resources. $ python treetaggerwrapper.py --help treetaggerwrapper.py Usage: python treetaggerwrapper.py [options] input_file Read data from specified files, process them one
このエントリーは、Python入門者と、Python入門予備軍の方を対象としています。 どうしてPythonやるの? Pythonって覚えやすい言語なんです。といっても、それなりに使いこなせるようになるには、数十時間程度はかかるわけです。なんとなく・・で勉強するなら、やらないほうがましです。ちゃんと、自分なりの目標を設定してから勉強しましょう。私の目標は、2011年中に、Pythonで日本国内でそこそこ有名になることです。そこそこでいいです。pythonでぐぐって10番ぐらいに表示されれば満足です。それぐらい有名になったら、来年はPythonで仕事しつつ、他のこと勉強してると思います。 実は世界的にはPHPより人気がある Pythonは、Java、C、C++に次いで人気のある言語です。決してマイナー言語ではありません。 2011年2月のランキング GoogleAppEngineで使える ク
069.音節 これまでの学習を通じて、個々の音素(単独での子音・母音)を発音記号によって正しく発音できるようになり、さらに英語特有の音声学的現象について代表的なものをさらったことで、かなり英語的(「英語っぽい」ではない)な発音のあり方が見えてきたと思う。 ここまでの内容について十分理解し、練習されたのであれば、英語の発音についての基礎はほぼできた状態にある。ここから先の内容は、ある意味発展的なものとなる要素も含まれているので、このまま続けて読み進めていただいてもいいし、文法について早く学びたいとうずうずしている人は、いったん、ここから先の発音関連をとばしてしまい、文法の章に進まれても結構である。折を見て、また発音について「一層の上達」を求めて、この先の内容を読んでいただくだけでもよいと思う。(この先もずっととばしたままでは、ちょっと困るが) さて、ここでは「音節」というものについて述べる。
○○を意識すると、カタカナ英語が治る発音が苦手、なぜかネイティブに通じない、カタカナ英語になってしまう……そんな人は「音節」を意識してみましょう。正しく音節が見分けられたら、次は正しくストレスをつけましょう!これでカタカナ英語卒業! 「音節」を意識すると、カタカナ英語は治る!自分ではちゃんと発音しているつもりなのに、なぜかネイティブに通じない、カタカナみたいで英語らしく聞こえない、という人は「音節」を意識してみましょう。「音節(syllable=シラブル)」とは音声の単位で、最も小さなひとまとまりの音のこと。どの単語も一つ以上の音節から構成されています。 英語らしく発音するポイントは次の2点。 正しい音節の数 正しい強勢(ストレス)の位置 日本語と英語はこの2点が全く違うので、英語の音節ルールで発音しなければ、個々のアルファベットの音が正しく発音できていても、全体として英語らしく聞こえませ
現在大学1年生の人で3年後には NAIST に (というか松本研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は Perl → Python がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出
アメリカにはアメリカにしかない便利なサービスが沢山あります。一部は日本からでも使えますが、現地アメリカで使うと、よりサービスの盛りあがりを感じます。 これからアメリカに行く人、今アメリカに住んでる人は、ぜひこのまとめを参考にしてみてください。生活がより便利なものになるのは、間違いないでしょう。 旅系 Airbnb 2007年にサンフランシスコで始まった、自分の空き部屋を有料で貸し借りできるサービス。海外旅行ではもはやCouchSurfingに次ぐ鉄板。日本のユーザーが増えることを外国人は望んでいる。 CouchSurfing 読んで字の通り、Couch(ソファー)や空き部屋を利用し、無料で宿を貸し借りできるサービス。バックパッカーには必須のサービス。 Zipcar 去年IPOをして1億7400万ドルの資金を集め、企業価値10億ドルの大企業となった世界最大のカーシェアリングサービス。日本に
思考力とは「物事を考える力」。思考力が高い人は、いつも物事を上手く解決したり、スムーズに作業を進めていきますよね。一方で、思考力が低い人はと言うと、、、 ■同じミスをする ■要領が悪い ■物覚えが悪い このような共通点は、勉強や仕事にも大きな支障をきたします。私なんて、、、と悩みこんでします前に一度思考力を鍛えてみませんか? 今からお話しする内容を継続して行う事が出来れば、物事を上手く解決したり、スムーズに作業を進めていくことが容易になります。そう、まさに「継続は力なり」。では早速始めましょう 思考力で人生を変える為に:複数のトレーニングを行うまず、「思考力」という言葉について考えてみましょう。「力」と付いているからには、「体力」や「腕力」、「脚力」と同じジャンルに分類されます。 たとえば「腕力」を鍛える場合、もちろん鉄アレイでトレーニングをすることが重要です。しかしそれだけで良いでしょう
本日、はてなブログはサービス開始から1周年を迎えました。1年にわたってサービスを成長させることができたのも、ひとえにユーザーの皆さまのおかげです。ありがとうございます! はてなブログ1周年を記念して、皆さまに「ありがとう」の気持ちを込め、iPod touchなど豪華賞品が当たる「はてなブログ1周年! ありがとうキャンペーン」を実施します。プレゼント賞品や応募方法などについては、エントリーの最後をご覧ください。<キャンペーン概要までスキップする> はてなブログの1年間(ここがおすすめ!) はてなブログは、「しっかり落ち着いて書けるブログ」を目指して日々進化を続けています。この1年でもたくさんの機能を追加してきました。最近の機能追加の中から、特におすすめのポイントをご紹介します。 書くネタに困らない 「編集サイドバー」を使うと、Twitterのツイートや、Instagramに投稿した写真、はて
田中真紀子文科相は秋田公立美術大など3大学の2013年度開校を不認可とした問題について6日に大学設置認可に関するあらたな検討委員会を発足させる意向を表明した。 文科相の諮問機関である大学設置・学校法人審議会の見直しをこの委員会で行い、改めて3大学の設置認可を判断することとして、来春の開学への可能性を残す考えである。 大臣は設置審議が「許可されてから工事をするならわかるが、ビルが建って、教員も確保してから、認可申請をするというのは筋違いだ」と批判した他、設置審議会の構成が委員29名中22名が大学関係者であることを咎めて、「多くのジャンルの方の意見を聞きたい」とした。 不認可という爆弾を放り投げてみたものの、世論の袋叩きに遭って、あわてて引っ込めたということである。 政治的にはそれだけの単なる失策に過ぎないが、この失策の背後には大学教育をめぐる本質的な問題点がいくつも透けて見える。 ひとつは文
先日のプログラマ向けデザイン勉強会で発表された「少ない手間と知識で”それなり”に見せる、ズルいデザインテクニック」(by 赤塚さん)の中に書かれていたSassのMixinをRailsで使えるGemにしてみました。 zurui-sass-rails: https://github.com/mahm/zurui-sass-rails sample: http://zurui-sample.herokuapp.com/ うおおずるい!w RT @mah_lab: .@ken_c_lo さんのズルいデザインをGemにしてみました。 github.com/mahm/zurui-sas… サンプルはこちら zurui-sample.herokuapp.com (based on github.com/machida/Custom…) — TAEさん (@ken_c_lo) 11月 7, 2012 @m
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く