タグ

2010年4月6日のブックマーク (26件)

  • MeCabのRubyバインディング (マルッと!)

    MeCabのRubyバインディングを試してみました。 まずは、下記のページを参考に、ダウンロードしてインストール。 http://mecab.sourceforge.net/bindings.html http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205294 付属のテストコードを見てみる。 #!/usr/bin/ruby require 'MeCab' sentence = "太郎はこのを二郎を見た女性に渡した。" begin print MeCab::VERSION, "\n" c = MeCab::Tagger.new(ARGV.join(" ")) puts c.parse(sentence) n = c.parseToNode(sentence) while n do print

  • MeCab: Yet Another Japanese Dependency Structure Analyzer

    スクリプト言語のバインディング $Id: bindings.html 161 2008-02-03 09:58:46Z taku-ku $; 概要 各種スクリプト言語 (perl, ruby, python, Java) から, MeCab が提供する形態素解析の機能を利用可能です. 各バインディングは SWIG というプログラ ムを用いて, 自動生成されています. SWIG がサポートする他の言語も 生成可能だと思われますが, 現在は, 作者の管理できる範囲内ということで, 上記の4つの言語のみを提供しております. インストール 各言語バイディングのインストール方法は, perl/README, ruby/README, python/README, java/README を御覧下さい. とりあえず解析する MeCab::Tagger というクラスのインスタンスを生成し, pa

    gologo13
    gologo13 2010/04/06
    SWINGによるいろんなLLへのバインディング
  • TABLOG:TED.comは、最高レベルの英語学習コンテンツでは? - livedoor Blog(ブログ)

    2009年05月21日 TED.comは、最高レベルの英語学習コンテンツでは? すでに、いろんなところで紹介されているのですが、TED.comというサイトがあります。Technology,Entertainment,Designの頭文字をとって、TEDだそうです。 TEDは、世界の超一流の人物が、年に1回集まり、開かれるカンファレンスです。 その講演ビデオが、ネット上に無料で公開されているのですが、この動画が、「英語学習の教材としての要件を確保」しながら、「2009年の今、話を聞くべき人物の、話を聞くべきアイデア」を紹介しているという二つの要素を高い次元で両立させています。 これが、いろんな意味で「最高」レベルの英語学習コンテンツのように思えてきました。「話す人物」も最高レベル。「話される内容」も最高レベル。講演後のスピーチに対する「取り扱い」も・・・。 これまでもMITのオープンコースウ

  • 英語中級レベルの理系にとって、最良の英語学習コンテンツとは? - A Successful Failure

    TABLOGにおいてTED.comが最高レベルの英語学習コンテンツとして紹介されており注目を集めている。確かに素晴らしい教材であることは確かだが、内容的にもレベルが高すぎてかなりモチベーションが高くないと続けるのはキツい。万人にとって適したコンテンツは存在しない。自分の能力、要求にあったコンテンツを選ぶ必要があるのだ。 今回、エントリでお勧めするのは、NHK英語と他の16カ国語で配信しているNHK WORLD RADIO JAPANだ。Podcast配信されており、iTunesで購読しておけば毎朝最新のニュースがiPodの中に入っている。15分の放送時間中に伝えられるニュースは多くても5つほど。短い時間で聞くことが出来るのは大きなメリットだ。もちろん購読は無料で、NHKに受信料を払う必要もない。 NHK英語ニュースによる英語学習が効果的なのは次の条件に合う人だ。 技術者、研究者など、

    英語中級レベルの理系にとって、最良の英語学習コンテンツとは? - A Successful Failure
  • podcastの面白さ重視で飽きない英語コンテンツを探してる。

    TOEICのスコア上げたい人は英会話レッスンものを見ればいいが、そうじゃなくて、特にせっぱつまってないけどある程度は英語分かるようになりたい人として、飽きずに抵抗無く続けて見られる面白コンテンツがもっと知りたい。英会話レッスンくさくない、かつ初歩的過ぎないものというワガママなニーズ。 ゆっくりレッスンものはビジネス英会話とかのお勉強にはいいんだろうけど、話自体がつまらん。飽きて見なくなるから、内容的に色々あって飽きないやつ。ラジオも聞いてるだけじゃ飽きるからビデオしか見てない。こういうニーズもあると思うんだけど、なんでpodcastの内容についてのユーザーレビューがあんまりないんだろう。利用者はまだまだ少ないんだろうか。iTunesが重くてpodcast探すのもめんどくさいのに。 とりあえず今のところ飽きてないやつABC World News Webcast ←普通のニュースだけど、メイン

    podcastの面白さ重視で飽きない英語コンテンツを探してる。
  • スティーブ・ジョブスのスピーチをiTunesに入れて聴きまくろうよ! | nanapi[ナナピ]

    スティーブ・ジョブスのスピーチをiTunesに入れて聴きまくろうよ! に関するライフレシピをご紹介します。nanapi [ナナピ]は、みんなで作る暮らしのレシピサイトです。Steve Jobs のスピーチを聞きまくると英語とスピーチの訓練になるよ Macbook、iMac、iPod、そして iPhone。  今や知らない人がいない Apple社の製品ですが、その創業者であるスティーブジョブスの、スタンフォード大学卒業式で行われたスピーチもとても有名です。 Apple創始者・スティーヴ・ジョブスの伝説のスピーチ(1)(日語訳付き) Apple創始者・スティーヴ・ジョブスの伝説のスピーチ(2) 英語版テキストで読みたい方はこちら 日語翻訳版のテキストはこちら 英語もスピーチも、どちらも大事なのは”リズム” ジョブスのこのスピーチはもちろん内容も素晴らしく感動的なものですが

  • Steve Jobs Stanford Commencement Speech Audio Download

    Apple and Pixar CEO, Steve Jobs, spoke at Stanford's commencement on June 12, 2005.Steve Jobs Speaks at Stanford Commencement The creator of the famous "Reality Distortion Field" has done it again! This inspiring speech is guaranteed to lift you out of your chair, quit your job and go out there to find your true love. Ok. Maybe not really. But it will make you think twice about what you are doing

  • 【最新まとめ】Podcast英語リスニング用エントリー厳選6本+3本。【lifehack】

    2010年01月21日 21:09 カテゴリ 【特集】ライフスタイルに定着したPodcastによる英語学習エントリーのまとめ。 Posted by meganeou No Comments No Trackbacks ラジオ系のエントリーを紹介するブログのために、 ラジオの進化系として誕生した、 Podcastのエントリーを読みまくっています。 豊富なPodcastのソフトの中でも、 英語ニュースなどのPodcast英語学習に利用しているエントリーの豊富さには、 目を見張らせるものがあります。 あまりに豊富なので、 厳選した6つのエントリーを紹介させていただきます。 英語中級レベルの理系にとって、最良の英語学習コンテンツとは? - A Successful Failure・TOEICで700~900点程度の英語能力を持つ人にとっては学習効率が良い ・聞き取れない人は、家を出る前にNH

  • mecab-skkserv MeCab を使ってかな漢字変換

    mecab-skkserv とは mecab-skkserv は, 形態素解析器 MeCab を用いたシンプルな仮名漢字変換サーバです. SKK は通常,「単語単位」の変換のみをサポートしますが, mecab-skkserv では, 「文単位」の変換が可能となります. 目次 特長 変更点 ダウンロード インストール 使い方 辞書への単語登録 注意事項 TODO リンク 特長 SKK は通常,「単語単位」の変換のみをサポートしますが, mecab-skkserv では, 「文単位」の変換が可能となります. 連文節を含む比較的長い入力でもそれなりに賢く変換してくれます. 単語連接コストや単語生起コストは, HMM に基づく確率的な推定に基づいて 与えられています. MeCab が出力する N-best 解 を変換候補として用いており, 通常の SKK よりは 多くの変換候補をそれなりのランキン

  • mecab-gree-20060411.ppt

    MeCab 汎用日形態素解析エンジン 工藤 拓 アジェンダ 形態素解析技術 辞書引きのアルゴリズム、データ構造 曖昧性の解消 MeCab の開発裏話 歴史 設計方針 汎用テキスト変換ツールとしての MeCab 恐ろしく汎用的! 「意外な」使い方 これから 形態素解析 文を単語に区切り、品詞を同定する処理 全文検索 Spam フィルタリング 人工無能... 以下の3つの処理 単語への分かち書き(tokenization) 活用語処理(stemming, lemmatization) 品詞同定(part-of-speech tagging) すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*

  • 大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google) - Cafe Babe

    第80回知識ベースシステム研究会を開催したが,二日間で58名の方々に参加して頂き,積極的に議論に加わって頂いた.この場を借りて,参加してくれた方々に感謝したい.大変遅くなった(爆)が,Googleの工藤拓氏による招待講演「大規模テキスト処理を支える形態素解析技術」の概要を,このブログで報告しておきたい.工藤氏の専門分野は統計的自然言語処理と機械学習であるが,日形態素解析エンジンMeCabの開発者であり,他にも自然言語処理関連の有益なツールや,Webベースの日本語入力を可能にするAjax IMEのようなユニークなサービスを提供しているなど,時代をリードする研究開発者の一人である.彼の活動に興味があれば,彼のブログ「きまぐれ日記」は必見だろう. なお,当日は弊社側の不手際で,予定していた工藤氏の重要なデモをおこなうことができなかった.弊社はネットワーク会社であるにもかかわらず,ネットワーク

    大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google) - Cafe Babe
    gologo13
    gologo13 2010/04/06
    工藤氏はMeCabを汎用テキスト処理ツールとして考えて貰いたいようだ
  • SWIG (Simplified Wrapper and Interface Generator)

    Welcome to SWIG SWIG is a software development tool that connects programs written in C and C++ with a variety of high-level programming languages. SWIG is used with different types of target languages including common scripting languages such as Javascript, Perl, PHP, Python, Tcl and Ruby. The list of supported languages also includes non-scripting languages such as C#, D, Go language, Java inclu

  • きまぐれ日記: もっと SWIG を!

    はてなでは XS を使い始めて処理速度が改善されつつあるようです。 スクリプト言語へのバインディングは、もはやミドルウェアには必須の機能だと思います。 しかし、最近気になっているのは、少なくとも日では XS 直書きのようなスクリプト言語固有の機能を直接使ってバインディングを作成している開発者が圧倒的に多いということです。 正直なところSWIG をもっと使ってほしいです。 私が気に入っている点は以下です。 1. SWIG はスクリプト言語固有のバインディング作成バッドノウハウを エレガントにラップしてくれます。たとえば、例外処理などがいい例ですが、 SWIG のインタフェイス上で例外処理を書いておけば、 各言語の例外処理のシンタックスに適切に変換してくれます。 2. バンディングレベルで OOP の機能が無く、プリミティブな関数呼び出ししかできない スクリプト言語(perl,python,

  • http://www.nesugi.net/hiki/?swig%A4%CE%BB%C8%A4%A4%CA%FD%A4%CE%A5%E1%A5%E2%BD%F1%A4%AD

    gologo13
    gologo13 2010/04/06
    C++から他言語へのバインディング
  • きまぐれ日記: 「読めてしまう」コピペがなぜ読めてしまうのか

    http://www.asks.jp/users/hiro/59059.html http://www.itmedia.co.jp/news/articles/0905/08/news021.html 最初読んだとき、違和感なく読めてしまったのですが、よくよく見てみると、そんなトリックがあったのですね。 さて、この「読めてしまう」がなぜよめてしまうのでしょうか? 人間の言語モデルの単語パープレキシティは、約100ぐらいであると言われています。どういうことかというと、 人間が文章を読んでいるときに、次の単語を過去の文章から推測するのは 1/100 程度の 確率で正解するということです。 件のコピペですが、最初の文字は変わらないので、その正解率は平仮名の数(52)倍になります。 すなわち、52/100 =~ 0.5 実際には、最後の文字も変わらないし、 単語の長さが変わらないというもの、大きな

    gologo13
    gologo13 2010/04/06
    人間の言語モデルの単語パープレキシティは、約100ぐらいであると言われています。
  • 読めることが間違い? : ひろゆき@オープンSNS

    【教えてくん】コミュニティーなのです。 なんかニュースとかあったらここに書こうかと思ってますよ。とりあえず、おいらのブログ 読めることが間違い? 390 名前:なまえをいれてください[sage] 投稿日:2009/05/08(金) 00:37:47 ID:Oqxr6eLt こんちには みさなん おんげき ですか? わしたは げんき です。 この ぶんょしう は いりぎす の ケブンッリジ だがいく の けゅきんう の けっか にんんげは たごんを にしんき する ときに その さしいょ と さいご の もさじえ あいてっれば じばんゅん は めくちちゃゃ でも ちんゃと よめる という けゅきんう に もづいとて わざと もじの じんばゅん を いかれえて あまりす。 どでうす? ちんゃと よゃちめう でしょ?

    gologo13
    gologo13 2010/04/06
    自然言語的にかなりすごくないかこれww
  • COM Meets Ruby

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • ActiveScriptRuby and Other packages

    RScript(Ruby IActiveScript wrapper)についてのバグ報告や要望はGithubのIssuesに登録してください。 Ruby MSI Packages Ruby-2.4.0 (i386-mswin32_100) Microsoft Installer Package (2016-12-24 revision 57164) 19,310,592バイト (msi 1.0.0) MD5 checksum: dd445a60ce6164374ab4689990dfc6f1 ActiveScriptRubyのバージョン付きLanguage名はRubyScript.2.4です ActiveScriptRuby(RubyScript.2.4), RJBを含みます。なおriドキュメントは省略しています。 リファレンスはDiceさんが作成されたRubyリファレンスマニュアル ch

  • Beautiful Soup: We called him Tortoise because he taught us.

    You didn't write that awful page. You're just trying to get some data out of it. Beautiful Soup is here to help. Since 2004, it's been saving programmers hours or days of work on quick-turnaround screen scraping projects. Beautiful Soup is a Python library designed for quick turnaround projects like screen-scraping. Three features make it powerful: Beautiful Soup provides a few simple methods and

    gologo13
    gologo13 2010/04/06
    HTML/XMLパーサ
  • 最近のコンピュータ将棋の強さは情報処理学会のお墨付き - 武蔵野日記

    @unnonounoさんの人知への挑戦というポストで知ったのだが、情報処理学会が日将棋連盟に「コンピュータ将棋」で挑戦状を出したらしい。 挑戦状に対する返信の文面が米長日将棋連盟会長っぽい(笑)が、コンピュータによる挑戦を逃げないところが潔くてすばらしい。だいぶ前から終盤の読みはプロといえどコンピュータに勝てないところに行っていたのだが、Bonanzaの登場以降序盤や中盤も強くなってきて、そろそろ人間のプロ相手にも善戦できるくらいになってきた。それで、その手始めに女流トップ棋士の清水市代女流王位・王将が選ばれた、というわけである。 彼女は自分が中学高校の将棋部で将棋をやっていたころからトップ女流プロだったのだが、あれからかれこれ20年、ずっとトップに君臨し続けているというのもすごい話である。囲碁は男性と女性の区別がなく、両方同じプロ棋士になるのだが、なぜか将棋は男性と女性の強さに差があ

  • Windows PowerShellクックブック

    書はPowerShellを使ってさまざまな処理を行うための方法を解説します。「PowerShellの基」「一般的なタスク」「管理者タスク」という3部構成で、様々な場面で発生しうる実際的な問題を260例集め、それぞれに解決法を示します。 「一般的なタスク」では、対話的なシェルの利用法、パイプラインの基礎とオブジェクトの概念、スクリプト言語としての特徴などを解説します。「管理者タスク」では、実践的なレシピを網羅。システム管理として、Windowsレジストリ、イベントログ、プロセスなど管理方法を扱い、エンタープライズ管理として、WMI、Active Directory、その他エンタープライズ指向のタスクなどを扱います。またExchange Server 2007とOperations Manager 2007管理者のためのタスクもカバーします。 PowerShell開発チームに初期から携って

    Windows PowerShellクックブック
  • 因数分解機

    使用方法 「式」のテキストボックスに因数分解する式を入力して 「計算」ボタンをクリックすると,「答え」テキストボックスに 因数分解された式を表示します。 数字のみを入力すると,素因数分解された式を表示します。 式の入力 変数はすべて x(半角,大文字小文字どちらでも可)です。 素因数分解するときは数字のみを入力してください。 x の2乗は「x2」と入力してください。 半角スペースは入力しても無視されます。 例えば,「式」の欄に次のように入力すると・・・ 2x3 + 3x2 - 17x + 12 「答え」欄には次のように表示されます・・・ (x - 1)(x + 4)(2x - 3) また多くのブラウザでは,式も表示されます・・・ 2x3+3x2-17x+12 = (x-1)(x+4)(2x-3)

  • 正規表現エンジンを作ろう一覧

    CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

    正規表現エンジンを作ろう一覧
  • 何故駄目なのか?: 御手洗特急途中下車

    C言語で配列に配列を代入するのは何故駄目なのか C言語で配列に配列を代入すると、コンパイルエラーが発生します。例えば以下のコードをgccでコンパイルしようとすると、"incompatible types in assignment"というエラーが発生します。 1 /* header files */ 2 #include <stdlib.h> 3 #include <stdio.h> 4 5 /* main */ 6 int main (int argc, char *argv[]) { 7 char c1[] = "afa"; 8 char c2[4]; 9 10 c2 = c1; 11 12 return EXIT_SUCCESS; 13 } |10| error: incompatible types in assignment "incompatible types in assi

    gologo13
    gologo13 2010/04/06
    左辺が全体,右辺が最初のポインタか.
  • http://www.rubyist.net/~rubikitch/computer/rd-intro/

    gologo13
    gologo13 2010/04/06
    これで日記書いてみようかなー./2010-05-24 結局書いてない。はてな記法を使ってる
  • mekentosj.com | Introducing Papers... Your personal library of science

    Papers, your© Mekentosj B.V. Gerberastraat 117 1431 RA Aalsmeer, The Netherlands. KvK Amsterdam 34282675. All rights reserved. XHTML | CSS