タグ

studyに関するemergentのブックマーク (97)

  • Perl で自然言語処理

    PyData Tokyo 05 でのLTのプレゼン資料です。 絵文字に対応した mecab-ipadic-NEologd は以下からダウンロードできます。 https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md 以下は資料のまとめです。 - mecab-ipadic-NEologdで絵文字に読みを付与するためのエントリを”試験的”に追加したという話 -mecab-ipadicと併用すれることで、絵文字の読み・原型の文字列で検索が可能になりました - 応用 => 言語処理・音声処理・コンテンツ監視等が考えられます - 今後アノテーションは徐々に改善していきます

    Perl で自然言語処理
  • Texture-Aware Image Resizing

    Team Member: Tai-Hsu Lin(B93901167), Cheng-Yi Chiang(B93901107) Figure 1: The bidirectional similarity. Completeness (backward similarity) and coherence (forward similarity) together preserve the important information and image smoothness at the same time. In the final project, we have implemented the content-aware image resizing algorithm of [1] and tried to improve it by applying patch dimension

    emergent
    emergent 2010/04/24
    下のほうに載ってる処理サンプル(?)が怖いんですけど…
  • 404 not found

  • だからその論文はリジェクトされる - 大「脳」洋航海記

    【研究方法】 論文がまるで書けない時vs.スラスラ書ける時 [1] どれくらいの研究内容ならどんな雑誌に載るのか:ヒト認知神経科学(fMRI)の場合 [2] - 当blog 与太話が連発してるので、便乗してさらに悲惨なネタを書いてみようと思います。題して「だからその論文はリジェクトされるんだ!」・・・rejectの回数がacceptの回数を大幅に上回っているからには、こんなものを書いてみてもかなりの説得力があるだろうと思いますので。:cool: 今回も「初めて投稿論文を書くD1ぐらいの学生さん向け」でいきます。 とりあえず以前の与太話も踏まえて、そして自分の過去(現在も?)の失敗談を思い出しながら、「こういう時にorこういうことをしているとその論文は必ずリジェクトされる」というシチュエーションを書いていこうと思います。なお、今回も基的には僕の研究テーマであるヒト認知神経科学分野での事情を

    emergent
    emergent 2009/10/21
    仕事でも言えることだなぁ
  • ぜひ押さえておきたいコンピューターサイエンスの教科書

    僕はバイオインフォマティクスという生物と情報の融合分野で研究を行っています。東大の理学部情報科学科にいた頃は同僚のマニアックな知識に驚かされたものですが、そのような計算機専門の世界から一歩外に出ると、それが非常に希有な環境だったことに気が付きました。外の世界では、メモリとディスクの違いから、オートマトン、計算量の概念など、コンピューターサイエンスの基礎知識はあまり知られていませんでした。コンピューターサイエンスを学び始めたばかりの生物系の人と話をしているうちに、僕が学部時代に受けた教育のうち、彼らに欠けている知識についても具体的にわかるようになってきました。 バイオインフォマティクスに限らず、今後コンピュータを専門としていない人がコンピューターサイエンスについて学ぶ機会はますます多くなると思われます。そこで、これからコンピューターサイエンスを学ぼうとする人の手助けとなるように、基礎となる参

  • スタンフォード大学の自然言語処理(NLP)の授業公開っぷりがとてつもない件 - Unchained Life

    以前からMITのOCWを中心にアメリカの大学の授業のビデオや資料などが公開されているのは知っていたが、今日知ったスタンフォード大学の授業公開っぷりがものすごい。 http://see.stanford.edu/SEE/lecturelist.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a 授業のビデオだけではなく、なんと授業のtranscript、つまり授業中に先生がしゃべったことがテキストに書き起こされているのだ。 MITなどでも授業のビデオは公開されていたが、当然授業の内容を理解するには授業資料がある場合にせよ、何をしゃべっているかを自分で聞き取るほか無く、リスニング力が低い僕には結構ネックだった。 それが今回しゃべる内容がテキストになっているということで聞き取れなくてもテキストを見ればよいし、リスニングの勉強にもなる。 しかも公開されてい

    スタンフォード大学の自然言語処理(NLP)の授業公開っぷりがとてつもない件 - Unchained Life
  • JAFST : Vol. 13 (2008) , No. 1 pp.83-92

    犯罪者プロファイリングにおけるベイジアンネットワーク活用の有効性についての一考察─屋内強姦における犯人の職業に関する確率的推定─ Offender profiling is one of the tools of decision making for criminal investigation. It is a set of techniques to infer characteristics of an unknown offender, such as sex, age bracket, lifestyle, psychological feature, previous crime, inhabited area, from the information which is left at the crime scene.   In this article, we prop

  • 爆速!!!"歩く"アニメーションの作り方|_level0.KAYAC

    アニメーションの作業を人に頼んだときに 相手のセンスとスキルを測れる動きがあります。 それが"人の歩行" なぜ"人の歩行"かというと、 ・誰でも毎日見る動きなのでモチーフとして公平。 ・表現するには観察力が必要。 ・自分をモデルに出来る。 ・モーショントゥイーン(クラシックトゥイーン)の特性をある程度理解している必要がある。 という理由です。 そんなセンスとスキルがモロバレになるアニメーションでも、 コツさえつかめば3分で作れる魔法のtippsを今回はご紹介。 ちなみにCS4から今までの "モーショントゥイーン"が"クラシックトゥイーン"になりましたが、 細かい動作が必要な場合には"クラシックトゥイーン"が向いているように思います。 今回紹介するtippsも"クラシックトゥイーン"で制作しています。 前置きが長くなりました。 続きを読む ココがポイント タイムラインをコピーして逆に動く手と

    爆速!!!"歩く"アニメーションの作り方|_level0.KAYAC
  • エンジニアがタイトル買い、著者買いすべき本 - Fight the Future

    著者買いすべき! ファウラー、ジョエルは知名度もあり、改めて僕がどうこう紹介する必要はないと思うけど、ここではスティーブ・マコネルを特に推したい。 読んだ人には非常に高い評価を得ているけれど、その分厚さや価格もあってなかなか広まっていない。 特にCode Completeはすべてのエンジニアが必ず読むべきだと思ってる。 これを読んで理解する/しないが(職業プログラマとしての)初級と中級の境界だと言えるくらい。 タイトルにはCodeとあるけど、別にコーディングをターゲットにしたではない。 設計、テストも含めてコーディングを考えている。当たり前だがコーディングだけではコーディングはできないからだ。 上下巻1,200ページの大作だし、2冊で12,000円だがその価値は大いにある。 スティーブ・マコネル ソフトウェア見積り―人月の暗黙知を解き明かす 作者: スティーブマコネル,久手堅憲之,S

    エンジニアがタイトル買い、著者買いすべき本 - Fight the Future
  • 大規模データを基にした自然言語処理 - DO++

    人工知能問題研究会 (SIG-FPAI)でタイトルの題目で一時間ほど話してきました。 発表資料 [pptx] [pdf] 話した内容は - 自然言語処理における特徴ベクトルの作り方と、性質 - オンライン学習, Perceptron, Passive Agressive (PA), Confidence Weighted Learning (CW) 確率的勾配降下法 (SGD) - L1正則化, FOLOS - 索引を用いた効率化, 全ての部分文字列を利用した文書分類 で、スライドで70枚ぐらい。今までの発表とかぶっていないのはPA CW SGD FOLOSあたりでしょうか オンライン学習、L1正則化の話がメインになっていて、その両方の最終形の 確率的勾配降下法 + FOLOSの組み合わせは任意の損失関数に対してL1/L2正則化をかけながらオンライン学習をとても簡単にできるという一昔前

    大規模データを基にした自然言語処理 - DO++
  • 価値の判断基準が自分の外にある人間は表現者になれない - 発声練習

    卒業していく君へ。 卒業おめでとう。当は面と向かって言ったほうが良いのだけど先生という立場だと私の発言が思った以上に重くなってしまうので直接君にはいえない。でも、君への言葉を一度形にしておかないと私の頭に一生こびりつきそうなのでここに書かせてもらうよ。 今年、君は卒論に苦しんだね。君が卒論に苦しんだ理由は自分でも分かっていると思うけど、常に外部に正解を求めたことにあるんだ。私が「どうして、それが正しいと思うの?その理由を教えて。」と聞くと、いつも君は表情を凍らせて黙ってしまったね。何度も何度も「研究には正解とか不正解とかない。誰も答えを知らないから研究になっているんだ。だから、自分の主張をとりあえず述べて、相手の反論が正しいと思えてから自分は間違っていたと考えれば良いんだよ。」と伝えたのだけど、最期最後まで君は自分の主張の正しさを自分の言葉で言えず、常に私の保証を求めたね。はっきり言って

    価値の判断基準が自分の外にある人間は表現者になれない - 発声練習
    emergent
    emergent 2009/02/28
    コメ欄の議論も参考になる。本文にはほぼ同意。
  • プログラマー面接時の技術的な質問事項(アプレッソ版) - 解答編 : 小野和俊のブログ

    昨日、プログラマー面接時の技術的な質問事項(アプレッソ版)を書いたところ、「自分ならこう答える」というエントリを書いてくれた人が何人かいて、個別にコメントしようかとも思ったのだが、昨日のエントリだけだと質問の投げっぱなしになってしまうところもあるので、解答編を書くことにした。 なお、「面接の質問項目を公表しちゃっていいの?」という指摘もあったが、ブログに書いたのはあくまでも質問項目の一例だし、解法を検討する過程を見れば普段どんな風に開発しているのかはだいたいわかるので、特に問題ない。 for (int i = 0; i < list.getLength(); i++) {}の潜在的パフォーマンスボトルネック list.getLength()がlist.getLength()回評価されてしまう。具体例としては、JREに標準で付属するDOMのライブラリのNodeListの実装はlist.get

    プログラマー面接時の技術的な質問事項(アプレッソ版) - 解答編 : 小野和俊のブログ
  • 10分のトレーニングで3倍速以上に読めるteruyastar速読法 - teruyastarはかく語りき

    さっき1時間前に思いついてやってみたら結構楽しくて、 速読とかできなかった僕でも 「言葉に脳内変換せず読む」事ができました(`ヘ・)=b んで、ざっと「速読」ではてぶホッテントリーやググって 上位の50記事ぐらいみても特にこの方法は書いてなかったので やり方を説明します。*1 どうやったら脳内で声を出さずに速く読めるか? 宮沢賢治「セロ弾きのゴーシュ」 ゴーシュは町の活動写真館でセロを弾く係りでした。けれどもあんまり上手でないという評判でした。上手でないどころではなく実は仲間の楽手のなかではいちばん下手でしたから、いつでも楽長にいじめられるのでした。 ひるすぎみんなは楽屋に円くならんで今度の町の音楽会へ出す第六交響曲の練習をしていました。 トランペットは一生けん命歌っています。 ヴァイオリンも二いろ風のように鳴っています。 クラリネットもボーボーとそれに手伝っています。 ゴーシュも口をりん

    10分のトレーニングで3倍速以上に読めるteruyastar速読法 - teruyastarはかく語りき
    emergent
    emergent 2009/02/09
    やってみる意外とすんなり読める。いいかも
  • kousyoublog.jp – このドメインはお名前.comで取得されています。

    このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年5月時点の調査。

  • いろはかるた比較

    かるたの部屋 いろはかるた 戻る いろはかるた比較表 い 江戸犬も歩けば棒に当る 京都一寸先は闇 大阪一を聞いて十を知る 上方いやいやいろはいやいや三杯 尾張いろは一を聞いて十を知る ろ 江戸論より証拠 京都論語読みの論語知らず 大阪六十の三つ子 上方いやいやいろは論語読みの論語知らず 尾張いろは六十の三つ子 は 江戸花より団子 京都針の穴から天を覗く 大阪花より団子 上方いやいやいろは針の穴から天覗く 尾張いろは花より団子 に 江戸憎まれっ子世に憚る 京都二階から目薬 大阪憎まれっ子神直し 上方いやいやいろは憎まれ子世にはびこる 尾張いろは憎まれ子頭(かみ)固し ほ 江戸骨折り損のくたびれ儲け 京都仏の顔も三度 大阪惚れたが因果 上方いやいやいろは仏の顔も三度 尾張いろは惚れたが因果 へ 江戸屁をひって尻窄める 京都下手の長談義 大阪下手の長談義 上方いやいやいろは下手の長談義 尾張いろ

    emergent
    emergent 2009/02/01
    QMAの参考に
  • Pythonでアルゴリズム - Konnichiwa, A doumo

    これはなんですか? 奥村晴彦氏の著書「C言語による最新アルゴリズム事典」をPythonでやろうと決意。Rubyに翻訳されていたので、Pythonでもやってみようと。でも実は書籍はもっていなくてCとRubyのソースを見つつ翻訳しています。1日1個ペースで進んでいます。 やっているうちにこのが欲しくなってきました。 個人のPython力を高めるために始めましたので、間違いが含まれているかもしれません。ご指摘等ございましたら連絡[syobosyobo at gmail dot com]ください。 ちょっと方針をかえて、ctopyで訳すことにした。またまた方針をかえて、、、ctopyはあまりつかえない。ちょっといじってやらないと、出力がよくない。コメントとか入ってると、うまく変換してくれないし。 で、そのあとPythonらしい書き方で書いていこう、かと。どうなるかわかりませんが。

  • Yapprという動画による集合知的な英語リスニング学習用Webサービスがすごい - yanbe.log

    ひさしぶりにWebサービスで感動しました. http://en.yappr.com/welcome/Welcome.action インターネット上のリソースを使って英語のリスニングを学習するには,今はいろんな方法があって,初学者向けのものだとVoA NewsのPodcastなどが有名ですが,個人的には音声だけだとどうも興味が続かなかったり,話されているトピックに飽きてきたり,またインタフェース的な問題で長いスクリプトを目で追うのが疲れたりして,結局続きませんでした. CNNのニュースなどの動画で練習するのもいいですが,ある程度慣れるまではスクリプトがあった方がシャドーイングをやりやすかったりと,学習効率の面ではベターです.英語の動画対してスクリプトがつけられていて,なおかつ楽にスクリプトが読めるインタフェースのものがないか探してみたら,あっさり見つかりました.YapprというWebサービス

    Yapprという動画による集合知的な英語リスニング学習用Webサービスがすごい - yanbe.log
  • 「赤壁の戦い(レッドクリフ)」の中国版Googleマップがおもしろい

    Googleマップ中国版で、Googleが「赤壁の戦い」を超視覚化して再現したそうです。もちろんコンテンツは中国語になりますが、歴史の教科書なんて目じゃないくらいに興味をそそる内容となっています。 映画好きな人や歴史マニアに限らず、歴史・世界史を学んでいる学生にも是非見て欲しいマップです。 組織のマインドマップツールをマインドマイスターにすべき理由 伸びてる産業、会社、事業を紹介しまくるStrainerのニュースレターに登録!! 赤壁の戦いでの主要人物の動きが視覚化されたGoogleマップ 「The Battle of Red Cliffs」は赤壁の戦いから1800年経った事を記念して、Google ChinaがGoogle Mappletで制作したもの。コンテンツは現在公開されている「レッドクリフ」と連動しています。 歴史上の時系列と人物毎にまとめられ、クリックするとそのときの軍勢の動き

    「赤壁の戦い(レッドクリフ)」の中国版Googleマップがおもしろい
  • 言葉にまつわるあれこれ|国語力検定|Z会 受検者の国語力体験~メダリストと記者との会話3~

    時下、益々ご清祥のこととお喜び申し上げます。 株式会社Z会 国語力研究所では、国語の能力を客観的に測る「国語力検定(中学生から社会人対象)」と「国語力基礎検定(小学3年生以上対象)」を実施してまいりましたが、2017年度より新しく「日語運用能力テスト」としてリニューアルいたしました。 それにともない、国語力検定は、2017年3月をもちまして終了いたしました。2007年度より多くの方にご受検いただき、まことにありがとうございました。 ひきつづき、「日語運用能力テスト」をよろしくお願い申しあげます。 なお、「日語運用能力テスト」の内容につきましては、こちらのページにてご確認ください。 株式会社Z会 国語力研究所

    言葉にまつわるあれこれ|国語力検定|Z会 受検者の国語力体験~メダリストと記者との会話3~
  • 2008-12-03 - 一法律学徒の英語と読書な日々

    TOEICは簡単な勉強で800点取れる」みたいなエントリがしばしばホッテントリ入りしますが、当に「英語が使えること」の真価が発揮されるのは、英語で情報を仕入れられるようになってからです。そして、英語で情報を仕入れるには、英語をある程度早く読むことができないといけない。 あの無教養アメリカ人でさえ、平均して毎分200単語程度読むのに対し、日人で毎分200単語読める人は稀です。ちなみに私は、この方法の実践によって、400〜900単語/分*1程度で読めるようになりました。理解の程度は、ゆっくり読んでいた頃と変わりありません。むしろ、英文になれたおかげでよくなったと言えるかもしれません。 エントリで紹介する方法を実践すれば、1ヶ月で毎分300〜600単語の英文読解が可能になります*2。日の大学生のトップ1パーセントでさえ、この速度で読めないのではないでしょうか。なお、エントリは、TO

    2008-12-03 - 一法律学徒の英語と読書な日々