タグ

あとで読むに関するyu4uのブックマーク (133)

  • 「Web本文抽出 using CRF」の学習用データの作り方 - 木曜不足

    第2回自然言語処理勉強会@東京が 9/25 に行われます。 前回よりキャパの大きい会場&週末に参加募集が始まったばかりですが、早くもほぼ定員。 自然言語処理に興味のある人はぜひ。でも、計画的なドタキャンは運営の方にご迷惑がかかるのでやめてね。 今度の第2回でも出しゃばって発表させてもらう予定だが、第1回も「Web文抽出 using CRF」という話をさせてもらった。 CRF(Conditional Randam Fields) を Web ページからの文抽出に用いるという手法の提案という内容で、実際に動作する Python スクリプトもあわせて公開している。 資料: http://www.slideshare.net/shuyo/web-using-crf 実装: http://github.com/shuyo/iir/blob/master/sequence/crf.py http:

    「Web本文抽出 using CRF」の学習用データの作り方 - 木曜不足
  • 青ざめた学生さんへのアドバイス:いきなり長文を書かない - 発声練習

    lessorの日記:コピペどころじゃない これまで一度も文章を自分に見せてこなかった学生(論文の章立てさえ何度言っても出さなかった)にきつく注意をしたところ、ついに2000字あまりの原稿が送られてきた。添付ファイルではなく、メール文として。 間違いなく自分の言葉で書かれている。コピペはおそらく一ヶ所もないだろう。ただし、そのために最初から最後まで日語表現が完全に破綻している。 上記のエントリーを読んで、「やべっ!」と青ざめた学生さんはたぶんちゃんと卒業論文書ける。「しょうがないだろう」と思った学生さんは、就職したあと上司に鬼のように叱られればよい。 ちゃんとした説明文を書いたことない人は、いきなり長文を書いても指導する方の負担がバカでかいし、非効率になりがちなので、ステップバイステップで論文を構成していった方が良い。 まずは、指導教員の血圧をガリッとあげる「書式がでたらめ」についてなぜ

    青ざめた学生さんへのアドバイス:いきなり長文を書かない - 発声練習
  • ICDE2010勉強会 - ICDE2010勉強会

    目次論文の割り当てについて資料作成要領決まりではないですがスライド造りのコツ SIGMOD2009勉強会,VLDB2009勉強会に引き続き,ICDE2010勉強会を開催 することになりました。趣旨は手分けをして1日で全論文を制覇しよう! ということです。 今回は以下の日程で開催することにいたしました。 日時:2010年6月20日(日)場所:お茶の水女子大学 理学部3号館   (関西会場を現在交渉中です)時間:10:00〜 積極的なご参加のほどどうぞよろしくお願いいたします^^ 現在参加申し込みと論文の割り当ての募集を行っております。 申込フォームはこちらです https://spreadsheets.google.com/viewform?formkey=dERvaTBrN3hOR3VXT0c2QkJtZ0F6UEE6MQ ICDE2010のページ http://www.icde2010.

  • English

    金谷健一のここが変だよ日人の英語 第1回, 電子情報通信学会 情報・システムソサイエティ誌, Vol. 7, No. 3 (2002-11), pp. 9-12. (理工系専門家向け) 第2回, 電子情報通信学会 情報・システムソサイエティ誌, Vol. 7, No. 4 (2003-2), pp. 4-7. (理工系専門家向け) 第3回, 電子情報通信学会 情報・システムソサイエティ誌, Vol. 8, No. 1 (2003-5), pp. 14-17. (理工系専門家向け) 最終回, 電子情報通信学会 情報・システムソサイエティ誌, Vol. 8, No. 2 (2003-8), pp. 15-18. (理工系専門家向け) 続・金谷健一のここが変だよ日人の英語 第1回, 電子情報通信学会 情報・システムソサイエティ誌, Vol. 8, No. 3 (2003-11),

    yu4u
    yu4u 2010/08/30
    金谷健一のここが変だよ日本人の英語
  • はじめての国際学会発表 - NextReality

    なんか「はじめてのお使い」みたいですが、初めて国際学会発表する人のために。 大前提だが、英語の発表をするのが目的でなく、研究の発表が目的。英語が多少下手なのはしかたがないが、発表(研究) そのものがつまらないとどうしようもない。 発表時間が何分なのか(純粋な発表と、質疑の時間との配分はどのくらいか)を確認する。大きな学会だとセッションのタイプも色々なので混乱しないように。 学会にレジストしたら、まず自分が発表する会場を確認する。その会場でのセッションに参加して、スクリーンと観客の距離はどのくらいか、どのくらいのサイズの文字まで読めるか、スクリーンの下の文字はどこまで見えるか、などを確認する。必要に応じて発表スライドを手直しする。 一般原則として、スライドの文字数は少なめに、1ポイントでも大きなフォントにならないか工夫する。アニメーションを使うと、一度に出す文字の量を調整しながら説明できる。

    はじめての国際学会発表 - NextReality
  • Videolectures

  • 英語の時制シーケンスまとめ - A Successful Failure

    英語文法において時制は最も厄介なルールの一つだ。特に複数の出来事の前後関係を含意するシーケンスは、正確に使うには訓練が必要だろう。"Sequence of Verb Tenses"では、そのルールをロジカルに一覧にしている。とても有用な表なので、以下に紹介したい。 主節の動詞が過去形もしくは過去完了形以外の場合には、従属節の動詞の時制は何でも利用することができて、その時制の通りの意味を表す。しかし、主節の動詞が過去形もしくは過去完了形の場合には、従属節の動詞は、過去形もしくは過去完了形でなくてはならない。例外は従属節が一般的真実として広く知られていることを表現するときである。 In the 1950s, English teachers still believed that a background in Latin is essential for an understanding o

    英語の時制シーケンスまとめ - A Successful Failure
  • Pythonでいろんなバイナリファイルを覗いてみる – taichino.com

    プログラマをしていると、ちょくちょくバイナリデータから情報を読みたくなりますね。そんな時は、ブツブツ言いながらバイナリエディタと睨めっこすることになるわけですが、これが結構大変なので、何とか楽にならないかなぁと思って探していると、hachoirというナイスなpythonモジュールが見つかりました。このモジュールを使うとバイナリデータをパースして様々なデータを取得できます。かなり多くのデータフォーマットに対応している(現時点で70種類)のが素晴らしいです。 hachoirはいくつかのモジュールに分かれているのですが、大抵は以下をインストールすれば良いと思います。 $ easy_install hachoir_parser $ easy_install hachoir_metadata このモジュールにはhachoir-metadataというコマンドラインツールが含まれていて、コードを書かなく

  • 日本は高等教育過剰か?(1) - Cerebral secreta: 某科学史家の冒言録

    は高等教育過剰か?この問い自体が様々な曖昧さを含んでいる。まず第一に、過剰かどうかは、何をもって適正な基準とするかに依存する。従って、日に高等教育が過剰であるとする議論において、何をもって適正なな基準とするかが示されていないのであれば、迷走した議論にしかなりえない。そして、何が適正であるかは、論理的に導きだされるものではなく、主権者の政治的判断によって決定されるべきことであると思う。 第二に、過剰ということ自体にも、様々な意味がありうる。なされている教育の量や質 が過剰なのか、大学生数ないし大学数が過剰なのか、あるいは使われている予算が過剰なのか。 このエントリーは4つほど続けてエントリーを書くシリーズの最初のものである。ここではまず、日は高等教育が過剰であるとする主張にどのようなものがあるのか考えてみる。そして、次のエントリーではそれを批判・検討する。三番目のエントリーで、逆に日

  • iostreamの拡張

    Last update 1999/09/22 iostreamの拡張 (C)平山直之 無断転載は禁止、リンクはフリー 誤字脱字の指摘は歓迎 iostreamの拡張について 例によって唐突ですが、iostreamの拡張について書いてみたいと思います。ここでいう「拡張」とは、自分でcinとかcoutみたいなものを作ろう、ということです。 「こんなもん一番最初に教えんなや」と比較的評判の悪いiostreamですが、 演算子オーバーロードがいわば「御法度」な使い方をされている メソッドの命名法がやたら変 などのように表面的に美しくないのが悪評の原因で、その辺に目をつぶれば実はそれなりによくできたシステムだったりします。 拡張方法も一度覚えると結構便利ですぜ。 iostream拡張の基礎知識 iostream、というと、そのインターフェイス(Java的な意味じゃなくて)であるところのstd::cin

  • コンピュータアーキテクチャの話 Hisa Ando | コラム | エンタープライズ | マイコミジャーナル

    新着記事一覧 【連載】乗って! 撮って! べて! 江ノ電で旅気分 第2回 観音様や大仏を上手に撮影しよう--長谷・極楽寺編 [10:39 9/30]  ミリタリーアクションドラマ第3シーズンが放送! - 『ザ・ユニット3〜』 [10:00 9/30]  【特集】『クリミナル・マインド』 研究部 [10:00 9/30]  【レポート】ネットで申し込める"お気軽"自動車ローンに注目--三井住友銀行&みずほ銀行 [10:00 9/30]  【連載】山田塾長の結婚必勝方程式 第2回 エリート難民にパラサイト親子…あなたは「結婚できない男」ではないですか? [10:00 9/30]  1タブ1プロセスを実現したMac用ブラウザ「Stainless」登場 [09:41 9/30]  安藤建築の原点「住吉の長屋」を原寸大で再現 - 安藤忠雄建築展 [09:37 9/30]  【AIRコレ】オフライン

  • TABLOG:TED.comは、最高レベルの英語学習コンテンツでは? - livedoor Blog(ブログ)

    2009年05月21日 TED.comは、最高レベルの英語学習コンテンツでは? すでに、いろんなところで紹介されているのですが、TED.comというサイトがあります。Technology,Entertainment,Designの頭文字をとって、TEDだそうです。 TEDは、世界の超一流の人物が、年に1回集まり、開かれるカンファレンスです。 その講演ビデオが、ネット上に無料で公開されているのですが、この動画が、「英語学習の教材としての要件を確保」しながら、「2009年の今、話を聞くべき人物の、話を聞くべきアイデア」を紹介しているという二つの要素を高い次元で両立させています。 これが、いろんな意味で「最高」レベルの英語学習コンテンツのように思えてきました。「話す人物」も最高レベル。「話される内容」も最高レベル。講演後のスピーチに対する「取り扱い」も・・・。 これまでもMITのオープンコースウ

  • f-kid blog : EvernoteとDropboxを使い分けるための3つのポイント

    <追記>2010/1/20 最新情報をアップしました。下記もご参考までにどうぞ。 オンラインストレージを使い倒す 利用シーン別活用法 昨日待望のDropboxのiPhoneアプリがリリースされました。 Dropbox機動画面です。 今回iPhoneにDropboxをインストールするにあたり、DropboxとEvernoteの使い分けについてルールを決めました。ルールがないと2つのアプリの間を行ったり来たりしながらデータを探したりしそうだな、と不安になり。。 なので、今回は両アプリを使い分けて活用するための3つのポイントを紹介します。ポイント1:保存容量のルールの違いが意味するところ EvernoteとDropboxは保存容量計算のロジックが全く違います。 Evernoteは月当たりの転送量制限が設定されています。無料版は40MB/月まで。有料版(月額400円程度)は500MB/月までとなっ