タグ

ブックマーク / komachi.hatenablog.com (18)

  • 賃貸住宅サービスFC京都伏見店での出来事: 嫌な予感は案外当たる - 生駒日記

    午前中の日当りを見るために丹波橋へ。あと、今日は平日の車通勤が可能か、車で来てみる。ローカルの人しか分からないと思うが、NAIST から車で京都に行くには何通りか方法があって、今回はスタンダードに (いつも使う) 京奈和自動車道で北上。途中一度宇治川を超える手前で曲がり間違い、5分ほど手戻りが発生したが、それでも45分なので、有料道路を使えば通勤できなくはないということが分かる。ただ、今日は10時に家を出てみたので、もっと早い時間だと通勤ラッシュに当たるかもしれない。 丹波橋に到着してから不動産屋さんに行き、昨日最後に見せてもらったところの日当りと電車の音を確認。ぶっちゃけ、電車の音に関しては、建物自体は確かに線路沿い5mくらいのところに立っているのだが、マンションの反対側だし、なにより JR なので (京都〜奈良の人はご存知だと思うが、こっちで JR は遅くて数が少ない路線の代名詞)、

    賃貸住宅サービスFC京都伏見店での出来事: 嫌な予感は案外当たる - 生駒日記
  • 中高大は男子校のほうが学力は伸びる - 武蔵野日記

    朝から高の原へ。意外に空いている。昼はならまちの江戸川へ。奈良に来るとまずここへ来る気がする……。 午後家に帰ってきてごろごろしたり。夜は踊る大走査線 THE MOVIE 3 を見たり。 以前購入した「男子校という選択」 男子校という選択 日経プレミアシリーズ 作者: おおたとしまさ出版社/メーカー: 日経済新聞出版社発売日: 2011/12/09メディア: 新書購入: 4人 クリック: 47回この商品を含むブログ (12件) を見るを読む。「なぜ東大合格トップ10の8校は男子校なのか」というのがオビで、以前紹介した「女子校育ち」と同じようなネタかと多少期待していたのだが、教育パパ・ママをことさら刺激するでもなく、男子校をおもしろおかしく暴露しているでもなく、割合中立なであった (取り上げられている学校の選択は偏っているが、意図的だろう)。 男子校出身者は大学の1-2年で彼女ができる

    中高大は男子校のほうが学力は伸びる - 武蔵野日記
    yokochie
    yokochie 2012/01/23
    『共学出身の男女、および女子校出身の女性はともに40%』世間一般の彼女ができる率ってそんなにあるのか...
  • 英語の壁を諦めてから拓ける道もある - 武蔵野日記

    どうやら寝る4時間前までにご飯をべるのがいいらしい。あと牛乳。子どものころは毎日牛乳、ご飯のときも牛乳だったが、あれは実はお腹によかったのか……。 腰はやはり温泉に行ってしばらく湯船に浸かるとよいようだ。温度・湿度のせいか、それとも浮力のせいか分からないが、1日行くと1週間くらいは回復するみたい (先週は行きそびれた)。やっぱり水泳したほうがいいのかな〜。 先日の日記のコメント欄で教えていただいたのだが、英文校正サービス enago の「トップ研究者インタビュー」がおもしろかった。基的には「日人はネイティブ並に英語ができるようにはならない。諦めるところから始まるものもある。」というスタンス (別に「だから英文校正を利用しなさい」と誘導されているわけではなく、単にインタビューだけ)。タイトルからして秀逸。 第7回 東京大学大学院教授 上野千鶴子氏 「私は英語圏で勝負するのを断念した。」

    英語の壁を諦めてから拓ける道もある - 武蔵野日記
  • 12人の研究者のものがたり - 武蔵野日記

    一昨日から徹夜続きだったので午後出勤。 昨日は修論の方々のお話が聞けなかったので、今日は週末から今日にかけての様子を聞いてみたり。修論提出まであと1週間程度なので、まだ実験で手一杯で書いていない人も、そろそろ書いたほうがいいのでは……と老婆心。学部生のとき、レポートは提出当日になってから書き始めていた自分は人のことは言えない。 図書館から予約図書が届いたという知らせ。最近代が馬鹿にならないことに気がつき(年間20万くらい、研究とは関係ない買っている)、図書館に入っているを読むことにしていて、ぼちぼちとリクエストしていたのだ。(岩波新書とブルーバックスはほぼ全部揃っているのだが、だいたい新書を読みたいときは外のカフェなので、やっぱり屋に行ってその日の気分で数冊選び、カフェ読んで帰ってくる) リクエスト自体、通っても手元に届くのは1ヶ月以上かかるので、忘れたころに届くのだが、Amazo

    12人の研究者のものがたり - 武蔵野日記
    yokochie
    yokochie 2011/01/26
    読んでみようかな
  • 研究者の大学院生きのこりのためのサバイバルガイド - 武蔵野日記

    午前中共同研究ミーティング。@shirayu くんの進捗報告を聞いたりする。最近修士の人たちの研究の進捗をふらふらと歩きながら聞いたりするのだが (実はときどき立って歩くのが腰によいのである)、いろいろと詰まっているバグなりなんなりが取れていくとおもしろいものである。ぶっちゃけ自分は Gentoo Linux の開発者として3年くらいひたすらバグ潰ししていたくらいで (その前の相談員時代を含めると6年くらい)、他人のプログラムのバグ取るのは割と楽しいのであった。 昼から言語教育勉強会。@seijik42 くんと @tomo_wb くんの進捗報告。@seijik42 くんは手も早いしいろいろと実験していてすごいのう。@tomo_wb くんも実験報告に実例をたくさん入れてくれるので、聞いていておもしろい。 今日が〆切だったので、言語処理学会第17回年次大会に発表申し込み。豊橋かぁ〜 Twitt

    研究者の大学院生きのこりのためのサバイバルガイド - 武蔵野日記
    yokochie
    yokochie 2010/12/29
    豊橋技科大の評価高すぎw
  • 日英混在で書きたいならモードレスな日本語入力メソッドはいかが - 武蔵野日記

    午前中ミーティング。今日までに調べておかないといけないことが間に合わなかったので申し訳ない。金曜日の仕事かな……。 昨日 Kinect における日本語入力はどうすればいいのか、という話を日記に書いたが、来年の言語処理学会のテーマセッション3は「日本語入力における言語処理」だそうで、自分も話す予定 (実験結果を発表するというよりは問題提起になるけど) なので他の方々もネタがあればどうぞ〜。 最近の日本語入力というとおもしろいのは @kiyoka さんが開発されているSekka。モードレスなので、ローマ字で入力していって変換したいところで C-j を押して変換、という形式。 モードレスな入力メソッド、前 @tettsyun くんに話したら知らなかったようなので、まとめておくと、普通の日本語入力はローマ字をタイプするごとにひらがなに変換し、適当なところで漢字に変換するが、これは「日語モード」と

    日英混在で書きたいならモードレスな日本語入力メソッドはいかが - 武蔵野日記
    yokochie
    yokochie 2010/12/16
  • わたしと言語学入門 -- antipassive との出会い - 武蔵野日記

    午前中はタグづけミーティング。11時から1時間のつもりだったが、議論がいろいろあって(というか事例を見たりして)結局2時間丸々白熱教室していた (笑) 実は自分も修士のときタグ付けしていたのは名詞についてだけなので、述語についていろいろ調べていて最近とても勉強になっている。 自然言語処理で使われている日語の文法というのは大きく分けて2つあって、一つは JUMAN 辞書が用いている益岡・田窪文法と呼ばれているもので、もう一つは ChaSen/MeCab が広く使っていた IPADic という辞書が準拠する学校文法(橋文法)がある。「基礎日語文法」 基礎日語文法・改訂版 作者: 益岡隆志,田窪行則出版社/メーカー: くろしお出版発売日: 1992/05/25メディア: 単行(ソフトカバー)購入: 6人 クリック: 105回この商品を含むブログ (9件) を見るは恐らく日語を対象とし

    わたしと言語学入門 -- antipassive との出会い - 武蔵野日記
  • 日本という死に至る病 - 武蔵野日記

    ある意味昨日の話の続きなのだが、@nokunoさんの Mixi Voice で 稲船敬二氏は,何を思い,何を考え,何を目指してカプコンを辞めていくのか。渦中の氏に直撃インタビューを知る。これもいろいろ考えさせられる記事である。 この人はカプコンの CTO の人で、「ロックマン」や「鬼武者」などの数々のヒット作を生み出してきた(20年以上この業界にいる)人で、日ゲームに足りないのはなにで、それはどうすればいいのか、ということを滔々と述べている。(そのため、とうとうカプコンを辞めることになった、と) 最初に問題にしているのは、日では一生懸命働くのは無駄で、失敗しないことが美徳なのだから、それには成功しようと思わないことが重要、という話。これではゲームに必要不可欠な「もっといいゲームを作らないと」という意識が弱くなる、ということ。はて、どこかで聞いたような話。 もちろん大きな会社なので多数

  • エンジニアを幸福にしないヤフーというシステム - 武蔵野日記

    @nokunoさんのYahoo! JAPANを退職しましたという記事を読む。いまはタイトルに「翻訳」と書いてあるので紛らわしくないが、最初は「すわ id:nokuno さんがとうとう辞めたか?!」と釣られたものである (笑) 内容を読んでみると「まあ、そうだろう」という感じで、そんなに目新しいことが書いてあるわけではない (が、Yahoo! JAPAN の労働環境について知らない人が読むと「え、Yahoo! ってそんなところだったの??」とびっくりするかも)。著者も断っているが、これはアメリカYahoo! のことではなく、日Yahoo! JAPAN のことであり、Yahoo! JAPAN は外資系の会社ではなくコテコテの日企業である (それが悪いと思うかよいと思うかは人次第)。 (2010-10-31 追記) Yahoo! JAPAN の環境がそんなによくないのは My New

    エンジニアを幸福にしないヤフーというシステム - 武蔵野日記
  • 手軽に自然言語処理を学ぶには「入門 自然言語処理」の第12章がお勧め - 武蔵野日記

    午前中、言語教育勉強会。進捗報告と発表練習など。見る度に新しい機能が追加されていたりUIが向上していたりするので、まだまだ先が楽しみである。 午後、CJE 勉強会と研究会。日語の依存構造解析、これ以上向上させていくのは難しいということを知る。いろいろと悩ましい。少なくともこの状況の上に述語項構造解析をやらなければならないわけで…… 松研OBの@takahi_iさんが記事を書いていると小耳に挟んだので、大学の売店で WEB+DB PRESS を購入してみる。ちなみに大学の売店、書籍・雑誌は1割引である。 WEB+DB PRESS Vol.59 作者: 竹内真,猪狩丈治,矢野りん,中島拓,伊藤敬彦,角田直行,はまちや2,柄沢聡太郎,田中正裕,梶原大輔,藤真樹,増井俊之,加藤幹生,藤澤瑞樹,木村俊也,永井幸輔,中尾光輝,平田雄一,渡辺智暁,藤吾郎,原悠,浜階生,八柳幹太郎,uupaa,塙

    手軽に自然言語処理を学ぶには「入門 自然言語処理」の第12章がお勧め - 武蔵野日記
  • 自然言語処理の研究者が SKK を使うのはちょっと悲しい - 武蔵野日記

    午前中助教室にいると自分を訪ねて来てくれた学生さんがいる。どうもこれからインターンシップに行く人だそうで、いろいろと不安なので相談に乗ってほしい、ということだ。 自分の経験や今後のキャリアについてお話してみたり。やはり今どきの女性は一生働く(途中に出産や育児で休んだり時短にしたりするのを考慮に入れて)キャリアを考えて人生設計すべきだと思うし、男性も同様。意外に行ってみるといろいろ道が開ける(というかつながっている)ものである。 そうそう、今年の SVM 勉強会は 8月7日開催 なので、お日にち間違えなきよう (※松研の OB/OG の同窓会です)。 午後は水曜日からの読書会の読み合わせ。夏の勉強会は The Syntactic Process (Language, Speech, and Communication) 作者: Mark Steedman出版社/メーカー: A Bradfo

    自然言語処理の研究者が SKK を使うのはちょっと悲しい - 武蔵野日記
    yokochie
    yokochie 2010/08/03
    私は一文丸々未確定状態で入力してから変換しています / 単語の区切りミスでストレスを感じたことはあまりない
  • Microsoft Office IME 2010 はガチ - 生駒日記

    ガチとはガチンコの略で「真剣勝負」を意味したそうだが、Microsoft Office 2010 IMEが東方に強いと言う噂を聞いたので検証してみたという話を目にしたので、Microsoft Office 2010 ベータ版ダウンロードから Office Professional 2010 を取得してインストールして試してみた。無料のプロダクトキーがダウンロードページに書いてあり、2010年10月31日まで使用可能なようだ。 上記ページには Twitterのアカウントで、MS-IMEへの不満を書いたら、MicrosoftでIME開発をしている人 (自称) にMS-Office 2010のIMEを勧められ、更に"Twitter / Takashi umeoka: @rh_kimata 東方に強いという、うわさもありますよ"と言われたので、検証してみた。 と書いてあるが、Twitter でつぶ

    Microsoft Office IME 2010 はガチ - 生駒日記
    yokochie
    yokochie 2010/01/20
  • ATOK の辞書をつくる - 武蔵野日記

    @klmquasi さんのお勧めで 電脳日語論 作者: 篠原一出版社/メーカー: 作品社発売日: 2003/03/01メディア: 単行購入: 1人 クリック: 8回この商品を含むブログ (11件) を見るを読んでみる。これはジャストシステムの開発者の人から辞書を作っていた人、そして ATOK 監修委員会のできるまでとできてから、などなどをまとめたであり、日本語入力や計算機上の日語処理に興味のある人が読むと、とてもおもしろいだろう(2003年ので新し目だし、これはお勧め)。後述するが、これはぜひみなさんに買って読んでもらいたい。 Google 日本語入力ができてから、日本語入力は規範的であるべき(たとえば「ら抜き表現」は日語として「間違っている」ので変換できないようにするとか)か記述的であるべき(実際言語は変わりうるものであり、使う人がそう書きたいのであれば、変換できるべき)かと

    ATOK の辞書をつくる - 武蔵野日記
    yokochie
    yokochie 2009/12/24
    辞書作成作業の類は精神的にとてもきついですよね
  • Google IME の次は Google 日本語スペル訂正が来そう - 武蔵野日記

    Google IME がリリースされたそうで、Twitter でも #googleime というハッシュタグで祭りになっているようである。リリース文を見ると @taku910 さんと @komatsuh さんが主に関わっているようである。 以前Google サジェストのローマ字検索機能 = Google IME でも書いたことがあるのだが、これが出る予兆はいろいろあって、 2007年秋に Google語 N グラムが出る(もっと言えば2007年3月に言語処理学会で「N グラムデータを出すならどういう形がいいか、どういう用途で使うか」という特別セッションがあった)ときから想像できたことであり、taku さんや komatsuh さんくらいのエンジニアであればエンジンを作るのには数日もかからないであろう。 Social IME 開発者の nokuno さんもGoogle IMEという可能

    Google IME の次は Google 日本語スペル訂正が来そう - 武蔵野日記
    yokochie
    yokochie 2009/12/04
    Anthyの作者グループがどこに行ったのかはウォッチしてなかったなぁ。どこにいったんでしょう
  • Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記

    最近次世代「検索」エンジンが登場しつつあるが、彼らのすごいところは検索結果ではない。たとえば Mathematica を作った会社が Wolfram|Alpha や最近検索に異様に力を入れている Microsoft が Bing を開発中だとアナウンスされたが、彼らが真にすごいのは、現在の自然言語処理(や情報検索などの周辺技術)の精度では恐らく不可能だと思えるようなことをやろうとしている、もしくはやっているところだと思う。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解析器を作っているので仕方な

    Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記
  • 自然言語処理における半教師あり学習のテキスト - 武蔵野日記

    最近移動続きであまり研究に時間は割けないのだが、は読めるということでを2冊、サーベイ的な記事を3(うち2はチュートリアルスライドつき)を紹介する。まず Semisupervised Learning for Computational Linguistics (Chapman & Hall/CRC Computer Science & Data Analysis) 作者: Steven Abney出版社/メーカー: Chapman and Hall/CRC発売日: 2007/09/17メディア: ハードカバーこの商品を含むブログ (4件) を見る を読む。このの著者の Steven Abney はブートストラッピングの理論的解析をした人で、 Steven Abney. Bootstrapping. 40th Annual Meeting of the Association fo

    自然言語処理における半教師あり学習のテキスト - 武蔵野日記
  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
  • 最大マージン kNN と SVM の関係: kNN も最近はがんばっています - 武蔵野日記

    先日書いた機械学習における距離学習の続き。 kNN (k-nearest neighbour: k 近傍法)は Wikipedia のエントリにも書いてある通り、教師あり学習の一つで、あるインスタンスのラベルを周辺 k 個のラベルから推定する手法。memory-based learning と呼ばれることもある。単純に多数決を取る場合もあれば(同点を解決する必要があるが)、近いインスタンスの重みを大きくする場合もあるのだが、いずれにせよかなり実装は単純なので、他の機械学習との比較(ベースライン)として使われることも多い。 簡単なアルゴリズムではあるが、1-NN の場合このアルゴリズムの誤り率はベイズ誤り率(達成可能な最小誤り率)の2倍以下となることが示されたり、理論的にもそれなりにクリアになってきているのではないかと思う。また、多クラス分類がちょっと一手間な SVM (pairwise に

  • 1