タグ

ブックマーク / d.hatena.ne.jp/nokuno (3)

  • エンジニアの英語勉強法 - nokunoの日記

    エンジニアの、というほど特化しているわけではありませんが、昨日のエントリに英語のことを少し書いたら英語勉強法について書きたくなったので、まとめてみました。Smart.fm - 世界最大級英語学習コミュニティーサイトPC上で単語の学習ができます。iTunesに無料のPodcastもあり、電車の中などで勉強するのにオススメです。英会話ならオンライン英会話のレアジョブSkypeで英会話のレッスンを受けることができるサイトです。講師はフィリピン大学の学生さんで、気楽に話ができます。Lang-8 - Multi-lingual language learning and language exchange | Lang-8外国語の文章を相互に添削しあうサイトです。ライティングの勉強になるので、英語のブログを書いたら試してみようと思います。 PodcatiTunesには英語系のPodcastがたくさ

    Chisei
    Chisei 2010/12/31
    論文なども読んでみよう。
  • 2010-10-26 - nokunoの日記

    このエントリはJon Keating氏による以下のブログ記事の日語訳です。Leaving Yahoo! Japan « The Jon 4年と少しを勤めたYahoo! JAPANを退職し、今よりも良い場所を求めて旅立つことを決めました。最初に入ったときの仕事は、動画ニュースのバックエンドを改善することでした。この会社に入る前、LinuxcurlでASXファイルをダウンロードしたりしていました。そのためその仕事には馴染みがありましたが、それはユーザとしてでした。その後もいろいろなプロジェクトに関わり、いくつかは新聞や雑誌に取り上げられ、そのために日の記者と話をする機会もありました。全体的に、それは素晴らしい経験でしたが、去るべき時が来てしまいました。 内部から見ていくつか思うことがあったのでここに書き記します。ここで言っているのはYahoo! JAPANについてのことで、アメリカのYa

  • 「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

    Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日語では、単語の境界はそれほど自明ではないため、日語特有の処理をする必要があります。 日語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ

  • 1