タグ

2007年6月23日のブックマーク (8件)

  • きまぐれ日記: Yahoo!の形態素解析をMeCabで無理やり再現してみる

    MeCabで形態素解析器を作りたい場合は以下の二つの言語リソースが必要です。 1. 辞書 (単語と品詞のペアの集合) 2. 入力文と、それに対応する正解出力ペア(正解データ) 現在公開している mecab-ipadic は、ipadicとRWCPコーパスという正解データを使っています。 ここから分かるとおり、少なくともMeCabを使う場合は、コスト値を丹念にチューニング するといった職人芸は要りません。形態素解析への入力文とそれに対応する(理想)出力 があればコスト値を機械学習的なアプローチで構築することができます。 さらに、正解データを人手で作る必要は必ずしもありません。 すなわち、Yahoo!形態素解析器の出力結果を「擬似正解」とみなして MeCabの学習プログラムを走らせれば、Yahoo!の出力を高い精度で再現できる MeCab用辞書を作成することが原理的に可能です。 ふだんはあま

  • 「字幕in」を活用した日本語字幕コンクール、戸田奈津子氏が審査

    字幕inは6月22日、同社の字幕入力システムが神田外語グループ主催の日語字幕翻訳コンクールに採用されたことを発表した。このコンクールは角川映画配給の映画「ミス・ポター」を題材としたもので、ウェブ上のフォームに文字を入力するだけでリアルタイムに映像に字幕を反映できる仕組みだ。 審査委員長は字幕翻訳家の戸田奈津子氏が務める。同氏らの監修により、字幕の文字数制限、タイムラインに同期させた原文/日語の同時表示といったシステムがカスタマイズされている。 字幕.inによればリアルタイムに映像に反映される字幕コンクールは史上初の試み。今後はPRツール以外に、教材や外国語学習ツールとしての利用も検討していくという。

    「字幕in」を活用した日本語字幕コンクール、戸田奈津子氏が審査
  • はてなブログ | 無料ブログを作成しよう

    来年も作りたい!ふきのとう料理を満喫した 2024年春の記録 春は自炊が楽しい季節 1年の中で最も自炊が楽しい季節は春だと思う。スーパーの棚にやわらかな色合いの野菜が並ぶと自然とこころが弾む。 中でもときめくのは山菜だ。早いと2月下旬ごろから並び始めるそれは、タラの芽、ふきのとうと続き、桜の頃にはうるい、ウド、こ…

    はてなブログ | 無料ブログを作成しよう
    toruto
    toruto 2007/06/23
    向井秀徳
  • インテル、どら焼きでおばあちゃんにCore 2 Duoをアピール

    インテルは6月22日、クライアント向け製品の記者説明会にて、7月26日から29日までの期間限定で東京都豊島区巣鴨に「すがもパソコン茶屋」を設置すると発表した。インテル マーケティング部長の江田麻季子氏は、「より幅広い層の人たちにパソコンを使ってもらうことがインテルにとって大切なこと」と述べている。すがもパソコン茶屋では、来店者へのサービスとしてフリードリンクが振る舞われるほか、毎日先着100名にオリジナルの「Core 2 Duoどら焼き」が配布される。また、PC体験コーナーも設置され、PCを使った音楽作成や視聴、写真撮影、画像加工、ヘルスチェックなどが行われる。 Core 2 Duoどら焼き インテルは6月22日、クライアント向け製品の記者説明会にて、7月26日から29日までの期間限定で東京都豊島区巣鴨に「すがもパソコン茶屋」を設置すると発表した。インテル マーケティング部長の江田麻季

    インテル、どら焼きでおばあちゃんにCore 2 Duoをアピール
    toruto
    toruto 2007/06/23
    どらやきたべたい
  • 対談:日本における検索の未来 - データセクション 橋本大也 vs ヤフー 志立正嗣

    検索エンジンの開発競争では米国が注目されがちだが日の取り組みはどうか。日語類似検索エンジン「といえばサーバ」などユニークで先進的な取り組みで知られるデータセクション 代表取締役 CEOの橋大也氏と日最大のポータルサイトYahoo! JAPANの検索を率いるヤフー リスティング事業部長の志立正嗣氏。対極的なアプローチから検索に取り組んできた2人に日の検索の未来を語ってもらった。

    対談:日本における検索の未来 - データセクション 橋本大也 vs ヤフー 志立正嗣
  • Yahoo! JAPAN(ヤフー・ジャパン)を退職します - 関裕司/2007-06-18 - Shikencho.com

    shikencho.com のドメイン(このサイト)は年内をめどに消滅します 今後は以下のサイト (URL) をご利用ください 四軒丁 (shikencho) - sekiyuj : shikencho.hatenablog.jp Project Nonsense/プロジェクト・ノンセンス : projectnonsense.web.fc2.com twitter.com/sekiyuji

    toruto
    toruto 2007/06/23
  • さいごの告白

    許諾をいただいて、友人の mixi 日記より転載。 親戚のおじさんが亡くなりました。 うちには女の子がいないからと、とてもかわいがってくれて 会うたびに「美人になったねえ」と褒めてくれて。 父とこのおじさんだけが、世界でただ2人、 私のことが美しく見える特殊な目の持ち主でした。 私の結婚式では男泣きしてくれました。 とても仲良しの夫婦だったので、 伴侶を亡くしたおばさんの悲しみを思うと 会うのが怖い気さえしながら葬儀に出かけました。 でも、時々涙を見せながらも、 おばさんは背筋をしゃきっと伸ばしていて いつにも増して美しくさえ見えました。 「あのね、おじさん最後にこう言ったんよ わしは、あんたが大好きじゃった」 死を目前にした苦しみの中で 最愛の人にそんな言葉を残していけるなんて これ以上の愛の告白はない。 おばさんは、その言葉があったから 今もちゃんと立っていられるのかもしれません。 生

  • Folksonomy も結局「信用ベース」になりそう

    Folksonomy も結局「信用ベース」になりそう 2005-02-18-3 [Folksonomy] Folksonomy = folks + taxonomy。 利用者が対象(URLや写真)に「タグ」というカテゴリ名みたいものを付 与して、それを利用者が共有する。利用者がカテゴリ分けを行うという 「草の根分類手法」かと。タグを用いたよく知られたサービスとして del.icio.us, flickr, はてなブックマークなどがある。 とはいえ、タグspamにどう対処するんだろう。いまさら指摘するまでもな いだろうけど、一般的なタグ(キーワード)はすぐに汚染されそう。あさ ましい人ならこれを利用して広告を出すよなあ。ほっとけば HTML の META タグと同じ運命をたどりそう。 今後どのように展開していくのか観察していきたい。信用できる人がつけ たタグだけ利用するとか、ソーシャルネット

    Folksonomy も結局「信用ベース」になりそう
    toruto
    toruto 2007/06/23
    信用ベース。機械的に情報面での信用を少しでも上げる手段が考えられてる。たまに。