タグ

2014年6月30日のブックマーク (4件)

  • 文節境界解析のラベルと性能 - skozawa's blog

    文節境界解析で使うラベルで、BIとBILUの2種類でどちらが性能がよいかを検証してみた。結果的にはBIだけのほうが性能が高かった。 前回の輪読会で紹介した固有表現抽出に関する論文の中で印象に残ったことのひとつとして、系列ラベリングに使うラベルで最近はBIOよりもBILOUを使ったほう性能が高いというものがあった。 BIO(Begin, Inside, Outside)とBILOU(Begin, Inside, Last, Outside, Unit(Begin and Last))の違いは固有表現の末尾を考慮するかどうかで、末尾を考慮したほうが性能がよいというもの。 社内輪読会で「Joint Inference of Named Entity Recognition and Normalization for Tweets」を紹介した - skozawa's blog Comainuでは、

    文節境界解析のラベルと性能 - skozawa's blog
    nfunato
    nfunato 2014/06/30
  • Joe's Labo : 新刊まえがき紹介と目次と見どころについて

    2014年06月28日12:09 by jyoshige 新刊まえがき紹介と目次と見どころについて カテゴリ 新刊のまえがき用に書いたのだけれども、スペースの都合でボツにしたものを供養代わりにアップしておこう。 まえがき もし連合がプロ野球チームを保有し、全選手を終身雇用にしたら、何が起こるか。 「そんなことはありえない」という笑い飛ばした人は、人生で多くのことを損しているに違いない。というのも、ありえないシチュエーションほど、物事の質をくっきり浮かび上がらせてくれるものはないからだ。 たとえば「自分が結婚するなんてありえない」と言う人は、とりあえず誰か好きな人と結婚することを想像してみるといい。まだまだ生活基盤が弱い、仕事の先行きが見えない等、さまざまなハードルが思い浮かぶだろう。それらはみな今の日常生活では気づかない隠れた真実であり、いずれ対処を迫られる問題である。 また、現在はあ

    nfunato
    nfunato 2014/06/30
  • 関数ポインタのキャストと gcc - まめめも

    C の関数呼び出しは、関数定義の型と互換性のない型として呼び出したら未定義動作です。例えば以下のコードの動作は未定義です。 #include <stdio.h> int main(void) { ((int (*)(char *, ...)) &printf)("Hello, world!\n"); } printf は int printf(const char *, ...) なので、const が無くなってるのが間違ってます。未定義のプログラムはどのような実行結果になろうとも、C の規格には違反しません。 でも、現実問題としてこのコードは期待通りに動くだろー、と高をくくってました。しかし最近の gcc (3.4 以降くらい) では、このコードは落ちます。 $ gcc --version gcc (GCC) 4.3.1 Copyright (C) 2008 Free Software

    関数ポインタのキャストと gcc - まめめも
  • Google, Twitter and NASA are showing why data is the new cloud – Old GigaOm