タグ

learningとnlpに関するHeavyFeatherのブックマーク (2)

  • 機械学習や自然言語処理分野のエンジニアを募集しているベンチャー企業一覧 - nokunoの日記

    Quoraでこんな質問がありました.What startups are hiring engineers with strengths in machine learning/NLP? - Quora Foursquare: foursquare :: Jobs Findnotice: Findnotice | A Platform for Public Notices TheFind: TheFind - Shopped & Found TellApart: Page not found » TellApart Nowmov.com: Message Fahd Butt Fahd Butt - Quora Wavii: Message Erik Frey Erik Frey - Quora BloomReach: Message Joshua Levy Joshua Levy - Quo

  • 単語と文字の話 - Preferred Networks Tech Blog

    4月からPFIで働いてます。海野です。 今日は単語の話をします。読み物的な話なので軽く読んでください。 テキストデータなどの自然文を機械処理するときには、まず最初に単語に分割するということをよく行います。一般的にはMeCabやChasenといった形態素解析エンジンに投げて行います。形態素と単語の区別という話もあるのですが、ここでは大雑把に「連続した文字列の単位」くらいの意味で話します。 検索という文脈ですと形態素インデックスという言葉がありますが、これは検索の最小単位を文字単位ではなくて形態素の単位にするということです。例えば「東京都」は「東京」「都」に分かれるため、「京都」というクエリに対して見つかるのを防ぐなど、精度を上げる効果があります。反面、深刻な検索漏れを引き起こす可能性があるため嫌われることが多いです。こうした漏れは検索に限らず、テキストマイニングなどの文脈でも問題となることが

  • 1