エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント2件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
NLTKで英文の文末判定
英文の文末を判定する簡易なルールベースのアルゴリズム。 Separating sentences 1年前にこの手のアル... 英文の文末を判定する簡易なルールベースのアルゴリズム。 Separating sentences 1年前にこの手のアルゴリズムを実装しようとしたが、この問題は非常にやっかいです。 たとえばこんな例:CELLULAR COMMUNICATIONS INC. sold 1,550,000 common shares at $21.75 each yesterday, according to lead underwriter L.F. Rothschild & Co. "INC."の直後や"$21.75"、"L.F."などのピリオドを文末と認識しては大間違いになるのです。 この問題を解決するのに自分が1年前に着目していた論文は以下のもの。 Unsupervised Multilingual Sentence Boundary Detection この論文では、特に言語を英語だけに限定しない方法
2019/07/26 リンク