新型コロナウイルスに関する情報は、厚生労働省の情報発信サイトを参考にしてください。情報を見る
エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Elasticsearch で不適切投稿のバリデーションチェックを実装してみた話
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Elasticsearch で不適切投稿のバリデーションチェックを実装してみた話
Photo by Norman Tsui on UnsplashElastic Stack (Elasticsearch) Advent Calendar 2020 の 12月21日の... Photo by Norman Tsui on UnsplashElastic Stack (Elasticsearch) Advent Calendar 2020 の 12月21日のエントリーです。 突然ですが、みなさんは不特定多数の人が投稿するシステムで、不適切な用語やNGワードを投稿されないようにしたいという要望を実現するために、どのようなシステムを設計しますか? 文章がスペースで区切られている英語でも複数形や過去形さまざまな形があります。日本語はさらに難しく、言語処理だけでも大変です。 また、不適切な単語やフレーズを検出するロジックをプログラミングしてしまうと、新たに発生する要件を実現するにはプログラムの変更が必要です。 パフォーマンスはどうでしょう?チェックする用語が膨大になっても大丈夫ですか? と、スクラッチで開発しようとすると結構いろいろ大変ですよね。 Elasticsear