皆さん、初めまして。2009年新卒入社の遠山と申します。 広告効果検証システムCAMPのシステムを担当しております。 今回のエントリーでは、「衣類用語辞書の構築」についてお話したいと思います。 弊社では、アメーバブログのNGワードの検知にアダルトキーワードを登録した辞書を用いたり、流行語や著名人ブログ情報の検索サイトのアメーバ辞書(携帯のみ対応)では、人名を登録した辞書を用いたりしています。 独自の辞書を用いてブログ記事を解析することで、何の話題についてその記事が書かれているかを知る指標を得ることができます。 今回は、個人的にファッションが好きなので、2MBのコーパス(流行のファッションについて書かれたレポートのテキスト)から「ライダースジャケット」や「Tシャツワンピース」(※Tシャツとワンピースではないです。)といった衣類名を抽出し、ファッションの分野に特化した衣類用語辞書を作成した話を
![『衣類用語辞書の構築』](https://cdn-ak-scissors.b.st-hatena.com/image/square/944aef26c3c296dfa16d187a2f716479584bd204/height=288;version=1;width=512/https%3A%2F%2Fstat.ameba.jp%2Fuser_images%2F20101126%2F13%2Fprincipia-ca%2F96%2Fb6%2Fp%2Fo0800078710882139033.png)