[B! serverless][nlp] sato_susumuのブックマーク

sato_susumu id:sato_susumu

serverlessとnlpに関するsato_susumuのブックマーク (2)

プレゼンテーション：AWS APIGateway + Python Lambda + NEologdで作るサーバレス日本語形態素解析API | PyCon JP 2017 in TOKYO
PythonとMeCab+NEologdを使用した日本語形態素解析環境は様々な場面で広く利用されていますが，容量などサイズも比較的大きくなりがちで，サーバレス環境のような気軽な環境で動作させることは容易ではありません．本トークではAWSのサーバレスサービスであるLambdaを使用して日本語形態素解析環境をPython + MeCab/NEologd + AWS Lambdaで作成する際に有効なTipsを中心に紹介します． PythonとMeCab+NEologdを使用した日本語形態素解析環境は自然言語処理やテキストマイニングなど様々な場面で広く利用されています．一方でこれらの環境を開発環境と合わせて使用するためにはOSや文字コードなどの依存関係でセットアップやデプロイが面倒なことも多く，Docker化しても辞書のサイズが大きくコンテナが肥大化していくなど，簡単な日本語解析を行えれば良いよう
sato_susumu 2021/10/05
serverless

nlp
リンク
自然言語処理のサービスのAWS上での構成を考えてみる - Qiita
目標 AWSサービスを効率的に使って、自然言語処理に関するサービスを構築する。可能な限りローコストを目指す（特にアクセスしていない時の料金を減らす）。もちろん高可用性構成。マルチテナント構成を取る BERTを使って類似文章検索を行う。転置インデックスを使用した全文検索を行いたい（単語での検索など）。ElasticSearchは値段高いのでパス。前提今回は、構成の考察。検証済みの部分もあり、未検証部分もあり。実際の製品がこの構成を取っている事を示すものでは無いです（まだ検証段階です）。その為、この構成を取った事によって何か問題が発生するかもしれない事はご了承下さい。技術要件整理データ学習済み基本モデル最近流行りの転移学習向けに、公開されている学習済みデータを使用する。サイズ的には1~数GBを想定。ファインチューニング用コーパスデータ転移学習でのファインチューニング
sato_susumu 2021/10/05
serverless

nlp
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx