タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

serverlessとnlpに関するsato_susumuのブックマーク (2)

  • プレゼンテーション:AWS APIGateway + Python Lambda + NEologdで作るサーバレス日本語形態素解析API | PyCon JP 2017 in TOKYO

    PythonとMeCab+NEologdを使用した日形態素解析環境は様々な場面で広く利用されていますが,容量などサイズも比較的大きくなりがちで,サーバレス環境のような気軽な環境で動作させることは容易ではありません.トークではAWSのサーバレスサービスであるLambdaを使用して日形態素解析環境をPython + MeCab/NEologd + AWS Lambdaで作成する際に有効なTipsを中心に紹介します. PythonとMeCab+NEologdを使用した日形態素解析環境は自然言語処理やテキストマイニングなど様々な場面で広く利用されています.一方でこれらの環境を開発環境と合わせて使用するためにはOSや文字コードなどの依存関係でセットアップやデプロイが面倒なことも多く,Docker化しても辞書のサイズが大きくコンテナが肥大化していくなど,簡単な日語解析を行えれば良いよう

    プレゼンテーション:AWS APIGateway + Python Lambda + NEologdで作るサーバレス日本語形態素解析API | PyCon JP 2017 in TOKYO
  • 自然言語処理のサービスのAWS上での構成を考えてみる - Qiita

    目標 AWSサービスを効率的に使って、自然言語処理に関するサービスを構築する。 可能な限りローコストを目指す(特にアクセスしていない時の料金を減らす)。 もちろん高可用性構成。 マルチテナント構成を取る BERTを使って類似文章検索を行う。 転置インデックスを使用した全文検索を行いたい(単語での検索など)。ElasticSearchは値段高いのでパス。 前提 今回は、構成の考察。検証済みの部分もあり、未検証部分もあり。 実際の製品がこの構成を取っている事を示すものでは無いです(まだ検証段階です)。 その為、この構成を取った事によって何か問題が発生するかもしれない事はご了承下さい。 技術要件整理 データ 学習済み基モデル 最近流行りの転移学習向けに、公開されている学習済みデータを使用する。サイズ的には1~数GBを想定。 ファインチューニング用コーパスデータ 転移学習でのファインチューニング

    自然言語処理のサービスのAWS上での構成を考えてみる - Qiita
  • 1