タグ

2025年4月25日のブックマーク (2件)

  • GPUより安く、かつ高速な推論を実現。Amazon EC2 Inf1・Inf2インスタンスの徹底活用法 - Findy Tools

    公開日 2025/04/24更新日 2025/04/24GPUより安く、かつ高速な推論を実現。Amazon EC2 Inf1・Inf2インスタンスの徹底活用法 記事は、株式会社ゼンプロダクツの清原弘貴さんによる寄稿です。 Shodoの開発・運用に携わる中で得た実践的な知見をもとに、自社でAIモデルをホスティングする際の技術的な工夫を紹介します。特に、AWS Inferentia(Inf1、Inf2インスタンス)を活用して、安価かつ高性能な推論基盤を構築する方法を解説します。 はじめにAI校正のShodoでは、自社のAIモデルを動かしてお客様の文章を校正しています。ですがAIを自分でホストするのは簡単ではありませんし、他のミドルウェア等と比べると費用もかかるものです。この記事では自身のAIモデルを、より安価で手軽にホストする方法を紹介します。BERTとLlamaベースの日語モデルを例にし

    GPUより安く、かつ高速な推論を実現。Amazon EC2 Inf1・Inf2インスタンスの徹底活用法 - Findy Tools
    System
    System 2025/04/25
  • 「こういう無神経さが癇に障るんだよなあ」宮崎駿氏の思想や言葉は『東京住まいのアカインテリの傲慢』なのか?

    わいるどうぃりぃ @wildwilly888 率直に言えば、パヤオの言葉って山手線に乗れば国会図書館を含む資料を簡単に閲覧できる、東京住まいのアカインテリの傲慢にしか見えないんだよね。 ネットの充実で、動画を含む資料が片田舎でも閲覧できるようになったのは当にありがたいわけで。 パヤオ、こういう無神経さが癇に障るんだよなあ。 x.com/Harenai_Furuwa… 2025-04-23 11:34:51 わいるどうぃりぃ @wildwilly888 ネットが普及する以前、「一歩目の情報」を手に入れる労力は都会と地方では雲泥の差があった、ということを書いときたい。 例えば「マントルピース」という単語があっても地方ではそれが何なのか、どのようにして使われるのかすら分からなかったわけで。 でも東京だと旧岩崎邸などですぐわかる。 2025-04-23 16:49:42

    「こういう無神経さが癇に障るんだよなあ」宮崎駿氏の思想や言葉は『東京住まいのアカインテリの傲慢』なのか?
    System
    System 2025/04/25
    初歩から積み上げずに途中から資料を見ただけの状態で入っていっても、実感を伴わない情報はいざ実践するときにどこか空回りしている感じになる。あるいは手の付け所が分からなくなったり。