Systemのブックマーク / 2025年4月25日

System id:System

2025年4月25日のブックマーク (2件)

GPUより安く、かつ高速な推論を実現。Amazon EC2 Inf1・Inf2インスタンスの徹底活用法 - Findy Tools
公開日 2025/04/24更新日 2025/04/24GPUより安く、かつ高速な推論を実現。Amazon EC2 Inf1・Inf2インスタンスの徹底活用法本記事は、株式会社ゼンプロダクツの清原弘貴さんによる寄稿です。 Shodoの開発・運用に携わる中で得た実践的な知見をもとに、自社でAIモデルをホスティングする際の技術的な工夫を紹介します。特に、AWS Inferentia（Inf1、Inf2インスタンス）を活用して、安価かつ高性能な推論基盤を構築する方法を解説します。はじめにAI校正のShodoでは、自社のAIモデルを動かしてお客様の文章を校正しています。ですがAIを自分でホストするのは簡単ではありませんし、他のミドルウェア等と比べると費用もかかるものです。この記事では自身のAIモデルを、より安価で手軽にホストする方法を紹介します。BERTとLlamaベースの日本語モデルを例にし
System 2025/04/25
aws
リンク
「こういう無神経さが癇に障るんだよなあ」宮崎駿氏の思想や言葉は『東京住まいのアカインテリの傲慢』なのか？
わいるどうぃりぃ @wildwilly888 率直に言えば、パヤオの言葉って山手線に乗れば国会図書館を含む資料を簡単に閲覧できる、東京住まいのアカインテリの傲慢にしか見えないんだよね。ネットの充実で、動画を含む資料が片田舎でも閲覧できるようになったのは本当にありがたいわけで。パヤオ、こういう無神経さが癇に障るんだよなあ。 x.com/Harenai_Furuwa… 2025-04-23 11:34:51 わいるどうぃりぃ @wildwilly888 ネットが普及する以前、「一歩目の情報」を手に入れる労力は都会と地方では雲泥の差があった、ということを書いときたい。例えば「マントルピース」という単語があっても地方ではそれが何なのか、どのようにして使われるのかすら分からなかったわけで。でも東京だと旧岩崎邸などですぐわかる。 2025-04-23 16:49:42
System 2025/04/25
初歩から積み上げずに途中から資料を見ただけの状態で入っていっても、実感を伴わない情報はいざ実践するときにどこか空回りしている感じになる。あるいは手の付け所が分からなくなったり。
リンク
- 2025年4月29日
- 2025年4月25日
- 2025年4月23日