並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 195件

新着順 人気順

Kubernetesの検索結果1 - 40 件 / 195件

  • フレームワークはRails、インフラはAWS ECS、チケットには納期を定めず、コミュニケーションは非同期…… 不動産SaaSのマルチプロダクト展開のため全てに筋を通すスタートアップ「Facilo」の流儀 - はてなニュース

    Forbes JAPANによる次世代スタートアップ100選1にも選出されたFaciloは、創業CEOである市川紘(こう)さんが長年取り組んできた不動産テックの事業領域において、既存の不動産仲介会社の営業活動を支援するビジネスモデルを選び、顧客への物件紹介や内見といったプロセスでDX(デジタルトランスフォーメーション)を支援しています。 アプリケーション開発においては当初からマルチプロダクト展開を想定し、どのエンジニアでも扱えるようなインフラ環境の設計、保守運用のしやすさを重視したアプリケーションフレームワークの選択、そしてエンジニアの自律性と自主性を重視した開発プロセスを採用するなど、CTOである梅林泰孝さんの思考は一貫したシンプルさを保っています。 この開発姿勢はスピードが重視されるスタートアップにとって有用ですが、実際に徹底するのは簡単なことではないでしょう。Faciloではなぜこのよ

      フレームワークはRails、インフラはAWS ECS、チケットには納期を定めず、コミュニケーションは非同期…… 不動産SaaSのマルチプロダクト展開のため全てに筋を通すスタートアップ「Facilo」の流儀 - はてなニュース
    • 決済基盤のアーキテクチャ特集 - Findy Tools

      決済システムでは、高い耐障害性やスケーラビリティ、柔軟性、またデータの整合性等が特に高度に求められる領域です。本特集では、決済基盤の開発・運営に携わる6社のエンジニアの方々にご協力頂き、決済システムにおける技術選定のポイントや今後の展望を、アーキテクチャ図と共に解説頂きました。 ※ご紹介は企業名のアルファベット順となっております 合同会社DMM.com合同会社DMM.comは、会員数4,507万人(※)を誇る総合サービスサイト「DMM.com」を運営しています。 1998年の創業以来、多岐にわたる事業を展開し、現在は60以上のサービスを運営。動画配信や電子書籍、アニメなどの多様なエンタメサービスに加え、3DプリントやEV充電などのハードウェア分野、AIといった最先端のテクノロジーを取り入れた事業など、様々な事業を手掛けています。 2022年にはサブスクリプション会員システムの「DMMプレミ

        決済基盤のアーキテクチャ特集 - Findy Tools
      • [速報]Google Cloudが「Agent Development Kit」をオープンソースで公開へ。100行以下のコードでMCPやガードレールを備えたエージェントを開発可能

        Google Cloudは、日本時間で今日(2025年4月10日)未明に開幕した「Google Cloud Next 2025」において、AIエージェントの開発を容易にするフレームワーク「Agent Development Kit」をオープンソースとして公開することを発表しました。 使用するAIモデルとしてGoogleのGeminiだけでなく、Google Cloudが提供するモデルカタログであるVertex AIのModel Gardenからアクセス可能なAnthropic、Meta、Mistral AI、AI21 Labs、CAMB.AI、Qodo などが提供する200以上のモデルから選択可能(ただしGeminiとVertex AIに最適化されていると説明されています)。 Model Context Protocol(MCP)もサポートしており、データとエージェント間の安全な接続を実現

          [速報]Google Cloudが「Agent Development Kit」をオープンソースで公開へ。100行以下のコードでMCPやガードレールを備えたエージェントを開発可能
        • 弱者男性だけど人生初デリヘルを使ったらツイフェミ女に当たって最悪

          マジでもう最悪の体験したから聞いてくれ。 人生初デリヘル使ったらまさかのツイフェミ女に当たって地獄を見た。 これだから女は…ってなるのも無理ないだろ。 俺みたいな弱者男性がようやく勇気出してデリヘル呼んだんだぞ? それなのにさ、来たのがツイフェミオーラ出まくりの女でドン引きしたわ。 マジ金返せレベル。最初からそういうの書いとけよ。「フェミニスト風俗嬢」みたいなジャンルでもあるのかよw ていうかさ、ネットでちゃんと調べて、口コミとか評判良さそうな店選んだんだぞ?料金だって結構したし。弱者男性の俺としては一大決心だったわけ。 一人暮らしの寂しさに耐えかねて、ようやく電話する勇気出したのに。 電話の時点では普通だったんだよ。店員も丁寧だったし、希望も聞いてくれたし。 「初めてなんで優しい子がいいです」って言ったら「わかりました」って感じでさ。 それなのに来たのは明らかに俺に不快感持ってる女。玄関

            弱者男性だけど人生初デリヘルを使ったらツイフェミ女に当たって最悪
          • みんなのためのLLMアプリケーション開発環境の構築事例

            はじめに こんにちは。Game Platform DevのDong Hun Ryoo、Takenaka、Zhang Youlu(Michael)、Hyungjung Leeです。私たちの組織は、ゲームパブリッシングに必要なさまざまな機能を開発・運用する役割を担っています。 私たちは最近、組織内の業務効率を高めるためにさまざまなLLM(large language model)アプリケーションを開発し、それと連携してLLMOpsシステムの構築プロジェクトを行いました。プロジェクトの主な目標の一つは、参入障壁が高いLLMアプリケーション開発を、職種に関係なく誰でも簡単に作成できる環境を構築することでした。そのため、さまざまなことを考えながら試行錯誤を経た結果、誰でも簡単にアクセスできる開発・デプロイ環境を整えました。 今回の記事では、LLMアプリケーションの一般的な開発方法と開発プロセスで直面

              みんなのためのLLMアプリケーション開発環境の構築事例
            • Model Context Protocol (MCP) サーバを使ってみた・作ってみた

              Model Context Protocol(MCP)は、AI(LLM)の能力を拡張するためのプロトコルです。このブログ記事では、以下について書きます。 MCPの概要 MCPを使ってみた MCPを作ってみた MCPとは何か? Model Context Protocolは、AI(GPTやClaudeなどのLLM)が外部システムやAPIと通信するための標準化されたプロトコルでAnthropic社が定めたものです。MCPを使用することで、AIアシスタントは以下のようなことが可能になります: インターネット上の情報にアクセスする データベースを検索する ファイルシステムを操作する 外部APIを呼び出す GitやGitHubなどの開発ツールを操作する MCPの公式サイトの紹介文には以下のような概念図があります。 modelcontextprotocol.io introductionより引用 また

                Model Context Protocol (MCP) サーバを使ってみた・作ってみた
              • 改行文字を含む環境変数ケーススタディ - inSmartBank

                こんにちは osyoyu です。最近は環境変数の扱いの整理に取り組んでいました。 ところで、秘匿値を環境変数で管理する場合、改行文字(0x0A = LF)を含む環境変数を取り扱わねばならないケースは稀にあります。もっともありがちな例は秘密鍵のPEMでしょうか。GitHub Appを作成するとよくあるケースですね。 -----BEGIN RSA PRIVATE KEY----- MIICXQIBAAKBgQCw0YNSqI9T1VFvRsIOejZ9feiKz1SgGfbe9Xq5tEzt2yJCsbyg +xtcuCswNhdqY5A1ZN7G60HbL4/Hh/TlLhFJ4zNHVylz9mDDx3yp4IIcK2lb566d fTD0B5EQ9Iqub4twLUdLKQCBfyhmJJvsEqKxm4J4QWgI+Brh/Pm3d4piPwIDAQAB AoGASC6fj6TkLfM

                  改行文字を含む環境変数ケーススタディ - inSmartBank
                • Why I'm No Longer Talking to Architects About Microservices

                  Check out our Cloud Native Services and book a call with one of our experts today! It happened again last week. I was at an architecture review meeting when a fellow architect eagerly started another debate about *microservices*. Within minutes, eyes glazed over and we were knee-deep in an absurd discussion about something that should have been a means to an end, but had morphed into the end itsel

                    Why I'm No Longer Talking to Architects About Microservices
                  • SREのためのCline活用法:OSSコードリーディングを効率化する実践テクニック

                    エスマットでエンジニアをしているpotix2です。最近、 社内の EKS クラスター上に Dify 環境を構築していたときに設定ミスから予想外の問題に遭遇しました。この問題解決に Cline を活用したところ、コードリーディングの効率が大幅に向上し、従来の方法よりも短時間で原因特定ができました。 この記事では、SRE のための Cline 活用法と、実際のトラブルシューティング事例について共有します。 1 分まとめ Cline に実行ログを与えると、関連するコードを素早く特定できる Dify 環境の構築時、複数コンポーネント間のキャッシュ問題を Cline で効率的に解決した SRE こそ Cline を活用すべき、コードリーディングの効率が大幅に向上する Dify でのトラブル:見えない依存関係の謎 Dify は、ノーコード・ローコードで AI アプリケーションを開発できるオープンソース

                      SREのためのCline活用法:OSSコードリーディングを効率化する実践テクニック
                    • 【連載】Cybozu.comクラウド基盤の全貌 - Cybozu Inside Out | サイボウズエンジニアのブログ

                      イントロダクション クラウド基盤本部の吉川拓哉です。「Cybozu.comクラウド基盤の全貌」と題して私たちが運用している基盤を連載形式で紹介することになりました。第1回となる本記事はイントロを兼ねたサイボウズのクラウド基盤の概要説明です。 サイボウズのクラウド サイボウズが自社クラウド「cybozu.com」でサービス提供を開始したのは2011年。パッケージ提供していたグループウェア製品であるOfficeやGaroon、メールワイズをクラウド版として移植し、業務アプリケーションを手軽に開発できるkintoneをクラウド製品として新たに開発するなど、クラウドを通じてより多くのユーザーにサービスを届けられるよう努めてきました。 その土台となる基盤を構築しているのがクラウド基盤本部のエンジニアであり、サービスを24/365で安定稼働させつつ、ビジネス成長に合わせてアーキテクチャレベルでの基盤刷

                        【連載】Cybozu.comクラウド基盤の全貌 - Cybozu Inside Out | サイボウズエンジニアのブログ
                      • ハンズオンで学ぶ Prometheus による Kubernetes 監視のしくみ - RAKUS Developers Blog | ラクス エンジニアブログ

                        目次 はじめに Prometheusとは ハンズオン環境を構築しよう Prometheusを触ってみよう Prometheusによる監視の全体像をつかもう まとめ はじめに このブログの目的 (と、ごあいさつ) こんにちは。SREの gumamon です! 最近、Kubernetesを使う現場がどんどん増えてきました。 Kubernetesは自律的にいろいろ動いてくれる分、「今なにが起きているのか」を把握するのが意外と難しいです。 特に、構成が動的に変わるKubernetesでは、サービスディスカバリ機能のある監視ツールが欠かせません。 そんな中で、Kubernetesのメトリクス監視といえば、今やPrometheusがデファクトスタンダードです。 このブログでは、PrometheusがどのようにKubernetesの情報を集めているのかを、ハンズオン形式で体験しながら理解していきます。

                          ハンズオンで学ぶ Prometheus による Kubernetes 監視のしくみ - RAKUS Developers Blog | ラクス エンジニアブログ
                        • なぜオープンソースソフトウェアにコントリビュートすべきなのか

                          NTTの須田です。2024年9月に開催された 第57回 情報科学若手の会 にて、「なぜオープンソースソフトウェアにコントリビュートすべきなのか」と題して招待講演させていただきました。講演内容をブログとして再編成しました。 講演資料 (PDF)なぜOSSにコントリビュートすべきなのか結論から言うと、主にOSSの持続可能性のためです。 OSSは「タダ飯」(free lunch) であるかの如く、対価を支払うことなく消費されがちです。ミートアップなどで提供される実際の「タダ飯」🍕🍣とは異なり、遠慮なく好きなだけ食べても他の人の迷惑にはなりませんが、この「タダ飯」を提供する側のことを誰かが気にかけていないと次の問題が生じます: 「タダ飯」が出てこなくなる (OSSの開発が停滞する)毒入りの「タダ飯」が出てくる (OSSにマルウェアが混入する)前者はましな方で、後者が特に事業や社会にとっての脅威

                            なぜオープンソースソフトウェアにコントリビュートすべきなのか
                          • Kubernetes Event-driven Autoscaling(KEDA)で実現する夜間・休日のインフラコスト削減 - ZOZO TECH BLOG

                            はじめに こんにちは、データシステム部MLOpsブロックの木村です。MLOpsブロックでは、継続的にGoogle Cloudのコスト削減に取り組んでいます。その一環として、夜間や休日といった利用されていない時間帯にも稼働し続けることで発生していた、開発・検証・テスト環境の余分なコストに着目しました。 この課題を解決するために、MLOpsブロックではKubernetes Event-driven Autoscaling(以下KEDA)を導入しました。KEDAは、Kubernetes環境でイベントドリブンによるオートスケールを実現するオープンソースのツールです。KEDAにより利用されていない時間帯のPodを停止させ余分なコストを削減しました。 本記事ではKEDAを導入したモチベーションや効果、導入する際に直面した課題や、加えて事故なく本番環境へ適用するために工夫した点をご紹介します。KEDAの

                              Kubernetes Event-driven Autoscaling(KEDA)で実現する夜間・休日のインフラコスト削減 - ZOZO TECH BLOG
                            • 生成AI時代のCloud NativeとSREに対する考え方とスタンス - LayerX エンジニアブログ

                              こんにちは。LayerX AI・LLM事業部 SREのshinyorke(しんよーく)と申します。 現在はAI・LLM事業部のAIプラットフォーム「Ai Workforce」1人目のSREとして、 SRE(Site Reliability Engineering)の戦略策定と導入、実装。 企業への導入に際する技術的なサポート・伴走。 SREチーム立ち上げの為の組織作り。より具体的にはSREの採用と育成。 以上のミッションを担っています、入社から現在までの営みはこちらのブログで紹介しています。 tech.layerx.co.jp 一人目SREとして情報とノウハウを泥臭く取りに行きながら、さっさと行動して少しずつSREのプラクティスを浸透させましょう。というスタンスで泥臭く、時にはパワフルにやってきた話を前回のブログでは紹介させてもらいました。私達の行動指針的には「Trustful Team」

                                生成AI時代のCloud NativeとSREに対する考え方とスタンス - LayerX エンジニアブログ
                              • Kubernetesで実現できるPlatform Engineering の現在地

                                本日、「Kubernetesで実践する Platform Engineering - FL#88」というイベントで「Kubernetesで実現できるPlatform Engineering の現在地」🎵🧭 というタイトルで登壇しました! 🔍 イベント詳細: - イベント名: Kubernetes…

                                  Kubernetesで実現できるPlatform Engineering の現在地
                                • EKSの権限整備のため、K8sのRBACについて勉強した話 - freee Developers Hub

                                  こんにちは、SREの久保木です。一年弱ぶりにまた記事を書きます。 以前はfreeeに入って割とすぐの頃で、Project間の依存関係を表す図を自動生成したりしていました。 その後はfreeeで使われているTerraform Codeを一括整備するためにTFLintを導入しつつCustom Ruleを実装したり、この手のLinter導入にありがちな最初の間は警告が多すぎて無視されてしまう問題に対処するために全部のCodeを手入れしたり(すごい量でした……)、結果的にfreeeのInfrastructureのIaC周り全般の知識を得られたのでそれを用いてSecurity Riskのある問題の対処をしたり、最近はPSIRTやSRE内のCloud Governance Teamと連携してAWSのResourceの管理状態を見直したりと、いろんなふわっとした課題、ちょっと手をつけづらい課題を探しては

                                    EKSの権限整備のため、K8sのRBACについて勉強した話 - freee Developers Hub
                                  • 【海外記事紹介】マイクロサービスについてアーキテクトと議論するのはもうウンザリ

                                    3月20日、海外のインフラエンジニアIan Miell氏が「Why I'm No Longer Talking to Architects About Microservices(私がマイクロサービスについてアーキテクトと話をしなくなった理由)」と題した記事を公開した。この記事では、マイクロサービスを組織に導入するにあたっての課題と不満を述べており、海外で大きな反響を呼んでいる。 3月20日、海外のインフラエンジニアIan Miell氏が「Why I'm No Longer Talking to Architects About Microservices(私がマイクロサービスについてアーキテクトと話をしなくなった理由)」と題した記事を公開した。 この記事では、マイクロサービスを組織に導入するにあたっての課題と不満を述べており、海外で大きな反響を呼んでいる。 以下に、その内容を紹介する。

                                      【海外記事紹介】マイクロサービスについてアーキテクトと議論するのはもうウンザリ
                                    • CVE-2025-1974: The IngressNightmare in Kubernetes | Wiz Blog

                                      IngressNightmare: CVE-2025-1974 - 9.8 Critical Unauthenticated Remote Code Execution Vulnerabilities in Ingress NGINXOver 40% of cloud environments are vulnerable to RCE, likely leading to a complete cluster takeover. Wiz Research discovered CVE-2025-1097, CVE-2025-1098, CVE-2025-24514 and CVE-2025-1974, a series of unauthenticated Remote Code Execution vulnerabilities in Ingress NGINX Controller

                                      • Herokuが.NETを正式サポート。C#やVisual Basicなどで開発された.NETアプリケーションを簡単にデプロイ

                                        Herokuが.NETを正式サポート。C#やVisual Basicなどで開発された.NETアプリケーションを簡単にデプロイ PaaS(Platform as a Service)を提供するHerokuは、マイクロソフトのアプリケーションフレームワークである.NETを正式にサポートしたと発表しました。 これによりC#、F#、Visual Basicなどで開発された.NETアプリケーション、ASP.NET CoreやBlazorなどの.NET上のフレームワークで開発されたアプリケーションなどが、Herokuへ簡単にデプロイし、テスト環境や本番環境として利用できるようになります。 Today we’re thrilled to announce that #dotNET support on #Heroku is now GA! We’re thankful to all of our bet

                                          Herokuが.NETを正式サポート。C#やVisual Basicなどで開発された.NETアプリケーションを簡単にデプロイ
                                        • Introducing Styrolite: Building a Linux Container Runtime from Scratch

                                          Edera Protect 1.0 is now generally available. See it live at KubeCon Edera Protect is a suite of offerings bridging the gap between modern cloud native computing and virtualization-based security techniques. To power this platform, we've built our own container runtime designed to operate as a microservice, allowing it to run containers in a fully programmatic way—similar to how the Kubernetes Con

                                            Introducing Styrolite: Building a Linux Container Runtime from Scratch
                                          • Kubernetesの本番運用が8割の今、セキュリティが最大の課題だったクラウドネイティブ活用はどう変化した?

                                            Kubernetesの本番運用が8割の今、セキュリティが最大の課題だったクラウドネイティブ活用はどう変化した?:CNCFが年次調査結果の2024年版を公開 Cloud Native Computing Foundation(CNCF)は、クラウドネイティブ技術の導入状況に関する12回目の年次調査の結果をまとめたレポート「Cloud Native 2024」を発表した。 クラウドネイティブ関連のオープンソースソフトウェア(OSS)を管理する団体Cloud Native Computing Foundation(CNCF)は2025年4月1日(米国時間)、クラウドネイティブ技術の導入状況に関する12回目の年次調査の結果をまとめたレポート「Cloud Native 2024」を発表した。 CNCFはLinux Foundationの傘下団体であり、この調査はLinux Foundation Re

                                              Kubernetesの本番運用が8割の今、セキュリティが最大の課題だったクラウドネイティブ活用はどう変化した?
                                            • GKEを用いたマルチテナントSaaSの構築 - stmn tech blog

                                              はじめに こんにちは、プラットフォーム部の近藤です。 2018年に初期リリースしたチャット機能は、システムの拡張性と安定性の向上が課題となっていました。そこで、これらの課題を解決し、より快適なサービスを提供するために、2025年3月に「TUNAGチャット」をリリースしました。本記事では、このリプレースにおいて、マルチテナント型の SaaS アプリケーションをどのように構成したのかをご紹介します。 prtimes.jp 図1にアーキテクチャ全体の構成を示しました。Google Kubernetes Engine (GKE) を中心に構成しています。実際にはもっと多くのコンポーネントを用いていますが、この記事で取り上げたい内容に限定して図にしました。弊社ではこれまで、Amazon Elastic Container Service (Amazon ECS) を採用することがほとんどで、GKE

                                                GKEを用いたマルチテナントSaaSの構築 - stmn tech blog
                                              • Amazon Q Developer CLI での超高速な新しいエージェント型のコーディング体験 | Amazon Web Services

                                                Amazon Web Services ブログ Amazon Q Developer CLI での超高速な新しいエージェント型のコーディング体験 本記事は 2025 年 3 月 6 日に公開された “A lightning fast, new agentic coding experience within the Amazon Q Developer CLI” を翻訳したものです。 本日、Amazon Q Developer は Amazon Q コマンドラインインターフェース (CLI) において強化された CLI エージェントを発表しました。今回の発表により、Q Developer は最新のエージェント型体験を CLI に導入し、より動的でインタラクティブなコーディング環境を提供します。これにより、開発者と対話しながらフィードバックに基づいて変更を加えていくことが可能になります。Am

                                                  Amazon Q Developer CLI での超高速な新しいエージェント型のコーディング体験 | Amazon Web Services
                                                • Google Chromeのゼロデイ脆弱性を発見、悪用されると「リンクをクリックするだけで攻撃が成立」 Kaspersky

                                                  Kasperskyは2025年3月27日、「Google Chrome」(以下、Chrome)のゼロデイ脆弱(ぜいじゃく)性(CVE-2025-2783)を特定し、Googleに報告したと発表した。同脆弱性を悪用すると、攻撃者はChromeの「サンドボックス保護システム」を回避できる。 同脆弱性は、2025年3月中旬にKasperskyのEDR(Endpoint Detection and Response)「Next EDR Expert」が、あるマルウェア感染の高まりを検知したことがきっかけで、発見できたという。そのマルウェアに感染すると、フィッシングメール内の「個別にカスタマイズされた悪意のあるリンク」をクリックするだけで、システムが侵害される。 同社のグローバル調査分析チーム(GReAT)の分析によって、攻撃には、Chrome最新バージョンの未知の脆弱性が利用されていることが判明し

                                                    Google Chromeのゼロデイ脆弱性を発見、悪用されると「リンクをクリックするだけで攻撃が成立」 Kaspersky
                                                  • Wiz to Join Google Cloud: Making Magic Together | Wiz Blog

                                                    Wiz to Join Google Cloud: Making Magic Together Securing the future of cloud and AI Today we have reached yet another milestone on our journey - we have signed a deal to be acquired by Google. The deal is subject to regulatory review, and Wiz will join Google Cloud after close. Five years ago, my fellow cofounders and I set out to create something security and development teams would love. We emba

                                                    • Gemini、社内利用スタート! | フューチャー技術ブログ

                                                      米国時間の2025年1月15日に「Google AI の優れた機能を Google Workspace の Business プランと Enterprise プランに組み込むことを決定しました」でもアナウンスされた Gemini が、ついに当社内でも利用が始まりました。Chatbot Arena で常連の Gemini モデルが業務で使えるようになり、とても熱い展開なのでブログ化しました。 はじめにこんにちは。tanai(棚井龍之介) です。 先日、ある企業さんのオフィスへ訪問した際に、「ウチでは、〇〇(←誰もが知っている生成AIサービス)は、全員にアカウントが支給されているよ」という話を伺い、とても羨ましいなと思っていました。私の場合、業務外で ChatGPT Plus、Felo Pro、Gemini Advanced、Mapify Pro を中心に課金して、他サービスもお試し利用しなが

                                                        Gemini、社内利用スタート! | フューチャー技術ブログ
                                                      • 脱VMwareにKVMという選択肢 OSSの知見はやはり重要だ

                                                        脱VMwareに向けて大手SIerのNTTデータがKVMに舵を切るという記者発表会のレポートは、読者の関心も高かったようだ(関連記事:脱VMwareで“KVM”に舵を切る NTTデータが仮想化基盤市場に本格参入)。ここではKVMの歴史を振り返り、テクノロジーの選択について学べることはないか考えてみたい。 現在のITを支える基盤とも言える仮想化技術。商用UNIXだけでなく、インテルやAMDなどのx86プラットフォームで利用できるようになったのが、VMwareの功績であることは間違いない。1990年代後半から一気に市場を席巻したVMwareに対して、2007年にシトリックスがLinux最古のハイパーバイザ型仮想化技術であるXenの開発元(XenSource)を買収し、2008年にマイクロソフトもHyper-Vの提供を開始した。KVMがLinuxカーネルにマージされたのもちょうどそんな時期。20

                                                          脱VMwareにKVMという選択肢 OSSの知見はやはり重要だ
                                                        • LINEヤフーのAIプラットフォームにおけるバッチスケジューリング戦略

                                                          こんにちは。LINEヤフーでAIプラットフォーム向けのKubernetesクラスタの設計や構築、運用を担当している大村です。 LINEヤフーでは、100を超えるサービス向けにAI/機械学習を活用したサービスのライフサイクル全般(MLOps)をサポートするAIプラットフォームを内製しています。 最近、AIプラットフォーム向けのKubernetesクラスタであるAI Cloud Platform(ACP)において、H100 GPUクラスタの導入が行われ、本格的に分散深層学習ワークロードを受け入れる基盤が整ってきました。それを契機として、ACPにおけるバッチスケジューラの選定を行いました。その結果、kube-scheduler(Scheduling Frameworkによる拡張)+Kueueという組み合わせを導入することにしました。 このブログでは、その検討の軌跡を紹介することで ACPにおける

                                                            LINEヤフーのAIプラットフォームにおけるバッチスケジューリング戦略
                                                          • LLMアプリの作成からテストとデプロイまで、LLMOpsの構築事例の紹介

                                                            LLMOpsとは? 近年、GPT-4のような大規模言語モデル(large language model、以下LLM)の使用が普及し、それを活用したアプリケーションの開発が活発に行われています。たとえば、24時間英語学習をサポートするアプリケーションや、お客様からのお問い合わせに自然に応答するアプリケーションなど、LLMは私たちの生活の中に溶け込んでいます。 しかし、このようなLLMベースのアプリケーションを直接開発し、商用サービス化するのはまだ難しい状況です。万能のように見えるLLMでも、現在の文脈を把握して確率に基づいて回答を生成することに特化しているため、もっともらしい応答を提供することがあります。そのため、予期しない回答などでサービス品質が低下するのを防ぐには、さまざまな技術を適用する複雑なプロセスが必要になります。 LLMが有意義な回答を提供できるように開発するためには、データセッ

                                                              LLMアプリの作成からテストとデプロイまで、LLMOpsの構築事例の紹介
                                                            • Here’s how I use LLMs to help me write code

                                                              11th March 2025 Online discussions about using Large Language Models to help write code inevitably produce comments from developers who’s experiences have been disappointing. They often ask what they’re doing wrong—how come some people are reporting such great results when their own experiments have proved lacking? Using LLMs to write code is difficult and unintuitive. It takes significant effort

                                                                Here’s how I use LLMs to help me write code
                                                              • 「gpt-4o-transcribe」「gpt-4o-mini-transcribe」を試す

                                                                from openai import OpenAI client = OpenAI() audio_file= open("voice_lunch_jp_5min.wav", "rb") transcription = client.audio.transcriptions.create( model="whisper-1", file=audio_file ) print("\n===== whisper-1 =====\n", transcription.text) transcription = client.audio.transcriptions.create( model="gpt-4o-mini-transcribe", file=audio_file ) print("\n===== gpt-4o-mini-transcribe =====\n", transcriptio

                                                                  「gpt-4o-transcribe」「gpt-4o-mini-transcribe」を試す
                                                                • クラウドの巨人たちが新たなKubernetesリソース管理ツールで協業

                                                                  Spring BootによるAPIバックエンド構築実践ガイド 第2版 何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

                                                                    クラウドの巨人たちが新たなKubernetesリソース管理ツールで協業
                                                                  • スクエニのゲーム基盤、試行錯誤重ねた“数百台のアプリ”のGoogle Cloud移設 (1/2)

                                                                    Google Cloudは、2025年3月6日、次世代インフラをテーマとしたイベント「Modern Infra Summit '25」をハイブリッドで開催。 本記事では、「ゲーム基盤システム移行クエスト そしてGoogle Cloudへ…」と題するスクウェア・エニックスのセッションを紹介する。同社が数年かけて進めてきた、オンプレVMwareベースのアプリケーションをGoogle Cloudへ移設するプロジェクトについて語られた。 数十msecオーダーのAPI性能が求められたゲーム基盤の移行 詳細は伏せられたが、移行を進めたゲーム基盤は、ゲームプレイにおいて重要な役割を担うシステムであり、高性能で安定した動作が求められていた。新作ゲームのリリースやイベント時には大量のリクエストが集中し、“ネットワークが瞬断”すると数百件のエラーが発生してしまう。加えて、ユーザー体験のために、“数十msecオ

                                                                      スクエニのゲーム基盤、試行錯誤重ねた“数百台のアプリ”のGoogle Cloud移設 (1/2)
                                                                    • 内製AIコードレビューActionsの導入 - LIFULL Creators Blog

                                                                      エンジニアの小林です。 LIFULLで社内ABテスト基盤を開発しています。その開発の中で社内の生成AI基盤「keelai」を活用した取り組みを紹介します。 www.lifull.blog LIFULLではkeelaiという社内向けの生成AI基盤プロジェクトを運用しており、今回はこのkeelaiを利用したコードレビュー用のGitHub Actionsを実装した事例を紹介します。 www.lifull.blog 内製AI Agentによるコードレビュー GitHub Actionsを活用して実現したAIレビューのワークフローは以下の通りです。 コードレビューの概要 GPTやClaudeなどのAPIを利用せず、内製AI Agent「keelai」を活用した理由は以下のとおりです。 社内固有の知識を活用可能 - 社内ドメイン知識を持ったレビューが可能です 継続的な改善サイクル - レビューActi

                                                                        内製AIコードレビューActionsの導入 - LIFULL Creators Blog
                                                                      • Amazon EKS Auto Mode のノード自動更新を Deep Dive する ~ 長期実行ワークロードを正しく取り扱う - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS

                                                                        Amazon EKS Auto Mode は、AWS re:Invent 2024 で発表された Amazon EKS の新しい実行モードです。Auto Mode は、Kubernetes クラスターのノード管理を大幅に自動化し、運用の負荷を軽減することを目的としています。「Amazon EKS Auto Mode を始めよう」では、Auto Mode が持つ機能やアーキテクチャ、具体的に運用をどのように効率化できるかについて記載されていますのでぜひご参照ください。 Auto Mode では、Amazon EKS が皆さんに代わって自律的にノードを管理します。そのため、 Auto Mode が管理している Kubernetes のノードには以下のような動的な性質があります。 AMI の自動更新 : Auto Mode 用の新しい Amazon Machine Image (AMI) がリリ

                                                                          Amazon EKS Auto Mode のノード自動更新を Deep Dive する ~ 長期実行ワークロードを正しく取り扱う - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS
                                                                        • SIerがSREを提供する難しさ〜アサインと教育のリアルと解決策〜 - APC 技術ブログ

                                                                          1. はじめに 2. SREの人月提供で直面するアサインの難しさ 2.1 SREに必要なスキルセットが広すぎる 2.2 「インフラエンジニア=SRE適性あり」とは限らない 2.3 案件ごとに求められるSREの役割が異なる 3. SREを提供するための教育の壁 3.1 SREマインドの定着が難しい 3.2 短期間で現場適応できるスキル育成が求められる 3.3 「開発」と「運用」の橋渡しスキルをどう教えるか 4. SIerとしての解決策 4.1 アサインの工夫 4.2 教育の工夫 5. SRE人材の成長とキャリアパス 6. まとめ 1. はじめに こんにちは。ACS事業部でEnginnering Managerをしている谷合です。 弊社はSIerとしてSIでのご支援の傍らSRE(Site Reliability Engineering)を提供しています。 過去投稿したSREに関するブログは以下

                                                                            SIerがSREを提供する難しさ〜アサインと教育のリアルと解決策〜 - APC 技術ブログ
                                                                          • HTTP/3 is everywhere but nowhere

                                                                            HTTP/3 has been in development since at least 2016, while QUIC (the protocol beneath it) was first introduced by Google way back in 2013. Both are now standardized, supported in 95% of users' browsers, already used in 32% of HTTP requests to Cloudflare, and support is advertised by 35% of websites (through alt-svc or DNS) in the HTTP Archive dataset. We've developed a totally new version of HTTP,

                                                                              HTTP/3 is everywhere but nowhere
                                                                            • 【海外記事紹介】HTTP/3はなぜ普及しないのか、を考察した記事が話題に

                                                                              3月13日、HTTPのデバッグツールを開発するHTTP Toolkitが「HTTP/3はどこにでもあるが、どこにもない(HTTP/3 is everywhere but nowhere)」と題した記事を公開し、大きな話題を呼んでいる。この記事では、HTTP/3とQUICの標準化・普及状況の現状と課題について詳しく紹介されている。 3月13日、HTTPのデバッグツールを開発するHTTP Toolkitが「HTTP/3はどこにでもあるが、どこにもない(HTTP/3 is everywhere but nowhere)」と題した記事を公開し、大きな話題を呼んでいる。この記事では、HTTP/3とQUICの標準化・普及状況の現状と課題について詳しく紹介されている。 HTTP/3は「どこにでもある」が「どこにもない」 HTTP/3はQUICを基盤とし、TCPベースのHTTP/2よりも接続やデータ転送の

                                                                                【海外記事紹介】HTTP/3はなぜ普及しないのか、を考察した記事が話題に
                                                                              • GitHub - kro-run/kro: kro | Kube Resource Orchestrator

                                                                                What is kro? Kube Resource Orchestrator (kro) is a new operator for Kubernetes that simplifies the creation of complex Kubernetes resource configurations. kro lets you create and manage custom groups of Kubernetes resources by defining them as a ResourceGraphDefinition, the project's fundamental custom resource. ResourceGraphDefinition specifications define a set of resources and how they relate t

                                                                                  GitHub - kro-run/kro: kro | Kube Resource Orchestrator
                                                                                • 実践 OpenTelemetry

                                                                                  本書は、オブザーバビリティのコンセプトとともに、OpenTelemetryのアーキテクチャ、仕様、活用方法について解説する書籍です。SREやDevOpsの分野でマイクロサービスを実装・運用しているソフトウェア開発者、Kubernetesアプリケーションのトラブルに悩むインフラエンジニアなどが、OpenTelemetryを導入し、オブザーバビリティを実装する際の助けとなります。本書によってOpenTelemetryを本番環境で利用する際のアーキテクチャ、設定、またトラブルシュートの方法などについての知識が得られるでしょう。

                                                                                    実践 OpenTelemetry