並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 194件

新着順 人気順

Kubernetesの検索結果1 - 40 件 / 194件

  • MCPで広がるLLM 〜Clineでの動作原理〜

    この記事『Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜』では、Clineの内部構造について解説しました。今回は、その中でも最近、特に注目されている機能の一つ、MCPについての概要、ならびにCline内部での実装方法について詳しく掘り下げていきます。 そもそもMCPとは MCP(Model Context Protocol)はClineやCursorなどといった、LLMを使用しているクライアントがMCPサーバーと連携するためのプロトコルです。広義的に、MCPとはそのプロトコルを使用したサービスのことを指します。 MCPサーバーとはクラウド上のサービスやローカルで立ち上げているサーバーなどのことです。LLMがこのサーバーと連携することで、Notionのファイル編集やSupabaseのデータベースクエリ、Cloudflareのステータスチェック、ローカルのファイル編集などが可能に

      MCPで広がるLLM 〜Clineでの動作原理〜
    • フレームワークはRails、インフラはAWS ECS、チケットには納期を定めず、コミュニケーションは非同期…… 不動産SaaSのマルチプロダクト展開のため全てに筋を通すスタートアップ「Facilo」の流儀 - はてなニュース

      Forbes JAPANによる次世代スタートアップ100選1にも選出されたFaciloは、創業CEOである市川紘(こう)さんが長年取り組んできた不動産テックの事業領域において、既存の不動産仲介会社の営業活動を支援するビジネスモデルを選び、顧客への物件紹介や内見といったプロセスでDX(デジタルトランスフォーメーション)を支援しています。 アプリケーション開発においては当初からマルチプロダクト展開を想定し、どのエンジニアでも扱えるようなインフラ環境の設計、保守運用のしやすさを重視したアプリケーションフレームワークの選択、そしてエンジニアの自律性と自主性を重視した開発プロセスを採用するなど、CTOである梅林泰孝さんの思考は一貫したシンプルさを保っています。 この開発姿勢はスピードが重視されるスタートアップにとって有用ですが、実際に徹底するのは簡単なことではないでしょう。Faciloではなぜこのよ

        フレームワークはRails、インフラはAWS ECS、チケットには納期を定めず、コミュニケーションは非同期…… 不動産SaaSのマルチプロダクト展開のため全てに筋を通すスタートアップ「Facilo」の流儀 - はてなニュース
      • 弱者男性だけど人生初デリヘルを使ったらツイフェミ女に当たって最悪

        マジでもう最悪の体験したから聞いてくれ。 人生初デリヘル使ったらまさかのツイフェミ女に当たって地獄を見た。 これだから女は…ってなるのも無理ないだろ。 俺みたいな弱者男性がようやく勇気出してデリヘル呼んだんだぞ? それなのにさ、来たのがツイフェミオーラ出まくりの女でドン引きしたわ。 マジ金返せレベル。最初からそういうの書いとけよ。「フェミニスト風俗嬢」みたいなジャンルでもあるのかよw ていうかさ、ネットでちゃんと調べて、口コミとか評判良さそうな店選んだんだぞ?料金だって結構したし。弱者男性の俺としては一大決心だったわけ。 一人暮らしの寂しさに耐えかねて、ようやく電話する勇気出したのに。 電話の時点では普通だったんだよ。店員も丁寧だったし、希望も聞いてくれたし。 「初めてなんで優しい子がいいです」って言ったら「わかりました」って感じでさ。 それなのに来たのは明らかに俺に不快感持ってる女。玄関

          弱者男性だけど人生初デリヘルを使ったらツイフェミ女に当たって最悪
        • みんなのためのLLMアプリケーション開発環境の構築事例

          はじめに こんにちは。Game Platform DevのDong Hun Ryoo、Takenaka、Zhang Youlu(Michael)、Hyungjung Leeです。私たちの組織は、ゲームパブリッシングに必要なさまざまな機能を開発・運用する役割を担っています。 私たちは最近、組織内の業務効率を高めるためにさまざまなLLM(large language model)アプリケーションを開発し、それと連携してLLMOpsシステムの構築プロジェクトを行いました。プロジェクトの主な目標の一つは、参入障壁が高いLLMアプリケーション開発を、職種に関係なく誰でも簡単に作成できる環境を構築することでした。そのため、さまざまなことを考えながら試行錯誤を経た結果、誰でも簡単にアクセスできる開発・デプロイ環境を整えました。 今回の記事では、LLMアプリケーションの一般的な開発方法と開発プロセスで直面

            みんなのためのLLMアプリケーション開発環境の構築事例
          • ここがつらいよ分散型SQLデータベース.pptx

            ここがつらいよ分散SQLデータベース Yoshitaka Koitabashi Sr. Solution Architect PingCAP株式会社 ハッシュタグ:#jawsdays2025 #jawsug #jawsdays2025_e 自己紹介 ハッシュタグ:#jawsdays2025 #jawsug #jawsdays2025_e Yoshitaka KOITABASHI PingCAP株式会社 Sr. Solution Architect 💙 Database / Serverless / Container ● PingCAPとは? ● 分散型SQLデータベース ● TiDBの裏側 (アーキテクチャ/MVCC/分散トランザクション/Raft/ etc...) ● 実際の運用現場で直面する課題 ハッシュタグ:#jawsdays2025 #jawsug #jawsdays2025_

            • Model Context Protocol (MCP) サーバを使ってみた・作ってみた

              Model Context Protocol(MCP)は、AI(LLM)の能力を拡張するためのプロトコルです。このブログ記事では、以下について書きます。 MCPの概要 MCPを使ってみた MCPを作ってみた MCPとは何か? Model Context Protocolは、AI(GPTやClaudeなどのLLM)が外部システムやAPIと通信するための標準化されたプロトコルでAnthropic社が定めたものです。MCPを使用することで、AIアシスタントは以下のようなことが可能になります: インターネット上の情報にアクセスする データベースを検索する ファイルシステムを操作する 外部APIを呼び出す GitやGitHubなどの開発ツールを操作する MCPの公式サイトの紹介文には以下のような概念図があります。 modelcontextprotocol.io introductionより引用 また

                Model Context Protocol (MCP) サーバを使ってみた・作ってみた
              • 改行文字を含む環境変数ケーススタディ - inSmartBank

                こんにちは osyoyu です。最近は環境変数の扱いの整理に取り組んでいました。 ところで、秘匿値を環境変数で管理する場合、改行文字(0x0A = LF)を含む環境変数を取り扱わねばならないケースは稀にあります。もっともありがちな例は秘密鍵のPEMでしょうか。GitHub Appを作成するとよくあるケースですね。 -----BEGIN RSA PRIVATE KEY----- MIICXQIBAAKBgQCw0YNSqI9T1VFvRsIOejZ9feiKz1SgGfbe9Xq5tEzt2yJCsbyg +xtcuCswNhdqY5A1ZN7G60HbL4/Hh/TlLhFJ4zNHVylz9mDDx3yp4IIcK2lb566d fTD0B5EQ9Iqub4twLUdLKQCBfyhmJJvsEqKxm4J4QWgI+Brh/Pm3d4piPwIDAQAB AoGASC6fj6TkLfM

                  改行文字を含む環境変数ケーススタディ - inSmartBank
                • 「kubeshark」でKubernetesのトラフィックをリアルタイムに可視化する

                  はじめに 3-shakeのSreake事業部でインターンとして活動している小林(@moz-sec)です。第13回目の今回は、KubernetesのAPIトラフィックアナライザである「kubeshark」について紹介します。 kubesharkは、KubernetesのPod、Node、Clusterを出入りするすべてのトラフィックをキャプチャし、リアルタイムで可視化するツールです。 kubesharkとは kubesharkは、WiresharkをKubernetesのためにカスタマイズしたツールです。kubesharkを使うことでトラフィックの分析が可能になり、インシデントの迅速な解決を支援します。 また、REST、GraphQL、gRPC、Redis、Kafka、RabbitMQ(AMQP)、DNSなどといった幅広いプロトコルをサポートしています。 ノード数が4台以下のクラスターであれ

                    「kubeshark」でKubernetesのトラフィックをリアルタイムに可視化する
                  • Why I'm No Longer Talking to Architects About Microservices

                    Check out our Cloud Native Services and book a call with one of our experts today! It happened again last week. I was at an architecture review meeting when a fellow architect eagerly started another debate about *microservices*. Within minutes, eyes glazed over and we were knee-deep in an absurd discussion about something that should have been a means to an end, but had morphed into the end itsel

                      Why I'm No Longer Talking to Architects About Microservices
                    • レベル別で紹介!オープンソースで挑戦できる120のプロジェクトアイデア集 - Qiita

                      はじめに 「オープンソースに挑戦したいけど、どんなプロジェクトを作ればいいかわからない…」そんな悩みを持っていませんか? 本記事では、初心者・中級者・上級者・達人 の4つのレベルに分けて、合計 120個のオープンソースプロジェクトアイデア を紹介します。 それぞれのアイデアの詳細については折りたたんであります。興味がある内容については広げてみて機能要件や実装のポイント、拡張機能、学べることを見てみてください! 自分のスキルレベルに合ったプロジェクトを見つけて、実際に開発に挑戦してみましょう! 初心者向けプロジェクトアイデア 1. ToDoリストアプリ 概要 ToDoリストアプリは、ユーザーがタスクを追加・編集・削除し、完了状況を管理できるシンプルなアプリです。 初心者でも取り組みやすく、プログラミングの基礎となる CRUD(Create, Read, Update, Delete) の概念

                      • SREのためのCline活用法:OSSコードリーディングを効率化する実践テクニック

                        エスマットでエンジニアをしているpotix2です。最近、 社内の EKS クラスター上に Dify 環境を構築していたときに設定ミスから予想外の問題に遭遇しました。この問題解決に Cline を活用したところ、コードリーディングの効率が大幅に向上し、従来の方法よりも短時間で原因特定ができました。 この記事では、SRE のための Cline 活用法と、実際のトラブルシューティング事例について共有します。 1 分まとめ Cline に実行ログを与えると、関連するコードを素早く特定できる Dify 環境の構築時、複数コンポーネント間のキャッシュ問題を Cline で効率的に解決した SRE こそ Cline を活用すべき、コードリーディングの効率が大幅に向上する Dify でのトラブル:見えない依存関係の謎 Dify は、ノーコード・ローコードで AI アプリケーションを開発できるオープンソース

                          SREのためのCline活用法:OSSコードリーディングを効率化する実践テクニック
                        • 【連載】Cybozu.comクラウド基盤の全貌 - Cybozu Inside Out | サイボウズエンジニアのブログ

                          イントロダクション クラウド基盤本部の吉川拓哉です。「Cybozu.comクラウド基盤の全貌」と題して私たちが運用している基盤を連載形式で紹介することになりました。第1回となる本記事はイントロを兼ねたサイボウズのクラウド基盤の概要説明です。 サイボウズのクラウド サイボウズが自社クラウド「cybozu.com」でサービス提供を開始したのは2011年。パッケージ提供していたグループウェア製品であるOfficeやGaroon、メールワイズをクラウド版として移植し、業務アプリケーションを手軽に開発できるkintoneをクラウド製品として新たに開発するなど、クラウドを通じてより多くのユーザーにサービスを届けられるよう努めてきました。 その土台となる基盤を構築しているのがクラウド基盤本部のエンジニアであり、サービスを24/365で安定稼働させつつ、ビジネス成長に合わせてアーキテクチャレベルでの基盤刷

                            【連載】Cybozu.comクラウド基盤の全貌 - Cybozu Inside Out | サイボウズエンジニアのブログ
                          • ハンズオンで学ぶ Prometheus による Kubernetes 監視のしくみ - RAKUS Developers Blog | ラクス エンジニアブログ

                            目次 はじめに Prometheusとは ハンズオン環境を構築しよう Prometheusを触ってみよう Prometheusによる監視の全体像をつかもう まとめ はじめに このブログの目的 (と、ごあいさつ) こんにちは。SREの gumamon です! 最近、Kubernetesを使う現場がどんどん増えてきました。 Kubernetesは自律的にいろいろ動いてくれる分、「今なにが起きているのか」を把握するのが意外と難しいです。 特に、構成が動的に変わるKubernetesでは、サービスディスカバリ機能のある監視ツールが欠かせません。 そんな中で、Kubernetesのメトリクス監視といえば、今やPrometheusがデファクトスタンダードです。 このブログでは、PrometheusがどのようにKubernetesの情報を集めているのかを、ハンズオン形式で体験しながら理解していきます。

                              ハンズオンで学ぶ Prometheus による Kubernetes 監視のしくみ - RAKUS Developers Blog | ラクス エンジニアブログ
                            • なぜオープンソースソフトウェアにコントリビュートすべきなのか

                              NTTの須田です。2024年9月に開催された 第57回 情報科学若手の会 にて、「なぜオープンソースソフトウェアにコントリビュートすべきなのか」と題して招待講演させていただきました。講演内容をブログとして再編成しました。 講演資料 (PDF)なぜOSSにコントリビュートすべきなのか結論から言うと、主にOSSの持続可能性のためです。 OSSは「タダ飯」(free lunch) であるかの如く、対価を支払うことなく消費されがちです。ミートアップなどで提供される実際の「タダ飯」🍕🍣とは異なり、遠慮なく好きなだけ食べても他の人の迷惑にはなりませんが、この「タダ飯」を提供する側のことを誰かが気にかけていないと次の問題が生じます: 「タダ飯」が出てこなくなる (OSSの開発が停滞する)毒入りの「タダ飯」が出てくる (OSSにマルウェアが混入する)前者はましな方で、後者が特に事業や社会にとっての脅威

                                なぜオープンソースソフトウェアにコントリビュートすべきなのか
                              • 生成AI時代のCloud NativeとSREに対する考え方とスタンス - LayerX エンジニアブログ

                                こんにちは。LayerX AI・LLM事業部 SREのshinyorke(しんよーく)と申します。 現在はAI・LLM事業部のAIプラットフォーム「Ai Workforce」1人目のSREとして、 SRE(Site Reliability Engineering)の戦略策定と導入、実装。 企業への導入に際する技術的なサポート・伴走。 SREチーム立ち上げの為の組織作り。より具体的にはSREの採用と育成。 以上のミッションを担っています、入社から現在までの営みはこちらのブログで紹介しています。 tech.layerx.co.jp 一人目SREとして情報とノウハウを泥臭く取りに行きながら、さっさと行動して少しずつSREのプラクティスを浸透させましょう。というスタンスで泥臭く、時にはパワフルにやってきた話を前回のブログでは紹介させてもらいました。私達の行動指針的には「Trustful Team」

                                  生成AI時代のCloud NativeとSREに対する考え方とスタンス - LayerX エンジニアブログ
                                • Kubernetes Event-driven Autoscaling(KEDA)で実現する夜間・休日のインフラコスト削減 - ZOZO TECH BLOG

                                  はじめに こんにちは、データシステム部MLOpsブロックの木村です。MLOpsブロックでは、継続的にGoogle Cloudのコスト削減に取り組んでいます。その一環として、夜間や休日といった利用されていない時間帯にも稼働し続けることで発生していた、開発・検証・テスト環境の余分なコストに着目しました。 この課題を解決するために、MLOpsブロックではKubernetes Event-driven Autoscaling(以下KEDA)を導入しました。KEDAは、Kubernetes環境でイベントドリブンによるオートスケールを実現するオープンソースのツールです。KEDAにより利用されていない時間帯のPodを停止させ余分なコストを削減しました。 本記事ではKEDAを導入したモチベーションや効果、導入する際に直面した課題や、加えて事故なく本番環境へ適用するために工夫した点をご紹介します。KEDAの

                                    Kubernetes Event-driven Autoscaling(KEDA)で実現する夜間・休日のインフラコスト削減 - ZOZO TECH BLOG
                                  • Kubernetesで実現できるPlatform Engineering の現在地

                                    本日、「Kubernetesで実践する Platform Engineering - FL#88」というイベントで「Kubernetesで実現できるPlatform Engineering の現在地」🎵🧭 というタイトルで登壇しました! 🔍 イベント詳細: - イベント名: Kubernetes…

                                      Kubernetesで実現できるPlatform Engineering の現在地
                                    • ローカルで生成AIを実行できる環境を「Open WebUI」「Ollama」「Kubernetes」で構築してみよう

                                      ローカルで生成AIを実行できる環境を「Open WebUI」「Ollama」「Kubernetes」で構築してみよう:クラウドサービスだけじゃない! ローカルPCやサーバ、Kubernetesで生成AI(2) 気軽に試せるラップトップ環境で、チャットbotを提供するオールインワンの生成AI環境構築から始め、Kubernetesを活用した本格的なGPUクラスタの構築やモデルのファインチューニングまで解説する本連載。今回は、「Open WebUI」「Ollama」「Kubernetes」を活用して生成AIと対話できる環境をローカルで構築する方法を解説します。

                                        ローカルで生成AIを実行できる環境を「Open WebUI」「Ollama」「Kubernetes」で構築してみよう
                                      • 自宅Kubernetesを本格運用するためのツールとノウハウ

                                        🆚 Raspberry Pi Raspberry PiでKubernetesクラスタを組むのも良い選択だと思いますが、アーキテクチャがARMであることと、SDカードではディスクI/Oが遅すぎて現実的ではない点に注意が必要です。市販のキットを買って3段重ねにするのもKubernetesの面白さを感じられて楽しいと思います。 ノード構成: 物理シングル * VM複数ノード 物理マシンを複数保有していないため、ホストをVMで区切り3ノードにしています。物理マシンが1つしかなくとも、複数のVMで複数に分割することで下記のようなメリットを享受することができます。 あるVMのメンテナンス時に他のVMへワークロードを移動させダウンタイムを削減できる イメージを丸ごとバックアップすれば良いのでバックアップ戦略が簡略化できる より本番環境に近い構成となり実運用のノウハウを得やすい 私のクラスタでは下記のよ

                                          自宅Kubernetesを本格運用するためのツールとノウハウ
                                        • EKSの権限整備のため、K8sのRBACについて勉強した話 - freee Developers Hub

                                          こんにちは、SREの久保木です。一年弱ぶりにまた記事を書きます。 以前はfreeeに入って割とすぐの頃で、Project間の依存関係を表す図を自動生成したりしていました。 その後はfreeeで使われているTerraform Codeを一括整備するためにTFLintを導入しつつCustom Ruleを実装したり、この手のLinter導入にありがちな最初の間は警告が多すぎて無視されてしまう問題に対処するために全部のCodeを手入れしたり(すごい量でした……)、結果的にfreeeのInfrastructureのIaC周り全般の知識を得られたのでそれを用いてSecurity Riskのある問題の対処をしたり、最近はPSIRTやSRE内のCloud Governance Teamと連携してAWSのResourceの管理状態を見直したりと、いろんなふわっとした課題、ちょっと手をつけづらい課題を探しては

                                            EKSの権限整備のため、K8sのRBACについて勉強した話 - freee Developers Hub
                                          • 【海外記事紹介】マイクロサービスについてアーキテクトと議論するのはもうウンザリ

                                            3月20日、海外のインフラエンジニアIan Miell氏が「Why I'm No Longer Talking to Architects About Microservices(私がマイクロサービスについてアーキテクトと話をしなくなった理由)」と題した記事を公開した。この記事では、マイクロサービスを組織に導入するにあたっての課題と不満を述べており、海外で大きな反響を呼んでいる。 3月20日、海外のインフラエンジニアIan Miell氏が「Why I'm No Longer Talking to Architects About Microservices(私がマイクロサービスについてアーキテクトと話をしなくなった理由)」と題した記事を公開した。 この記事では、マイクロサービスを組織に導入するにあたっての課題と不満を述べており、海外で大きな反響を呼んでいる。 以下に、その内容を紹介する。

                                              【海外記事紹介】マイクロサービスについてアーキテクトと議論するのはもうウンザリ
                                            • CVE-2025-1974: The IngressNightmare in Kubernetes | Wiz Blog

                                              IngressNightmare: CVE-2025-1974 - 9.8 Critical Unauthenticated Remote Code Execution Vulnerabilities in Ingress NGINXOver 40% of cloud environments are vulnerable to RCE, likely leading to a complete cluster takeover. Wiz Research discovered CVE-2025-1097, CVE-2025-1098, CVE-2025-24514 and CVE-2025-1974, a series of unauthenticated Remote Code Execution vulnerabilities in Ingress NGINX Controller

                                              • Introducing Styrolite: Building a Linux Container Runtime from Scratch

                                                Edera Protect 1.0 is now generally available. See it live at KubeCon Edera Protect is a suite of offerings bridging the gap between modern cloud native computing and virtualization-based security techniques. To power this platform, we've built our own container runtime designed to operate as a microservice, allowing it to run containers in a fully programmatic way—similar to how the Kubernetes Con

                                                  Introducing Styrolite: Building a Linux Container Runtime from Scratch
                                                • Amazon Q Developer CLI での超高速な新しいエージェント型のコーディング体験 | Amazon Web Services

                                                  Amazon Web Services ブログ Amazon Q Developer CLI での超高速な新しいエージェント型のコーディング体験 本記事は 2025 年 3 月 6 日に公開された “A lightning fast, new agentic coding experience within the Amazon Q Developer CLI” を翻訳したものです。 本日、Amazon Q Developer は Amazon Q コマンドラインインターフェース (CLI) において強化された CLI エージェントを発表しました。今回の発表により、Q Developer は最新のエージェント型体験を CLI に導入し、より動的でインタラクティブなコーディング環境を提供します。これにより、開発者と対話しながらフィードバックに基づいて変更を加えていくことが可能になります。Am

                                                    Amazon Q Developer CLI での超高速な新しいエージェント型のコーディング体験 | Amazon Web Services
                                                  • GKEを用いたマルチテナントSaaSの構築 - stmn tech blog

                                                    はじめに こんにちは、プラットフォーム部の近藤です。 2018年に初期リリースしたチャット機能は、システムの拡張性と安定性の向上が課題となっていました。そこで、これらの課題を解決し、より快適なサービスを提供するために、2025年3月に「TUNAGチャット」をリリースしました。本記事では、このリプレースにおいて、マルチテナント型の SaaS アプリケーションをどのように構成したのかをご紹介します。 prtimes.jp 図1にアーキテクチャ全体の構成を示しました。Google Kubernetes Engine (GKE) を中心に構成しています。実際にはもっと多くのコンポーネントを用いていますが、この記事で取り上げたい内容に限定して図にしました。弊社ではこれまで、Amazon Elastic Container Service (Amazon ECS) を採用することがほとんどで、GKE

                                                      GKEを用いたマルチテナントSaaSの構築 - stmn tech blog
                                                    • A lightning fast, new agentic coding experience within the Amazon Q Developer CLI | Amazon Web Services

                                                      AWS DevOps & Developer Productivity Blog A lightning fast, new agentic coding experience within the Amazon Q Developer CLI Earlier today, Amazon Q Developer announced an enhanced CLI agent within the Amazon Q command line interface (CLI). With this announcement, Q Developer brings the latest agentic experience to the CLI that provide a more dynamic, interactive coding experience that works with yo

                                                        A lightning fast, new agentic coding experience within the Amazon Q Developer CLI | Amazon Web Services
                                                      • Wiz to Join Google Cloud: Making Magic Together | Wiz Blog

                                                        Wiz to Join Google Cloud: Making Magic Together Securing the future of cloud and AI Today we have reached yet another milestone on our journey - we have signed a deal to be acquired by Google. The deal is subject to regulatory review, and Wiz will join Google Cloud after close. Five years ago, my fellow cofounders and I set out to create something security and development teams would love. We emba

                                                        • 脱VMwareにKVMという選択肢 OSSの知見はやはり重要だ

                                                          脱VMwareに向けて大手SIerのNTTデータがKVMに舵を切るという記者発表会のレポートは、読者の関心も高かったようだ(関連記事:脱VMwareで“KVM”に舵を切る NTTデータが仮想化基盤市場に本格参入)。ここではKVMの歴史を振り返り、テクノロジーの選択について学べることはないか考えてみたい。 現在のITを支える基盤とも言える仮想化技術。商用UNIXだけでなく、インテルやAMDなどのx86プラットフォームで利用できるようになったのが、VMwareの功績であることは間違いない。1990年代後半から一気に市場を席巻したVMwareに対して、2007年にシトリックスがLinux最古のハイパーバイザ型仮想化技術であるXenの開発元(XenSource)を買収し、2008年にマイクロソフトもHyper-Vの提供を開始した。KVMがLinuxカーネルにマージされたのもちょうどそんな時期。20

                                                            脱VMwareにKVMという選択肢 OSSの知見はやはり重要だ
                                                          • LINEヤフーのAIプラットフォームにおけるバッチスケジューリング戦略

                                                            こんにちは。LINEヤフーでAIプラットフォーム向けのKubernetesクラスタの設計や構築、運用を担当している大村です。 LINEヤフーでは、100を超えるサービス向けにAI/機械学習を活用したサービスのライフサイクル全般(MLOps)をサポートするAIプラットフォームを内製しています。 最近、AIプラットフォーム向けのKubernetesクラスタであるAI Cloud Platform(ACP)において、H100 GPUクラスタの導入が行われ、本格的に分散深層学習ワークロードを受け入れる基盤が整ってきました。それを契機として、ACPにおけるバッチスケジューラの選定を行いました。その結果、kube-scheduler(Scheduling Frameworkによる拡張)+Kueueという組み合わせを導入することにしました。 このブログでは、その検討の軌跡を紹介することで ACPにおける

                                                              LINEヤフーのAIプラットフォームにおけるバッチスケジューリング戦略
                                                            • Gemini、社内利用スタート! | フューチャー技術ブログ

                                                              米国時間の2025年1月15日に「Google AI の優れた機能を Google Workspace の Business プランと Enterprise プランに組み込むことを決定しました」でもアナウンスされた Gemini が、ついに当社内でも利用が始まりました。Chatbot Arena で常連の Gemini モデルが業務で使えるようになり、とても熱い展開なのでブログ化しました。 はじめにこんにちは。tanai(棚井龍之介) です。 先日、ある企業さんのオフィスへ訪問した際に、「ウチでは、〇〇(←誰もが知っている生成AIサービス)は、全員にアカウントが支給されているよ」という話を伺い、とても羨ましいなと思っていました。私の場合、業務外で ChatGPT Plus、Felo Pro、Gemini Advanced、Mapify Pro を中心に課金して、他サービスもお試し利用しなが

                                                                Gemini、社内利用スタート! | フューチャー技術ブログ
                                                              • Here’s how I use LLMs to help me write code

                                                                11th March 2025 Online discussions about using Large Language Models to help write code inevitably produce comments from developers who’s experiences have been disappointing. They often ask what they’re doing wrong—how come some people are reporting such great results when their own experiments have proved lacking? Using LLMs to write code is difficult and unintuitive. It takes significant effort

                                                                  Here’s how I use LLMs to help me write code
                                                                • 「gpt-4o-transcribe」「gpt-4o-mini-transcribe」を試す

                                                                  from openai import OpenAI client = OpenAI() audio_file= open("voice_lunch_jp_5min.wav", "rb") transcription = client.audio.transcriptions.create( model="whisper-1", file=audio_file ) print("\n===== whisper-1 =====\n", transcription.text) transcription = client.audio.transcriptions.create( model="gpt-4o-mini-transcribe", file=audio_file ) print("\n===== gpt-4o-mini-transcribe =====\n", transcriptio

                                                                    「gpt-4o-transcribe」「gpt-4o-mini-transcribe」を試す
                                                                  • Freedesktop.org、GitLabインスタンス移行に伴い最大1週間のダウンタイムを予告 | gihyo.jp

                                                                    Linux Daily Topics Freedesktop.org⁠⁠、GitLabインスタンス移行に伴い最大1週間のダウンタイムを予告 Freedesktop.orgは3月16日からGitLabインスタンスをシャットダウンし、もとのホストである「Equinix Metal」からドイツのホスティング企業Hetznerが展開する「Hetzner Cloud」への移行作業を開始する。移行に伴うダウンタイムは最大で1週間ほどで、その間すべてのサービスが停止することになる。 Migration out of Equinix metal (tentative date: March 16, 2025) -freedesktop -GitLab Freedesktop.orgのGitLabインスタンスはこれまで、データセンター事業者のEquinixが提供するベアメタルIaaSサービス「Equinix

                                                                      Freedesktop.org、GitLabインスタンス移行に伴い最大1週間のダウンタイムを予告 | gihyo.jp
                                                                    • クラウドの巨人たちが新たなKubernetesリソース管理ツールで協業

                                                                      Spring BootによるAPIバックエンド構築実践ガイド 第2版 何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

                                                                        クラウドの巨人たちが新たなKubernetesリソース管理ツールで協業
                                                                      • スクエニのゲーム基盤、試行錯誤重ねた“数百台のアプリ”のGoogle Cloud移設 (1/2)

                                                                        Google Cloudは、2025年3月6日、次世代インフラをテーマとしたイベント「Modern Infra Summit '25」をハイブリッドで開催。 本記事では、「ゲーム基盤システム移行クエスト そしてGoogle Cloudへ…」と題するスクウェア・エニックスのセッションを紹介する。同社が数年かけて進めてきた、オンプレVMwareベースのアプリケーションをGoogle Cloudへ移設するプロジェクトについて語られた。 数十msecオーダーのAPI性能が求められたゲーム基盤の移行 詳細は伏せられたが、移行を進めたゲーム基盤は、ゲームプレイにおいて重要な役割を担うシステムであり、高性能で安定した動作が求められていた。新作ゲームのリリースやイベント時には大量のリクエストが集中し、“ネットワークが瞬断”すると数百件のエラーが発生してしまう。加えて、ユーザー体験のために、“数十msecオ

                                                                          スクエニのゲーム基盤、試行錯誤重ねた“数百台のアプリ”のGoogle Cloud移設 (1/2)
                                                                        • SpacetimeDB

                                                                          use spacetimedb::{table, reducer, ReducerContext, Table}; #[table(name = person, public)] pub struct Person { name: String, } #[reducer] pub fn add(ctx: &ReducerContext, name: String) { log::info!("Inserting {}", name); ctx.db.person().insert(Person { name }); } #[reducer] pub fn say_hello(ctx: &ReducerContext) { for person in ctx.db.person().iter() { log::info!("Hello, {}!", person.name); } log::

                                                                            SpacetimeDB
                                                                          • HTTP/3 is everywhere but nowhere

                                                                            HTTP/3 has been in development since at least 2016, while QUIC (the protocol beneath it) was first introduced by Google way back in 2013. Both are now standardized, supported in 95% of users' browsers, already used in 32% of HTTP requests to Cloudflare, and support is advertised by 35% of websites (through alt-svc or DNS) in the HTTP Archive dataset. We've developed a totally new version of HTTP,

                                                                              HTTP/3 is everywhere but nowhere
                                                                            • SIerがSREを提供する難しさ〜アサインと教育のリアルと解決策〜 - APC 技術ブログ

                                                                              1. はじめに 2. SREの人月提供で直面するアサインの難しさ 2.1 SREに必要なスキルセットが広すぎる 2.2 「インフラエンジニア=SRE適性あり」とは限らない 2.3 案件ごとに求められるSREの役割が異なる 3. SREを提供するための教育の壁 3.1 SREマインドの定着が難しい 3.2 短期間で現場適応できるスキル育成が求められる 3.3 「開発」と「運用」の橋渡しスキルをどう教えるか 4. SIerとしての解決策 4.1 アサインの工夫 4.2 教育の工夫 5. SRE人材の成長とキャリアパス 6. まとめ 1. はじめに こんにちは。ACS事業部でEnginnering Managerをしている谷合です。 弊社はSIerとしてSIでのご支援の傍らSRE(Site Reliability Engineering)を提供しています。 過去投稿したSREに関するブログは以下

                                                                                SIerがSREを提供する難しさ〜アサインと教育のリアルと解決策〜 - APC 技術ブログ
                                                                              • 【海外記事紹介】HTTP/3はなぜ普及しないのか、を考察した記事が話題に

                                                                                3月13日、HTTPのデバッグツールを開発するHTTP Toolkitが「HTTP/3はどこにでもあるが、どこにもない(HTTP/3 is everywhere but nowhere)」と題した記事を公開し、大きな話題を呼んでいる。この記事では、HTTP/3とQUICの標準化・普及状況の現状と課題について詳しく紹介されている。 3月13日、HTTPのデバッグツールを開発するHTTP Toolkitが「HTTP/3はどこにでもあるが、どこにもない(HTTP/3 is everywhere but nowhere)」と題した記事を公開し、大きな話題を呼んでいる。この記事では、HTTP/3とQUICの標準化・普及状況の現状と課題について詳しく紹介されている。 HTTP/3は「どこにでもある」が「どこにもない」 HTTP/3はQUICを基盤とし、TCPベースのHTTP/2よりも接続やデータ転送の

                                                                                  【海外記事紹介】HTTP/3はなぜ普及しないのか、を考察した記事が話題に
                                                                                • GitHub - kro-run/kro: kro | Kube Resource Orchestrator

                                                                                  What is kro? Kube Resource Orchestrator (kro) is a new operator for Kubernetes that simplifies the creation of complex Kubernetes resource configurations. kro lets you create and manage custom groups of Kubernetes resources by defining them as a ResourceGraphDefinition, the project's fundamental custom resource. ResourceGraphDefinition specifications define a set of resources and how they relate t

                                                                                    GitHub - kro-run/kro: kro | Kube Resource Orchestrator