3-shake SRE Tech Talk 特別回「アーキテクチャモダナイゼーション」にて、「30分でわかるアーキテクチャモダナイゼーション」というタイトルで登壇しました。 https://3-shake.connpass.com/event/382086/ 書籍『アーキテクチャモダナイゼー…
3-shake SRE Tech Talk 特別回「アーキテクチャモダナイゼーション」にて、「30分でわかるアーキテクチャモダナイゼーション」というタイトルで登壇しました。 https://3-shake.connpass.com/event/382086/ 書籍『アーキテクチャモダナイゼー…
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? この記事の対象読者 ローカルLLMに興味があるが、Ollamaで動かないモデルに遭遇して途方に暮れている方 NVIDIA Nemotron-Nano-9B-v2-Japanese を自分のPCで動かしてみたい方 llama.cpp や Open WebUI を使ったローカルAI環境を構築したい方 HuggingFace の safetensors モデルを GGUF に変換する手順を知りたい方 この記事で得られること Nemotron-Nano-9B-v2-Japaneseの全体像: Mamba-2 + Transformer ハイブリ
PC上に自分専用のAIアシスタントを常駐させてパソコン操作やスマートフォン連携による様々な作業を自動化することができるAIエージェントのOpenClaw(旧Clawdbot)は、さまざまなタスクをコンピューター上でこなしてくれる一方で、パーソナルなタスクを任せるためにはコンピューター上の深いプライバシー情報へのアクセスを許可する必要があり、利便性とセキュリティ上のリスクがトレードオフとなっています。セキュリティ上の懸念を軽減するための策として、「Raspberry PiをOpenClaw専用デバイスとして運用する」という方法をRaspberry Pi開発チームのトビー・ロバーツ氏が解説しています。 Turn your Raspberry Pi into an AI agent with OpenClaw - Raspberry Pi https://www.raspberrypi.com/
はじめに 東京科学大学 修士2年の藤井です。 本日(2026/02/20)、Swallow LLM Projectから、Qwen3-Swallow-v0.2、GPT-OSS-Swallow-v0.1をリリースさせていただきました。これらのモデルは、それぞれAlibaba Qwen3とOpenAI GPT-OSSから日本語、英語、数学、コード、科学分野のデータセットを用いて、継続事前学習(Continual Pre-Training)、SFT(Supervised Fine-Tuning) を行い、その後、数学データセットを用いてRLVR(Reinforcement Learning with Verifiable Rewards) を行ったモデルになります。 従来のSwallowモデル同様に日本語能力の強化がなされていますが、本モデルは、Qwen3やGPT-OSSなどのTopクラスの性能を
更新履歴2026-02-20: 初期バージョン(v0.2)を公開(v0.1は欠番となります)。2026-02-23: GPTQの量子化モデルで繰り返し生成が多く発生する傾向が見られるため、GPTQ版のモデルの公開を停止しました。性能8BモデルQwen3 Swallow 8B RLの性能を以下のLLMと比較しました。評価には大規模言語モデル評価フレームワークであるswallow-evaluation-instructを用いました。なお、この評価結果はSwallow LLM Leaderboard v2でもご覧いただけます(その他のLLMを比較に追加できます)。 Llama 3.1 Swallow 8B Instruct(Swallowチームが構築した最新の非推論型モデル)DeepSeek-R1-Distill-Llama-8B(DeepSeek R1をLlama 3.1 8Bに蒸留した推論型
更新履歴2026-02-20: 初期バージョン(v0.1)を公開。性能20BモデルGPT-OSS Swallow 20B RLの性能を以下のLLMと比較しました。評価には大規模言語モデル評価フレームワークであるswallow-evaluation-instructを用いました。なお、この評価結果はSwallow LLM Leaderboard v2でもご覧いただけます(その他のLLMを比較に追加できます)。 Gemma 3 27B IT(非推論型ではあるが規模がやや大きいモデル)Qwen3-14B(規模が近い推論型モデル、深い推論はon)gpt-oss-20b(継続学習元、深い推論のレベルはmedium)gpt-oss-120b(規模がワンランク大きいモデル、深い推論のレベルはmedium)GPT-OSS Swallow 20Bの日本語タスクでの性能GPT-OSS Swallow 20Bの
分類の観点としては以下を総合的に判断するようにしています。 変更が影響するコンポーネントやモジュールの数 既存の振る舞いへの影響度(インターフェース変更、DB変更、API変更など) 変更の波及範囲(他の機能やサービスへの影響) リスクの大きさ(決済・認証など重要ドメインへの関与) 2. AIによるコードレビューとApprove 同じworkflowの中で、AIがコードレビューも実施します。レビューの観点は人間のレビュアーと同じです。 コード品質とベストプラクティス 潜在的なバグ パフォーマンスへの影響 セキュリティの問題 テストカバレッジ そして、上記の観点で重大な問題がなければ、AIがApproveをsubmitします。 3. XSラベル × Approve済み → auto merge 最後のピースとして、以下の条件をすべて満たすPRでauto mergeを有効化するようにしました。
転職・求人情報サイトのtype エンジニアtype ITニュース 年収2500万でも貧困層? 米マイクロソフトに18年勤務した日本人エンジニアが「日本は健全」と語るワケ NEW! 2026.02.19 ITニュース マイクロソフトお金グローバルAI 「GAFAやMicrosoftに入れば、一生安泰の勝ち組になれる」――。 ビッグテックによる大規模レイオフに驚かなくなってきた昨今、そんな甘い考えでいる人は少ないだろう。しかし、一方でこうも思うはずだ。 「とはいえ、GAFAMに入社できるほどのエンジニアなら相当に優秀。レイオフされたところで、引く手あまたで職に困ることはない」と。 しかし、現実は違うようだ。 2006年に米国マイクロソフト(以下、MS)に入社し、プリンシパル・ソフトウェア・エンジニアという職位にまでのぼり詰めた太田一郎さん。だが、18年の献身が幕を閉じるのに要した時間は、わずか
Ubie CTO の @yukukotani です。 2025年は、Claude Codeのようなターミナル型やCursorのようなエディタ統合型など、ローカルで動作するコーディングエージェントが急速に普及した年でした。一方で、Devinのようなクラウド型のエージェントは、登場時の熱狂と比べるとやや落ち着いた印象を受けた方も多いのではないでしょうか。 個人的には、今の道具では生産性改善の天井が見えてきたように感じます。認知負荷が限界を迎えているからです。そしてその救世主として、クラウド型コーディングエージェントが再び主役に躍り出ると考えています。 本記事では、なぜ今までクラウド型が主流にならなかったのか、何が変わったのか、そしてクラウド型ならではの強みについて整理します。 なぜ今までクラウド型は流行らなかったのか クラウド型コーディングエージェントの普及を阻んでいたボトルネックは、大きく3
こんにちは。ウォンテッドリーでバックエンドエンジニアをしている小室 (@nekorush14) です。今回は、Claude Code の Agent Skills を活用してリポジトリのオンボーディングを効率化する取り組みについて紹介します。 先日、日々の業務改善や効率化につながる課題の解決がテーマの社内AIハッカソンが開催されました。私は自分自身が入社した時につまずいた「ドキュメントを読んでも全体像がつかめない」や「環境構築で謎のエラーが出る」などのオンボーディングに関する課題の解決に取り組みました。 その中で、Claude Code のコンテキストとしてリポジトリの「手がかり」と「地図」、そして「手順」を持たせ、リポジトリに慣れていないエンジニアが自走可能な仕組みの構築を目指しました。 目次はじめに Agent Skills を活用する リポジトリの概要をナレッジとして埋め込む サービ
目次 目次 はじめに この記事の対象読者 背景・課題 背景 課題 AI駆動開発ワークフローの概要 AIサービスごとの役割 Devin Playbook ユーザー起動のPlaybook(Slack → Devin) !ai_task(単一タスク実装) !ai_tasks(タスク分割&並列実装) !human_review(人間承認フロー) 人間レビューが必要なケース ワークフロー自動呼び出しのPlaybook !fix_ci_failure(CI失敗時の自動修正) !fix_review_comments(レビュー指摘の自動修正) !context_curation(AIコンテキストの週次更新) 使用技術 機能一覧 アーキテクチャ SlackからPR承認までの完全フロー 2つのワークフローの役割 フロー別の使い分け 実装 設定ファイル AI Task Implementation:Issue
こんにちは!プロダクトエンジニアのkazzhiraです。 私たちのチームでは、2025年の夏ごろから「AI活用による開発生産性の向上」に取り組んできました。しかし、当初の取り組みは抽象的なガードレールの提示や個々人の実践にとどまり、チームとして大きな成果には結びつきませんでした。 その後、SDD(仕様駆動開発)というアプローチに出会い、オープンソースの cc-sdd フレームワークをベースに試行錯誤を重ねてきました。 本記事では、AI開発標準の策定に失敗した経験から何を学び、どのように仕様駆動開発に辿り着いたのか、そして、実践を通じて得た成果と学びをご紹介します。 チームのAI導入でうまくいかなかった話 AI活用の個人最適化 当初、チームでは Cursor、Claude Code、Devin、GitHub Copilot、Gemini などの AI ツールを個々人の判断で利用できる状態でし
はじめに こんにちは!QAエンジニアのAyakaです。 前回の記事では、子供とGeminiを使ってみた体験と、AIとの距離感について書きました。 今回はそのときに出てきた、もう少し技術寄りの気づきについてです。 小1はキーボード入力がほぼできないので、音声入力でGeminiを使いました。 ここで想定外のところに壁がありました。 小1の操作フロー 実際の流れはこんな感じです。 マイクボタンを押す 子供が話す 音声認識結果が「入力欄」にテキスト化される 紙飛行機ボタンを押して送信 ここまでは一見スムーズでした。 起きたこと 実際に表示された入力欄には 「答えは1個」 と出ていました。 大人から見ると普通の文章ですが、小1にとっては 「答」 「個」 どちらもまだ習っていない漢字でした。 読めない文字が含まれているだけで、「これで合ってるのかな?」という不安につながっていました。 音声で話した内容
とりあえず他の人に説明するのに良さそうなので、ChatGPTに書かせた記事です。 Agentic CodingでCLIを実装していると、機能要件がどんどん進められる反面、非機能要件がないがしろになりがちです。自分は最近静的解析CLIを育てているのですが、OpenTelemetryでtracesとeventsをexportできるようにしました。結果として「どこで遅いか」「どの実装が遅いか」を事実として掴めるようになり、最適化を迷わず打てるようになりました。さらにJargerを使えばスクリーンショットやJSONとして結果を取得できるため、人間はもちろんCoding Agentにとっても計測と改善のループを回しやすくなります。 traces(Span)とは CLIの処理を「区間」に分けて、spanとして刻みます。例えば: 引数解析 入力列挙(ファイル探索など) 入力の読み込み 処理実行(処理ごと
と言うのも、細かく設定ができてテンションが上がる一方でiPhoneから動画撮影を始めた人からすると細かすぎて何をどのように設定したら良いのか分からない問題が発生しています。 ただ、このアプリを使いこなせると色々な場面に合わせて撮影できるだけでなく、iPhoneの優秀なカメラ性能と掛け合わせることで普通のカメラと同等かそれ以上の性能を発揮できます! なので持っている機材に合わせた設定方法を自分なりに考えたので参考にしていただけたらと思います。 Apple Logで"映画色"Apple LogというのはiPhone15Pro 以降のシリーズで使用できる機能です。あえて色味を淡く撮影することで、色味を綺麗に編集できる撮影方法です。このiPhoneのLog機能が一般的なカメラと比較しても物凄く優秀で、スマホで撮ったとは思えないぐらいの綺麗な色味を作ることができるのでぜひ使ってみてください。 ・Ap
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く