[B! trouble] manabouのブックマーク

manabou id:manabou

troubleに関するmanabouのブックマーク (122)

【特集】遠く離れた実家でPCトラブル発生！そんなときは「クイックアシスト」を使って救え
manabou 2024/09/04
windows

trouble

debug

error

rdp

vnc

quick
リンク
ゼロから始めるシステム障害対応フロー - Qiita
初めに本記事『ゼロから始めるシステム障害対応フロー』の内容についてタイトルの「ゼロから始める」には二つの意味があります。プロダクトのリリースを間近に迎える中、チーム内での障害対応体制の枠組みがなかったこと。そして体制づくりを担当することとなった私の知識・知見が（ほぼ）ゼロだったこと。この二つです。この状態から、リリース前〜リリース後の約2月間でなんとか形にすることができました。本記事ではその過程でぶつかった問題とそれに対する課題、それらにどう対応したのか、何を学んだのか、の紹介。そして、障害対応体制の策定・構築や改善の流れの中で私が起こした失敗から、人としてリーダーとして何を心がけなければいけなかったのかの反省を共有させてもらいたいと思います。本記事は以下の構成です。 0. 始まり ※ スクラムチームでの話。スクラムチームの登場人物は以下の三つ PO：プロダクトオーナー（Pd
manabou 2024/04/03
network

trouble

flow

work

communication
リンク
データパッチ環境と有事の際のログイン環境をサーバレス化・コンテナ化した取り組み - ANDPAD Tech Blog
1. はじめにこんにちは、SWEのあかりです。今回のテーマは、SRE NEXT 2023のCall For Proposals（CFP）に応募したものの、残念ながら不採択になってしまったものです。話せるネタとしてはまとまっていたので、テックブログとしてここに捧げます😇 2. 本記事の概要社内で最も古くから稼働している施工管理アプリでは、主にデータ修正と有事の際のログイン環境として開発者向けのEC2インスタンス（以降、「バッチサーバ」と表現）が存在していました。この記事では、このバッチサーバの廃止1を目的として、このサーバが担っていた役割をサーバレス環境・コンテナ環境へ移行し、EC2インスタンスからの脱却を達成した取り組み2について説明します。この記事を読んで得られることは以下の通りです。 EC2インスタンスを廃止する取り組みの流れ技術選定時に定性分析を行う事例本番データを修
manabou 2023/08/24
trouble

aws

server
リンク
「文化芸術分野の適正な契約関係構築に向けたガイドライン（検討のまとめ）」を公表します | 文化庁
「文化芸術分野の適正な契約関係構築に向けた検討会議」での検討結果が、「文化芸術分野の適正な契約関係構築に向けたガイドライン（検討のまとめ）」としてまとまりましたので、お知らせします。 1．趣旨文化庁では、文化芸術の担い手である芸術家等が安心・安全な環境で業務に従事できるよう、外部有識者による「文化芸術分野の適正な契約関係構築に向けた検討会議」を開催し、契約の書面化の推進や適正な契約関係の構築等について検討を進めてまいりました。この度、同会議での検討結果が「文化芸術分野の適正な契約関係構築に向けたガイドライン（検討のまとめ）」としてまとまりましたので、お知らせします。 2．「文化芸術分野の適正な契約関係構築に向けたガイドライン（検討のまとめ）」について別添1（概要）及び別添2（本文）のとおり別添1「文化芸術分野の適正な契約関係構築に向けたガイドライン（検討のまとめ）」概要（452KB
manabou 2023/02/14
business

art

trouble

contract

guide

guidebook
リンク
無料公開された“契約ガイドブック”が話題に　芸術分野のフリーランス必読の内容に「素晴らしい」「勉強になる」
文化庁のガイドラインをもとにした『アーティスト・スタッフのための契約ガイドブック』がWebで無料公開され、「素晴らしい」「勉強になる」などと話題になっています。音楽や舞台、美術や映像など、芸術分野で活動するフリーランスが安心して仕事をするために必要な、契約締結の要点を分かりやすく解説したものです。アーティスト・スタッフのための契約ガイドブック文化庁の「文化芸術分野の適正な契約関係構築に向けたガイドライン」を元に、契約における重要なポイントをまとめたガイドブック。依頼内容や報酬などについて取り決めが不十分なまま、口約束だけでプロジェクトが進みがちな文化芸術分野の現状に鑑みて、「なぜ契約が必要なのか」から説明されています。受注側・発注側ともに安心してプロジェクトを進められるよう、適切な契約で取引の条件を明確に前半は契約書の読み方や、各条項の重視すべきポイントを解説。例えば業務内容の条項
manabou 2023/02/14
business

art

trouble

contract

guide

guidebook
リンク
レガシーシステムをDockerコンテナ化する場合に直面した4つの壁 - RAKUS Developers Blog | ラクスエンジニアブログ
こんにちは。株式会社ラクスで先行技術検証をしたり、ビジネス部門向けに技術情報を提供する取り組みを行っている「技術推進課」という部署に所属している鈴木（@moomooya）です。ラクスの開発部ではこれまで社内で利用していなかった技術要素を自社の開発に適合するか検証し、ビジネス要求に対して迅速に応えられるようにそなえる「技術推進プロジェクト」というプロジェクトがあります。このプロジェクトで「WEBアプリケーションのDockerコンテナ移行」にまつわる検証を進めているので、その中間報告を共有しようかと思います。本検証での想定環境 CIに不必要な部分は後回し既存アプリでコンテナ化の障害になった部分 OSコマンドを利用しているミドルウェアとの密結合オンライン系とバッチ系の密結合ひとまず目指す状態プロセス相乗りの影響ログが複数出力されるまとめ続きの記事も書きました。 tech
manabou 2022/10/05
docker

legacy

migration

trouble

error
リンク
障害報告書を書こう！ - Qiita
担当しているITサービスなどに何かしらのインシデントや障害が発生した時に、対処後のアクションとして報告書を提出して事象の内容を報告（レポート）する場合がある。提出先は会社の偉い人だったりクライアントだったり。場合によってはユーザー向けに発表したり。事の顛末を報告して「今後同様のことを起こさないように努力します、ごめんなさい」をするのだ。どのように再発防止の努力するのかを書くものでもある。主にクライアント向けのビジネス内容ではあるが、自分が使っているテンプレパターンを共有するので参考にしてもらえればと思う。1 全般的なポイント心得のようなもの。次の点は留意してて欲しい。淡々と冷静な説明をこころがける当然のことながら事実は脚色しない。無駄な修飾も要らない。客観的な事実を簡潔に述べる。例： ❌「一生懸命頑張って対応したが…」 ❌「寝ないで対応したが…」 ❌「本当の原因は…」できるだ
manabou 2022/07/05
document

communication

engineer

trouble

check
リンク
データ変更を伴うバッチ処理を書く時に考慮していること - shallowな暮らし
こんにちは、id:shallow1729です。最近はインフラ寄りなお仕事をよくやっていますがこれまでにいくつかデータ移行やデータ基盤構築などのバッチ処理のお仕事をしてきました。以前にも一度そういった経験を元に記事を書いたのですが、MySQLやシステムに関する知識が以前よりも増えた今もう一度書き直したいなと思いました。なので今回はバッチ処理を書く時のテクニック2022版という感じです。今の仕事の関係でMySQLやrailsを前提にしている話が多いですが、おそらく他のデータベースを使っている人にも役に立つ話が多いのではないかと思います。ただ、今回の記事は経験に基づくものが多く、あまりよくないアイデアもあるかもしれません。改善点や間違いなどあればご指摘ください。冪等性を持つように冪等性とは端的に言えばある操作を複数回実行しても一回しか実行しなかった時と同じ結果になる性質の事です。長時間かか
manabou 2022/03/20
batch

trouble

error

development

transaction

uuid

consistency
リンク
「次から気をつけます」に対抗する、反省文よりは効果が上がる再発防止、学びの機会 - Qiita
再発防止策を書くのは難しい。良い再発防止策良い再発防止策について、順位付けするとしたら、その種類の問題について二度と意識することがなくなる解決策その種類の問題を開発時に自動的に検知することができる解決策その種類の問題が発生しても自動的に復旧することができる解決策その種類の問題が発生しても影響が局所化される、フールプルーフ、フェールセーフになる解決策と言うのは意識したいと思いつつ、やはり難しい。再発防止はむずかしい障害の再発防止策は、メカニズムツールルールチェックリストの順番に検討せよ。と言われても、急いで書けなんて言われると「次回からは複数人でチェックします。」とか「チェック項目を追加します。」とかいう徹底できなそうな「反省文」になってしまう。まさにこの有名な猫...。 **「なぜミスを繰り返すのか」「どうすればミスを防げるのか」を真剣に考えていないことがミス
manabou 2021/08/17
communication

work

trouble

error
リンク
みずほ銀行システム障害に学ぶ
みずほ銀行システム障害の調査報告書が公開されたのがニュースになって、Twitterなどで色々な人がコメントをしているのを見た。140文字しか書けない空間で他人の失敗談の揚げ足取りをするのは簡単だが、そこからは一時の爽快感以外に何も得るものがないので、僕はそういうのはカッコ悪いと思っている。そこで、ちゃんと読んでみたら全く他人事でない部分も沢山あるし、非常に面白く勉強になったので、ブログにまとめてみる。技術的な話銀行のシステムがどのようになっているのか、全然イメージが湧いていなかったので、それがまず勉強になった(p.29)。トラフィックのソースに応じて用意された色々なシステムから基幹システム「MINORI」の取引メインバスにトラフィックが流れ、そこから各種システムへとリクエストが送られていく。この辺はService Oriented Architectureらしい。開発当時としては（
manabou 2021/06/17
mizuho

trouble

architecture

communication

study

monitoring

security

design
リンク
How we found and fixed a rare race condition in our session handling
AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be
manabou 2021/03/19
trouble

debug

github

condition

session
リンク
How to Deal with Difficult People on Software Projects
Software is easy. People are hard.
manabou 2021/03/19
work

development

project

communication

trouble
リンク
「ITの開発現場によくいるやっかいな人」の対処法をタイプごとに解説したサイトが登場
ソフトウェアの開発プロジェクトにはさまざまな経歴や役職を持つ人が関与するので、我が強い人や性格に難がある人が問題になることもしばしば発生します。ソフトウェア業界のよもやま話を語るブロガーのニール・グリーン氏が、ソフトウェア開発プロジェクトの中で問題になりがちな人をタイプごとにまとめつつ、それぞれのタイプの特徴と管理職向けの解決策を解説しました。 How to Deal with Difficult People on Software Projects https://www.howtodeal.dev/ 上記のサイトにアクセスしたのが以下。上から「プロダクトマネージャー」「デザイナー」「プロジェクトマネージャー」「開発マネージャー」「開発者」「品質保証(QA)」の6カテゴリに分かれていて、それぞれの役職の中によくいる「問題のある人」のタイプが動物のアイコンで示されています。例えば、「プロ
manabou 2021/03/19
work

development

project

communication

trouble
リンク
Semantic Versioningの闇 - knqyf263's blog
今回も誰も興味ないシリーズなので今まで書いてこなかったのですが、Semantic Versioningに関して幻想を抱いている人がいる可能性があり、そういう方にどうしても現実を知っておいて欲しかったので書きました。3行要約（と可能なら余談）だけでも読んでいただけると幸いです。 3行要約 Semantic Versioning 2.0.0にはバージョン"比較"の定義はあるが、バージョン"制約"（>= 2.1.3みたいなやつ）の定義がないその結果、同じsemver準拠ライブラリでも制約の解釈が異なり結果が真逆になるというかそもそもsemver使ってるエコシステムが少なすぎる背景セキュリティアドバイザリでは特定のバージョンが脆弱であることを示すためにバージョン制約が使われることが多いです。例えば >=1.2.0 <1.2.6みたいなやつです。この場合、1.2.5は脆弱だが1.2.6は修正
manabou 2020/11/11
version

semver

semanticversioning

trouble

library

interoperability
リンク
東証システム障害はマニュアルの不備　富士通「確認が不十分だった」　関係役員の処分を検討
株式売買システム「arrowhead」の不具合が原因で10月1日に発生した東京証券取引所のシステム障害を巡って、機器を納入していた富士通は19日、製品マニュアルに不備があったとして謝罪した。今後は関係役員の処分を検討し、社長直轄の組織で再発防止に取り組むという。障害の原因について富士通は「マニュアルの記載と実際の仕様の齟齬（そご）があった」と説明。マニュアルには「メモリ故障などが発生した場合は、必ず自動切替が行われる」との記載があったが、実際は自動で切り替わらない仕様となっていたという。 OEM先の米国企業が製品の仕様を変更した際、富士通がマニュアルの記載が変更されていないことに気付かず、仕様の変更も検知できなかったとしている。富士通は「当社の試験・確認が不十分だった」と陳謝した。メモリ部品が故障した原因は、事前にOEMベンダーが故障部品の診断を行っているとして「ロット障害ではなく、偶
manabou 2020/10/21
fujitsu

arrowhead

trouble

manual
リンク
『マンガ災害事例』は製造業にまつわる死亡フラグの宝庫だった「事故の原因なんて冷静に見れば誰だってダメってわかるのが殆んど」
リンクマンガ災害事例マンガ災害事例労働災害の実例を４こまマンガで示し、最初の２こまからその後の展開を考えて頂くことにより、災害防止のセンスを高めます。 119 users 166
manabou 2020/07/15
comic

manga

trouble

disaster

災害

マンガ

漫画
リンク
マンガ災害事例
安全管理や労働災害防止は、難しくはありません。過去の実例や経験を上手に活用すれば、かなりの程度、達成できます。先人の犠牲は貴重な教訓です。その一端を、順次ご紹介して参ります。社会保険労務士・行政書士横山事務所所長　横山　誠〒　２６２－００３３千葉県千葉市花見川区幕張本郷２－５－１－２０７電話　　　　０４３－２７２－３９１７ファックス　０４３－２７２－３９１８業務内容主に、職場の安全管理、労働災害防止に取り組んでいます。実際に発生した災害を４こまマンガで表し、その状況、原因、防止対策を検討して、安全診断、教育、講演等の材料にしています。紙芝居風（パワーポイントも可能）の講演は、ユニークな手法として好評を頂いております。
manabou 2020/07/15
comic

manga

trouble

disaster

災害

マンガ

漫画
リンク
Kubernetesにアップグレードは必須　実施してわかる更新時の問題点や対処方法
Kubernetesやそれに関するソフトウェアについて交流や情報交換のための勉強会「Kubernetes Meetup Tokyo」。前回は、ソフトウェアエンジニアとして働く村田俊哉氏（@shmurata_）がKubernetesのアップグレード前の作業について紹介しました。今回は、実際のアップグレードについて、それに付帯するアドオンやストレージバージョンの更新について経験者だからわかる視点で説明します。 kubectl drainについて村田俊哉氏：メインのノードのアップグレードですね。ノードは、実際にサービスを稼働させているPodが動いているので、無停止でアップグレードするには、このPodをグレースフルシャットダウンさせてから、ノードを停止していく必要があります。ノードをグレースフルにシャットダウンする方法として、Kubernetesが提供しているコマンドkubectl drain
manabou 2020/07/02
k8s

upgrade

migration

trouble
リンク
「エラーする人は自分を信じすぎでは？」ヒューマンエラーの勉強で得た、「気をつける」は対策ではないという考え方
Ｓ　Ｕ　Ｚ　Ｕ@旅パッキングand客力の磨き方 @suzukyuin ヒューマンエラーの勉強をすると「気をつける」は対策ではありませんと、教え込まれるので。全てのものにフールプルーフ＆フェールセーフをするようになるので、エラーが減ります。エラーする人は自分を信じすぎでは？って思ってる。Ｓ　Ｕ　Ｚ　Ｕ@旅パッキングand客力の磨き方 @suzukyuin 得にルーティーンで決まってることの途中でイレギュラートラップ（例えば話しかけられる、電話かかってくるとか途中の流れをインターセプトされる状況）が起きると、全部スッこ抜けて大事故につながるエラーを起こすので、そう出来ない仕組みを作るとかね。とにかく「人は間違える」って思うの大事Ｓ　Ｕ　Ｚ　Ｕ@旅パッキングand客力の磨き方 @suzukyuin とんでもないのは「自分は間違えない」って変な自信を持ってる人。この手の人は「間違えるわけな
manabou 2020/06/20
error

trouble

work

design

architecture
リンク
ペパボトラブルシュート伝 - node プロセスの general protection fault を追う - abort(3) の意外な実装 - Pepabo Tech Portal
セキュリティ対策室の伊藤洋也 @hiboma です。業務中に、Haconiwa コンテナで動くとある node プロセスが general protection fault ( 一般保護違反! ) を起こしてdmesg にログを残す現象を調べ、問題解決にあたっていました。その際の痕跡をまとめなおして記したエントリになります。エントリの概要本エントリでは、以下のような内容を扱います。 Haconiwa コンテナの node プロセスが general protection fault を起こしているライブラリ関数 abort(3) の概要 abort(3) がプロセスを停止する方法の検証 node プロセスが abort(3) を呼び出すケース glibc x86系の abort(3) 実装が HLT 命令を呼び出し、general protection fault を起こすこと
manabou 2020/06/11
trouble

error

node
リンク
1 2 3 4 5 6 7 次のページ