タグ

engineeringに関するusadamasaのブックマーク (62)

  • 「FF6」の新たなバグを発売25年後に見つけたテスト技術者の腕前

    遊びつくされたゲームからバグを見つけ出す着眼点 エディさんは「バグは何かの条件が重なったときに起こる場合が多い。バグを見つけるときの基的な考え方だ」と言う。特に来は重なることがない条件が重なったときには、ゲーム開発者が想定していない挙動が起こる可能性がある。この考え方に基づいて、シドタイマー持ち込みバグと別のイベントを組み合わせ、低歩数クリアの記録更新ができないか試したという。 バグを見つけ出す方法について、エディさんは次のように話す。「プレー中に発見することは意外と少ない。ゲームで遊んだ後に外出して歩いているときなど、ゲームをプレーしていないときに突然思いつく」。シドタイマーも雪の降る日、喫茶店からの帰り道でひらめいた。「頭の中でFF6のプレーを想像していると『このタイミングでこうしたら、こういう現象が起こるのではないか』とひらめく」(エディさん)。 ひらめいた仮説を基に実機で思いつ

    「FF6」の新たなバグを発売25年後に見つけたテスト技術者の腕前
    usadamasa
    usadamasa 2019/08/13
    “実はエディさんはテストエンジニアが本業だ。2016年に第三者検証を手掛けるSHIFTに入社し、スマートフォン向けゲームのデバッグやテストプレーなどを担当している。”
  • 「いい検索」とはなにか? 検索システムのしくみと評価指標を解説

    2019年2月26日、検索技術研究会が主催するイベント「Search Engineering Tech Talk」が開催されました。「検索」や「検索システム」にまつわる技術や手法を共有するイベント。第1回となる今回は、3人のエンジニアが、現場の経験を通して学んだノウハウや、検索にまつわる知見を語ります。プレゼンテーション「『いい検索』を考える」に登壇したのは。株式会社リクルートテクノロジーズの内田臣了氏。一般的に用いられる検索エンジンの仕組みと「いい検索」の条件について解説します。講演資料はこちら 「いい検索」を考える 内田臣了氏(以下、内田):よろしくお願いします。「いい検索を考える」というタイトルで、リクルートテクノロジーズの内田が発表いたします。 まず自己紹介なんですけども、内田臣了(しんりょう)です。 けっこう珍しい名前だと言われます。2017年に株式会社リクルートに新卒で入社し

    「いい検索」とはなにか? 検索システムのしくみと評価指標を解説
  • バッチプログラムの運用と監視について検討しよう | メルカリエンジニアリング

    こんにちは。メルペイでバックエンドソフトウェアエンジニアをしている id:koemu です。 バッチプログラムのお話、今回は運用・監視についてお話したいと思います。当社はすべての業務が24時間行われていますので、システムがオンラインのときに動作するバッチプログラムについてのみ議論します。 過去の記事はこちらにあります。 運用に備えて バッチプログラムの運用について、「プリモーテム」「実行管理」そして「ログ管理」の3点について述べていきます。 プリモーテム ポストモーテムという言葉を聞いたことがある方はいらっしゃるかと思います。ポストモーテムとは、GoogleのSREの15章*1によれば、障害などの失敗を振り返り、今後に活かすプロセスの総称と捉えることができます。 さて、プリモーテム(プリモータム)とは何でしょうか。この言葉は、私が最近読んだThe Manager’s Path*2*3で使

    バッチプログラムの運用と監視について検討しよう | メルカリエンジニアリング
    usadamasa
    usadamasa 2019/04/17
    "まず、「開始」の監視は、最も難しいものです。なぜなら、開始のイベント自体が発生しないと、何も通知は起こらず、誰も気づけないからです。"
  • マイクロサービス化を支える継続的切り替え術 - クックパッド開発者ブログ

    こんにちはこんにちは。技術部のクックパッドサービス基盤グループのシム(@shia)です。グループ名が大きいですね。 クックパッドで運営しているサービスの中、一番古くから存在しているレシピサービス (cookpad.com) ——以下このサービスのコードベースを cookpad_all と呼びます——があります。 クックパッドサービス基盤グループはこのレシピサービスの運用及び改善という責務を持つグループとして今年の2月に発足しました。 わかりやすい業務の一つとしてはお台場プロジェクトが挙げられます。 お台場プロジェクトに関しては昨年12月の最後を飾った青木さんの クックパッド基幹システムのmicroservices化戦略 〜お台場プロジェクト1年半の軌跡〜という素晴らしい記事があるので紹介は省きます。 お台場プロジェクトの一つとして、僕は最近 cookpad_all からフィーチャーフォン向

    マイクロサービス化を支える継続的切り替え術 - クックパッド開発者ブログ
  • すぐ置き換わるから大丈夫 #62

    だいぶ昔の話。とある製品に新機能を入れるプロジェクトを手伝うことになった。私の担当はごちゃごちゃした入力データをパーズする部分に新しい処理を入れることで、このパーザは別のチームが所有していた。 さっそく、件のパーザのコードを見てみると、これがやたらと複雑で、メモリ管理は無駄にややこしくみえるし、歴史的に蓄積されたハックが溜まっていて、とても触りたくないような代物だった。古いコードベースゆえ、クラス名や変数名などから古くさい感じがぷんぷんと漂っていた。 これいじるのやだなあと思っていると、サブディレクトリに、新しいバージョンと思われるコードが見つかった。作者に問い合わせると、古いパーザは別の人が書いたもので、汚くてメンテ不可能だから、新しいものを書き始めたのだという。 やっぱそうだよねえ、と意気投合して、新しいパーザを読んでみると、古い方とは比べ物にならないほどきれいに書かれていた。コードは

    usadamasa
    usadamasa 2019/03/04
    うっ。
  • システム障害との向き合い方 @sinamon129 #tokyogirlsrb

    これまで大小様々なシステム障害に遭遇してきましたが、障害対応から学ぶことは沢山あります。 いろんな習熟度のフェーズで障害発生を学びに変えるための行動事例や、webアプリケーション開発において障害対応を減らすためにできることなどをお話しできればと思います。 TokyoGirls.rb Meet…

    システム障害との向き合い方 @sinamon129 #tokyogirlsrb
  • ユースケース駆動開発入門 (理論・実践編)

    社内勉強会のワークショップで使用した資料です

    ユースケース駆動開発入門 (理論・実践編)
  • Netflixにおけるフルサイクル開発者―開発したものが運用する - CARTA TECH BLOG

    こんにちは。fluctでiOS/Android向けSDKの開発をしているarimuraです。この記事ではPhilip Fisher-Ogden、Greg Burrell、Dianne MarshによるFull Cycle Developers at Netflix — Operate What You Buildを私が翻訳したものを著者の許可のもとに掲載しています。元の記事は弊社の技術力評価会のインプットの一つとして共有されており、そこで興味を持ったのが翻訳するきっかけとなりました。 以下、2018年5月時点における情報を記載したものであり Netflix TechBlog「Full Cycle Developers at Netflix」より引用したものである。 Netflixにおけるフルサイクル開発者―開発したものが運用する 2012年―Netflixでの重要なサービスの運用は骨の折れ

    Netflixにおけるフルサイクル開発者―開発したものが運用する - CARTA TECH BLOG
  • 希薄化したTDD、プロダクトの成長のために必要なものは?〜『健全なビジネスの継続的成長のためには健全なコードが必要だ』対談 (6)

    テスト書くのが当たり前、だけど・・・和田:次に意味の希薄化ですね。『Test-Driven Development by Example』の出版から15年経ち、テストコードを書く人はすごく増えました。15年前は啓蒙期で、テストコードを書きましょう、テストコードの書き方はこういう感じですというのを頑張って啓蒙する必要があった。 でも、例えば今の若手プログラマーは普通にテストコードを書く。なぜなら既存システムにはテストコードが書かれているから、開発の継続、不具合の修正とか機能追加を行う際にテストコードを書くのが普通だし、テストコードが無いとレビューは通らないしみたいな話になって、テストコードがあるという生活は普通のものになっている。そうすると、なぜテストコード書くのかとか、来こういうテストコードを書きたかったんだけどとか、こういうテストを書くべきなんだけどみたいな議論はだいぶ土俵から外れてし

    希薄化したTDD、プロダクトの成長のために必要なものは?〜『健全なビジネスの継続的成長のためには健全なコードが必要だ』対談 (6)
    usadamasa
    usadamasa 2018/12/28
    “モックは皮肉にも既存の実装のままで無理やりテストをするための道具にどんどんなり下がっていくんですね。”
  • QAエンジニアってどんな仕事?~ゲーム開発におけるテストの世界~ - SEGA TECH Blog

    はじめまして。 セガゲームス「龍が如くスタジオ」専属QAエンジニアの阪上と申します。 今回は、QAエンジニアという職種の紹介とゲーム開発におけるテストの話を、「龍が如くスタジオ」での開発の歴史を振り返りながらご紹介したいと思います。 目次 目次 ゲームのテストって何をするの? QAエンジニア仕事内容 (2009年~) 自動プレイテスト (2013年~) QAエンジニアの誕生と加速するテスト環境の自動化 (2015年~) テストの結果分析 (2018年~) テストピラミッドの考察とQAエンジニアリングの未来 まとめ 参考資料 ゲームのテストって何をするの? 題に入る前に、QAエンジニアのQAとは何なのかを説明しておこうと思います。QAは 「Quality Assurance」の略で、日語では品質保証という意味です。ゲーム開発においては、ゲームが正しく動作しているか、バグがないか、ゲーム

    QAエンジニアってどんな仕事?~ゲーム開発におけるテストの世界~ - SEGA TECH Blog
    usadamasa
    usadamasa 2018/12/22
    "自動テストのエラーに対する信頼性が低いと、「このエラーは製品でも起きるの?」と言われて修正されないまま放置されてしまい" わかりみがある。
  • BacklogにおけるSREの事例 / SRE Lounge #5 - Speaker Deck

    2018年9月26日の「SRE Lounge #5」にて、Backlog SREの吉澤(@muziyoshiz)が、BacklogにおけるSREチームの変遷と、そのなかで直面してきた課題について発表しました。 SRE Lounge #5 https://sre-lounge.connpass.c…

    BacklogにおけるSREの事例 / SRE Lounge #5 - Speaker Deck
  • [CloudWatch] パーセンタイル統計値がELBなどで利用可能になりました | DevelopersIO

    はじめに Cloudwatchのアップデートにより、メトリックの集計値として従来の平均値、最小値、最大値に加え、 パーセンタイル統計値を取得する事が可能となりました。 今回、Application Load Balancer(ALB)のレスポンスタイム(TargetResponseTime)の パーセンタイル出力を確認する機会がありましたので、紹介をさせて頂きます。 Amazon CloudWatch 更新 – パーセンタイル統計およびダッシュボードの新ウィジェット 操作方法 AWSのマネジメントコンソール「CloudWatch」の画面より「メトリックス」を指定します 今回、測定対象のALB名称、メトリックとして「TargetResponseTime」を指定しています 「グラフ化したメトリックス」のタブより、期間を「1分」に変更します 統計としてパーセンタイル統計値「p99」〜「p10」の

    [CloudWatch] パーセンタイル統計値がELBなどで利用可能になりました | DevelopersIO
  • 負荷テストのデータ、読めてますか?

    ピーク時になると応答時間が急激に悪化したので、とりあえずCPUとメモリを倍増しておけば大丈夫かな……と勘に頼って対応し、ドツボにはまった経験、ありませんか? この連載では、インフラエンジニアなら最低限理解しておきたい性能問題の基礎を解説します。(編集部) はじめに 前回「性能対策、できてますか?」では「待ち行列の基」を解説しました。公式を覚えるだけではなく、少し実践的な解説にしようと試みましたが、いかがでしたか? 今回のテーマは、「平均値」と「パーセンタイル値」という統計値についてです。数学の勉強みたいですが、前回同様、もう一歩だけ実践的にしてみたつもりです。 測定したデータを“正しく読めること”は、性能対策に取り組む際の必須スキルの1つです。「ツールを使えば、測定結果はツールが示してくれるから、特別なスキルは必要ない」と思うのは間違いです。今回もやはり、基礎の中の基礎から、つまり測定デ

    負荷テストのデータ、読めてますか?
  • Googleが解説 - 他社のSRE実践はなぜ誤りなのか

    GoogleCRE(Customer Reliability Engineer)であるStephen Thorne氏が先日のDevOps Enterprise Summit Londonで講演し、SRE(Site Reliability Engineering)とは何か、その基的な前提とメリットを理解できていない組織がいかに多いか、などについて解説した[スライドのPDF]。氏がこれまでに他の組織で見たおもな誤解は、早期の障害検出に重点を置いたSLO(Service Level Objective)や、あるいは過去のインシデントの金銭的保証に使用するSLA(Service Level Agreement)との混同、エラー予算を執行しない、SREチームの活動の少なくとも50パーセントをシステムやツールの改善に費やさず、“消防活動”という名の運用上の苦役に没頭させる、といったものだ。 SLO

    Googleが解説 - 他社のSRE実践はなぜ誤りなのか
  • SRE Lounge #2 に登壇してきた

    SRE チーム の@katsuhisa__ です。 先日、SRE Lounge #2 に参加し、スタディストのSRE の取り組みについて発表をしてきました。 資料は以下に置いています。SRE にご興味のある方はぜひご覧ください。 発表資料デブサミ2018 で伝えきれなかった 快適なマニュアル作成共有を支えるSite Reliability Engineering https://speakerdeck.com/katsuhisa91/debusami2018-dechuan-ekirenakatuta-kuai-shi-namaniyuaruzuo-cheng-gong-you-wozhi-erusite-reliability-engineering SRE Lounge とは?SRE Lounge は、主催のユーザーベースさんのブログにある通り、SRE の取り組みを双方向に共有するクロ

    SRE Lounge #2 に登壇してきた
    usadamasa
    usadamasa 2018/08/05
    “「サービスをグラフでチェックし、問題点があれば、インフラ側・開発側の双方から考えられる原因について共有する」”
  • SRE (Site Reliability Engineer) 職 転職・中途 - 株式会社はてな

    SRE (Site Reliability Engineer) 職(中途)開発速度と信頼性はトレードオフであり、バランスを取っていく必要があります。SRE の役割は、サービス特性、開発フェーズ、利用ユーザーの体験などを考慮しつつ、Product Owner とともに SLO を定義し、ソフトウェアエンジニアリングとシステムエンジニアリングとソフトスキルを駆使して信頼性を計測、コントロールすることです。 id:cohalzSRE2018年入社信頼性を制御し「サービス開発」を加速させるサービス開発チームにジョインして開発/運用していく Embedded SRE は運用業務だけでなく、SREの原則に基づいたSLOの策定およびその先の開発速度を最大化するためにリーダーシップを発揮していくことが重要な仕事です。 自身のソフトウェアエンジニアリングとシステムエンジニアリングとソフトスキルを組み合わせつ

    SRE (Site Reliability Engineer) 職 転職・中途 - 株式会社はてな
  • 各社の募集要項からSREに求められるスキルをまとめた - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに SRE(Site Reliability Engineering)が具体的にどんなスキルを求められるのかを知りたくて、SREという名前で明示的に募集をしている企業の採用情報を眺めたので簡単にまとめた。 軽く探したところ、明示的にSREとして募集している企業として、以下の7つが見つかったのでこれらの企業の募集要項を対象にしている(2016年12月時点)。 cybozu mercari SmartNews Retty BASE FiNC エニグモ 大規模システムの構築・運用 大規模あるいは高トラフィックなシステムの構築・運用経験は

    各社の募集要項からSREに求められるスキルをまとめた - Qiita
  • エンジニア組織をリードする人のことを考えた話 - nozayasu

    エンジニア組織をリードする人に、大きく3つの責務を求めたい そんな風に考えるようになったという話をします 求める3つの責務 テクニカルマネージメント ピープルマネージメント コミュニティマネージメント 1. テックリード 品質、生産性、技術的な承認、技術的な評価等、組織の専門性について責務を持つ人 2. エンジニアリングマネージャー 教育、採用、人事的な承認、人事的な評価等、組織の人間性について責務を持つ人 3. コミュニティマネージャー 提起、反応、支援、新陳代謝等、組織の社会性について責務を持つ人 コミュニティマネージャー? これが今回話したいことです エンジニア組織に1と2が重要な事は、多くの方が言葉にしてくれています プラスで僕はエンジニアコミュニティをリードする責務が必要なのではないか?と思うようになりました コミュニティをリードするということ リードすると書きましたが、コミュニ

    エンジニア組織をリードする人のことを考えた話 - nozayasu
    usadamasa
    usadamasa 2018/07/15
    “提起、反応、支援、新陳代謝等、組織の社会性について責務を持つ人”
  • ファイルシステムサイズの拡張時にデータベースアクセスがスローダウンする問題の解決 - Cybozu Inside Out | サイボウズエンジニアのブログ

    はじめに こんにちは、技術顧問のsatです。 サイボウズでは、ファイルシステムサイズ拡張時にデータベースアクセスがスローダウンするという問題に長年悩まされてきました。記事では運用部の藤田と深谷がこの問題を解決した流れについて報告いたします。問題を解決するために2人はLinuxカーネルを修正しました。修正は社内に閉じたものではなく、執筆当時の最新 Linuxカーネルであるv4.17にマージされています。 問題 以下の操作の後にデータベースへのアクセスが一時的にスローダウンする ブロックデバイスのサイズを拡張する 上記デバイス上にあるファイルシステムのサイズを拡張する 原因 linuxカーネルはブロックデバイスのサイズ変更(縮小および拡張)時に、当該デバイス上にあるファイルシステムのページキャッシュ(後述)を無効化する*1 解決方法 ブロックデバイスのサイズ拡張時にはページキャッシュを無効

    ファイルシステムサイズの拡張時にデータベースアクセスがスローダウンする問題の解決 - Cybozu Inside Out | サイボウズエンジニアのブログ
  • SREチームの発足 | ランサーズ(Lancers)エンジニアブログ

    SREチームの金澤です。 2018年度より、SREチームを発足しました。 その経緯をお話ししたいと思います。 インフラエンジニアとして 私は、2013年11月にランサーズに入社しました。 ランサーズ5年目にして、サービスが格的に伸び始めた時期で、アプリエンジニアが運用を兼務するには荷が重くなり始めており、専任のインフラエンジニアが必要でした。 入社後、4年半にわたり、サービスの安定化や負荷対策、最新の技術やサービスへの追従など、様々な施策を実行してきました。 スタートアップのインフラエンジニアに求められる仕事は多岐にわたります。 時には、サービスのソースコードに手を入れることも度々ありました。 また、この時期のランサーズは、開発環境の支援や、社内インフラの整備もできる人材が不足しており、そのような業務もインフラエンジニアである私が担っていました。 インフラエンジニア採用の難しさ 2017

    SREチームの発足 | ランサーズ(Lancers)エンジニアブログ