タグ

ブックマーク / techblog.yahoo.co.jp (14)

  • Apache Ignite新メモリアーキテクチャ

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog シュティフ ロマン(データプラットフォーム) Apache Igniteコミッター @rshtykh はじめに 近頃、急激に増量していくデータはもはやタイムリー且つ正確なデータ処理を困難にする。そのような中で、複雑なETLを無くしてコストを削減でき迅速なデータ処理の可能性を実証するインメモリコンピューティング技術が注目されている。例えば、2015年からスタートしたIn-Memory Computing Summitだが、年1回の少人数イベントから、1年にインメモリシステムの開発者と利用者を2回集めるイベントまで発展してきた。 インメモリコンピューティングプラットフォーム(データベースシステム)では、なるべくメモリ上で高速なデータ処

    Apache Ignite新メモリアーキテクチャ
    kimutansk
    kimutansk 2017/07/28
    これまではJVM上にオブジェクトを保存し、GCの影響が大きかったのがオフヒープに保持し、ディスクベースの分散ストアにも透過的にアクセス可能な構成にしたのが更新点と。
  • 高速ファイル/メッセージ転送 K2HFTFUSE の紹介

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、Technical Yahoo の中谷です。 今回は、Yahoo! JAPANからオープンソースとして公開した高速ファイル/メッセージ転送システムの K2HFTFUSE の紹介をします。 K2HFTFUSEは、確実で高速なファイル/メッセージ転送を低コストで実現するために開発されたシステムです。 K2HFTFUSE(K2Hash File Transaction by FUSE-based file system)とは、FUSE(Filesystem in Userspace)によるユーザースペースでのマウント機能を利用したファイル/メッセージ転送システムです。 K2HFTFUSEは、仮想ファイルシステムを提供し、マウ

    高速ファイル/メッセージ転送 K2HFTFUSE の紹介
    kimutansk
    kimutansk 2016/12/09
    もの自体は面白いのですが、あと何年か早く出せなかったのかという感があるので残念・・Kafkaやfluentdの中間的な立ち位置として良いといっても、後発は当然基本機能は良くなるでしょうし。
  • 高次元ベクトルデータ検索技術「NGT」の性能と使い方の紹介

    この結果を見て単語ベクトルが変わるとNGTの性能が変わってしまうように感じた方がいるかもしれません。しかし、実はこれらの単語ベクトルはデータの次元数や件数が違っているため、それぞれの条件をあわせてみる必要があります。興味がある方は論文を読んで見比べて欲しいと思いますが、ここで重要なことは、NGTが高い精度にも関わらず、せいぜい100ミリ秒程度で検索できるという規模感であるということです。その規模感を感じてもらうために、これらの実験結果をご紹介しました。この実験以外にも論文の中では単語ベクトルの応用としてアナロジーと呼ばれる合成ベクトルでの実験やその他の比較手法の比較、実験結果の考察などもありますが今回は割愛します。 これまで紹介した内容と同じような実験はLinux系のサーバーであれば公開しているExperimental softwareという実験プログラムを使うと簡単に試すことができます。

    高次元ベクトルデータ検索技術「NGT」の性能と使い方の紹介
    kimutansk
    kimutansk 2016/11/25
    特徴量ってたいていベクトルであらわされてるので、そこそこ汎用的に様々な近傍探索に使用できるということなんですかね?
  • 社内クラウド環境におけるディスク(HDD)の故障率を確認してみました。

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog はじめに 「Usenix FAST 16」というカンファレンスにおいて「Environmental Conditions and Disk Reliability in Free-cooled Datacenters」という論文が発表されたのはご存じでしょうか。 こちらの論文はフリークーリング方式におけるデータセンターがハードウエアに与える影響を調べた論文です。 内容については省略しますが、この中で特筆すべき項目として、気温の高さや気温変化よりも湿度の高さがディスク故障の最も大きな要因であると述べられています。 弊社の社内クラウド環境においてもあてはまるのか確認してみたというのが記事の要旨です。 データセンター環境について まず

    社内クラウド環境におけるディスク(HDD)の故障率を確認してみました。
    kimutansk
    kimutansk 2016/04/27
    拠点Aの故障率が突出してますが、気温も微妙に高めの構成ですので、湿度の寄与度が実際どれくらいかは微妙かも。ただ、こういう事実はあると。面白い。
  • サーバの電力消費傾向とピークカットの取り組み

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog サイトオペレーション部の杉(@keyaki)です。 サーバの導入検証や、インフラ関連ツールの開発・運用を担当しています。 今回は、データセンターの電力問題に対する取り組みをご紹介します。 ラックの不足と電力容量 ヤフーでは、増加し続けるデータの処理と格納のために、毎月多くのサーバを購入しており、設置場所が慢性的に不足している状態となっています。プレハブデータセンターの発想で建てられた白河データセンター3号棟など、ヤフーのスピード感に対応した新規のデータセンターの建設も行っていますが、既設のデータセンターについても有効利用を図っていく必要があります。 既設のデータセンターを活用する場合でも、新規のデータセンターを建設する場合でも

    サーバの電力消費傾向とピークカットの取り組み
    kimutansk
    kimutansk 2016/03/31
    バッテリーを組みこんでハードレイヤでもピーク対応しますか。CPUを常時全開というわけにもいかないというのは逆に面白い。
  • 分散プログラミングモデルおよびデザインパターンの考察

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog 写真:アフロ データ&サイエンスソリューション統括部、データインフラ部、今野です。 早速ですが、今月開催の「Developers Summit 2016 (以下、デブサミ2016)」で当方が登壇する運びとなりました。気がつけば、前回の記事「分散システム処理モデルに関する動向について」から随分と日がたってしまいましたので、今回は、より広範囲な内容を整理してみたいと思います。 デブサミ2016の当方の講演テーマは「温故知新」です。今回は、このテーマにもつながる話題として、クラウド環境の代表的な分散プログラミングモデルやデザインパターンについて、一般的な考察をしてみたいと思います。 古典的なプログラミングモデルによる分類 まず最初に

    分散プログラミングモデルおよびデザインパターンの考察
    kimutansk
    kimutansk 2016/02/16
    懐かしい分類図。ただAkkaは開発者側が「Toolbox」と言い切ってますし、DesignPatternも5パターン実現可能なので含めるのは不適切な気も。
  • オープンソース化するハードウェア 〜ヤフーがOCPサーバを導入するまで〜 - Yahoo! JAPAN Tech Blog

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。データセンターのサーバを管理しています宮です。 今回はOpen Compute Project(以下、OCP)の概要とヤフーがOCP仕様のサーバ(以下、OCPサーバ)を導入するまでに至った経緯をお話したいと思います。 オープンソースとハードウェア オープンソースという言葉はよく耳にしますが、この「みんなで作り上げていく」という考え方はハードウェアの世界にも浸透してきています。 ソフトウェアでオープンというとソースコードの共有にあたりますが、ハードウェアのオープンソースは物理的な仕様の設計書を共有することを意味します。 Facebookが2011年にデータセンターやサーバのオープンソース化を目的としてOpen Comp

    オープンソース化するハードウェア 〜ヤフーがOCPサーバを導入するまで〜 - Yahoo! JAPAN Tech Blog
    kimutansk
    kimutansk 2015/11/25
    ラックの幅と縦は1割増程ですが2OUに3サーバ搭載可能と。後は電源等の接続がラックに刺すと同時に行われるのは確かに楽です。
  • 分散システム処理モデルに関する動向について(MapReduceからBorgまで)

    詳細については後述しますが、MapReduceの処理モデルは、上記の通り各区分ごとにそれぞれ単純化(限定)されたモデルであったと言えます。 また、MapReduceの関数プログラミングおよびグラフ的な特徴も合わせて以下に整理してみます。 関数プログラミング的な特徴 MapおよびReduceフェーズは、それぞれ関数型プログラミングのMapおよびReduce処理をモデル化したものです。MapReduceは、参照透過性がある純粋な関数処理と言えます。参照透過性とは入力により出力が一意に決まる性質のことです。言い換えればMapReduceの処理は、大域などの処理に影響する外部の環境は持たず、内部的にも静的な一時変数などの状態も持たないことを意味します。 純粋な関数処理は複数の処理が同時に実行されても他の並列に動作している処理の状態には左右されないため、この参照透過性は並列化に向いている性質がありま

    分散システム処理モデルに関する動向について(MapReduceからBorgまで)
    kimutansk
    kimutansk 2015/06/13
    「分散処理モデル」という非常に抽象的な言葉の中に用途が異なるものがいろいろ詰め込まれた感じですが・・・これって、何かしらの切り分けをするべきな気はしますね
  • 分散システムの一貫性に関する動向について

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog システム統括部アーキテクト室 今野です。 昨年は、Twitter,Facebookを始めとするクラウド各社で新規の分散システム開発のプロジェクトが相次いで発表された年でした。これらの新しい分散システムを開発する理由や、その背景にあるものは何なのでしょうか? 今回は、昨年末に開催された高信頼性分散システム系の国際学会であるSRDS 2014[1]の発表内容に関連する論文の話題も踏まえて、昨今のクラウド各社の分散システムの動向について整理してみます。 分散システムにおけるクラウド各社の動向 近年の分散データベースの世界では、AmazonのDynamo[2]やFacebookのCassandra[3]などを代表とする結果整合性(Eve

    分散システムの一貫性に関する動向について
    kimutansk
    kimutansk 2015/04/06
    アプリケーションに合わせた一貫性モデルを採用すべきという非常に真っ当な話から透明性にいきなりシフト。ともあれ、次回を待ちますか。
  • Sensu と Graphite による大規模インフラの監視

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog サイトオペレーション部の渡邉です。 サイトオペレーション部はデータセンタ・ネットワーク・サーバー・OS・ストレージといった全社的なインフラの管理運用や調査検証などを担当しています。 今回は、2013年に全社のプライベートクラウドとして導入した OpenStack の監視基盤として、OSS の Sensu と Graphite を採用した事例についてご紹介したいと思います。 採用に至るまで サイトオペレーション部では、もともと 2011 年から内製のプライベートクラウドを開発運用していました。 プライベートクラウドでは VM のホストとなるハイパーバイザを大量に運用する必要がありますが、その監視基盤として社内で一般的に利用され

    Sensu と Graphite による大規模インフラの監視
    kimutansk
    kimutansk 2014/12/10
    段階的に拡張しているバージョンが見れるのはいいですね。5000台でMQとcacheは数台で済みますか。
  • IPMIでの大規模サーバー管理 - Yahoo! JAPAN Tech Blog

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog サイトオペレーション部の藤見です。 今回はIPMIを利用した大規模なサーバー管理の仕組みをご紹介したいと思います。 IPMIについて IPMI(Intelligent Platform Management Interface)はサーバーベンダやOSに依存する事なくエージェントレスでハードウエアの各種センサ情報の取得や遠隔操作を行うためのインターフェースです。 一般的にIPMIとして動作するチップはマザーボード上に搭載されておりBMCやサーバーベンダ固有のiLO、iDRAC、iRMC等と呼ばれます。 それぞれにチップはサーバーベンダ独自の機能や管理UI等が存在する等の違いはありますがIPMIコマンド(ipmitoolやfreei

    IPMIでの大規模サーバー管理 - Yahoo! JAPAN Tech Blog
    kimutansk
    kimutansk 2014/12/05
    ブレード刺して即OSとミドルセットアップ、とかを自動でやるためにはこういう形になってくるんですかね。
  • StormとKafkaによるリアルタイムデータ処理

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、鈴木カズです。 社内向けの監視システム構築のため、StormやKafkaを利用して開発を行っていました。 そのときの経験をもとに、まずStormによる実際のシステムがどんなものかということを紹介し、KafkaSpoutの処理内容、カスタマイズ方法、Stormのメッセージ処理などを説明したいと思います。 読者としては、StormやKafkaについて興味があり記事を読んだりしたことがあるがもう少し具体的な話を知りたい方、これから開発予定があるような方を想定しています。 StormとKafka Stormは簡単に言うと、リアルタイムに流れてくる大量のデータを処理するための分散システムです。Twitterのメッセージの分析など

    StormとKafkaによるリアルタイムデータ処理
    kimutansk
    kimutansk 2014/10/31
    YahooでもStormとKafkaの組み合わせを使っていますか。特にKafkaは日本だと少数派な感が強いので、使っている所が増えるのは嬉しいですね。
  • 第8回Jenkins勉強会にてプロモーション広告におけるCI/CDの取り組みについて発表しました #jenkinsstudy

    マーケティングソリューションカンパニー開発部サービス運用部インフラ開発の石川です。 先日行われた第8回Jenkins勉強会にてプロモーション広告の継続的インテグレーション(以下、CI)/継続的デリバリー(以下、CD)に 関する取り組みについて紹介させていただきました。 タイトルは「Jenkinsはじめました」になっていますが、諸事情でタイトル通知後に少し内容を変更したため、 「はじめました」というよりは「結構使ってきました」というほうがしっくりくるかもしれません。 資料だけでは分かりにくい部分もありますので、このエントリーにていくつか補足したいと思います。 また、以下の内容においては具体的な数字や利用しているツールの詳細に触れることができない部分があります。 あらかじめご了承ください。 プロモーション広告におけるCI/CDの現状 今回はプロモーション広告での取り組みを事例として取り上げま

    第8回Jenkins勉強会にてプロモーション広告におけるCI/CDの取り組みについて発表しました #jenkinsstudy
    kimutansk
    kimutansk 2013/12/30
    エヴァンジェリストの存在とまず挑戦してみることが重要と。
  • 第8回Jenkins勉強会で「Jenkins with Docker」というLTをしました #jenkinsstudy - Yahoo! JAPAN Tech Blog

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog LT の中で触れた環境を構築するデモコードを Vagrantfile にまとめて GitHub においていますのでよければ触ってみてください。ジョブ登録済の Jenkins が立ち上がるので全く同じ環境を試してもらえます。 yahoojapan/jenkins-with-docker-demo LT は5分でざっと流してしまったため、このエントリで補足します。 ジョブ実行毎にクリーンな環境がほしい 特に説明の必要もなく普段 Jenkins を使っていればジョブ毎にクリーンな環境がほしいと思うはずです。スレーブノードをジョブ毎に新規でインスタンスを立ちあげて実行することもできますが インスタンスの作成、起動はそれなりの時間がかかりま

    第8回Jenkins勉強会で「Jenkins with Docker」というLTをしました #jenkinsstudy - Yahoo! JAPAN Tech Blog
    kimutansk
    kimutansk 2013/12/21
    おー、イベントページの発表内容見て期待していましたが期待通りの内容。クリーンな環境作ってすぐ破棄できるってやはりこういう用途には向きますよね
  • 1