モニタリング | GREE Engineering

2023/05/11

egmc

インフラのいわほり（egmc）です。 eBPFを利用したプロダクトとしてはCiliumなどがcloud nativeな文脈として盛り上がっていますが、一方でBCC Toolsやbpftaceは、システム内部のかゆいところ […]

2022/04/27

Hiroaki Kobayashi

こんにちは、インフラの小林です。 GCP環境の監視基盤が一段落し実績も積めてきたので、アーキテクチャについて簡単に紹介します。この記事ではメトリックに焦点を当てています。Prometheusを用いたGCP監視基盤を検討し […]

2021/10/04

egmc

インフラのいわほり（@egmc）です。久々のエントリとなりますが、今回はインフラのMonitoring Unitとして長期的に取り組んでいた監視システムのリプレースについてのお話になります。背景含めて長いエントリとな […]

2019/04/15

egmc

開発本部インフラストラクチャ部の岩堀・反田です。私達は部内のチームへの所属の他、Monitoring Unitというチームに属しており、サーバ監視システムの運用を担当しております。今回Unitとして3/25-27にブ […]

2018/12/27

sejima

こんにちわ。せじまです。秋くらいから艦これ再開したので、ちょうどよいWindowsタブレットはないものかと物色しており、 Surface GO LTE Advanced（一般向け）の発売を待ちわびている今日この頃です。 […]

2018/10/02

mtanda

インフラの反田です。AWSやGCPのモニタリングまわりを担当しています。 GREEでは、大部分のサービスをAWSで運用していますが、一部の新しいサービスではGCPも利用しています。 AWSで運用しているサービスについては […]

2017/10/23

mtanda

インフラの反田 (@mtanda) です。 GREEでは、多くのサービスをAWS環境で運用しており、それらサービスのモニタリングシステムとしてPrometheusを利用しています。 Prometheusを導入してから約2 […]

2017/05/31

egmc

インフラのいわほり（@egmc）です。サーバ監視を構成するシステムは色々ありますが、今回はAWS環境上での監視に使われているアラート通知の仕組みについて紹介させて頂きます。監視システムの構築そのものは2015年頃、A […]

2011/01/20

mdoi

　こんにちは。グリーのmdoi(@m_doi)です。　今回は、グリーの監視システムについて説明したいと思います。以前、こちらの記事にて、リソース監視システムの説明をさせて頂きましたが、死活監視やログ監視については語られ […]

2010/10/08

ebisawa

こんにちは。インフラチームの ebisawa です。今回はグリーのインフラにおける各種機器の監視がどのように行われているのかご紹介させていただきたいと思います。一般にサーバの監視というと、システムダウンを検出するための […]