はじめに
Grafana Incident が、無料プランを含む、すべての Grafana Cloud ユーザーに一般公開されたことを発表でき、大変嬉しく思います。(今すぐ無料のGrafana Cloud アカウントにサインアップできます。)
インシデント管理を容易にするために構築されたGrafana Incidentは、管理タスクを自動化することで平均修復時間 (MTTR) を短縮し、チームが目の前の問題を解決することに集中できるようになります。2 月に Grafana Incident のプレビュー版をロールアウトしました。プレビュー ユーザーの皆様からの貴重なフィードバックのおかげで、フル マネージドのオブザーバビリティ プラットフォームであるGrafana Cloud の全ユーザーに Grafana Incident を提供する準備が整いました。Grafana Incident は追加料金なしで Grafana Cloud に含まれており、組織内ですでに影響を与えている新機能および拡張機能が含まれています。
PagerDuty をGrafana OnCallと Grafana Incident に置き換えている、Clearcoソフトウェア エンジニア Bruno Da Silva氏は、「私たちにとって最大のメリットは、Slack との統合、Google ドキュメントの自動テンプレート作成、StatusPage との統合などの細かい部分にあります。これらの小さなことが積み重なって、インシデント対応のための非常に便利でまとまりのあるツールとなっています。それは予想以上の成果を上げています。Incident の将来に非常に期待しています!」と述べています。
このブログでは、Grafana Incident が対処する問題を取り上げ、問題が発生したときにチームを支援するために、今日から使用できるすべてのGrafana Incidentの機能について詳しく説明します。
始めるには、Grafana Incident のドキュメントもご覧ください。
Grafana Incidentとは?
インシデントに対処する際の大きな課題となるのは、事態を収拾するために必要な調整とコミュニケーションです。これまでに何が起きたのか?誰が関与しているのか?誰がどのクエリを試したのか? ステークホルダーに情報を提供することを忘れていないか? そのインシデントの深刻度は?これはカスタマーにどのような影響を与えるのか?
特に新しいメンバーがインシデントに参加すると、このようなことを把握するために、多くのやりとりが必要になります。インシデントが解決された後でも、イベントとアクション アイテムの重要なタイムラインをキャプチャし、インシデント後のレビューを作成する作業が追加されます。
ここで、Grafana Incident の出番です。Grafana Incident は、インシデント管理に関する業界のベスト プラクティスに準拠しているため、問題が発生したときにチームを成功に導くための有益なアクションをすぐに見つけることができます。その後、ツールはフォールアウトを管理し、将来に同じ問題を回避するための重要なインサイトが得られます。
Grafana Incident のインシデント管理機能
インシデントを宣言する
インシデントの宣言は簡単です。Web UI またはチャットから直接行うことができます。このツールは、Slack チャネルから共同作業ができる専用の会議室 (Zoom や Google Meet など) まで、必要なすべての重要なものを自動的にセットアップしてくれます。
インシデントのロールを割り当て
ロールを割り当てることで、誰が何をしているかを全員が知ることができます。まず、「調査員」を特定する必要があります。これは、何が起こっているのかを把握したり、それができる人を見つける責任がある人です。重大なインシデントの場合、インシデントを担当する「コマンダー」司令官が割り当てられ、全員が最新の状態に保たれ、何も見逃さないようにします。
チャットボット
チャットボットは、インシデントを管理するためのコマンドライン インターフェイスを提供します。チャットボットは、チャットで共有される興味深いコンテキストに注目します。
たとえば、GitHub イシューへのリンクを投稿すると、それはインシデントに添付され、ページに表示されます。Grafana Incident はステータスを同期するので、何が完了し、何が残っているかを簡単に確認できます。
GitHub イシューやプル リクエスト、JIRA チケット、Grafana ダッシュボード、外部リンクなど、何が起こっているのかを受動的に把握できます。Grafana Incident で利用可能な統合の詳細については、ドキュメントをご覧ください。
サジェストボット
Grafana Incident は、関連するダッシュボードを提案することもできます。これは、初めてコールするときに最適です。サジェストボットは、機械学習を使って、Grafana ダッシュボードからいま起きていることに関連するであろうものを探します。NLP (自然言語処理) がインシデントのタイトルを理解し、関連していると思われるものをダッシュボードから検索します。これは、Grafana Labs にとってエキサイティングな方向への第一歩であり、今後、インシデントへのインサイトが拡大するであろうことを期待しています。
タスクマネージャー
ビルトイン タスク マネージャーでTo Do 項目を追跡します。タスクの追加や作業の割り当てが簡単で、見落としがありません。
アクティビティ タイムライン
このツールは、アクティビティのタイムラインを自動的に構築し、何が起こったのか、レスポンス プロセスがどのように機能しているか、または機能していないかについて、有益なインサイトを得るのに役立ちます。
インシデントの事後分析のための Present ツール
Grafana Labs では、インシデントの事後分析を行う際に、インシデントの概要を提供するPresentツールを使用しており、透明性を高めるために非常に効果的であることがわかりました。Grafana IncidentにPresent機能を搭載することで、ユーザーは問題が発生したときに学習し、再発を防ぐことができるようになりました。
Grafana Incidentの利用を開始する
もしあなたが既存の Grafana Cloud ユーザーの場合は、垂直サイドバーで Grafana Incident アイコンを探すだけで利用できます。Grafana Cloud 管理者はアプリを有効にすることができます。 Slack を使用している場合は、チャットボットがツールのインタラクティブなツアーに参加できるように、すぐに設定した方が良いでしょう。
まだ Grafana Cloud ユーザーではありませんか? 無料アカウントにサインアップすると、Incident に今日からアクセスできます。Grafana Cloud では、永久無料の利用枠のほか、すべてのユース ケースに対応するプランを用意しています。
皆様からのご意見をお待ちしております。 GitHubのGrafana Incident コミュニティ リポジトリで問題を報告し、ディスカッションに参加するか、Grafana Labs コミュニティ Slackの #grafana-incident チャンネルにご参加ください。
Grafana Cloud をまだ使用していない場合は、今すぐGrafana Cloud Pro の 14 日間の無料トライアルにサインアップしてください。無制限のメトリクス、ログ、トレース、およびユーザー、長期保持、そして1 つのエンタープライズ プラグインにアクセスできます。
原文:Grafana Incident for incident management is now generally available in Grafana Cloud
著者:Mat Ryer