属人化を解消!AI活用により実現する運用管理のDXとは
~ビジネスを止めないために「監視・分析・管理」の視点から
考える~
更新日:2022年6月9日
DX時代のAIを活用したIT運用
~モニタリングからオブザーバビリティへの進化~
04
AIOpsのビッグデータ分析、機械学習、人工知能の活用で、IT運用の正確さとスピードを高めることができます。本セッションでは、各ソースから膨大なデータセットを取り込み、高度な分析で運用を自動化し、データ分析を向上させるユースケースが紹介されました。
株式会社日立ソリューションズ
ビジネスコラボレーション本部 デジタルアナリティクスビジネス部
原 明日香
クラウドネイティブ環境で盲点が多い既存の監視ツール
デジタル革命はかつてないスピードで進み、今後クラウドネイティブへのさらなる移行が予想されますが、課題が明確になってきています。クラウドネイティブ環境を構築し、コンテナ、Kubernetes、サーバーレス関数、マイクロサービスなどのテクノロジーを導入すると、運用が複雑化し、障害への対応が困難となります。事態をさらに悪化させるのが、既存の監視ツールです。複数のツールが存在し、その多くは連携せず、拡張性も低いため盲点が生まれ、データがサイロ化し、収束に時間がかかります。
複雑な環境下で問題を測定 Splunkによるオブザーバビリティ製品
「複雑な環境でも状況を適切に把握し、隠れた問題を素早く測定して解決するために必要なのがオブザーバビリティです。モニタリングは、何が起きているのかを見続けるのに対し、オブザーバビリティは、予期せぬ事態でなぜそれが起きたのかを把握します。特にクラウドネイティブ環境においては、オブザーバビリティへのシフトが必要となります。モニタリングではカバーできないところを、オブザーバビリティで補完する形となりますが、当社で分析した結果、アメリカのSplunkによるオブザーバビリティ製品が、解決策の一つです」(原)
従来の運用課題に対する運用の進化
メトリクス、トレース、ログ 3種類のデータを有効活用
続いてSplunkでのオブザーバビリティについて解説が行われました。クラウドネイティ ブ環境では、ログの監視だけでは、ダイナミックに変化するインフラ上で、サービスの依存関係の全体像を把握することは困難です。一方で複数のツールを駆使しようとすると工数がかかってしまいます。そこでメトリクス、トレース、ログという3種類のデータ活用が最適です。「メトリクス」で何が起きているのかを検知し、「トレース」のどこで問題が起きているのかを判別し、「ログ」からなぜ問題が発生したのかを究明というように、各データの相関付けられた連携が、オブザーバビリティのための活用へとつながります。これらのデータで正確に状況を把握して、容易に観測することが、オブザーバビリティとしてのポイントとなります。
Splunkによる次世代のオブザーバビリティプラットフォーム
「2020年には次世代オブザーバビリティプラットフォーム『Splunk Observability Suite』が発表されました。これは、すべてのメトリクスデータ、トレースデータ、ログデータに対して、単一で一貫したユーザーエクスペリエンスを提供します。そしてモニタリング、トラブルシューティング、調査のための、シームレスで合理的なワークフローを提供し、問題の発見から解決までを短時間で簡単に行うことが可能です」(原)。
さらにSplunkのポートフォリオのなかで代表的な製品である「Splunk Infrastructure Monitoring」「Splunk APM」「Splunk RUM」ついて解説がありました。
Splunkの代表的な製品でリアルタイムインフラ監視
「Splunk Infrastructure Monitoring」は、オンプレミス環境やハイブリッド環境、マルチクラウド環境に対応。ハイブリッドにモニタリングでき、拡張性に優れたAIドリブンのリアルタイムインフラ監視ソリューションです。あらゆる規模、あらゆる導入形態のインフラを監視できます。「Splunk APM」はアプリケーションの状況確認や、問題発生時に、簡単にトラブルシューティングするための機能を提供するソリューションです。「Splunk RUM」はリアルタイムでユーザーの接続情報を確認することで、問題が起きているかを確認できる製品です。「Splunk APM」と組み合わせることで、ユーザーの操作から、サーバーでの情報を可視化する、高精度な監視ソリューションの実現も可能です。
Splunk Infrastructure Monitoring
管理者・ユーザーの課題を改善 分析活用統合ソリューション
また、Splunkがなぜ最適なのかについて「ストリームアーキテクチャーによるリアルタイムの監視とアラート」「異常値を捉える100%のトレース」「サービス全体から個別のトレースまで容易なドリルダウン」「3rdパーティーベンダーやオープンソースのソフトウェア・クラウドサービスとの充実した連携」「Built-inのダッシュボードやアラートテンプレートによるFast-Time-To-Value」「統計や機械学習を用いた多様で柔軟な可視化とアラート」などの理由が述べられました。
Splunkが最適な理由
「Splunkは分析を活用した統合ソリューションとして、課題に挙げられていた、あらゆる規模の最新のアプリケーションとインフラの複雑さを解消。管理者とユーザーのエクスペリエンスを改善することができるソリューションとして、お役に立てると考えております」とセッションは締めくくられました。
ホワイトペーパー第2弾
「企業の成長を加速させるには、オブザーバビリティが不可欠!今、注目されるオブザーバビリティとは何なのか?徹底解説」
従来の監視との違いや、オブザーバビリティの必要性および最新事例をホワイトペーパーに纏めました。