使用Instana来监控IBM Workload Scheduler

早上好。下午好。晚上好。
我要参加Instana可观察性冒险日程。在第14天,我想写一下关于我日常工作中使用的IBM Workload Scheduler产品在Instana下如何进行监控的试验结果。
如果我在Instana上监控IBM的一款软件包(IWS),它会显示什么样子,如果对你有一点参考价值,我会很高兴。

IBM工作负载调度器和监控

希望观看Instana 观察性 Advent 日历的各位可能已经非常熟悉Instana了,但也可能有一些不熟悉IBM Workload Scheduler(以下简称IWS)的人,请允许我简单介绍一下。

IWS是IBM提供的作业调度程序。它主要用于自动执行夜间批处理等任务。除了日志归档和备份之外,这也常被用于自动执行与业务应用程序相关的批处理任务,而IWS的故障或停机可能直接导致客户业务的中断。

因此,通常会使用监控工具监控IWS进程的运行状态和通过IWS自动执行的作业的状态。(通过监视IWS写出作业状态的日志来实现对作业状态的监控。)

这次我们来试着看看如何在Instana上监控IWS。

验证环境

    • IWS 10.2 (RHEL 9)、Db2 11.5(RHEL 8、IWS用のリポジトリとして使用)

 

    Instana Build 263 (SaaS)

IWS基础设施的监控

首先,我们将确保能够监控IWS服务器的基础指标和其他相关信息。

通过安装和配置Instana Agent

在 IWS 服务器和 IWS DB 服务器中安装 Instana Agent(由于 Instana Agent 的安装非常简单,因此省略此步骤!)。
由于 DB 服务器中有 Db2,所以通过使用 configuration.yaml 来适当地配置,以便获取实例和数据库的信息。

com.instana.plugin.db2:
  # Local monitoring configuration
  local: # multiple local configurations supported
    - instance: 'db2inst1'
      port: '50000'
      user: 'db2inst1'
      password: 'password'
      databases:
        - 'TWS'
        - 'DWC'

这样一来,我们就能够获取到 IWS 服务器的基础度量指标了。另外,由于 IWS 是基于 WAS Liberty 和 Db2 的产品,所以我们也能够获取与 WAS Liberty 和 Db2 相关的信息。

以基础设施为视角,观察IWS服务器群。

スクリーンショット 2023-12-12 19.47.17.png
スクリーンショット 2023-12-12 20.02.38.png
スクリーンショット 2023-12-12 19.32.27.png

通过Instana Agent检测到的TWS DB仪表板可以打开,您可以查看TWS DB的指标。您可以获取各种指标,包括表空间使用率、日志使用率和数据库配置参数。(有关可获取的Db2详细指标,请参阅此处。)

スクリーンショット 2023-12-12 19.54.15.png

我发现在Instana的UI上可以查看相当详细的信息。
如果IWS存在问题,则可能需要从WebSphere Liberty和Db2的角度进行故障排除。但是,如果向WebSphere Liberty或Db2专家说“看这个界面!”也许可以在不登录到各个服务器上的情况下找到问题的原因。(希望往好的方向推测)

监控IWS进程

由于没有为IWS准备传感器,因此遗憾的是Instana无法自动检测和监视IWS过程(不包括Websphere Liberty和Db2过程)。
但是通过Instana Agent的设置,可以监视各个独立进程。虽然本次并没有进行验证,但是像mailman、batchman等重要进程似乎可以通过单独的设置进行监视。

应用程序监控 xù

IWS是一个以WebSphere Liberty作为执行环境的应用程序。同时,它还使用Db2作为后端数据库。我们可以将IWS作为一个独立的应用程序进行监控。

创建应用程序的视角

使用Instana创建IWS的应用程序视角,并将IWS作为应用程序进行监控。

スクリーンショット 2023-12-12 20.38.26.png

在「应用程序」中查看IWS。

スクリーンショット 2023-12-12 21.10.21.png

只需安装Instana Agent并进行简单的设置,就可以轻松看到这么多内容简直太棒了。可观测性万岁!Instana 万岁!

对IWS网站进行监控

如果使用IWS,用户可以通过浏览器访问IWS服务器,并且可以注册作业或者查看作业的执行结果等等。它是一种Web应用程序。因此,也可以将其作为Web网站监控的对象。

将IWS作为网站监控的对象

スクリーンショット 2023-12-12 21.22.01.png
<html xml:lang="en-us" lang="en-us">
  <head>
    <base target="_top">    
    <title>Dynamic Workload Console</title>
    <meta http-equiv="X-UA-Compatible" content="IE=edge" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <meta charset="utf-8" />
    <script defer src="dashboard/jsonlint.js"></script>
    <script type="text/javascript">
        DWCdebugMode = false;
        var WD={};
    </script>
    <script>
      (function(s,t,a,n){s[t]||(s[t]=a,n=s[a]=function(){n.q.push(arguments)},
      n.q=[],n.v=2,n.l=1*new Date)})(window,"InstanaEumObject","ineum");
    
      ineum('reportingUrl', 'https://xxx-xxx-saas.instana.io');
      ineum('key', 'xxxxxxxxxxxxxxxxxxxxxxx');
      ineum('trackSessions');
    </script>
    <script defer crossorigin="anonymous" src="https://eum.instana.io/eum.min.js"></script>
    <%@include file="./index.html" %>
</head>

通过网站监测查看IWS

スクリーンショット 2023-12-12 21.42.55.png

IWS 固有指標的监控

由于没有为IWS准备专用传感器,因此不能只通过引入Instana Agent来立即开始监视IWS!但是,通过对IWS和Instana分别进行一些设置,可以在Instana中收集和可视化IWS特定的指标。

IWS固有指标是指以下这些指标,例如:

    • ジョブのステータス(正常終了・異常終了など)

 

    • IWSサーバーおよびエージェントのステータス

 

    DBへの接続状況

我将看看有哪些可以被引用的内容。

IWS指标的公开发布

在IWS的V10.1及以后的版本,我们发布了各种指标以便Instana等监控工具能够收集和可视化运行状态。为了使这些指标可以在Instana等监控工具中获取,我们需要在IWS中进行设置以公开这些指标。

请按照这里的步骤进行操作。

IWSサーバーへログインします。以降の手順は全て root権限で実施します。

IWSサーバーの設定ファイルが保存されているディレクトリーへ移動します。

cd /opt/wa/TWSDATA/usr/servers/engineServer/configDropins/overrides
    prometheus.xml というファイルを作成し、以下の内容を記載し、保存します。
<server>
  <featureManager>
      <feature>mpMetrics-4.0</feature>
      <feature>cdi-3.0</feature>
  </featureManager>

  <mpMetrics authentication="false" />

</server>
    IWSサーバー(WebSphere Liberty)を再起動します。
su - wauser
conman "stopappserver ;wait"
conman "startappserver ;wait"
    • メトリックが公開されていることを確認します。下記のURLへアクセスします。

 

    • https://<IWSサーバーホスト名またはIP>:31116/metrics

 

    このような形でメトリックが参照できればOKです。
スクリーンショット 2023-11-10 14.59.39.png

使用Instana代理設置指標擷取配置

在IWS服务器上安装Instana Agent后,您需要在configuration.yaml文件中进行配置,以获取IWS的指标数据。

    下記を configuration.yaml に追記します。
com.instana.plugin.prometheus:
  # Global (all) endpoints username/password configuration (optional)
  username: ''
  password: ''
  customMetricSources: # list metric sources
  - url: 'https://localhost:31116/metrics'
    username: 'wauser'                             # endpoint specific username/password configuration
    password: 'password'
スクリーンショット 2023-12-12 22.46.18.png

将IWS仪表板导入到Instana

在提供IWS插件的网站上,可以找到用于监控IWS的Instana自定义仪表板。通过导入和自定义此自定义仪表板,您可以在Instana UI中将IWS指标可视化。

    カスタムダッシュボードをこちらからダウンロードします。
スクリーンショット 2023-12-12 22.03.23.png
instana-blog-10_orig.png

据我所知,IWS代理的连接状态似乎可以以概要图表的形式展示,并且通过这个概要图表可以进一步识别出存在连接问题的代理和异常的作业,但要进行进一步的判断以及确定异常作业,则需要同时使用IWS的用户界面。在使用的过程中,大致可以通过概览级别来把握IWS环境的健康状况,而具体详细信息则可以在IWS的用户界面中确认。对于单独的作业状态通知,可能需要结合传统的日志监控以及IWS事件规则来实现个别通知。

总结

本次我们介绍了如何在Instana上监控IBM Workload Scheduler这个产品。
通过基础设施视角和应用程序视角的监控,我们可以更好地了解到以前很难实现可视化的IWS内部状态。这对于故障排除IWS运行中的问题将非常有帮助。这正是Instana提供的可观察性的独特之处。
另一方面,个人感觉IWS的仪表盘还有些欠缺。
希望在Instana的界面上能够找出与IWS Agent无法连接或存在异常的作业。
这篇文章结束了。

bannerAds