WatchDog 是一个辅助应用程序 HostMonitor. Windows 版 WatchDog 包含在 Advanced_Host_Monitor 包中。
Linux 下的 WatchDog 可以是 下载的 分别地。
介绍
安装
快速开始
行动
价格
假设您已在可靠的服务器上安装了 HostMonitor 并设置了数千个测试项目来监控整个网络(或多个网络)。
如果出现任何问题,HostMonitor 会通知您。 除非...除非运行 HostMonitor 的系统发生问题。
如果由于某些有缺陷的驱动程序导致电源死机、主板损坏或 Windows 崩溃怎么办? 如果您的主路由器停止响应怎么办?
有多种解决方案。 让我们从不太有效的地方开始,逐渐转向最有效的地方。
- 您可以设置 HostMonitor 来检查与路由器或 ISP 的连接并使用“网络独立”警报(例如 "Send SMS using GSM modem") 通知您有关此问题的信息。
- 您可以将 HostMonitor 设置为在其他操作员停止监视或禁用警报(使用“暂停监视/警报”对话框窗口)时启动警报,或者仅允许使用以下命令停止对单个管理员帐户的监视 User Profiles
当然,当 HostMonitor 运行的系统崩溃时,这将无济于事。 还有另一种选择:
- 您可以使用 HostMonitor 的内置调度程序定期启动某些操作。 例如。 您可以将 HostMonitor 设置为每 30 分钟向您的智能手机发送一次电子邮件。 如果您没有收到电子邮件,那么您就知道出了问题。
您认为这是烦人且不是有效的解决方案吗? 我们同意。 还有更好的解决方案。 还有其他方法可以监视监视器。
- 手动:您可以使用 RCC, Web_Service or Telnet_Service 远程检查 HostMonitor。
这样您就可以看到发生了什么、哪些测试失败、执行了哪些操作; 您可以确认状态并更改测试参数。
你可以做任何事情,但你应该自己做所有事情。 当 HostMonitor 停止响应时,RCC 将无法采取任何操作(除非您设置了“播放声音”操作来寻求帮助)
- 还有另一种方法:在另一个系统上安装 WatchDog(以及可选的 HostMonitor 的另一个实例),并使用该系统 24/7 自动监控主监视器。
更好的是:当主 HostMonitor 没有响应时,您可以设置第二个系统来启动网络监控。
- 最后,您可以使用 HostMonitor 的另一个副本来监控主 HostMonitor!
在这种情况下,所有必要的操作都可以自动启动。 还有另一个好功能:主 HostMonitor 可以监控备份 HostMonitor,这样每个系统都会监控同事!
虽然 WatchDog 在一个应用程序中免费提供图表和警报(它包含在企业包中),但 HostMonitor 的第二个实例将提供极大的灵活性和可靠性。
看 HM Monitor 测试方法。
注意:如果您想在 2 个系统上安装 HostMonitor,则需要订购 2 个许可证。
那么,我们来谈谈WatchDog。
WatchDog 可以用作交互式应用程序,实时显示统计信息和图表。
它不允许您管理像 Remote_Control_Console 这样的测试项目。
它仅提供有关 HostMonitor 运行状况的基本信息:您将看到监控是否已启动且操作已启用、HostMonitor 执行了多少测试探针、有多少测试探针失败、启动了多少操作等。

如果您有数千个测试项目,Remote_Control_Console 可能会增加网络负载并给 HostMonitor 带来额外负载(HostMonitor 需要加密有关每个执行的测试探测的信息并将数据发送到 RCC)。
在相同情况下,WatchDog 仅请求一般统计信息,不会增加资源使用量。
另一方面,您可以将 WatchDog 作为 Win32 服务启动,设置一些操作并使其无人值守。 服务将在系统启动时自动启动,WatchDog 将尝试连接到 HostMonitor 并几乎不断地检查连接。 如果连接断开,WatchDog 将执行指定的操作并尝试重新连接。 如果连接恢复,服务将启动另一组操作。
例如,您可以使用以下一组操作
- --"Bad" 行动--
- 连接断开且第一次重新连接尝试失败时发出视觉/声音警报
- 如果 1 分钟内无法建立连接,则将系统日志消息发送到某个控制台
- 启动外部程序(sendmail):如果1分钟内无法建立连接,则向管理员发送电子邮件
- 启动外部程序:如果2分钟无法建立连接,则启动备份HostMonitor
- --"Good" 行动--
- 连接恢复时发出视觉/声音警报
- 启动外部程序(sendmail):如果连接稳定1分钟,则向管理员发送电子邮件
- 启动外部程序:如果连接稳定2分钟,则停止备份HostMonitor
无论您如何启动WatchDog(使用应用程序或服务模式),它都会提供相同的用户界面。 它还在系统托盘中显示图标,并根据条件更改图标图像:连接断开; HostMonitor 警报禁用时已建立连接; 连接已建立但监控已停止; 一切正常(已建立连接、已启动监控并已启用警报)。
WatchDog安装
WatchDog 不需要任何特殊安装。 只需将 watchdog ELF 文件复制到要启动 WatchDog 的任何系统即可。
(可选)我们建议使用默认设置复制 watchdog.ini 和 wdactions.lst 文件。
当您想要将预配置的 WatchDog 从一个系统移动到另一个系统时,您应该复制这 3 个文件。
WatchDog配置:快速启动
要允许远程监控 HostMonitor,请按照以下简单步骤操作:
- 启动主机监视器
- 配置 HostMonitor 的远程控制接口 RCI 页面中的 Options 对话框(菜单 Options)
- 设置“WatchDog” user accounts: 使用 HostMonitor 的菜单指定密码和可接受的 IP 地址列表 "User"->"Operators"
现在您可以启动WatchDog,输入HostMonitor运行的系统地址(Host),输入密码(Password)并单击“连接”按钮。 就是这样。
当TCP连接建立并通过认证后,WatchDog将显示HostMonitor的信息,显示实时图表等。
您可以选择更改 HostMonitor、RCC、Web_Service 和 WatchDog 使用的 TCP 端口(RCI 端口); 指定超时和状态刷新率。
- RCI Port 港口
如果您将 HostMonitor 设置为使用默认 TCP 端口(默认端口为 1054)以外的端口,请指定 WatchDog 使用的相同端口;
如果运行 HostMonitor 的系统受防火墙保护,请确保防火墙不会拒绝 RCI 端口上的 TCP 请求
- Timeout 暂停
WatchDog 在返回错误响应之前等待 HostMonitor 回复的最长时间(以秒为单位);
- Status refresh rate 状态刷新率:
WatchDog 定期请求 HostMonitor 并检索统计信息。 刷新率选项指定发出此类请求的频率。
- Do not store password, prompt before connection 不存储密码,连接前提示
如果选择此选项,WatchDog 将显示“连接参数”对话框并在每次启动时要求输入密码
- Use stored password, connect automatically 使用存储的密码,自动连接
当您想要在没有人工交互的情况下启动 WatchDog 时,请使用此选项。
应用程序将存储密码并在启动时自动连接到 HostMonitor。 如果您想将 WatchDog 作为服务启动,则应使用此选项。
注意:您可以随时使用菜单更改连接参数 "Action"->"Connect to HostMonitor"
如果您只想观看 HostMonitor 性能图表,则您的设置已完成。
WatchDog 将请求 HostMonitor、检索统计数据、显示图表、有关执行的测试、操作、日志记录的信息。

注:ATC 表示平均时间消耗.
例如。 “Actions: 230 | 0.01/sec | ATC: 4.09 msec/action”的含义如下:
- HostMonitor 执行了 230 actions
- HostMonitor 每秒启动 0.01 次操作(平均)
- HostMonitor 每次操作执行使用 4.09 毫秒(平均)。
注意:HostMonitor 计算主线程用于日志记录和操作的时间,它不包括辅助线程使用的时间,因为它不太重要。
此信息可用于调查某些与第 3 方软件相关的问题(例如,为 ODBC 日志记录指定的 ODBC 驱动程序是否消耗太多时间)。
Options/Actions选项/操作:
如果您想在远离 HostMonitor 和 WatchDog 时接收警报,则需要设置“actions”。
您可以设置 2 个操作列表
- 当 HostMonitor 在一段时间内没有响应时执行一组操作
- 当连接建立并且在指定时间段内稳定时将执行另一组
要使用操作,您可以使用 Options 对话框。 要调出此对话框,请使用菜单 Options
要修改每组操作,请使用列表右侧的按钮:
Add | 添加新动作到集合中 |
Edit | 调出 Action_Properties 对话框,用于编辑所选操作的参数 |
Delete | 删除选定的操作 |

以下是为响应问题而启动的可用操作列表:
操作属性在 Action_Properties 对话框中定义。
但是,每种类型的操作都有一组特定于该操作类型的参数。
我们先看一下常用属性(这些参数位于“操作属性”对话框的上半部分):

Action name 动作名称
动作名称; WatchDog 根据操作类型自动使用建议名称填充此字段; 您可以将该名称更改为您想要的任何名称。
Condition to start action 开始操作的条件
Start when HostMonitor does not respond for N min
此参数告诉何时应执行“不良”操作 - 当与 HostMonitor 的连接断开且重新连接尝试失败 N 分钟时
Start when HostMonitor does respond for N min
此参数告诉何时应执行“良好”操作 - 当建立与 HostMonitor 的连接且稳定 N 分钟时(0 表示应在刚建立连接时执行操作)
Action depends on "bad" one 行动取决于“坏”行动
此可选参数仅适用于“Good”操作。 您可以根据“坏”操作设置“好”操作。 你为什么需要它?
例如,您定义“Bad”操作以在连接丢失 3 分钟时向网络管理员发送电子邮件通知,您还定义“Good”操作以在连接恢复且稳定 2 分钟时发送通知。
如果连接中断 1 分钟,然后一小时内一切正常,会发生什么情况?
WatchDog 不会发送有关失败的通知(因为连接会在 1 分钟后恢复),但程序会发送有关恢复“良好”状态的通知。
为了避免不必要的“好”操作执行,您可以标记“操作取决于坏的”选项并选择“坏”操作。
在这种情况下,只有执行了相应的“坏”操作,WatchDog 才会启动“好”操作。
特定于操作的设置:
Visual/Sound 视觉/声音 |
此操作旨在播放声音文件(WAV、MID 等)。 除了常见的操作参数外,“视觉/声音警报”操作还有以下选项:
Sound file 声音文件
指定声音文件的完整路径或单击右侧的小按钮并从“打开文件”对话框中选择文件。
Show WakeUP window and play sound repeatedly 显示唤醒窗口并重复播放声音
启用此选项后,WatchDog 将显示一个弹出窗口,其中包含有关事件的信息,并会重复播放声音,直到您单击“停止”按钮。
|
Execute external program 执行外部程序 |
此操作的名称本身就说明了这一点,它启动指定的外部应用程序。
除了 通用动作参数 这个动作还有 2 个参数:
Command line 命令行
指定启动外部应用程序的命令行。 Macro variables 可以在命令行中使用。
例如你可以
- 使用如下命令将消息发送到 LAN 中的另一个系统 net send * "%HMSystemAddr% %EventText%"
- 启动备份 HostMonitor 作为应用程序: c:\program files\HostMon8\hostmon.exe
- 启动备份 HostMonitor 作为服务: net start HostMonService
- 启动sendmail程序发送电子邮件
- 等等.
Linux 上没有 HostMonitor,因此您无法在那里启动备份 HostMonitor,但此操作在某些情况下可能会有所帮助。
Window mode 窗口模式
此选项仅在 Windows 系统上启用,它指定应用程序窗口的显示方式。
选择可能的选项之一:
SW_SHOWNORMAL | - | 以原始大小和位置显示应用程序窗口。 |
SW_HIDE | - | 启动应用程序而不显示其窗口。 |
SW_MAXIMIZE | - | 将应用程序窗口显示为最大化窗口。 |
SW_MINIMIZE | - | 将应用程序窗口显示为最小化窗口。 |
SW_SHOWMINNOACTIVE | - | 将应用程序窗口显示为最小化窗口。 活动窗口保持活动状态。 |
SW_SHOWNOACTIVATE | - | 以原始大小和位置显示应用程序窗口。 活动窗口保持活动状态。 |
|
Syslog 系统日志
|
此操作使用 Syslog 协议发送数据。 Syslog 是 Unix 的标准事件日志子系统,您也可以找到 Windows 的 Syslog 服务。
Syslog 守护进程接收从路由器、交换机、UNIX 主机、HostMonitor 和其他网络设备发送的标准 UDP Syslog 消息,并可以在屏幕上显示详细信息、日志到文件、终端设备等。
Syslog 还允许您将日志条目转发到另一台计算机进行处理,这样 syslog 就可以充当分布式错误管理器。
除了 通用动作参数, “Syslog”操作具有以下参数:
Server 服务器
这是系统日志服务器的名称或 IP 地址。
Port 港口
默认 SNPP 端口为 514,但您可以指定非标准端口。
Message 信息
提供要发送的短信。 Macro variables 消息中支持在操作执行时将其替换为实际值。
Severity 严重性
日志消息按便利性和紧急程度的组合确定优先级。
级别(严重性)可以被视为问题的各个级别(例如警告、错误、紧急情况),而设施则被视为服务领域(例如打印、电子邮件、网络等)。
可用的级别如下:
- | Emergency | 恐慌状态。 系统无法使用。 |
- | Alert | 应立即纠正的情况,例如损坏的系统数据库。 |
- | Critical | 关键情况,例如硬设备错误. |
- | Error | 错误. |
- | Warning | 警告消息。 |
- | Notice | 不是错误条件但可能应该特殊处理的条件。 |
- | Info | 信息性消息。 |
- | Debug | 包含通常仅在调试程序时使用的信息的消息。 |
Facility 设施
设施是被视为服务区域的数字。 各种设施如下:
0 | 内核消息 |
1 | 用户级消息(随机用户进程生成的消息) |
2 | 邮件系统 |
3 | 系统守护进程 |
4 | 安全/授权消息 |
5 | syslogd 内部生成的消息 |
6 | 行式打印机子系统 |
7 | 网络新闻子系统 |
8 | UUCP子系统 |
9 | 时钟守护进程 |
10 | 安全/授权消息 |
11 | FTP 守护进程 |
12 | NTP子系统 |
13 | 日志审核 |
14 | 日志警报 |
15 | 时钟守护进程 |
16-23 | 保留供本地使用 |
|
SNMP Trap 陷阱
|
此操作使用 SNMP 协议向管理站发送消息。
SNMP(简单网络管理协议)是用于在管理控制台应用程序和受管实体(主机、路由器、网桥、集线器等)之间交换管理信息的 Internet 标准协议。
除了 通用动作参数, “SNMP_Trap”操作具有以下参数:
Destination address 目的地地址
您应该在此处提供主机名 (例如 mail.maincorp.com) 或IP地址 (例如 204.71.200.68) 将接收 SNMP_Trap 消息的主机的名称。
该计算机应运行 SNMP 控制台才能接收陷阱消息。 您可以使用 macro variables 在这个领域里。
您也可以指定非标准 UDP 端口。 可以在目标地址后面的冒号后面提供端口号 (例如. 195.168.10.10:1162).
Agent address 代理地址
提供生成 SNMP_Trap 的代理的 IP 地址。 如果保留默认值“localhost”,WatchDog 将使用其运行系统的 IP 地址。
Community 社区
指定用于此陷阱的 SNMP 团体名称。 大多数系统的默认社区是“public”。 团体字符串必须与 SNMP 控制台使用的团体字符串匹配。
Enterprise 企业
识别引起陷阱的对象的类型。
Trap type 陷阱类型
选择一种通用陷阱类型:
- Cold Start
- Warm Start
- Link Down
- Link Up
- Authentication Failure
- EGP Neighbor Loss
- Enterprise Specific
Specific 具体的
如果陷阱类型是企业特定的,请提供陷阱的 ID。
MIB OID
SNMP_Trap消息可以包括与该消息相关的OID及其值。 在此字段中定义对象标识符(对象标识符是唯一标识该对象的名称,
例如 OID“1.3.6.1.2.1.2.1”表示系统可以发送/接收IP数据报的网络接口的数量。
MIB Value 价值
定义对象的值。 您可以使用 macro variables 在这个领域也是如此。
MIB Type 类型
选择数据类型。 它可以是以下之一:
- NULL
- INTEGER
- OCTET STRING
- OBJECT IDENTIFIER
- IP ADDRESS
- UNSIGNED32
- COUNTER
- GAUGE32
- TIMETICKS
- OPAQUE
- COUNTER64
|
Macros 宏
|
在定义时 some 您可以使用特殊的宏变量来设置警报操作的参数:
%HMVersionText% | HostMonitor 的版本,例如 HostMonitor v. 8.12 |
%HMVersionBin% | 二进制版本,例如 0812 |
%HMSystemName% | Name of the system where HostMonitor is running |
%HMSystemAddr% | 运行 HostMonitor 的系统的主机名或 IP 地址(指定为连接参数的地址) |
%HMStartedTime% | HostMonitor 启动的日期和时间 |
%HMStatusString% | 表示目标 HostMonitor 状态的字符串,如下所示
- monitoring started, alerts enabled, modifications stored
- monitoring stopped, alerts disabled, modifications not stored
如果与 HostMonitor 的连接断开,则此变量返回 'request failed' 细绳 |
%WDSystemAddr% | 运行WatchDog的系统的IP地址 |
%WDSystemName% | 运行 WatchDog 的系统的主机名 |
%ConnectedAt% | 建立与 HostMonitor 的连接的日期和时间,可用于“良好”操作 |
%ConnectedTime% | 与 HostMonitor 建立连接的时间,可用于“良好”操作 |
%DisconnectedAt% | 连接丢失的日期和时间,可用于“不良”操作 |
%DisconnectedTime% | 连接丢失的时间,可用于“不良”操作 |
%EventText% | 对于“好”操作返回“Connection established”字符串,对于“坏”操作返回“Connection lost” |
|
下表说明了可以在何处使用宏变量:
行动 | 适用宏 | 适用宏的操作参数 |
Visual/sound alert | 不 | |
Execute external program | 是的 | 命令行 |
Syslog | 是的 | 信息 |
SNMP Trap | 是的 | 目的地地址 MIB 价值 |
|
|
它要多少钱?
当您购买 Advanced_Host_Monitor ENTERPRISE 软件包时,您将获得 1 个 RCI 许可证(此类许可证允许您使用 Remote_Control_Console、Web_Service、Telnet_Service 和 WatchDog)。
初级版、专业版或高级版许可证的持有者可以单独购买 RCI 许可证,价格为 199 美元。
您可以使用信用卡、Switch 和 Solo 借记卡、支票/汇票或电汇来订购许可证。
细节..
|