stackhpc.os_monasca_monitor

stackhpc.os-monasca-monitor

构建状态

此角色将 Monasca Monitor 部署为 systemd 服务。它还配置了 Monasca-Monitor 工作所需的警报和通知。运行后,您应该能够获得一个 Prometheus 端点,用于监控 Monasca 警报管道的状态。

使用方法

  1. 决定要将监控器与哪个 OpenStack 项目关联,并确保该项目中存在用户,并且具有 monasca 用户角色。

  2. 创建一个剧本来运行该角色,覆盖您需要的任何默认值,例如:

    $ cat my_playbook.yml
    ---
    - name: 确保 Monasca Monitor 已部署
      hosts: 一台对外开放 OpenStack API 的节点
      vars:
        monasca_monitor_port: 8000
      roles:
        - name: stackhpc.os_monasca_monitor
          monasca_monitor_bind_port: "{{ monasca_monitor_port }}"
          monasca_monitor_bind_host: "10.0.0.10"
          monasca_monitor_auth_url: "http://{{ public_os_vip_address }}:5000"
          monasca_monitor_project_name: "monasca-monitoring"
          monasca_monitor_password: "{{ secrets_monasca_monitoring_password }}"
          monasca_monitor_username: "monasca-monitor"
          monasca_monitor_region_name: "RegionOne"
          monasca_monitor_endpoint_type: "public"
      tasks:
        - name: 打开端口以允许来自 Monasca 通知服务的 ping-back
          iptables:
            state: present
            jump: ACCEPT
            in_interface: enp0s1
            chain: IN_public_allow
            protocol: tcp
            destination_port: "{{ monasca_monitor_port }}"
            comment: 启用对 Monasca 监控服务的 ping-back。
          become: yes
    
  3. 在希望运行监控器的主机上运行剧本:

    $ ansible-playbook -i localhost my_playbook.yml
    
  4. 配置 Prometheus 以抓取端点。默认情况下,该端点绑定到主机上的所有接口。感兴趣的指标是 monasca_monitor_heartbeat_total,默认情况下,每分钟应增加一次。目的是在 Prometheus 中设置一个警报,以确保计数器持续增加。如果停止,则应检查 Monasca 警报管道。以下是 Prometheus 端点的示例输出:

    [stack@sv-b16-u22 monasca-monitor]$ curl http://10.0.0.100:8000/metrics
    # HELP process_virtual_memory_bytes 虚拟内存大小(以字节为单位)。
    # TYPE process_virtual_memory_bytes gauge
    process_virtual_memory_bytes 2.64052736e+08
    # HELP process_resident_memory_bytes 常驻内存大小(以字节为单位)。
    # TYPE process_resident_memory_bytes gauge
    process_resident_memory_bytes 2.9036544e+07
    # HELP process_start_time_seconds 自 Unix 纪元以来的进程启动时间(以秒为单位)。
    # TYPE process_start_time_seconds gauge
    process_start_time_seconds 1.55068281646e+09
    # HELP process_cpu_seconds_total 总用户和系统 CPU 时间(以秒为单位)。
    # TYPE process_cpu_seconds_total counter
    process_cpu_seconds_total 0.72
    # HELP process_open_fds 打开的文件描述符数量。
    # TYPE process_open_fds gauge
    process_open_fds 13.0
    # HELP process_max_fds 最大打开的文件描述符数量。
    # TYPE process_max_fds gauge
    process_max_fds 1024.0
    # HELP python_info Python 平台信息
    # TYPE python_info gauge
    python_info{implementation="CPython",major="2",minor="7",patchlevel="5",version="2.7.5"} 1.0
    # HELP monasca_monitor_heartbeat_total Monasca 系统级心跳
    # TYPE monasca_monitor_heartbeat_total counter
    monasca_monitor_heartbeat_total 8.0
    # TYPE monasca_monitor_heartbeat_created gauge
    monasca_monitor_heartbeat_created 1.550682817310154e+09
    

许可证

Apache

作者信息

http://www.stackhpc.com

关于项目

Monasca Monitoring utility

安装
ansible-galaxy install stackhpc.os_monasca_monitor
许可证
apache-2.0
下载
245
拥有者
StackHPC develops OpenStack capabilities for research computing use cases. Through extensive experience, we understand HPC and cloud.