mplachter.flume

Überblick Versionen Einblicke

Apache Flume =========

Ansible Rolle zum Bereitstellen und Konfigurieren von Apache Flume

Bereitstellung von Apache Flume
Konfiguration von Apache Flume
Erstellung des Dienstes apache-flume
- Läuft nur mit Agent-Konfiguration

Voraussetzungen

Ausführung
- Ansible 2.3+
Testen
- Docker/Vagrant
- Molecule = 1.2.5

Rollenvariablen

Java vars
```
java_heap_xms: 125
java_heap_xmx: 250
```

Apache Flume vars

mirror_url: http://apache.mirrors.ionfish.org/flume
version: 1.7.0

Installationsordner/-pfad vars

download_path: /tmp
installation_path: /usr/local
owner: root
group: root

Apache Flume Konfigurations vars
- Bitte konsultieren Sie das Flume Benutzerhandbuch
- Die aktuelle Konfiguration erlaubt
  - Agenten
    - Dienst wird nur für agent erstellt
    - mehrere
    - Es müssen manuell weitere Dienste erstellt werden, um diese derzeit auszuführen
  - Quelle
    - Derzeit wird nur eine Quelle für jeden agent zugelassen
  - Kanal
    - Derzeit wird nur ein Kanal für jeden agent zugelassen
  - Senken
    - mehrere
  - Senkengruppe
    - Fügt alle sinks im agent zur sinkgroup hinzu
- Aufgrund der zahlreichen Konfigurationsmöglichkeiten von Flume lesen Sie bitte folgendes
  - Bitte ersetzen Sie "." durch "_" in Ihrer Flume-Konfiguration für Eigenschaftsnamen
    - Werte benötigen nicht die Ersetzung
    - Beispiel
      - kafka_consumer_group_id: testflume
    - Ergebnis
      - agent.source.kafka.consumer.group.id = testflume
- Sie können die apache_flume_config-Variable übergeben, um die Konfiguration zu kopieren
  - Beispiel
    - apache_flume_config: file/flume-conf.properties
  - Ergebnis
    - Dies kopiert die flume-conf.properties aus Ihrem Dateiverzeichnis auf die Zielmaschine(n)
Zusätzliche Variablen
- HDFS native Bibliotheken
  - hdfs_libs = true
    - Dies wird HDFS Native Libs herunterladen und in plugin.d/hdfs/native/ ablegen

Beispielvariablen

mirror_url: http://apache.mirrors.ionfish.org/flume
version: 1.7.0
download_path: /tmp
installation_path: /usr/local
owner: root
group: root

java_heap_xms: 125
java_heap_xmx: 250
hdfs_libs: true

agents:
- name: agent
  source:
    name: kafkaSource
    type: org.apache.flume.source.kafka.KafkaSource
    kafka_consumer_group_id: flume
    kafka_consumer_auto_offset_reset: latest
    kafka_consumer_max_partition_fetch_bytes: 1048576
    kafka_consumer_heartbeat_interval_ms: 3000
    kafka_consumer_session_timeout_ms: 30000
    kafka_consumer_request_timeout_ms: 40000
    kafka_consumer_fetch_max_wait_ms: 500
    kafka_bootstrap_servers:
      - 127.0.0.1:9092
      - 0.0.0.0:9092
    kafka_topics:
      - topic1
      - topic2
  channel:
    name: kafkaChannel
    type: memory
    capacity: 1000000
    transactionCapacity: 100000
  sinks:
    - name: kafkaHDFSSink1
      type: hdfs
      hdfs_path: "s3n://GFGJFSHFJHFGFHSBJ:fdjhSFUYGSF65678+-saigfew123@hdfs/%{topic}/%y/%m/%d/%H"
      hdfs_filePrefix: FlumeData
      hdfs_inUseSuffix: .tmp
      hdfs_rollInterval: 30
      hdfs_rollSize: 1024
      hdfs_rollCount: 10
      hdfs_idleTimeout: 0
      hdfs_batchSize: 100
      hdfs_fileType: "SequenceFile"
      hdfs_maxOpenFiles: 5000
      hdfs_callTimeout: 10000
      hdfs_threadsPoolSize: 10
      hdfs_rollTimerPoolSize: 1
      hdfs_round: false
      hdfs_roundValue: 1
      hdfs_roundUnit: second
      hdfs_timeZone: Lokale Zeit
      hdfs_useLocalTimeStamp: false
      hdfs_closeTries: 0
      hdfs_retryInterval: 180
    - name: kafkaHDFSSink2
      type: hdfs
      hdfs_path: "s3n://GFGJFSHFJHFGFHSBJ:fdjhSFUYGSF65678+-saigfew123@hdfs/%{topic}/%y/%m/%d/%H"
      hdfs_filePrefix: FlumeData
      hdfs_inUseSuffix: .tmp
      hdfs_rollInterval: 30
      hdfs_rollSize: 1024
      hdfs_rollCount: 10
      hdfs_idleTimeout: 0
      hdfs_batchSize: 100
      hdfs_fileType: "SequenceFile"
      hdfs_maxOpenFiles: 5000
      hdfs_callTimeout: 10000
      hdfs_threadsPoolSize: 10
      hdfs_rollTimerPoolSize: 1
      hdfs_round: false
      hdfs_roundValue: 1
      hdfs_roundUnit: second
      hdfs_timeZone: Lokale Zeit
      hdfs_useLocalTimeStamp: false
      hdfs_closeTries: 0
      hdfs_retryInterval: 180
  sink_group:
    name: sinkgroup1
    processor_type: load_balance
    processor_backoff: false
    processor_selector: round_robin

Abhängigkeiten

andrewrothstein.java-oracle-jre

Beispiel-Playbook

- hosts: all
  roles:
    - role: mplachter.flume

Lizenz

MIT

Autoreninformationen

Matthew Plachter

Über das Projekt

Ansible role to install and configure Apache Flume

role apache flume

Installieren

ansible-galaxy install mplachter.flume

GitHub Repository

3 Sterne

1 Forks

0 Offene Issues

Lizenz

mit

Downloads

523

Besitzer

Matthew Plachter

Let's Do Stuff & Things.