mplachter.flume

Przegląd Wersje Wgląd

Apache-Flume

Ansible Rola do wdrażania i konfigurowania Apache Flume

Wdraża Apache Flume
Konfiguruje Apache Flume
Tworzy usługę apache-flume
- Działa tylko w konfiguracji agenta

Wymagania

Wersja
- Ansible 2.3+
Testowanie
- Docker/Vagrant
- Molecule = 1.2.5

Zmienne Roli

Zmienne Java
```
java_heap_xms: 125
java_heap_xmx: 250
```

Zmienne Apache Flume

mirror_url: http://apache.mirrors.ionfish.org/flume
version: 1.7.0

Zmienne dotyczące folderów/ścieżek instalacji w systemie Linux

download_path: /tmp
installation_path: /usr/local
owner: root
group: root

Zmienne konfiguracyjne Apache Flume
- Proszę zapoznać się z Podręcznikiem Użytkownika Flume
- Aktualna konfiguracja pozwala na
  - Agenci
    - Usługa Zostanie Utworzona Tylko Dla agenta
    - wiele
    - Będzie trzeba ręcznie tworzyć więcej usług, aby uruchomić je w tej chwili
  - Źródło
    - Pozwolenie tylko na jedno źródło dla każdego agenta
  - Kanał
    - Pozwolenie tylko na jeden kanał dla każdego agenta
  - Odbiorniki
    - wiele
  - Grupa odbiorników
    - Wszystkie odbiorniki w agencie zostaną dodane do grupy odbiorników
- Ze względu na dużą ilość możliwości konfiguracji Flume, prosimy o przeczytanie poniższego
  - Proszę zastąpić "." znakiem "_" w swojej konfiguracji flume dla Nazw Właściwości
    - Wartości Nie Wymagają Zastąpienia
    - Przykład
      - kafka_consumer_group_id: testflume
    - Rezultat
      - agent.source.kafka.consumer.group.id = testflume
- Można przekazać zmienną apache_flume_config, aby skopiować konfigurację
  - Przykład
    - apache_flume_config: file/flume-conf.properties
  - Rezultat
    - To skopiuje flume-conf.properties z twojego katalogu plików na maszyny docelowe
Dodatkowe zmienne
- Biblioteki natywne HDFS
  - hdfs_libs = true
    - To pobierze HDFS Native Libs i umieści je w plugin.d/hdfs/native/

Przykładowe zmienne

mirror_url: http://apache.mirrors.ionfish.org/flume
version: 1.7.0
download_path: /tmp
installation_path: /usr/local
owner: root
group: root

java_heap_xms: 125
java_heap_xmx: 250
hdfs_libs: true

agenci:
- name: agent
  source:
    name: kafkaSource
    type: org.apache.flume.source.kafka.KafkaSource
    kafka_consumer_group_id: flume
    kafka_consumer_auto_offset_reset: latest
    kafka_consumer_max_partition_fetch_bytes: 1048576
    kafka_consumer_heartbeat_interval_ms: 3000
    kafka_consumer_session_timeout_ms: 30000
    kafka_consumer_request_timeout_ms: 40000
    kafka_consumer_fetch_max_wait_ms: 500
    kafka_bootstrap_servers:
      - 127.0.0.1:9092
      - 0.0.0.0:9092
    kafka_topics:
      - topic1
      - topic2
  channel:
    name: kakfaChannel
    type: memory
    capacity: 1000000
    transactionCapacity: 100000
  sinks:
    - name: kafkaHDFSSink1
      type: hdfs
      hdfs_path: "s3n://GFGJFSHFJHFGFHSBJ:fdjhSFUYGSF65678+-saigfew123@hdfs/%{topic}/%y/%m/%d/%H"
      hdfs_filePrefix: FlumeData
      hdfs_inUseSuffix: .tmp
      hdfs_rollInterval: 30
      hdfs_rollSize: 1024
      hdfs_rollCount: 10
      hdfs_idleTimeout: 0
      hdfs_batchSize: 100
      hdfs_fileType: "SequenceFile"
      hdfs_maxOpenFiles: 5000
      hdfs_callTimeout: 10000
      hdfs_threadsPoolSize: 10
      hdfs_rollTimerPoolSize: 1
      hdfs_round: false
      hdfs_roundValue: 1
      hdfs_roundUnit: second
      hdfs_timeZone: Local Time
      hdfs_useLocalTimeStamp: false
      hdfs_closeTries: 0
      hdfs_retryInterval: 180
    - name: kafkaHDFSSink2
      type: hdfs
      hdfs_path: "s3n://GFGJFSHFJHFGFHSBJ:fdjhSFUYGSF65678+-saigfew123@hdfs/%{topic}/%y/%m/%d/%H"
      hdfs_filePrefix: FlumeData
      hdfs_inUseSuffix: .tmp
      hdfs_rollInterval: 30
      hdfs_rollSize: 1024
      hdfs_rollCount: 10
      hdfs_idleTimeout: 0
      hdfs_batchSize: 100
      hdfs_fileType: "SequenceFile"
      hdfs_maxOpenFiles: 5000
      hdfs_callTimeout: 10000
      hdfs_threadsPoolSize: 10
      hdfs_rollTimerPoolSize: 1
      hdfs_round: false
      hdfs_roundValue: 1
      hdfs_roundUnit: second
      hdfs_timeZone: Local Time
      hdfs_useLocalTimeStamp: false
      hdfs_closeTries: 0
      hdfs_retryInterval: 180
  sink_group:
    name: sinkgroup1
    processor_type: load_balance
    processor_backoff: false
    processor_selector: round_robin

Zależności

andrewrothstein.java-oracle-jre

Przykładowy Playbook

- hosts: all
  roles:
    - role: mplachter.flume

Licencja

MIT

Informacje o autorze

Matthew Plachter

O projekcie

Ansible role to install and configure Apache Flume

role apache flume

Zainstaluj

ansible-galaxy install mplachter.flume

GitHub repozytorium

3 gwiazdki

1 forki

0 otwarte zgłoszenia

Licencja

mit

Pobrania

523

Właściciel

Matthew Plachter

Let's Do Stuff & Things.