フルームは、データをKafkaにどのように収集するのか。
FlumeからKafkaへデータを収集するには、以下の手順を実行する必要があります。
- Flumeのインストールと設定:
- Flumeのバイナリファイルをダウンロードしてインストールしてください。
- Flumeのエージェントを設定し、ソースとシンクの種類と関連パラメータを指定してください。
- Flumeの設定ファイルで、sinkのタイプをKafkaに設定し、bootstrap.servers、topicなどの関連パラメータを指定します。
- Kafkaのトピックを作成する:
- Flumeが送信したデータを受信するために、Kafkaクラスターで1つ以上のトピックを作成します。
- Flume エージェントを起動する:
- Flumeのエージェントを起動するには、次のコマンドを使用してください:$ bin/flume-ng agent –conf conf –conf-file –name -Dflume.root.logger=INFO,console
- Flumeの設定ファイルを作成する。
- Flumeの設定ファイルを作成して、sourceとsinkの種類と関連パラメーターを指定してください。
- sinkの部分では、タイプをorg.apache.flume.sink.kafka.KafkaSinkに設定し、Kafkaの関連パラメータを指定します。
- 以下は、Flume の設定ファイルの例です。
- エージェントのソースはsource1、チャンネルはchannel1、シンクはsink1です。
エージェントのソースのソース1のタイプはです。
エージェントのソースのソース1のはです。
エージェントのチャネルのチャンネル1のタイプはメモリで、容量は1000、トランザクション容量は100です。
エージェントのシンクのシンク1のタイプはorg.apache.flume.sink.kafka.KafkaSinkで、トピック名は、Kafkaブローカーリストは、必要な確認は1、バッチサイズは20、チャネルはチャネル1です。 - 上記の例では、、、、を実際の値に置き換える必要があります。
- Flumeエージェントを起動してログを監視してください。
- Flumeのエージェントを起動するために手順3のコマンドを使用し、コンソール出力のログ情報を観察してください。
- 一切が正常であれば、Flumeは指定されたソースからデータを収集し、それを指定されたKafkaのトピックに送信します。
上記の手順は基本的な例だけを提供していることに注意してください。実際の状況に合わせて追加の設定や調整が必要かもしれません。