欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 美景 > Elastic Stack 8.16.0 日志收集平台的搭建

Elastic Stack 8.16.0 日志收集平台的搭建

2025/3/15 1:11:54 来源:https://blog.csdn.net/JingAi_jia917/article/details/146200423  浏览:    关键词:Elastic Stack 8.16.0 日志收集平台的搭建

简介

1.1 ELK 介绍

ELK 是 ‌Elasticsearch‌、‌Logstash‌、‌Kibana‌ 三款开源工具的首字母缩写,构成了一套完整的日志管理解决方案,主要用于日志的采集、存储、分析与可视化‌。

1)Logstash:数据管道工具,负责从多种来源(如文件、数据库、消息队列)采集日志,进行过滤、格式化后输出到目标(如 Elasticsearch)‌;

2)Elasticsearch:分布式实时搜索与分析引擎,基于 Lucene 构建,负责存储和检索数据。支持全文检索、结构化查询和大规模数据的高效处理‌;

3)Kibana:数据可视化平台,提供交互式图表、仪表盘和地图,提供 ‌Dev Tools‌ 直接操作 Elasticsearch 中的数据并生成可视化报告‌;

1.2 Elastic Stack 介绍

Logstash 是基于 JVM 运行,默认堆内存 1GB,资源消耗较高,单节点处理能力受限于 CPU 和内存‌ ,尤其在大规模日志场景下性能瓶颈明显‌ 。Elastic公司推出‌Beats家族‌,旨在提供轻量级、专一化的数据采集工具。Filebeat作为其中一员,专攻‌日志文件采集‌,解决了Logstash Forwarder(旧版采集器)的功能局限和性能问题‌。

Filebeat采用Go语言开发,具有低资源占用(CPU/内存消耗可忽略不计)、易部署等特点,尤其适合边缘节点和资源受限环境‌。

随着 Beats 等新成员的加入,原有名称无法涵盖全部组件。为统一品牌和技术生态,Elastic 公司将 ELK 更名为 ‌Elastic Stack‌,强调其能力的全面性(如支持日志、指标、安全监控等)。

1.3 高并发高可用架构(分布式)

在高并发的架构中,ELK可以结合Kafka作为中间件,用于解耦数据生产者和消费者,处理突发的数据流量,避免Logstash或Elasticsearch过载。

1)Beats‌(Filebeat/Metricbeat)直接采集数据并发送至 Kafka 主题,避免数据直接冲击下游组件‌;

2)Logstash‌ 从 Kafka 消费数据,进行过滤、富化等操作后批量写入 Elasticsearch‌;

准备工作

1)准备一台服务器,系统为CentOS8;

2)安装Docker及docker-compose;

注:在安装 Elasticsearch、Kibana、Logstash,需安装相同版本号的版本。Filebeat 和 ELK 的大版本也要保持一致。

Elasticsearch 安装

3.1 elasticsearch.yml 配置

a)创建elasticsearch用户

useradd elasticsearch

可通过 cat /etc/passwd 查看当前系统的用户信息。

b)在home目录中,创建elasticsearch目录,并授权给elasticsearch用户

mkdir elasticsearch

chown -R elasticsearch:elasticsearch /home/elasticsearch

c)在elasticsearch目录中,创建data、logs、conf目录

d)在conf目录中,创建elasticsearch.yml文件。文件的配置信息如下:

# 集群名称
cluster.name: es-cluster
network.host: 0.0.0.0
# 支持跨域访问
http.cors.enabled: true
http.cors.allow-origin: "*"
# 关闭安全认证
xpack.security.enabled: false

3.2 elk_elasticsearch-compose.yml 配置

编写 elk_elasticsearch-compose.yml,内容如下:

version: "3"
services:elasticsearch:container_name: elasticsearchhostname: elasticsearchimage: elasticsearch:8.16.0user: "elasticsearch:elasticsearch"ports:- 9200:9200volumes:- /home/elasticsearch/conf/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml- /home/elasticsearch/data:/usr/share/elasticsearch/data- /home/elasticsearch/logs:/usr/share/elasticsearch/logsenvironment:- "discovery.type=single-node"  # 设置elasticsearch为单节点- "TAKE_FILE_OWNERSHIP=true"   # 在容器启动时,自动将宿主机中挂载的卷的文件操作权限赋给容器的用户(默认为UID 1000)。- "ES_JAVA_OPTS=-Xms216m -Xmx512m"- "TZ=Asia/Shanghai"

1)user: "elasticsearch:elasticsearch"

elasticsearch容器的用户为elasticsearch

2)- "TAKE_FILE_OWNERSHIP=true"

在容器启动时,自动将宿主机中挂载的卷的文件操作权限赋给容器的用户(默认为UID 1000)。

生产环境慎用:自动修改目录权限可能存在安全风险,建议预配置权限

3.3 执行安装

进入elk_elasticsearch_compose.yml 目录,执行如下:

docker-compse -f elk_elasticsearch_compose.yml up -d

3.4 docker 常用命令

1)查看容器id

docker ps

2)查看容器实时日志

docker logs -f 容器id

3)将日志实时追加到日志文件中

docker logs -f 容器id  >> test.log 2>&1

4)进入容器

docker exec -it 容器id bash

Logstash 安装

4.1 logstash.yml 配置

在home目录中,创建logstash/conf目录,创建logstash.yml文件,文件的配置信息如下:

# 通过filebeat数据输入,端口为5044
input {beats {port => 5044}
}# 数据处理
filter {grok {   # Grok结构化文本解析,解析日志信息match => [    "message", "(?<logTime>\d{4}-\d{2}-\d{2}\s\d{2}:\d{2}:\d{2}.\d{3})\s+\[(?<thread>.*)\]\s+(?<level>\w*)\s{1,2}+(?<class>\S*)\s+-\s+(?<content>.*)\s*"] }date {    # 时间处理match => ["timestamp_string", "ISO8601"]}mutate {   # 字段操作remove_field => [message, timestamp_string]}   
}# 数据输出
output {        elasticsearch {   # 输出到elasticsearchhosts =>  ["http://192.168.199.210:9200"]index => "logstash-test"}stdout {   # 输出到控制器,用于调试codec => rubydebug}
}

1)logstash配置分为三部分,分别为

input {   ...    }       # 数据输入

filter {    ...    }       # 数据处理

output {   ...    }     # 数据输出

2)grok的match

a)logstash接收到内容会放到message字段中,通过正则表达式匹配message中的信息;

b)可配置多个解析规则,当任意一个 message 匹配上了这个正则,则 grok 执行完毕;

c)如果配置了多个规则,grok依然没有匹配上,message 也会输出到 ES,只是这条日志在 ES 中不会展示 logTime、level 等字段;

grok的正则表达式编写比较麻烦,可通过 kibana 进行调试

http://IP:5601/app/dev_tools#/grokdebugger

如上面的日志信息,通过解析后,会解析出level、thread、class、content 和 logTime

4.2 elk_logstash_compose.yml 配置

elk_logstash_compose.yml 的内容如下:

version: "3"
services:logstash:container_name: logstashhostname: logstashimage: logstash:8.16.0command: logstash -f ./conf/logstash.confvolumes:- /home/logstash/conf/logstash.conf:/usr/share/logstash/conf/logstash.confenvironment:- elasticsearch.hosts=http://192.168.199.210:9200- xpack.monitoring.elasticsearch.hosts=http://192.168.199.210:9200   # 解决logstash监控连接报错- "TZ=Asia/Shanghai"- "LS_JAVA_OPTS=-Xms216m -Xmx512m"ports:- 5044:5044

同3.3,执行 elk_logstash_compose.yml 进行安装

Filebeat 安装

5.1 filebeat.yml 配置

在home目录中,创建filebeat目录,创建conf、data 和 logs 文件夹。在conf中,创建logstash.yml文件,文件的配置信息如下:

filebeat.inputs:
- type: filestreamenabled: truepaths:- /home/app/*.log# 多行日志合并(处理Java异常堆栈)multiline:pattern: '^\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}\.\d{3}'negate: falsematch: after
# 使用processors 提取字段
processors:# 第一步:使用 dissect 分解原始日志行- dissect:tokenizer: '%{timestamp} [%{thread}] %{level} %{logger} - %{message}'field: "message"  # 原始日志字段(默认存储为 message)target_prefix: ""   # 直接提取到根字段(非嵌套)# 第二步:解析时间戳(覆盖默认@timestamp)- timestamp:field: timestamp   # 从 dissect 提取的timestamp字段layouts:- '2006-01-02 15:04:05.000'   # Go 时间格式(必须与日志中的时间格式完全匹配)test:- '2025-03-07 10:12:23.123'   # 测试用例(可选)第三步:删除临时字段- drop_fields:fields: ["timestamp", "log.offset", "input.type"]  # 清理无用字段
# 输出到 Elasticsearch
output.elasticsearch:hosts: ["http://192.168.199.210:9200"]index: "filebeat-%{+yyyy.MM.dd}"
# 输出到控制台(测试时可查看结果)
output.console:pretty: truecodec.json:pretty: true  

在测试的时候,可以通过output.console,将信息输出到控制台。

5.2 elk_filebeat_compose.yml 配置

elk_filebeat_compose.yml 的内容如下:

version: "3"
services:filebeat:container_name: filebeathostname: filebeatimage: elastic/filebeat:8.16.4user: rootvolumes:# 映射到容器中【作为数据源】- /var/lib/docker/containers:/var/lib/docker/containers- /home/app:/home/app# 方便查看数据及日志- /home/filebeat/logs:/usr/share/filebeat/logs- /home/filebeat/data:/usr/share/filebeat/data- /home/filebeat/conf/filebeat.yml:/usr/share/filebeat/filebeat.yml

1)user: root

Filebeat 需要访问宿主机的文件,需要有 root 的权限

2)- /home/app:/home/app

注:在 filebeat.yml 中配置了文件的 paths 为 /home/app 下的文件,此处需要将 /home/app3 和容器进行映射,否则 filebeat 将访问不到日志文件

同3.3,执行 elk_logstash_compose.yml 进行安装

Kibana 安装

6.1 kibana.yml 配置

在home目录中,创建kibana/conf目录,创建kibana.yml文件,文件的配置信息如下:

# 服务端口
server.port: 5601
# 服务IP
server.host: "0.0.0.0"
# ES
elasticsearch.hosts: ["http://192.168.199.210:9200"]
# 汉化
i18n.locale: "zh-CN"

6.2 elk_kibana_compose.yml 配置

elk_kibana_compose.yml 的配置如下:

version: "3"
services:kibana:container_name: kibanahostname: kibanaimage: kibana:8.16.0ports:- 5601:5601volumes:- /home/kibana/conf/kibana.yml:/usr/share/kibana/config/kibana.ymlenvironment:- elasticsearch.hosts=http://192.168.199.210:9200- "TZ=Asia/Shanghai"- XPACK_SECURITY_ENABLED=false       # 关闭安全模块(非必要功能)- ELASTICSEARCH_ASSISTANT_ENABLED=false  # 禁用 Elastic Assistant 插件:ml-citation{ref="3,4" data="citationList"}

Kibana安装时,需关闭安全模块(非必要功能)和禁用Elastic Assistant 插件

注:不同版本的 ELK 可能会存在不同的问题

测试示例

容器都安装成功后,在 /home/app 中添加日志文件,测试的日志信息如下:

2025-03-04 01:34:24.143 [http-nio-8094-exec-7] INFO  c.q.s.s.i.SessionUserInterceptor - session user check ... false
2025-03-04 01:35:13.984 [nioEventLoopGroup-5-7] INFO  c.q.e.addsub.netty.WebSocketHandler - handlerRemove 调用fa163efffe9f832c-000079e3-00000973-55cbd5b44071a452-2c89d78a

结尾

以上为本篇分析的全部内容。

关于本篇内容你有什么自己的想法或独到见解,欢迎在评论区一起交流探讨下吧。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词