芒果TV ELK日志系统实践 -刘波涛_第1页
芒果TV ELK日志系统实践 -刘波涛_第2页
芒果TV ELK日志系统实践 -刘波涛_第3页
芒果TV ELK日志系统实践 -刘波涛_第4页
芒果TV ELK日志系统实践 -刘波涛_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、芒果TV ELK日志系统实践关于我关于我刘波涛芒果TV研发工程师日志文件重要性日志文件重要性Linux哲学: 万物皆文件运维哲学: 日志管理是保障高质量服务的基础日志日志架构演变架构演变日志系统架构日志系统架构ELK系统架构系统架构RsyslogNginx: 通过syslog模块转发应用程序: 通过调用syslog函数写入规范统一格式v8版本以上(原生支持Kafka)Rsyslog-Avoid-Block关闭HUPIsRestart配置选项(低版本)监控rsyslog服务,一旦crashes能够马上重启传输方式由TCP改为UDP(恶性循环)Kafka强大消息堆积能力日志领域高度成熟支持Hado

2、op数据并行加载高性能(顺序写单机写入TPS约在百万秒/s)Kafka vs RedisKafka-OptionsPartition Number(数量必须大于消费者数量)Broker Number(配置和内核数相同)work.threadsnum.io.threadsLogstashLogstash性能问题,大量消耗CPU和内存容易僵死自定义JAVA程序替代Logstash(支持kafka,syslog输入,ES输出)启动多个进程进行消费配置Elasticsearch以写为主,读为辅助(随机写 磁盘瓶颈 使用SSD替代传统硬盘)增加Index.refresh_interval 时间(默认为一

3、秒),降低压力设置filedldata: format :doc_value 避免Heap crash减少副本数量(副本数为0)合理使用TCP,UDP索引模式(我们使用Http模式)关闭系统swap内核配置修改对数据聚合聚合进行处理string2int定时删除旧索引(保存2个星期)服务器参数调整服务器参数调整net.ipv4.tcp_fin_timeout = 30net.ipv4.tcp_keepalive_time = 1200net.ipv4.tcp_syncookies = 1net.ipv4.tcp_tw_reuse = 1net.ipv4.tcp_tw_recycle = 1net

4、.ipv4.ip_local_port_range = 1024 65000net.ipv4.tcp_max_syn_baklog = 8192net.ipv4.tcp_max_tw_bukets = 5000TCP参数调整Linux的最大文件数ulimit -SHn 65535磁盘磁盘如果util接近100%则说明产生的I/O请求太多,I/O系统已经满负载磁盘可能存在瓶颈如果idle小于70%,I/O的压力比较大,说明读取进程中有较多的waitiostat vmstat 2 查看b堵塞进程情况vmstat磁盘磁盘# fio -filename=/dev/sda3 -direct=1 -iod

5、epth 1 -thread -rw=randrw -ioengine=psync -bs=1k size=1G -numjobs=10 -runtime=120 -group_reporting -name=mytest检查磁盘性能Elasticsearch自定义分词:尽量不使用标准分词使用ikMapping:压缩_source(compress:true)Mapping:禁用all(include_in_all:false)ES_HEAP_SIZE: -Xms = -Xmx 不超过内存50%index.cache.field.type = softindex.cache.field.max

6、_size:50000index.cache.field.expire:10mindex.fielddata.cache: softElasticsearch SSD优化参数优化参数mmap索引文件格式 (index.store.type: mmapfs)indices.store.throttle.type:noneindices.memory.index_buffer_size: 30%index.translog.flush_threshold_size:5gbindex.translog.flush_threshold_ops: 500000index.gateway.local.sync:30sindex.merge.scheduler.max_thread_count: 3index.merge.scheduler.max_merge_count: 6关闭文件系统ATIME(atimeoff)磁盘RAID0KibanaK3 VS K4原生 VS 自定义可视化监控报警监控报警Nginx 5xx/sMysql 慢日志、错误日志Redis

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论