夏彦刚:视频CDN系统建设关键要点.pdf_第1页
夏彦刚:视频CDN系统建设关键要点.pdf_第2页
夏彦刚:视频CDN系统建设关键要点.pdf_第3页
夏彦刚:视频CDN系统建设关键要点.pdf_第4页
夏彦刚:视频CDN系统建设关键要点.pdf_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 视频视频视频视频cdncdncdncdn系统建设关键要点系统建设关键要点系统建设关键要点系统建设关键要点 夏彦刚 乐视网-cdn技术专家 2013年7月 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 摘要 1、硬件商务预算 2、文件分发系统 3、智能调度系统 4、web服务器 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 图片cdn /视频cdn 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 视频cdn系统建设关键要点 a)a) a) a)案例简述案例简述: 网络视频是如今十分主流的应用,视频播放的流畅度和稳定性尤为重要。 cdn系统在提升用户体验方面起着十分重要的作用,本案例主要是剖析视频cdn 系统建设的主要要点:cdn系统的服务器带宽采购、文件分发、调度系统、web 服务器等内容 b) 设计目标设计目标: 自建一套稳定高可用、效果出色、易于管理和维护的视频cdn系统,提升用 户的视频播放体验,提升公司的行业知名度和竞争力 c) c) c) c)自建自建cdncdncdncdn的优点的优点: 免受市场价格波动的困扰,有利于成本降低,且可控性较高 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 行业分析 cdn服务商代表企业 优势劣势 专业cdn服务商蓝汛、 帝联等 进入市场较早,具有成 熟的运营和服务能力 受制于运营商带宽费用制约 提供cdn服务的 idc运营商 网宿科技、 世纪互联等 拥有带宽资源优势需要添置大量的服务器、网络 设备资源,成本高 电信运营商中国电信、 中国联通 拥有巨大的带宽和网络 优势 资本实力雄厚 品牌优势 跨网络运营的问题难解决 不是主营业务,运营经验和服 务能力不强 自建cdn的互联 网企业 优酷土豆、 乐视网、 奇艺网等 节约成本,可控性较高投资大,成本高 非核心业务,需要专业团队运 营 国外cdn服务商akamai、 limelight networks等 资金雄厚,技术运营和 服务能力强 存在安全隐患 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 怎么做到的 主讲内容: (1)商务预算 (2)文件分发 (3)调度系统 (4)web服务器 内容生成 内容管理 内容存储 内容分发 内容路由 内容服务 终端访问(视频播放) 调度系统 cache节点(普通节点) 文件源(存储节点) 媒资管理系统 上传转码系统 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 1.1 商务预算之带宽 系统容量:满足系统容量:满足100100100100万人同时在线播放视频万人同时在线播放视频 带带宽需求宽需求 a.标清:350kbps*100,0000=350gbps b.高清:800kbps*100,0000=800gbps 实际带宽实际带宽 a.未来业务发展可能会需要更多带宽 b.需要20%30%冗余带宽备用,应对突发流量 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 1.2 商务预算之服务器 服务器数量服务器数量 a.100,0000/100=10000 100台*并发连接10000 b.100,0000/1000=1000 1000台*并发连接1000 服务器性能分析服务器性能分析 a方案:硬件要求过高,成本过高 b方案:普通服务器可支持,单机1000连接,1g带宽 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 1.3 商务预算之idc部署 qq用户实时在线分布图/online/index.shtml 部署原则:部署原则: 1.用户分布密度 2.公司区域战略 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2 文件分发系统要点 分发模式比较:push/pull cdn节点分类 分层分发策略 分发网络模型构建 下载速度提升方案 文件一致性保障 分发状态记录 源文件上传转码分发到存储节点生成播放页全网分发放出页面 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2.1 分发模式比较 序号功能点push模式(推)pull模式(拉) 1应用示例土豆网、酷6网等图片cdn系统 2分发特点智能分发、 主动分发、 提前预发布 被动分发、 按需分发、 最适合小文件 3驱动方分发管理中心系统用户请求miss时 4下载器agent/web服务器web服务器 5节点文件量节点只保存部分文件每个节点均为全量节点 6文件管理需要上报分发状态一般不需要状态 7分发协议http/udp,多线程,p2p(http)proxy取源 8完整性分片校验、整体校验不校验 我们的策略:push+pull,两种方式相结合,push为主pull为辅 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 中心节点 区域中心节 点 边缘节点 边缘节点 区域中心节 点 边缘节点 边缘节点 边缘节点 中心节点 区域中心节 点 边缘节点 边缘节点 区域中心节 点 边缘节点 2.2 cdn节点分类 (1)中心节点 存储节点,磁盘空间足够,方便扩容 分发的中心节点,最终源节点 服务区域中心节点未命中的请求 (2)区域中心节点 非全量文件,主要的分发源 服务边缘节点未命中的请求 具有较强的抗压能力,支持高并发访问 带宽充足,有ssd磁盘更好(高io能力) (3)边缘节点 就近部署,离用户最近;服务80%以上用户 磁盘空间有限,仅存储热点内容 (4)第三方备用节点 网宿、蓝汛、快网、帝联 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 一级 中心节点 至少两份 二级 区域中心节点 最近节点 优先节点 三级 边缘节点 每节点只分发一份 四级 节点内分发 热点节点内多份 2.3 分层分发策略(按节点) 按层次生成分发任务: 取源节点选择: 根据各个idc机房之间的网络选择 依据smokeping数据构建分发网络 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2.3 分层分发策略(按热度) 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2.4 分发网络模型构建(smokeping) smokepingsmokepingsmokepingsmokeping特点特点: opensource(http:/oss.oetiker.ch/smokeping/) 多种探测方式,包括fping、echoping、dig、curl等 易用可扩展的插件 master/slave的工作方式 有特色的alert设置 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2.4 分发网络模型构建(smokeping) 源节点目标节点延时ms丢包率探测时间 50018200.2399470.00%2012-7-12 16:11 500112214.790570.00%2012-7-12 16:11 500182633.168910.00%2012-7-12 16:11 500119126.64130.00%2012-5-21 16:11 500115119.989098.80%2012-7-12 16:11 5001176205.13069.72%2012-7-12 16:11 5001731286.821510.19%2012-7-12 16:11 50013631.0844316.20%2012-5-21 16:11 500112429.9934230.99%2012-5-23 16:11 500111157.722843.49%2012-5-30 16:11 500115482.4032256.94%2012-7-12 16:11 500117114.654973.61%2012-7-12 16:11 500116310000100.00%2012-7-12 16:11 500118010000100.00%2012-7-12 16:11 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2.5 下载速度提升方案 1.多协议下载,如:udp/http(s)/ftp/bittorrent/metalink 2.多源分片下载,如:p2p/p2sp 3.下载工具推荐:wget/curl/aria2 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2.6 文件一致性保障 注意事项注意事项: a.必须进行完整性校验,如size/md5校验 b.文件要及时回写磁盘,防止机器断电文件损坏 c.定时进行对帐,校验文件的完整性,防止后期文件被篡改 d.cdn节点过多,文件份数较多,修改文件容易导致不一致,建 议重命名文件 e.记录已分发过的文件信息 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 2.7 文件状态记录 记录目的记录目的: (1)文件分发系统:需要知道哪些节点/服务器存在文件,从而 决定文件如何在cdn节点之间复制;磁盘满时删除哪些文件 (2)cdn调度系统:可依据此信息进行“精准调度”,如只调度 用户到存在文件的节点 记录方式:记录方式: (1)实时上报:文件下载完成后/删除前上报状态 (2)全量上报:扫描所有磁盘文件上报到中心系统 (3)内存数据库:如memcache/membase/redis 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3 智能调度系统 gslbgslbgslbgslb定义定义: 全局负载均衡系统(global server of load balance),将用户的 请求重新引导到离用户最近的节点,即内容路由系统 系统要点系统要点: 服务器数据采集 ip库收集与完善 访问节点列表生成 节点压力平衡方案 业务层qos保障 防盗链方案 服务部署方案 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.1 服务器数据采集 (1 1 1 1)存活状态信息)存活状态信息 a.中心主动探测:如中心请求服务器的80端口,探测是否响应 b.服务器主动上报:通过udp方式上报心跳 (2 2 2 2)压力数据)压力数据 a.带宽(本机/交换机) b.连接数 c.磁盘io d.其他:load/cpu等 (3)(3)(3)(3)服务监控数据服务监控数据 a.开源软件:cacti/nagios/zabbix b.监控告警 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.2 ip库收集与完善 (1 1 1 1)自建)自建ip ip ip ip库管理系统库管理系统 a.ip导入:多格式支持,单ip导入,批量导入 b.ip管理:ip冲突解决方案,ip库日常变更维护 c.ip输出:多格式支持,如xml,接口,mysql表 (2 2 2 2)推荐)推荐ip ip ip ip库库 ip138:/ geoip: qq纯真ip库 腾讯ip地址查询接口 /ipaddress 新浪ip地址查询接口 /iplookup/iplookup.php?format=js 搜狐ip地址查询接口 /cityjson 谷歌ip地址查询接口 /app/geoip.js 淘宝ip地址查询接口 /service/getipinfo.php?ip=ip地址字串 乐视ip地址查询接口 /recommend?format=2 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.3 访问节点列表生成 “线性规划线性规划”算法算法 解决问题:如何分配资源,使全局质量最优;开源项目开源项目glpkglpkglpkglpk 问问题模型:题模型: 城市a b c 分别有用户 500 300 100 人 服务cdn节点 l m n 为他们提供服务 三个服务商的容量为 200 300 400 服务节点为三地提供服务的质量分别为 a l 90 m 80 n 70 b l 80 m 70 n 90 c l 70 m 80 n 90 求解:城市分别向各地分流多少人,才能使得服务质量最好 条件:条件: a.资源:节点的容量能力:物理带宽/连接数 b.用户:每个地区的用户量,根据历史数据预判 c.质量表:每个地区的用户到每个节点的质量数据(历史) 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.3 访问节点列表生成 用户访问节点列表生成,内容路由表示例: 国家码 省id 地区id 运营商 服务节点列表普通节点 cn1192706,706,706,705,700,730 cn1222706,705,705,705,705,720,711 cn151807,820,810,812,841 cn187168,102,105,104,103 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.4 节点压力平衡方案 (1 1 1 1)节点之间压力平衡)节点之间压力平衡 a.节点分级调度 b.节点容量放大 普通节点、区 域中心节点 存储节点第三方节点 普通节点、区域中心 节点 存储节点 第三方节 点 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.4 节点压力平衡方案 (2 2 2 2)节点内部压力平衡)节点内部压力平衡 节节点内部调度算法点内部调度算法 热点文件:轮询调度,平衡压力 其他文件: hash算法,节省磁盘空间 文文件分发策略件分发策略 冷文件:很少访问,仅存储节点存储(长尾) 普通文件:每节点存一份 热点文件:每服务器都存储,如甄嬛传 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 级别请求数(滑动窗口)分布比例是否丢弃 110012%- 212014%- 315018%- 414016%- 500%- 613015%- 710012%drop 8405%drop 9202%drop 10506%drop 3.5 业务层qos保障 (1 1 1 1)业务分级)业务分级 免费与付费 终端类型:手机/盒子/tv/pc 产品:广告/直播/站外 码率:高清/标清 频道 (2 2 2 2)用户分级)用户分级 国内用户/国外用户 北上广深/重点用户 直辖市/省会城市用户 其他地区用户 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.6 防盗链方案 (1 1 1 1)基于网站来源)基于网站来源 根据referer/user-agent/host头信息,设置黑白名单 缺陷:此类信息经常变化、增加,会导致误杀用户 (2 2 2 2)基于)基于cookiecookiecookiecookie的防盗链的防盗链 缺陷:部分浏览器不支持cookie写入操作,安全限制不允许操作 (3 3 3 3)基于)基于urlurlurlurl和时间和时间md5md5md5md5变化变化 原理:将url里面的关键字段md5加密,同时加上url过期时间限制。 访问服务器时进行验证。可防止url过期后使用,url篡改等盗链 url示例: /video.mp4?videoid=1487447 &time=1351565894&md5key=977722fec1785025c04a3d39de509604 md5key=md5(user-agent,filename,videoid,time,privatekey) 揭示研发管理白金定律,分享那些激动人心的创新与变革,使得团队获得过多源动力与更大的推动力! 3.7 服务部署方案 gslb是全局调度,需要解决单点故障。通过dns+lvs实现: 揭示研发管理白

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论