一、直播的一些质量评估指标
1.延迟(首播时间),即从画面产生到用户看到画面的时间
2.卡顿率,即一定时间内卡顿的用户数/观看用户数的比例(不同厂商定义有所不同)
3.卡顿比,即一定时间内卡顿次数/播放次数(不同厂商定义有所不同)
这些指标很大程度上和前一篇文章讲的CDN网络的质量关系密切。
二、运营监控
1.基础网络监控
包括机房带宽、服务器带宽利用情况;同运营商间跨机房监控(特别是回源路径的监控),要保证丢包率非常低,特别是直播网络要求非常高。可以通过全网同运营商机房间全互ping、http下载等来监控。
注:对于跨运营商间的网络丢包,IDC机房一般是不解决的。
对于静态文件下载来说,CDN网络对网络丢包、延迟要求其实并不是很高,但对于直播来说则是非常严格的。所以,一但出现回源路径丢包时,系统必须能够依据一定的触发条件自动切换到备用的回源线路,当某个机房本身有问题时,要能够自动踢除。而这些根据来源,就是运营平台的监控数据。
另外,用户到边缘节点的网络状况也是很重要的,但对于大部分CDN厂商来说还没有很好的测试方法。普遍做法是通过第三方的基调测试来评估和发现问题(比如之前文章提到过的劫持问题)。
对于网络丢包的具体分析,这里就不多赘述,可以看之前发的文章《互联网链路丢包率分析总结》
2.服务器监控
一般直播的服务器要求不是很高,主要是监控各应用的可用性,以及CPU、内存等资源的使用率。顺便说一下,如果是静态资源下载的CDN,对磁盘IOPS和容量要求肯定是非常高的,都必须是固态硬盘,可以搭建GFS多台服务器互备。但对于直播来说,磁盘要求就低多了,因为数据是不需要缓存在本地的(最多是直播转点播的服务器进行存储,但数据量不大)
3.客户卡顿数据反馈
部分视频网站/直播厂商会监控用户的卡顿数据,并可以通过接口实时反馈给CDN厂商,这些数据可以通过运营平台反馈给调度系统。并作为网络优化的根据之一。
4.告警
分级别进行邮件、微信、短信、电话告警。
当然,实际的运营会复杂得多,这里就不细说了。
原文出自:
http://blog.too2.net/?p=299
转载请注明转自:辛碌力成【http://blog.too2.net】
发表评论