CCDF的解释及其在网络科研中的应用


CCDF(Complementary Cumulative Distribution Function,互补累积分布函数)是一种用来描述数据分布的统计工具。我们可以用一个很通俗的方式来理解它:

先从“累积分布”说起

想象你有一堆数据(比如上面图中可能记录的是不同网络下的延迟、帧率等),如果你想看看 “有多少比例的数据 小于等于 某个值”,这时候画出来的曲线就叫「累积分布函数(CDF)」。

举个例子:假设你测了一批手机的电量,CDF 就能告诉你 “电量 ≤ 20% 的手机占多少比例”“电量 ≤ 50% 的手机占多少比例” 等等。

再看“互补”是什么意思

CCDF 则是 CDF 的“反面” :它关注的是 “有多少比例的数据 大于等于 某个值”。

还是拿刚才的手机电量举例:CCDF 就会回答 “电量 ≥ 20% 的手机占多少比例”“电量 ≥ 50% 的手机占多少比例”……

换句话说,CCDF = 1 - CDF。

结合图来理解

image-20250911104014312

看你贴的这三张图,横轴分别是 RTT(往返时延)、帧延迟、帧率,纵轴是 CCDF(对数坐标)。每一条线代表一种网络(WiFi、4G、有线网)。

  • 当你沿着某条线往左上方看时,比如看 “有线网” 那条黄线在 RTT=0.2s 处的 CCDF 值很高(接近 10⁰,也就是 1),这就表示:在有线网测试里,有大约 100% 的情况下,RTT 都 ≥ 0.2s(当然实际场景里 RTT 不会这么固定,这里只是举例子理解概念)。
  • 再看 WiFi(红方块线),同样在 RTT=0.2s 左右,它的 CCDF 明显比有线网低——意味着 “WiFi 下 RTT ≥ 0.2s 的情况占比更少”,或者说 “WiFi 下 RTT 更容易出现比 0.2s 小的情况”。

总结一下 CCDF 的作用

它最方便的地方,是能让你一眼看出 “极端情况出现的比例” 有多大。比如你想知道 “延迟特别大(比如 RTT 超过 1s)的情况占比多少”,看 CCDF 在 RTT=1s 处的数值,就能知道有多少比例的数据满足 “≥1s”。

所以在这三张图里,你可以对比 WiFi、4G、有线网在不同指标(延迟、帧率)下,“表现差(数值大)” 的情况占比有多高——从而判断哪种网络在延迟、帧率稳定性上更优~


文章作者: zheyuanzhang
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 zheyuanzhang !
评论
  目录