我目前正在研究在我的网站上使用 CDN 的可行性(每月约 200 万页面浏览量)。然而,在查看大量可用软件包之前,最好先弄清楚我到底需要什么,而不是盲目地估计。
那么,是否有人知道任何实用程序可以从我的 Web 服务器(Apache)日志(或其他地方)中提取对特定资源(即 *.css、*.js、*.gif 等等)的请求量等。
有了这些信息,我就会知道 CDN 每秒需要支持多少个请求,更重要的是,我需要多少带宽——由此我应该能够根据我的需求选择正确的 CDN 包。
提前致谢
答案1
冒着完全 UNIX 化的风险,
egrep '\.css|\.gif|\.js' httpd.access | awk '{print $10}'| perl -n -e '$sum += $_ ; print "$sum\n" ;'| tail -1
将把 .css、.gif 和 .js 请求中传递的所有字节加起来,并打印总数。如果这对你不起作用,请尝试
egrep '\.css|\.gif|\.js' httpd.access | head
确保只打印相关的行,然后
egrep '\.css|\.gif|\.js' httpd.access | awk '{print $10}' | head
确保它只打印相关行的字节数(应该是 HTTP 返回代码后的字段),因为与大多数 UNIX 文本黑客一样,这在很大程度上取决于我们正在操作的文件的格式。一旦您有了字节数,带宽就是字节数除以 中第一行和最后一行之间的时间httpd.access
。