小工具分享:不被数据表面迷惑,洞察真实负载!

戴尔易安信解决方案 2018-04-25

戴尔易安信解决方案

微信号 DellEMC_Enterprise
功能介绍 戴尔易安信解决方案专注于数字化转型中的前沿技术和解决方案,内容涵盖现代化基础架构、云计算、大数据、物联网及AI等,并通过对全球,特别是中国用户的成功实践案例分析和前沿技术解读,助力企业数字化转型,快人一步!



点击“戴尔企业级解决方案”快速订阅

 

“大吉大利,晚上吃鸡!”

最近,《绝地求生》游戏风靡网络,

很多朋友为了能“晚上吃鸡”,

不分昼夜,废寝忘食,

但往往奋战到天亮也吃不到“鸡”。

如果是运气不佳、水平太low也能理解,

但若是由于电脑太卡,那就着实太让人恼火了。

申斯基就有这样一个朋友,痴迷“吃鸡”,但从没享受过“吃鸡”的快感。一次恰好去他家里,看到卡顿得像播放幻灯片一样的游戏画面,申斯基总算知道了朋友为何一直吃不到“鸡”。


朋友也很苦恼,这台电脑并不算旧,配置肯定超过了《绝地求生》的最低要求,但堪称“脑盲”的他一直不知道问题出在哪里。一番检查之后,发现朋友电脑塞满了流氓软件,数个可疑进程占据了大量的CPU资源,我只好告诉他,杀杀毒,重装下系统再试试吧…


——相信很多朋友都遇到过电脑越用越慢、应用卡顿等情况,很多时候其实不必过于纠结问题到底出在哪,通过重装系统“大法”一般都能解决。


但如果企业的IT基础架构出现了反应迟钝、性能下降等问题,重装系统“大法”可就万万行不通了,那么,IT管理员如何才能快速的找到系统中的“症结”所在?



DPACK,给管理员一双“慧眼”


很多时候,企业IT管理员们都会发出类似的感慨:

为什么测试时有几十万的IOPS,实际跑数据库为什么非常慢?为什么买了最高端的存储,带宽却只有不到十MB?刚刚升级了存储,为什么应用还是响应缓慢?


这些难以确定的问题着实会让IT管理员们感到恼火,如若没有多年的运维管理经验,或是对系统运行状况有着全局性的了解,很难一下子定位到系统瓶颈。


那么,有没有一种方法,让IT管理员能够一目了然的洞悉IT环境?


答案是肯定的!戴尔提供了一款免费的小工具——性能分析和收集工具包DPACK (Dell Performance Analysis Collection Kit),其目标就是让管理员能够对IT系统了如指掌!


DPACK主要具有以下这些能力:

收集分析主机端性能信息

帮助用户理解工作负载的性能,也可协助进行存储解决方案的规划和选型

收集所需的数据并生成专业报告(涵盖多种不同语言)

帮助客户更好了解自己的环境,做出明智的业务决策


简而言之,DPACK有着三大绝招:收集、分析、生成报告。


先看收集功能。DPACK虽然是一个免费的小工具,并且无需代理服务器,但它在收集系统信息方面的能力却非常强悍,远远超出很多传统信息收集工具。


如下表,传统工具往往只能收集系统的I/O数、吞吐量等少量信息,对操作系统支持也不完善;DPACK却能收集CPU、内存、I/O、磁盘队列长度、容量等多个指标,并且支持Windows、Linux、Unix、VMware甚至Solaris操作系统。



再看分析功能。光收集出一堆数据让管理员自行去分析?No,要从一大堆枯燥的数据中看出系统问题,不但是一件非常耗费时间的事情,也十分考验管理员的经验。DPACK的另一个绝活是能够从“全局”角度去分析系统的负载情况,从而让管理员能够洞悉系统的真实负载,而不被数据表面所迷惑。


举个例子,比如某企业的存储系统同时运行着SQL Server、Exchange、FileServer、WebServer等多个负载,很多传统工具在收集和分析存储需求的时候都是独立收集和独立分析,然后进行简单叠加,这样的话其实并不能真实反映存储的真实负载。


传统工具一般都是将负载简单叠加,

但这并不能反应真实的负载情况


DPACK则能够进行全局的、宏观的负载分析。例如,SQL Server、Exchange、FileServer、WebServer这些应用的负载峰谷不一定会出现在同一个时间点,如果仅仅将负载简单叠加,并不能反映出存储负载的真实情况。


如果将负载简单叠加,表面上所看到的IOPS总需求是305+250+157+200=912,但是事实上,从全局角度来看,这些应用的IOPS汇总后只需要535,峰值出现在11:03


再看生成报告。DPACK使用起来很简单,只需三步:登录DPACK支持网站、远程或本地收集信息、用户生成*.iokit文件邮寄给戴尔工程师来创建报告。DPACK2.0则进一步简化了生成报告的操作,用户可以直接将收集的日志数据同步上传到DPACK网站,请求Dell销售人员代为生成报告,之后可以在线查看报告。


DPACK能生成两种报告,一种报告汇总了各个不同服务器的资源需求,如果这些工作负载已整合成共享资源,则还会对它们进行模拟;另一种报告是关于各个服务器的深入报告,供IT管理员搜寻需要通过新设计来改进的潜在瓶颈或热点问题。


通过可视化的报告,IT管理员能够很轻易的发现IT系统中的瓶颈和症结。例如,DPACK能够显示单台服务器的CPU和内存的峰值/最低值、队列深度、延迟、平均IO、总容量、可用/已用容量、读写比例等信息,通过这些参数能够很清晰的看到服务器是否过载、资源是否充分利用、读写是否均衡等。



例如,如果服务器偶尔出现延迟高峰,一般没有太大问题,也很难避免;但是如果出现持续的延迟高峰,可能表示服务器方案设计的性能未达到要求。再如,持续的高队列深度可能表明系统已“受到磁盘的制约”或者已经在超负荷工作,存储系统的能力规模过小。


DPACK就像一双“慧眼”,指出症结,帮助管理员及时弥补瓶颈,让系统一直维持在健康的运行状态。



DPACK,帮领导省钱“精打细算”


除了能够帮助管理员找到系统瓶颈和症结,DPACK另一个强大的能力是让企业IT部门具有全局观,对IT基础架构的下一步扩容、上云做出更明智的决策,也能避免过度投资,导致资源浪费。


一个真实的例子

某企业建设了VDI环境,支撑超过二百个用户。该企业对于成本敏感,故而全部采用了10K SAS硬盘,理论上足以满足所需的IOPS。结果是,客户忽略了群起风暴,导致早上上班时段只能分批启动虚拟桌面,每批次耗时40分钟,总计两小时启动时间。


该用户的问题在于对于即将到来的存储负载情况没有进行很好地预估,没有真正摸清自己的系统状况,导致理论和现实之间出现了巨大的差异。


DPACK能够很好地帮助企业避免这种情况。它不仅能对单个服务器进行信息收集、分析和生成报告,还能对所有服务器在信息收集期间的运行数据进行汇总,以高度精确的方式模拟复合工作负载将在虚拟环境上呈现的总运行状况,生成报告摘要,其中包含了总吞吐量、总IOPS、总读/写比率、总容量等信息——这个信息非常关键,能够帮助企业更加明智的做出存储规划决策。


例如,MB/s指的是每秒传输的数据量,该数据与传输大小和 IOPS 数相关;业界公认的公式是IOPS x 传输大小(字节数)= 每秒字节数(答案通常转换为 MB/s)。如果MB/s 这个指标没有得到正确的了解,经常会导致过度投资,而正确利用这一指标,企业就可以更加精准的规划连接存储系统所需的带宽大小。

所以,通过DPACK,企业IT部门可以“精打细算”,既满足业务的需要,又能实现更好的成本效益。


对于DPACK,戴尔曾经给出一些应用上的小建议:

如果您预期某天会出现性能高峰,建议在那一天运行DPACK信息收集!

不建议在低工作量时期执行DPACK (报告会没有意义!)

建议DPACK收集超过一天,因为24小时内能收集的有用信息太有限了!

收集总持续时间可以最长7天!

不要长期使用老版本的DPACK软件!收集分析主机端性能信息

 DPACK有频繁的更新和增强新功能,记得下载新版本!


恐惧来源于未知,IT亦如此。


网络上曾经流传过这样一张图片,一位IT管理员对着一排机架下跪烧香,祈祷这些基础设施能够稳定运行,不出毛病。


我想,除了搞笑之外,这张图也传达了IT管理员们一种普遍的心态,即对于IT基础架构各种疑难杂症的无奈、迷茫,甚至说恐惧。


但是,如果能够洞察一切,提早做出预判,那管理员们对IT还会怀有恐惧么?DPACK就是这样一个工具,帮助IT管理员们打破未知,让IT尽在掌控之中。