网络流量分析是一个不可或缺的网络工程工具,它几乎支持所有功能,包括快速故障修复、安全监控和容量规划。此外,它的处理量巨大,必须有一个保持连通的管道随时报告数据包,而这要求有效且灵活的后期处理和解析。它实际上并不完全符合大数据的定义——这里并不涉及艾字节数据,但是NetFlow监控系统是大数据挑战的一个微观体现。从有限的IT资源角度看,在任何规模的应用中都可能成为网络工程师的大学问。
大数据项目通常不会使用关系数据库。虽然关系数据库管理系统(RDBMS)提供了非常好用的功能,如灵活的接口、很容易管理的持久化和强大报表,但是它们却很难达到NetFlow的要求。要理解这其中的原因,我们需要先弄清楚一个问题:NetFlow数据的最近一次变化发生在什么时候?
零基数数据提供了难得的机会
除了存储数据的方式,大数据解决方案确实不同于以前的数据仓库。这个过程通常会有大量的提取、转换和加载 (ETL)操作,或者需要从许多系统一次性给中央存储设备输入大量数据。
但是,在应用各种MapReduce或开源数据方案(如Hadoop)之后,大数据平台会周期性阻塞CPU。无论如何根据数据应用情况调整和优化大数据及数据仓库共享,都会出现这样的情况。
在收集之后,, NetFlow、sFlow、CFlow、JFlow或IPFIX-Flow记录都不再会发生变化。关系数据库的B树过载可以简化更新记录的查找过程,但是查询时间完全浪费在历史流数据上。由于有太多的网络管理,所以流量数据会填满网络监控数据库,因此会对各个方面的性能产生严重影响。这些会引起硬件警报的流监控肯定不是什么好东西。
创建NoSQL流报告有一定的难度
一些NetFlow分析供应商坚持使用关系数据库,其最主要原因之一是他们还没有技术能力实现一个NoSQL解决方案。还有许多数据技术专注于提高高性能,如位图索引(如FastBit)和Hadoop等开源解决方案,但是FastBit并不是一种数据存储技术,而Hadoop则完全与网络数据无关。
专门给网络工程师开发一些新技术,同时要求提供快速仪表板、节约CPU和存储且简单易用,这肯定是不容易做到的。网络管理供应商必须有多年的监控经验、长期客户协作和在研发中投入大量的资源,才可能将这些重要方面正确地组合在一起。然而,在研发时一定要在三个主要方面有突破:提高性能、优化报表粒度和降低运营开支。
高性能可以通过组合运用普通文件的高压缩和内存内索引技术实现。在一些时候,使用这些技术可以在相同硬件上将速度或功能提高一个数量级。降低存储价格使用户可以调整事实表粒度,从而真正能够支持真实帮助台在规定时间内解决问题。能够存储几周时间细粒度的NetFlow历史数据,同时又不需要安装庞大的关系数据库服务器,这就是关键。在我们尝试处理一个服务质量映射问题的请求时,是不是很多时候仅仅是查找详细的流数据(其中包含一些有用的峰值数据)就耗费了全部的存储时间?如果流细节数据达到一个月或更多,那么问题就更严重了。
第三个优势是IT预算经理关心的问题,即采用专用的NoSQL流存储将会减少开支。使用更便宜的硬件、减少RDBMS授权数量和降低维护复杂性,都更容易让经理点头。
正好到假期时间
有许多网络流量分析和监控供应商推出了利用专用流存储的解决方案,它可以扩展支持最大型的企业应用。这些产品绕过了关系数据库的内在局限性,从而支持根据需要自由测量流量——支持网络中任意位置的测量。年底就要到来,管理层就要离开办公室去度假,现在正是在实验室发力的时候,然后看看这些大数据技术能够在来年产出一两个NetFlow成果。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。
相关推荐
-
借助Mellanox互连方案,美团网加速大数据和云数据中心
美团网现已部署Mellanox以太网适配器、交换机和线缆,为其数千台服务器提供加速,助力人工智能、大数据分析和云数据中心。
-
应用虚拟化IT:需要决策支持做后盾
公司使用大数据、云和虚拟化IT的原因是加速和优化业务决策过程。其原因就在于决策支持。
-
EmTech香港峰会:探索下一代的技术突破
第二届EmTech香港峰会于2017年6月6日及7日在香港会议展览中心举行。EmTech香港峰会由麻省理工学院技术评论和科隆展览有限公司共同举办,展示了最具潜力改变生活的新兴技术,为世界上最具创意的人才和公司提供交流的平台。
-
从博科参展数博会看网络对大数据的支撑
良好的生态环境对大数据的持续发展有着举足轻重的作用,唯有拥有强大的数据中心网络架构的支撑,企业才能更好的拥抱大数据,并利用其开启转型之旅。