|
随着数据业务的飞速发展,企业用户需要搭建集中统一的网管平台,真正实现IT部门所有运维人员的协同管理。这个IT运维平台必须具有高度的自动化、智能化程度,提供智能美观的自动拓扑图和应用拓扑图,具有强大而全面的功能,以及极高的可用性和易用性,能够快速部署和简单操作。
正是针对中国用户的以上需求,游龙科技在广泛调研和深入研发后,推出了最新款基于.NET架构的SiteView ECC -----SiteView 综合网管系统。它专注对局域网、广域网和互联网上的应用系统、服务器和网络设备的故障监测和性能管理,是集中式、跨平台的系统管理软件,可以对应用系统、网络设备、服务器、中间件、数据库、电子邮件、WEB系统、DNS系统、FTP系统、电子商务等进行全面深入的监测管理。SiteView ECC功能强大,不仅方便系统管理人员随时了解整个IT系统的运行状况,而且能从应用层面对企业IT系统的关键应用进行实时监测。
SiteView ECC——主界面
SiteView ECC采用分布式架构的部署方式实现全网集中管理,通过监控中心的一台SiteView ECC监测主机实时采集和分析各子系统反馈的数据,7X24小时对企业网络运行状况进行全面监测。IT运维部门可通过精美的网络拓扑图,直观查看网络应用运行状况。SiteView ECC采用B/S架构,全中文web界面,具有灵活的系统架构,无需安装Agent,适用于各种规模的网络。
通过SiteView ECC,企业用户可实现高效、智能的团队协同运维。对于网络中的异常,SiteView ECC会及时通过短信、邮件、声音、脚本等方式发出警报,并自动对常见故障进行修复。SiteView ECC报表自动统计功能,随时随地都可以自定义生成一个图文并茂的统计报表,并将各种相关的报告定时自动发送到相关管理人员的邮箱。同时,对于警报设置和报表统计,IT运维部门管理人员都可以自定义设置,查看不同的数据信息。SiteView ECC可7X24小时高速运转,有力保障企业网络和关键业务的稳定、持续运行。
由于具有强大的功能、高度的产品化、极好的易用性、稳定的性能、源代码级的技术支持和用户至上的本地化服务, SiteView ECC先后为移动梦网(27省)、中国联通、中国铁通、中国网通、建设银行、中国银行、交通银行、华夏证券、国泰君安证券、粤电集团、海航集团、中石化、金山石化、中油和黄、上海政府、当当网、腾讯、易趣等几百个大型用户提供了全面的IT运维解决方案,并获得这些行业客户的高度认可。
随着企业信息化建设的深入,相应的网络应用也越来越复杂,网络性能的好坏在整个企业运转中的作用也越来越重要。一旦企业应用出现异常,将会对企业的整体经营产生重大的影响。而面对复杂的网络应用环境,系统管理员必须借助智能化的网管系统才能有效地进行管理。
SiteView ECC应用监测功能可以完全解除系统管理人员在这方面的困惑,它内置了几十种监测器,组合使用它们可以对WEB、Email、DNS、FTP、ERP、CRM、MIS、中间件、财务、电子商务等应用系统从应用可用性、系统资源占用和性能指标三个层面进行全面深入的监测管理。通过对各个业务服务主机进行定时和实时的测量,提供其需要的业务的服务水平数据,包括XXOA、Mail系统所经路经的延迟、丢包、流量、网络停顿时间和网络可用率,以及视频会议的时延、延迟抖动、丢包情况。
在企业的网络管理过程中,管理者的一大部分精力需要放在维护电子邮件、网站等企业应用上。我们根据企业内部的这种需求,提供了一系列全面的应用系统监测参数,用来系统的管理企业各种应用和服务,如数据库服务、Email服务和各种中间件等。
针对网络的实际情况, SiteView ECC将提供下列业务服务水平指标:
|
指标名称 |
说明 |
|
业务可用性 |
给定某时刻t,如果在其前后某时间内,从源端到目标端所测量的丢包率及往返延迟都小于事先设定的门限,则网络在某时刻t是可用的。 |
|
网络时延 |
从源端向目标端发送一个包,到收到目标端应答为止的时间间隔,包括中间节点的排队时间和目标端的处理时间。 |
|
延迟抖动 |
源端向目标端连续发送数据包时,数据包到达的时间差异。 |
|
丢包率 |
当源端没有收到目标端对其发送数据包的应答时,认为发生了丢包。丢报数与发送的总包数之比称作源端到目标端的丢包率。 |
|
可用率 |
可用率是指一段时间内的可用时间与总时间之比。 |
性能指标反映了企业业务的运行状况,是判别业务运行是否正常的关键数据。性能指标超出预先设定的范围时,系统触发的告警称为性能告警。应用系统管理模块能提供方便设定/查询/修改/删除性能门限值的工具,一旦性能数据超过预先设置的性能门限时,能够自动产生性能告警,网管系统能以图形或列表的形式显示在界面上,供维护人员了解业务运行的性能质量,预测潜在的业务故障。
1、Web系统管理
Web应用监测应可以全面智能的监测各种与Web应用相关的服务,如Apache Server、MS IIS Server、Netscape Server、FTP、DNS、News、Web Publisher和ASP等。该监测基于TCP/IP协议族中的各种应用层协议(HTTP、FTP、DNS等),通常不需要对被监测服务进行配置。我们建议对Web应用系统的监测从以下几个方面进行:
检查CPU、内存、磁盘I/O及磁盘空间使用情况,确保Web系统有一个良好的运行环境,如果CPU、内存使用率过高、磁盘空间不足会导致系统崩溃,无法使用。
检查具体的Web应用的进程所占用的CPU、内存的使用情况,探测对应端口是否有响应。
监测Apache系统性能,提供Apache网络服务器的管理和性能统计。监测器应可以监测所选的Apache服务性能统计表的错误和危险。通过此监测就可以查看服务器的性能装载和容量的计划编制。运行Apache监测,能够返回服务器统计数据,包括:CPU负载、每秒钟的请求次数、每秒总字节数、总字节数/请求、激活的服务进程、闲置的服务进程等相关信息。
SiteView ECC的FTP监测可以模拟真实用户登陆FTP服务器进行下载某个文件的操作,以验证FTP服务器是否有响应。运行FTP监测,将返回的监测数据包括:下载的文件大小、往返时间、下载速率等相关信息。
监测DNS系统性能
SiteView ECC的DNS监测通过发送DNS请求,检查DNS服务器是否正常运行,校验是否DNS服务器响应DNS请求以及对于某一域名是否能够解析出它的IP地址。如果DNS服务器发生故障,所有的网络应用都将受到影响甚至中断,因此,确保DNS服务器的正常工作是非常有必要的。运行DNS监测,将返回发送DNS请求到DNS服务器响应的往返时间,并将往返时间写到日志文件中。
监测News系统性能
SiteView ECC 的News监测可以轻松查看指定News服务的工作情况,通过对指定的News服务器的监测可以得知该News服务器的往返时间以及指定组内包含的文章数量,从而避免文章数目不正常的增长,并在引起磁盘空间问题之前删除它们。运行News监测,将返回访问News服务器的往返时间以及指定组内包含的文章数量,并将监测数据写到日志文件中。
监测ASP系统性能
SiteView ECC 的Active Server Pages监测模块可以轻松查看Active Server Pages服务的工作情况,通过对指定主机上Active Server Pages的监测可以得知该主机ASP服务的运行情况。ASP服务对于采用ASP作用动态内容生成的网站具有异常重要的作用,ASP服务性能的好坏,决定了网站服务是否能正常运行,通过ASP监测模块可以帮助管理员及时了解ASP服务的运行情况。运行ASP监测,将返回的监测数据包括:ASP预处理错误数、脚本运行时的错误数、脚本编译器的错误数、每秒的错误数、请求字节总数、请求失败总数、请求总数、当前会话数、成功的请求数以及事务总数等相关信息。
SiteView ECC——Web应用监测原理图
2、Mail系统管理
SiteView ECC的Mail监测模块通过网络监测邮件服务器,它校验是否MAIL服务器可以接受请求、是否可以发送以及接收邮件。Mail监测模块通过简单邮件传送协议(SMTP)发送一个标准的邮件,通过邮局协议(POP3)或者Internet信息访问协议(IMAP4)接收这个邮件,如果Mail监测模块在这个过程中出现了错误(如POP3密码错误),Mail监测将停止并产生错误信息。SiteView ECC对Mail系统的监测主要从以下几个方面进行:
检查CPU、内存、磁盘I/O及磁盘空间使用情况,确保Email系统有一个良好的运行环境,如果CPU、内存使用率过高、磁盘空间不足会导致系统崩溃,无法使用。
检查Mail Server进程占用的CPU、内存,探测25、110端口是否有响应。
模拟真实用户用SMTP、POP3方式发送、接收邮件,检查Mail Server是否可用,发送、接收邮件速度是否正常。
监测Exchange Server的性能指标,POP3当前连接数、SMTP当前连接数、POP3连接拒绝数、POP3验证失败数等。
3、OA系统管理
OA系统是其非常重要的内部公文流转系统,如文档的申请、签发和撤回等,整个流程的畅通非常重要。如果某一个环节的流转出现问题而没有被及时发现的话,可能会导致内部信息沟通的滞缓和延迟,从而影响企业的工作效率。而SiteView ECC监测器可以模拟人的操作,监测公文流转系统的可用性,完成每一步的时间,以及总时间等性能参数。SiteView ECC对企业OA系统的监测主要从以下方面进行:
检查CPU、内存、磁盘I/O及磁盘空间使用情况,确保企业的OA系统有一个良好的运行环境,如果CPU、内存使用率过高、磁盘空间不足会导致系统崩溃,无法使用。
检查进程占用的CPU、内存。
性能监测
SiteView ECC的OA监测器还可以验证系统的OA使用是否正常以及性能如何。
4、Websphere系统管理
WebSphere软件平台能够帮助客户在Web上创建自己的业务或将自己的业务扩展到Web上,为客户提供了一个可靠、可扩展、跨平台的解决方案。
SiteView ECC软件已拥有一套完整的WebSphere监控管理方案,能够保证系统的稳定运行,其通过一下几个方面对应用系统进行监控。
应用程序性能
l Servlet/EJB响应时间
l Servlet/EJB请求
l 有效的HTTP session
WebSphere中的工作流
l Web服务器线程(您要从HTTP服务器上得到这个,而不是PMI)
l Web容器线程池,ORB线程池
l Database连接池
JVM性能
l JVM堆(用于潜在的内存漏洞和动态垃圾收集)
SiteView ECC具有全面的立体式监测,其中在对中间件的监测和管理上做得非常完善和稳定,已经走在了中间件监测和管理的前列。游龙科技SiteView ECC网管系统已将对中间件的监测指标提升到100多个。SiteView ECC提供的10多种监测器,专门对中间件进行监测和管理,组合使用它们更可以达到深入的中间件监测和管理功能,其功能完全可以与专业的中间件管理软件相媲美。
SiteView ECC树型视图清晰地表明了各监测组、监测实体和监测器之间的层级关系,非常便于用户对网络进行管理。用户自定义的监测分类,可以通过树型视图一目了然地体现出来,也达到了用户通过网管系统提高工作效率的初衷。当企业的网络非常庞大或采用分布式的网络结构的时候,就可以考虑在SiteView ECC主页上设置多个监测组以方便管理,每个组里又可以分别设置多个监测页面。
SiteView ECC——树型视图
1、中间件监测
随着网络经济的快速发展,企业需要引进ERP、CRM、SCM,以及各个行业的特殊应用系统等,并且要求能够与现有业务流程、各种系统结构进行无缝集成,做到既可以充分利用现有的投资,又可以利用电子商务的优势。如何把这些软硬系统集成起来并开发新的应用是一个非常现实而困难的问题,而中间件提供的程序接口定义了一个相对稳定的高层应用环境,完全可以解决这一问题,保护和充分利用企业已有的IT资源。在这种形势下,中间件发挥了巨大的作用,与此同时中间件监测和管理就显得十分重要了。
SiteView ECC在对中间件的监测和管理上做得非常完善和稳定,已经走在了中间件监测和管理的前列。游龙科技SiteView ECC已将对中间件的监测指标提升到100多个。SiteView提供的10多种监测器,专门对中间件进行监测和管理,组合使用它们更可以达到深入的中间件监测和管理功能,其功能完全可以与专业的中间件管理软件相媲美。SiteView系统的中间件监测和管理可以对数据访问中间件、远程过程调用中间件、消息中间件、交易中间件、对象中间件等进行监测和管理。
SiteView ECC可以对IBM的MQ、Webspher,BEA 的Tuxedo、WebLogic等中间件进行全面监测。以Tuxedo为例,SiteView能够对Client信息(请求数、事务处理数、Client状态等)、队列信息(队列的最大字节数、当前队列字节数、队列IPC消息数、机器状态等)、服务信息(总共的请求数、Server每秒请求数、Server每秒transaction数、并发的连接数、服务状态等)、WSH监测(请求数、WSH接收的字节数、WSH接收的消息数、WSH发送的消息数、WSH每秒接收的字节数、WSH每秒接收的消息数、WSH每秒发送的字节数数、WSH每秒发送的字节数数、WSH每秒发送的消息数、WSH状态等等)进行全面监测,有效帮助系统管理人员加强对中间件的监测和管理,提高工作效率。
SiteView ECC不仅可以对中间件进行全面监测,而且还可以对中间件的监测进行故障报警和故障处理。
tuxedo监测内容及其主要的监测参数解释:
|
检测监测内容其主要的监测参数 |
检测参数解释 |
|
CLIENT检测 |
|
numreq |
请求数 |
|
numtrancmt |
事务处理数 |
|
state |
Client状态,ACTive:激活中 INActive:没被激活 |
|
MACHINE检测 |
|
numtran |
本机接收到的事务总数量 |
|
numtrancmt |
本机处理过的事务总数量 |
|
wkcompleted |
被成功处理的队列服务 |
|
wkinitiated |
运行中的入队列服务数量 |
|
wkcompleted_per_secon |
每台机器每秒完成的transaction数 |
|
wkinitiated_per_second |
每台机器每秒初始化的transaction数 |
|
role |
机器的角色,是主机(MASTER)还是备份机(BACKUP) |
|
state |
机器状态,ACTive:机器对象定义并激活中 INActive:机器对象定义但宕机 |
|
QUEUE_MESSAGES检测 |
|
qbytes |
队列的最大字节数 |
|
cbytes |
当前队列字节数 |
|
qnum |
队列IPC消息数 |
|
state |
机器状态,ACTive:激活中 INActive:没被激活 |
|
SERVER检测 |
|
numreq |
总共的请求数 |
|
numtrancmt |
总共处理的事务数 |
|
numreq_per_second |
Server每秒请求数 |
|
numtrancmt_per_second |
Server每秒transaction数 |
|
curconv |
并发的连接数 |
|
state |
服务状态,ACTive:激活中 INActive:没被激活 |
|
WSH检测 |
|
numblockq |
请求数 |
|
rcvdby |
WSH接收的字节数 |
|
rcvdnum |
WSH接收的消息数 |
|
sentbyt |
WSH发送的字节数数 |
|
sentnum |
WSH发送的消息数 |
|
numblockq_per_second |
请求数 |
|
rcvdbyt_per_second |
WSH每秒接收的字节数 |
|
rcvdnum_per_second |
WSH每秒接收的消息数 |
|
sentbyt_per_second |
WSH每秒发送的字节数数 |
|
sentnum_per_second |
WSH每秒发送的消息数 |
|
state |
WSH状态,ACTive:激活中 INActive:没被激活 |
2、树型视图监测
通过SiteView ECC树型视图,用户可以获取最为丰富的系统监测和管理信息,可以通过树型视图浏览网管系统中所有的监测页面和报告页面,体现了网管软件高度的人性化设计理念。
SiteView ECC树型视图清晰地表明了各监测组、监测实体和监测器之间的层级关系,非常便于用户对网络进行管理。用户自定义的监测分类,可以通过树型视图一目了然地体现出来,也达到了用户通过网管系统提高工作效率的初衷。为更好地满足大型企业分布式网络自动化、智能化集中管理的需求,SiteView ECC提供了分布式可扩展性实施方案,通过将系统资源占用最大的数据采集工作分配给其它机器协同完成,实现网管规模的无限扩展。
对于遍布全国各地或各省市的网络,用户可以通过对不同区域的分布式监测来实现网络管理。虽然全国或全省的网络一般都很庞杂,但是通过SiteView ECC树型视图,都可以将这些大规模网络的架构清晰地表现出来。
SiteView ECC——树型视图
3、全网集中监测
通过一台监测主机可以对遍布全国或全省的大型网络进行集中管理,它不仅实现了数据采集和用户管理的分离,而且实现了大规模网络的分层分级管理。
为更好地满足大型企业分布式网络自动化、智能化集中管理的需求,SiteView ECC提供了分布式可扩展性实施方案,通过将系统资源占用最大的数据采集工作分配给其它机器协同完成,实现网管规模的无限扩展。SiteView ECC 采用分布式应用系统开发,从部署上分为数据监测服务器和Web监控平台,这两部分可分别运行在不同的计算机上。Web监控平台可以注册任意多数据监测服务器,且可以使用多个Web监控平台,依次实现可检测任意多网络设备的功能。
如图所示,系统管理员可通过SiteView ECC中央控制系统将不同的数据采集工作分配给其它的SiteView ECC监测服务器完成,从而大幅度降低SiteView ECC对中央控制系统资源的占用,满足大规模、分布式网络数据集中采集和管理的需求,从而实现整个网管系统的线性扩展。
SiteView ECC——高扩展性的分布式架构
SiteView ECC通过分布式架构可以对遍布全国的大型网络进行集中管理,它不仅实现了数据采集用户管理的分离,而且实现了对大规模网络的分层分级管理。以一个全省网络的管理为例,SiteView ECC网管系统可采用分布式架构的部署方式实现全网集中管理,通过一台SiteView ECC监测主机实时采集和分析省中心和各地区SiteView ECC子系统反馈的数据,7X24小时对全省范围内网络核心节点、服务器和应用系统的运行状况进行全面监测,而各地区子系统也可单独管理包括市和县区网络在内的本地区网络。相对于以前各省市网管系统单独管理、存在信息孤岛的情况而言,新版本实现了真正意义上的集中管理。
4、主页监测功能
当用户有多个重要监测页面时,可以通过自定义将这些关键页面设置在主页显示,随时随地在一个界面上了解多个监测信息的运行情况。
当企业的网络非常庞大或采用分布式的网络结构的时候,就可以考虑在SiteView ECC主页上设置多个监测组以方便管理,每个组里又可以分别设置多个监测页面。主页监测功能可以提供非常丰富的信息量,让用户在查看不同的SiteView ECC监测信息时一目了然,通过一个界面即可了解到所需的所有信息。
SiteView ECC——主页监测
5、个性化的特殊监测(API接口)
SiteView ECC提供的开放式的API接口,可以让系统管理人员十分方便地定制、添加特殊的监测器,满足用户特有的监测需求。系统更可方便地与用户原有的网管系统或HP、IBM、CA等公司的其它网管产品实现无缝集成。
再完善的网管软件都不可能很好满足所有客户的需求,不同行业的用户在网管方面的需求差异很大。为了满足客户差异化的网络管理需求,方便对系统进行二次开发,SiteView ECC特此设计了开放式的API接口。SiteView ECC开放式API由动态连接库(DLL)和模版文件(Template)组成。动态连接库可按照SiteView ECC定义的标准由用户或其他软件供应商提供,模版文件可以利用SiteView ECC的模版文件向导(TPLWizard)生成。
SiteView ECC——通过SNMP与其它系统集成
SiteView ECC提供的开放式API接口和高度模块化设计,十分方便用户进行二次开发以及将它与其它的网管软件进行无缝集成,从而实现网络管理资源整合,构建自己更为完善的自动化网络管理平台。二次开发轻松简单,无需从头开始,工程师可十分方便添加自己需要的独特的监测器,从而更好地满足用户个性化的网络管理需求。
SiteView ECC的数据库监测模块可以全面智能的监测企业各种与数据库应用相关的服务。SiteView ECC对Oracle、SQL Server、Mysql数据库从应用可用性、系统资源占用和数据库性能指标三个方面提供全面的监测管理策略,确保数据库的运行正常。SiteView ECC的数据库性能监测模块能够连续地监控企业数据库的关键参数。例如:数据库系统设计的文件存储空间、系统资源的使用率、配置情况、数据库当前的各种锁资源情况、监控数据库进程的状态、进程所占内存空间、可用性等。SiteView ECC可以在服务中断时捕获问题信息,并且自动发送到告警控制台,使系统管理员能够及时采取措施,避免灾难性的事故。
SiteView ECC的数据库监测模块模块是通过ODBC数据源进行监测和采集数据的。以下为数据库监测的工作原理图。
SiteView ECC——数据库监测的工作原理图
SiteView ECC——数据库统计表
SiteView ECC对数据库监测提供了多层面立体矩阵式的解决方案,使监测更加准确,例如对SQL Server数据库的监测可以从如下几个层次开展:
1、应用层面、系统资源层面管理
应用层面
企业有各种关键的应用系统系统,以及系统资源层面等,它们的正常运转是企业日常工作正常运行的保障。为此,需要从不同角度对应用系统进行监测。由于应用系统的数据最终都会从数据库中存取,因此我们也需要对数据库进行监测。SiteView ECC的Database监测可以直接了解数据库执行一段SQL语句花费的时间,设置3个左右Database监测器,让程序定时执行一些重要的与关键应用相关的SQL语句,如果查询时间超过阀值或查询结果不正确,表明数据库出现问题。
SiteView ECC的Database监测是SiteView ECC在数据库监测管理方面提供的一个接口,通过此接口,企业的管理员不但可以了解到数据库的运行状况正常与否,而且还可以直接执行对数据库中的数据表进行查询、检索的SQL语句,返回与重要业务相关的数据表中的字段的值和记录个数。灵活应用SiteView ECC的Database监测,可以帮助企业的管理员实时掌握数据库中的重要业务的数据信息,解决管理数据库时的应用层面的需求。
系统资源层面
在网络庞大,设备众多的企业里,必须对一些关键端口进行监测,因为关键端口是数据库 Server和Client通信的端口,一旦出现问题则Client无法访问Server。
监测数据库的进程,数据库本身有4-5个关键进程,这些进程一旦出现问题,数据库的某个功能将会不正常,但不一定影响整个数据库,它对数据库的影响是比较隐蔽的,管理员如果不监测这些进程,很难发现问题。
2、数据库各项性能指标监测
通过数据库性能监测器,网络管理人员可了解到数据库本身的运行状况,如Open Cursor等;这对调整企业的系统性能很有帮助。SiteView ECC的数据库监测模块支持对业界应用广泛的数据库系统的监测,包括Oracle、SQL Server、Informix、MySQL、Sybase、DB2等,涵盖了企业应用中的主流数据库系统。对于在数据库自身性能指标层次的监测,SiteView ECC针对主流的数据库系统提供了丰富多样的监测模块可供选择,全面深层次的监测数据库的性能和运行状况。
SiteView ECC对数据库系统的性能指标的监测包括:
l 数据库文件系统
l 表空间(Tablespace)使用情况
l 事物日志空间的使用情况
l 数据库死锁
l 数据库进程的监控
SiteView ECC对业界非常流行的数据库系统——Oracle和SQL Server提供了多达几十种的性能指标的监测。其中包括以下几种主流的数据库
l DB2数据库
SiteView ECC——查看Oracle数据库某时间段的历史报告
为确保企业服务器高速、稳定运转,SiteView ECC从多个方面对主机服务器的硬件设备及操作系统进行监控管理和性能管理。它通过采集服务器的CPU、内存、硬盘、网卡等硬件的关键运行参数,以及软件和应用程序的进程、服务、端口等的运行状况,对系统日志进行分类扫描查询。通过数据采集和分析,SiteView ECC能够及时对影响企业服务器运行性能的故障事件发送报警,并采取相应的故障处理措施,保证服务器的正常安全运行。
SiteView ECC与服务器相关的监测器有30多种,其中主要包括采集服务器CPU、内存、磁盘空间、服务、进程、网卡、错误日志、Windows事件日志、UNIX LOG文件、文件和目录等数据的监测器。
1、主机运行管理
主机的CPU、内存、磁盘的使用情况对主机的性能影响很大,如果出现问题,将直接影响到主机的正常运行,进而对服务器上正在运行的重要的应用系统带来不可预料的后果。所以,对企业主机的CPU、内存、磁盘资源使用情况进行监测是主机管理的首要任务。
在这一方面,SiteView ECC为企业提供了完善的监测保障。SiteView ECC的服务器监测模块不但可以监测到Windows系统的相关性能,还可以监测到几乎所有主流的UNIX平台(例如Linux、Solaris、AIX等)的相关性能,对于比较少见的UNIX系统,SiteView ECC提供了易于扩展的监测接口,只需要根据接口的定义添加监测模块即可监测SiteView ECC中暂不支持的UNIX系统。SiteView ECC提供的跨平台的服务器运行状况监测模块可以帮助管理员在第一时间发现主机基本性能的状态异常,并协助管理员对异常做出处理。
SiteView ECC——服务器监测选择
2、服务、进程管理
企业的主机上运行着各种非常重要的应用系统,例如大型的数据库系统、Mail系统、Web Server或特殊业务的应用系统等。应用系统的进程和服务是否正常运行是判断应用系统是否正常的关键,如果这些关键的进程和服务已经停止,则企业的应用系统肯定无法正常工作。
所以监测主机上的进程和服务是企业主机管理的另一个重点。SiteView ECC的服务器监测模块能够监测Windows平台和UNIX平台上运行的进程、服务的运行状况,例如指定进程的运行实例总数,对于Windows平台,不但能监测指定进程的实例总数,还能监测线程总数及内存总占用量。通过对进程和服务的运行状况的监测,SiteView ECC可以对重要的应用系统的正常运行提供有力的保障。
3、网络状况管理和日志管理
SiteView ECC的服务器监测模块还包括对服务器的网卡的运行状况的监测。SiteView ECC对服务器的网络状况的监测是基于SNMP协议实现的,SiteView ECC可以监测服务器的网卡的流量(接收速率和发送速率)、状态和丢包率等。通过对服务器网络状况的监测,SiteView ECC可以保障网络中的服务器系统维持正常的网络访问和提供正常的网络服务。
服务器上的应用系统或重要进程运行时会产生大量的日志文件,这些日志文件对于网络管理人员检查程序运行状态、查找程序出错原因很有帮助。SiteView ECC的服务器监测模块提供了相应的监测功能对这些日志进行监测。SiteView ECC不仅可以监测Windows平台和UNIX平台的日志变化情况,而且对监测结果支持匹配查询、设置过滤条件等方式进行更深层次的分析,通过应用SiteView ECC的服务器日志监测功能,可以帮助管理员更为准确的掌握重要进程或应用系统的运行状况,以保证关键业务的正常运行。
SiteView ECC可以从各个方面对的网络设备进行监测和管理,内容包括网络设备的可用性、设备性能、流量管理和业务分析等等。SiteView ECC的网络设备管理系统支持的网络设备,包括各种类型的交换机、路由器、防火墙、VoIP网关设备和其他启用了SNMP协议的网络设备。
SiteView ECC的网络监测模块基于SNMP和ICMP等协议,此模块中提供了极为广泛的网络监测。通过该模块,管理员可以全面监测整个网络体系,例如网络的连通性(Ping)及其网络设备(交换机、路由器、防火墙)的状态,如接口状态、接口流量、接口丢包率、路由器的CPU负载等。该监测模块需要被监测的网络设备启用SNMP(简单网络管理)协议,SiteView ECC系统通过发送Get请求并接受来自被监测的网络设备的响应。以下为SiteView ECC网络监测模块的工作原理图。
SiteView ECC——网络监测原理图
SiteView ECC——网络设备图
1、网络设备可用性、性能管理
监测网络设备可用性通常使用的方法,就是对网络设备使用Ping或者发送SNMP Get请求。SiteView ECC的网络监测模块很好的实现了这两种监测方式。通过对企业网络设备应用Ping监测,可以得到监测点到被监测设备的连通性、网络设备的响应时间以及丢包率等,从而有效地反应网络状况的畅通性。但是由于仅仅应用Ping监测,有时并不能反映网络的真实情况(例如网络设备Ping失败可能是由于管理员已经禁止对此网络设备使用Ping的请求),所以SiteView ECC的网络监测模块提供了对网络设备发送SNMP GET请求来监测网络设备的可用性的解决方案。
SiteView ECC的网络监测模块的技术核心集中在使用SNMP协议对网络设备进行监测的实现。SNMP(简单网络管理协议)是对网络设备进行监测和管理的标准,SiteView ECC不但提供了多种基于SNMP协议的监测模块,而且还提供了基于SNMP协议进行监测的标准接口模块,以满足网络设备的不同层次的监测需求。
网络设备的可用性主要表现于网络设备的接口的相关状态信息,包括接口状态、接口流量、接口丢包率等。SiteView ECC提供了根据公有MIB开发的网络设备的接口监测模块,只需要的管理员根据需求添加对相关接口的监测,即可实现对网络设备的接口状态、接口流量、接口丢包率等相关信息的动态监测。
网络设备的可用性还包括cpu利用率、内存利用率、当前连接数、会话数(session)、防火墙的性能指标(如拒绝的数据包数、丢弃的数据包、IP欺骗攻击数、ICMP攻击数等性能参数)、配置文件的变化情况等。SiteView ECC的网络监测模块提供了对业界流行的网络设备的这些性能的监测,例如Cisco系列的交换机和路由器、北电Alteon交换机、CheckPoint防火墙、NetScreen防火墙、Pix防火墙、天融信防火墙等。而且,SiteView ECC的网络监测模块还提供了便于扩展的SNMP监测开发接口,通过包含具体网络设备的私有MIB,SiteView ECC可以任何启用了SNMP协议的网络设备的可用性提供如上所述的更深层次的监测支持。
SiteView ECC的网络监测模块还提供了测试远程网络设备连通性的监测Proxy Ping。在网络中,数据传输经常存在瓶颈,特别是在连接相对较慢的广域网中。而Proxy Ping监测通过测量两个基本的参数[数据包往返时间]以及[数据包的成功返回的比率]来确定一个网络是否拥挤。数据包往返时间长或是数据包的成功返回的比率低则意味着网络可能存在问题,如果数据包的成功返回的比率为零,则可能说明网络已经完全瘫痪。但是,偶尔的数据包的成功率低不能说明上述问题,如果经常发生,则可能是因为网络太拥挤,或者是因为路由器不支持Proxy Ping数据包的转发。
Proxy Ping监测的实现原理是驱动代理Cisco路由器ping指定的网络地址,从而了解Cisco路由器和指定网络地址之间的网络连通性,每当运行Proxy Ping监测器,它将返回测试主机响应数据包的往返时间以及成功返回数据包的比率,并将数据写到日志文件中。
SiteView ECC Proxy Ping工作图
如上图所示,如果监测机到R1路由器的链路是正常的,那么就可以使用运行在监测机上的Proxy Ping监测器驱动R1路由器的SNMP代理(支持CISCO-PING-MIB)测试R1到R2路由器链路的连通性。
对于网络设备的性能参数,SiteView ECC主要提供网络设备的CPU负载、内存使用率以及剩余内存空间等等。针对这些性能参数,SiteView ECC的网络监测模块采用两种方式进行性能数据的采集,其一是通过SNMP来获得性能参数数据,这种方式的优点的占用网络资源小,速度快。其二是远程登录(Telnet),在这种方式中,SiteView ECC通过模拟终端用户的行为直接登录到网络设备,通过网络设备操作系统提供的命令来查看企业设备的性能参数,这种方式的优点是直观,完全符合企业运营维护员的行为。
2、网络流量管理
网络流量管理功能主要是对各种网络设备的接口流量进行监测和控制,以及根据需要对接口状态进行管理。通过对网络设备的接口状态的监测,可以确保其网络设备的正常工作。通过对网络设备接口流量状况的监测,以保证企业网络能够有效、平稳、安全地运行。同时,通过对网络设备流量数据的采集和分析,SiteView ECC可以向维护部门和管理部门提供充分、完整的运行数据,供维护和管理人员根据网络运行状况制定合适的运行策略,使网络运行在最高效的状态下。
SiteView ECC网络流量监测是一个基于实用的信息采集和传输平台。通过SNMP协议,对网络进行实时业务流量分析,通过各种数据指标、性能报表和性能趋势图,为企业网络提供网络的容量规划、趋势分析以及数据的优先级方面的信息。
为确保SiteView ECC流量管理能够实时、准确地反应网络的流量情况,SiteView ECC提供如下几种流量分析方式:
(1)流量即时数据,提供及查询最近2小时的网络5分钟即时流量
(2)流量小时数据,提供及查询最近48小时的每小时流量情况
(3)流量每天数据,提供及查询最近9周的每天流量情况
(4)流量每月数据,提供及查询最近10年的每月流量报告
(5)对于上述流量情况(包括流入/流出平均速率、流入/流出峰值速率、流入/流出字节数、流入/流出平均带宽利用率和流入/流出峰值带宽利用率),可以按照分行和时间等参数灵活查询,提供实时流量趋势图和流量报表,报表可以保存为EXCEL和XML格式,支持下载和打印操作。)
SiteView ECC——某一流量监测报表
3、网络业务分析
SiteView ECC通过CISCO路由器的NETFLOW协议,可以统计中有固定IP PORT的业务的流量情况,实时地了解网络中的业务分布情况:
骨干网流量分析
业务流量小时数据,提供及查询最近48小时的每个业务的每小时流量情况;
业务流量日数据,提供及查询最近9周的每个业务的每日流量情况;
业务流量月数据,提供及查询最近10年的每个业务的每月流量情况;
对于上述流量情况(包括流入/流出平均速率、流入/流出字节数),可以按照分行和时间等参数灵活查询,提供流量报表,报表可以保存为EXCEL和XML格式,支持下载和打印操作。
SiteView ECC——网络业务监测图表
4、网络设备事件管理
SiteView ECC的网络监测模块可以对网络设备的日志进行收集及分析,并提供趋势性分析报告和基本的网络升级方案。SiteView ECC系统中有接收SNMP TRAP、SYSLOG网络事件的功能。SiteView ECC系统的SNMP Trap模块使SiteView ECC系统可以接收任何网络设备的Trap信息,如路由器、交换机等,使得企业可以更方便的了解设备event。SiteView ECC在接收到网络事件后,可以按照相应的格式进行分析,从而得到相应的事件信息。
针对SNMP TRAP,它主要包括以下的信息:
企业: 网络事件的企业对象标识符
代理地址: 发生网络事件的SNMP代理地址
TRAP类型: 发生事件的标准类型(0~6)
特定代码: 发生事件的厂商特定类型(TRAP类型=6)
时间戳: 发生事件时代理的启动时间
对象标识符: 发生事件的对象标识符
标识符对应值:发生事件对象标识符的值
针对SYSLOG,它主要包括以下的信息:
时间戳(TimeStamp): 发生事件的时间
事件来源(Facility): 发生事件的设备
事件程度(Severity): 事件的严重级别
事件描述(Textual Description): 事件描述信息
根据上面的不同信息,SiteView ECC提供不同字段的查询报表,做到报表的任意定制。
另外,SiteView ECC不仅可以接收设备Trap信息,也可以接收其他网管系统软件的Trap信息,如HP OpenView、IBM Tivoli、CiscoWorks2000等。同样,SiteView ECC也可以向OpenView、IBM Tivoli、CiscoWorks2000发送Trap信息。通过这种方式SiteView ECC可以和OpenView、IBM Tivol、Cisco Works2000等网管软件无缝集成起来。
5、异常状况管理
对于网络设备的异常状况,游龙SiteView ECC可实现每次触发事件功能、SiteView ECC、通过定义(例如根据事件的来源、类型、报警级别等)实现对事件的过滤和分析、按照设置,新生成的事件可以自动识别前面的相关事件等进行管理。
1、每次触发事件,系统自动将触发情况立即记录到相关的历史记录中,同时将此信息记录到事件报告中;每次触发形成事件报告(系统自动生成事件编号,时间等),并将相关人员的处理报告进行汇总,可以由集中应用监控平台的维护人员根据需求进行对各类事件的类型的制定和分类,可以实现对事件的过滤及分类。
2、SiteView ECC能通过定义(例如根据事件的来源、类型、报警级别等)实现对事件的过滤和分析;可以按照事件的关联设置功能,自动区分和抑制重复事件,减少系统负载。
3、SiteView ECC可以按照设置,新生成的事件可以自动识别前面的相关事件,从而直接反应当前的最新状态,管理员不被过时的信息所干扰。例如在PING某一地址时,事件报告说PING不通,当通了以后,此事件被自动更改其属性为恢复(或通过),并在历史记录和事件报告中记录。
4、网络设备出现故障时网络设备会发出异常日志,帮助网络管理人员及时接收、发现异常日志。配置发生改变时及时报警;正常情况下,当网络设备投入使用后网络设备的配置是不会被改变的,除非有网络改造。所以正常情况下的配置改变很可能是黑客攻击造成的,而及时发现对抵挡黑客进攻很有帮助。
网络环境包括各种网络资源(路由器、交换机),硬件系统(UNIX、PC服务器),数据库、各种应用系统及其它设备,为了能够集成管理在分布式环境中的所有上述资源,游龙建议采用SiteView ECC分布式网络拓扑功能。SiteView ECC分布式网络拓扑功能可直观显示生成的网络拓扑图;实现对网络中节点状态的监测,如主机系统、网络设备的运行状态及故障原因等等;实现网络性能的监控及故障报警,如定义故障级别,根据故障级别实行故障的分级处理。
作为一个网络管理系统,管理员希望所见到的管理界面是现实世界对象的真实反映。通过SiteView ECC,网络管理人员能够看到整个运营网络系统的网络拓扑结构,包括各个分布地区的子网、各个子网之间的网络连接关系、及其每一子网上的资源。经过网络拓扑结构的生成后,可以在拓扑图上看到整个网络的拓扑结构图,并能直观地看到各个资源的状态变化。
同时,对于企业网络中的各种应用系统,SiteView ECC也可以通过Visio绘制的逻辑拓扑图反映应用系统的运行状况。如,SiteView ECC可以通过网络应用拓扑图对OA系统进行直观的监测和管理。
通过对网络节点状态的轮询,SiteView ECC可以实时监控网络中所有资源的状态。拓扑图上所显示的各被管对象的颜色可以直接反映出其内部被监控对象的状态。如绿色表示用户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误。当我们从表面看到这些状态信息后,利用与数据库的关联功能可以进一步进入被管对象内部,详细查看到底是什么因素造成该设备的状态变化。
SiteView ECC——拓扑列表
SiteView ECC——某大型企业拓扑展开菜单模式
1、直观的拓扑自动发现和轮循
自动发现是SiteView ECC拓扑中非常重要的一个功能,它能够自动识别设备类型,包括各种服务器类型、路由器、交换机、等等,以及它们之间的关系,并且自动将它们存储到公用对象库中对应的类中。网络管理人员通过图形管理界面能够直观的查询网络拓扑关系。自动发现顺序有三种发现方式,包括ICMP、SNMP、CDP、其中ICMP是按照IP地址,将子网内的各个主机节点逐一发现,它的发现内容最全面,但是耗时也是最长,视子网内主机数量而定。SNMP和CDP主要是用来搜索网络内的路由器、交换机等网络设备。
拓扑自动发现可以分为两个阶段。SiteView ECC拓扑自动发现第一阶段是勾建网络基本框架阶段——从某一路由器出发,将与该路由器相连接的子网和其他路由器搜索出来,构建出网络框架。SiteView ECC拓扑自动发现第二阶段丰富完善网络结构阶段——从已经搜索出的网络设备继续延伸搜索,包括子网中的主机,直至将整个网络拓扑图搜索完整,全面呈现网络拓扑结构,时实显示网络设备、服务器和PC机的运行状况和资源状况。
通过对网络设备的运行状况进行监测,网络管理人员可及时了解设备资源使用情况,并可通过设备面板图对网络设备进行远程操作。SiteView ECC全面支持SNMP V1、V2和V3,轮询代理每隔一定的时间就向每一发现的设备发出IP Ping请求。在设备作出响应或停止响应时,轮询代理将向SiteView ECC服务器发送信息报告设备的状态变化。轮询代理也可以轮询任何SNMP变量的值以确定有响应设备的内部状态。
SiteView ECC对网络设备监测和管理的内容:
1、 关于交换机:端口信息、端口使用情况(BPS)、端口使用率(%);端口字节/包状态、以太帧错误;网桥具体信息等。
2、 关于路由器:端口信息、端口使用情况(BPS)、端口使用率(%);地址表、路由表、ARP表等。
3、 Cisco的详细信息,如基本环境、环境信息、cpu利用图标、Free空间内存图标等。
SiteView ECC通过自动发现和轮循,可自动生成网络拓扑图,完整展现其网络的拓扑结构。通过自动拓扑图,网络管理人员可直接查看服务器或网络设备的运行状态、性能状况,对网络的资源状况有一个总体全面的了解。
SiteView ECC——某大型企业机房拓扑图
2、SiteView ECC网络应用拓扑图特点
SiteView ECC的网络应用拓扑可以直观反映企业系统基础架构及其应用的运行状况,与其它的网络拓扑不同,它的拓扑节点上不仅可以表示为一个实际的司网络设备,如服务器、路由器、交换机、防火墙等,还可以表示企业一个实际的应用服务,如WWW服务、数据库服务、邮件服务等。如果拓扑节点所对应网络设备或应用服务发生故障,则该拓扑节点以红色或黄色标识。通过网络拓扑图,网络管理人员可以迅速发现哪个网络节点发生故障,并进行处理。
SiteView ECC适用于各种复杂的网络环境。不管是简单的局域网,还是遍布全国的庞大的广域网或存储局域网。SiteView ECC可根据网络管理的需求,生成各种相应的网络拓扑图,并且可以十分方便地在各个拓扑图间进行切换,从而使复杂的网络信息系统管理工作变得直观和轻松。
SiteView ECC网络应用拓扑绘图模块是在微软的Visio2003基础上开发的,安装后经过环境参数的配置,就会出现在Visio2003的菜单中。由于Visio2003已经是微软开发的一种非常成熟强大的绘图工具,所以将SiteView ECC的拓扑插件集成在Visio2003中,更加可以发挥强大的所见即所得的绘图功能。并且SiteView ECC自带超大型图库,能逼真的标识不同厂家、不同型号的服务器和网络设备。
先进的可视化功能
SiteView ECC的网络拓扑功能使企业繁杂的网络信息平台运营维护管理工作变得直观和方便。网络管理人员通过一个基于浏览器的用户界面,可以一目了然地了解整个企业异构系统、网络设备及其应用的运行状况。SiteView ECC不仅可以用来保证企业网络基础架构的高可用性,还可以用来追踪各种关键网络应用的运行情况,查看各种设备之间的关联并在复杂的IT架构中漫游,从而实现方便高效的管理。
适用于各种复杂的网络环境
不管是简单的局域网,还是遍布全国的庞大的广域网或存储局域网,SiteView ECC都可根据你的需求生成各种相应的网络拓扑图,并且可以十分方便地在各个拓扑图间进行切换,从而使复杂的网络信息系统管理工作变得直观和轻松。
后台数据与网络拓扑的完美结合直观反映整个系统运行状况
网络拓扑图一旦生成,SiteView ECC会自动查找、添加与相应的服务器、网络设备、IP地址、端口相关的各种监测参数。单击网络拓扑图上的任意组件,与该组件相关的监测参数的运行状况都将直接显示出来,点击任意监测参数可以查看该监测参数的历史数据和实时报告。网络拓扑图中任何组件的监测参数中只要有一个达到了事先设定危险或错误的条件,该组件颜色就会变成相应的黄色或红色,系统管理人员从网络应用拓扑图可一目了然地了解整个网络信息平台的运行状况。
面向应用的网络拓扑
SiteView ECC的网络拓扑功能不仅可以用来直观地反映服务器、网络设备等网络基础架构的运行状况和网络状况,而且可以直观地显示数据库、Mail、FTP等等各种网络应用的运行情况,从而帮助的系统管理人员从应用层面确保整个网络信息平台的正常运营。
3、SiteView ECC网络应用拓扑图示例
SiteView ECC为企业提供的拓扑图形式非常灵活,网络管理人员可以根据自己的需要生成服务器拓扑图、网络拓扑图、应用拓扑图等不同类型的拓扑图,同时还可以对这些拓扑图进行图形编辑、样式排列等,从而可以直观地反映网络的各种运行状况。
1、SiteView ECC网络拓扑图
SiteView ECC强大的网络拓扑功能可以自动收集所有基础架构元素的多方面信息,并通过基于浏览器的可视化图形和动态直观视图让系统管理人员一目了然地了解整个系统的运行状况。先进的事件关联和根源分析功能还能够将各种事件联系起来进行分析,以便快速隔离并解决问题,从而降低运营成本,提高IT效率。
SiteView ECC——实时拓扑图
2、SiteView ECC服务器拓扑图
SiteView ECC不仅可以用来保证网络基础架构的高可用性,还可以用来查看服务器之间的关联并在复杂的IT架构中漫游,从而实现方便高效的管理。SiteView ECC提供了模仿实际环境的直观视图,使IT经理和系统管理员及时了解服务器情况的变化并跟踪性能问题,随时显示整个IT资源的最新信息。
SiteView ECC——服务器拓扑图
3、SiteView ECC应用拓扑图
SiteView ECC的系统应用拓扑管理模块可以对中间件、数据库、电子邮件、Web系统、DNS系统、FTP系统、商务应用等进行全面深入的监测管理。系统管理人员可根据需要制作并发布逻辑拓扑图,通过基于浏览器的可视化图形和动态直观视图实时了解整个系统的运行状况,迅速定位系统故障。
SiteView ECC——应用拓扑1
SiteView ECC——应用拓扑2
SiteView ECC故障管理系统是管理骨干网和子网络的设备、网络和业务所出现的故障;帮助网管人员采集、统计和分析来自网络各方面的报警信息和故障信息,准确预警、定位和解决网络中的故障。
SiteView ECC——报警配置结构图
原则上讲,所有支持SNMP协议的网络设备的故障与报警都能被SiteView ECC所管理。SiteView ECC作为统一的报警平台,收集所有网络设备所产生的SNMP报警报文信息。在各节点的SiteView ECC报警控制中心统一处理该节点范围的报警和故障;在网管中心的报警控制中心统一处理各节点的故障和报警信息。
系统的故障源有两种,一种是网络管理系统通过对网络性能的数据采集,主动发现系统的性能故障,另一种就是设备发生故障后主动报告给系统。报警级别分为紧急报警、严重报警、一般报警、提示报警、未确定报警等,并可根据用户需求进行自定义。
SiteView ECC故障诊断与管理功能可以根据用户设定的条件,当故障发生时发送警报至相关人员,让管理者能够及时了解系统发生的故障及其故障原因,并通过系统设置,自动恢复系统的正常状况。
l SiteView ECC告警系统能接收网络设备(路由器、交换机和VOIP设备等)以SNMP报文格式发送的Trap事件;
l SiteView ECC告警系统能接收IPNET系统的其他服务所产生的事件,如性能服务产生与性能相关的事件,流量服务的产生与流量相关的事件;
l SiteView ECC告警系统能接收服务器进程、日志等发送的事件;
l SiteView ECC告警系统能接收应用系统Web、Mail、OA等引发的事件通知;
l 第三方网管前转的标准告警信息。
告警系统同时采用轮询机制来主动的发现网络事件,可以发现如“系统宕机”等的故障,以保证事件的完整;
1、丰富的告警发送方式
SiteView ECC提供短信息、语音、声音、远程声音、邮件、脚本等多种方式及时发出警报。可以及时通知网管人员发现、定位和处理故障,让系统的管理从被动变为主动,可有效地预防故障发生,也可在故障发生时快速进行定位,及时处理好故障。
SiteView ECC包含多种报警方式,分为3大类:
1. 常用报警:声音、Email、手机短信(Web方式,GSM方式)、语音电话等。
2. 自动恢复(脚本)报警、禁止/启动监测报警:提供报警后的处理方法,如重启机器、重启服务、关闭进程等。
3. 传递(POST、SNMP)报警:对故障进行自动处理,提供报警接口,将报警发布到其它报警系统。
4. SiteView ECC6.2版本具有更丰富的报警事件概念,报警日志中详实地记录了每个故障发生、结束时间,丰富的时段性列表更方便管理员了解网络的运行情况。
SiteView ECC——报警日志图示
2、报警控制台
关于警报和故障的管理,SiteView ECC主要通过报警控制台来进行。SiteView ECC报警控制台包括四个方面:配置文件及接口数据、故障事件搜集、故障事件过滤、告警呈现。
1、配置文件及数据接口
SiteView ECC可以提供不限量的报警条件设置,即在条件成立的情况下,同一个警报允许同时符合N种条件。丰富的报警设置允许自定义报警的条件、升级、相关性以及报警分组,帮助管理人员快速查找报警发生的原因。
对数值信息的数据,管理人员可设置一个阈值,使得当数据超过阈值时产生报警信息。报警阀值设置可为企业提供手工输入阈值的功能,用户可输入报警的上限阈值和报警的下限阈值。
|
SiteView ECC报警功能设计 |
功能详细说明 |
优势和好处 |
|
实时报警方式 |
颜色、SMS, EMAIL, 声音等 |
确保报警及时送达相关人员 |
|
警报级别分为错误、警告和正常 |
监测参数可按自行设定条件分为正常、警告和错误三个级别,并可按事先设定的警报发送条件和方式自动发送警报 |
自行定义警告、错误标准 |
|
两种方式发送SMS |
一种是Web方式,另一种是无线Modem方式 |
确保报警及时发送 |
|
报警后自动启用/禁用监测器 |
可设定当一个报警发生时,启动或禁止某个或某几个监测 |
避免重复报警 |
|
SNMP |
将报警信息通过SNMP发送至SNMP陷阱 |
与其它系统集成 |
|
组报警 |
不同监测参数可自行设定不同的报警条件,将成百上千个监测参数分成不同的组分别进行报警 |
方便分类管理 |
|
时段配置 |
可在不同时段将报警发送给不同的值班人员,也可在不同时段取消或开启报警 |
方便值班人员的工作安排 |
SiteView ECC提供了十分丰富和完善的报警策略供用户选择,可根据自身系统的特点灵活制定自己的报警策略。
2、故障事件搜集
系统的故障源有两种,一种是网络管理系统通过对网络性能的数据采集,主动发现系统的性能故障,另一种就是设备发生故障后主动报告给系统。事件收集一方面接收被管网元设备发送的TRAP信息和Syslog信息,另一方面根据采集策略的定义,接收阀值超过定义值的性能故障事件。
SiteView ECC将监测结果设置为3种状态、正常、危险、错误。危险和错误状态表示系统可能出现故障,需要处理。企业的网络管理人员可以针对危险或者错误状态设置报警条件、发送方式。当监测结果为危险或错误状态后启动报警模块,报警模块根据报警规则判断是否需要报警,如果需要报警根据预设的报警方式发送报警信息。
报警规则分三种:
l 连续报警
l 一次性报警
l 跳跃报警
3、事件过滤
主要包括对事件的过滤和关联。一方面将无关事件和重复事件去掉,另一方面完成同一个故障的发生和结束事件的匹配工作,以便确定故障源。
故障事件上报过滤
SiteView ECC故障管理模块提供符合企业网络的故障管理能力。所有故障从设备通过事件采集进程转发到网管工作站时被转换为统一的信息格式,并重定义故障的级别和类别。对于故障管理模块收集的告警信息必须通过设定的过滤器和阀值条件,将各地市网络所关心的告警和故障信息转发到地市网络故障管理模块。
故障事件呈现过滤
SiteView ECC故障管理模块能够按照网段、地理位置和设备类型以及其他用户自定义的条件管理故障事件在管理终端上的呈现。可以按照各IP网段察看故障或者分类察看和管理个节点的故障和告警;按照业务和工作职责分配来管理全网的故障,如察看CISCO设备的故障事件等等。
故障事件入库过滤
SiteView ECC故障管理模块能够按照告警的级别、告警的类别和告警源的IP地址,对接收到的告警信息进行入库过滤,只有符合需要的告警信息才会被存储到数据库中,以保障故障管理模块数据存储和查询的效率。
故障事件确认
SiteView ECC从父子依靠关联、重复次数阀值关联、故障(报警事件)确认等方面来确保警报的高度准确性,有效地避免重复报警和误报。SiteView ECC在发现系统异常后,可以根据网络管理人员的设定发送报警。
4、告警呈现
当确定网络中发生了故障时,可以采取在界面上用不同颜色显示,发出报警声音,发出寻呼、手机短消息或电子邮件的方式通知网络管理人员。具体采取何种报警方式可以由企业配置,网络管理人员配置的信息包括确定是否采用声音报警和(或)其他特殊报警方式,选择报警声音文件,确定寻呼、手机和Email发送的次数和间隔时间。主要包括报警历史查询、报警阈值设置、报警确认与清除功能。主要包括告警历史查询、告警阈值设置、告警确认与清除功能。
告警历史查询设置查询条件进行历史告警数据的查询,查询条件包括告警级别、告警类型、告警状态(是否确认)、告警发生设备等。
对数值信息的数据,系统可设置一个阈值,使得当数据超过阈值时产生告警信息。告警阀值设置可为用户提供手工输入阈值的功能,用户可输入告警的上限阈值和告警的下限阈值。
告警确认表示该告警已经被认识并在进行处理,告警确认功能会在数据库中记录下确认人的信息,以便以后查询。只有确认过后的告警才可清除,清除后的告警将不会在告警列表中显示。
父子依存关联报警 如出现A、B、C、D等警报,只报告A 比如:一台服务器无法Ping通时,只发出Ping不通的警报,同时暂停对该服务器所进行的所有其它监测。
报警值班人员管理 在不同的时段,将报警发送给不同的值班人员
报警事件确认 当某个监测参数数值达到报警条件时并不立即发出警报,而是立即重新测试该监测参数,并可同时自动调整监测频率,如数据正常则不发出警报,否则发出警报。这样可避免系统对一些临时性故障发出警报。
报警升级 当报警出现一定次数后,报警自动升级,采用不同的发送方式,发送给新的系统管理员等。
重复次数阀值关联报警设置 If count (A) occurs in time interval [t1, t2], then generate C. 比如:第一次报警,通知经理和一线网管工程师,故障发生 第二,三,四次报警,只通知一线网管工程师,故障处理中 第五次报警,通知经理和一线网管工程师,故障处理时间太长,引起管理层对故障处理的重视
3、准确的故障定位
该功能可实现快速的实现故障定位,能一步定位到故障发生的设备。在报警监控界面中通过双击某报警条目,在拓扑显示图中就会定位报警设备所在的子图,并以醒目标记——不同的颜色来显示报警发生的设备,从而为企业定位故障点节省了时间。
在系统经常出现的问题中,有一些是属于流程性连锁故障,需要按照一定的顺序和特定的流程,一一去排除,这些重复性操作繁杂而没有效率。SiteView ECC故障连锁诊断功能,可以很好地解决这一问题。
系统工程师可将常见故障的连锁诊断过程做成Visio图发布到SiteView ECC系统中,一旦系统出现上述故障,SiteView ECC将自动启动连锁诊断功能,帮助管理人员逐一排查故障,迅速发现、定位故障。
SiteView ECC——零时定位系统故障
例如:用户自定义一个业务流程连锁诊断模块,该流程诊断分为四个步骤:网络设备连通性、WWW服务、中间件服务、数据库服务。如果该业务流程出现故障,SiteView ECC会自动启动连锁功能,按照这一顺序依次诊断,快速查明故障。
4、故障事件处理
针对系统中出现的故障,系统管理人员可以及时通过故障确认、故障自动恢复、故障连锁诊断等方式作出处理。系统管理人员更可以将各种故障处理的步骤和方法写入系统中,形成知识库,这样可以有效帮助其它系统管理人员及时、有效地处理故障。这样其它管理人员遇到该故障时,就可按故障处理知识库的建议逐步尝试处理故障,从而使故障得到及时的处理。同时可以提高整个运维团队的系统管理水平。
故障确认
当系统发生故障时,SiteView ECC会自动重新执行一次对该系统组件的数据查询,以确认确实是发生了故障,同时,SiteView ECC故障确认按钮会凸起来,相关系统管理工程师可以将处理故障的方法、过程等相关信息填入故障确认注释框里,SiteView ECC会将该信息自动进行存储。以后遇到同类型的故障时,网络管理人员可以通过查看故障确认日志获得相关参考信息。
报警确认表示该报警已经被认识并在进行处理,报警确认功能会在数据库中记录下确认人的信息,以便以后查询。只有确认过后的报警才可清除,清除后的报警将不会在报警列表中显示。
SiteView ECC的故障确认功能能避免系统管理人员进行重复性操作,提高对故障的处理速度和水平,帮助系统管理人员及时沟通故障处理情况。故障处理日志功能,更能为其它网络管理人员提供技术指导和参考,有效地提高系统管理人员的工作效率,为信息平台的稳定运行提供可靠的保障。
故障自动恢复
SiteView ECC的故障自动恢复功能对网络管理人员具有非常重要的意义。当出现一个临时性的标准故障时,自动恢复功能就会自动执行指定脚本或POST数据到指定的CGI程序,使服务恢复正常。比如,把一个挂起的服务器操作通过自动启动功能而使它重新运行;把一个耗费系统过多资源的进程停止或者重新启动设备。
|
SiteView ECC故障自动恢复方式 |
功能详细说明 |
优势和好处 |
|
自动POST数据清除故障 |
对于可能经常出现的故障,网络管理人员可事先编译好POST数据,一旦满足了预先设定的条件,系统将自动发送POST数据到指定的CGI程序对故障进行自动处理 |
可实现远程的故障自动处理,从而确保系统24X7正常运行 |
|
自动脚本执行恢复故障 |
当出现一个临时性的标准故障时,自动恢复功能就会执行脚本,使服务恢复正常。 |
及时快速解决故障问题,降低运营风险,减小损失,节约故障处理时间 |
SiteView ECC能够自动生成各种组合的相关监测对象实时的或基于天、星期、月的不同报告和报表。这样,网络管理人员就可以根据历史数据来分析网络的运行趋势,找到隐藏的性能瓶颈,并对IT系统的计划、扩容和升级提供战略帮助,为IT系统管理的长期规划提供数字依据。
SiteView ECC通过Web报告模块提供给管理者实时报告和计划报告,报告可以通过Email发送到管理工程师指定的邮箱。SiteView ECC报告内容分为4节:
1、状态的统计
该节给出相应监测状态的统计和最后一次的监测状态,SiteView ECC监测状态分为3种:正常、危险和错误。
2、数据的统计
该节给出相应监测参数的最大值、最小值、平均值和最后一次测量值。并提供图形和数据表格显示。
3、危险数据的统计
该节给出相应监测状态为危险的数据,以供用户查询。
4、错误数据的统计
该节给出相应监测状态为错误的数据,以供用户查询。
功能列表
|
主要功能 |
功能详细说明 |
优势和好处 |
|
丰富的可定制功能 |
用户可随意组合任意监测参数、任意时间段的报告 |
管理报告可满足不同层面对报告和报表需求 |
|
数据保存时间 |
可根据用户的实际情况自行设定数据保存的时间,默认设置为110天 |
可根据需要确定数据保存时间 |
|
基于Web的监测报告 |
方便用户随时查阅 |
用户无需购买数据库 |
|
多种报告类型 |
报告分为正常报告、错误报告和警报报告三种类型 |
可满足对报告不同的需求 |
|
报告可以通过Email方式自动发送 |
可以将自动生成的报告定期发送到指定邮箱 |
方便远程管理 |
|
可以定义报告的标题和内容 |
报告的标题和内容可自行设定 |
便于对报告进行管理 |
|
报告可以显示监测信息详情和时间刻度 |
报告显示监测参数状态图表和数据列表 |
便于查看监测的详细情况 |
1、丰富的报表类型
SiteView ECC可提供各种网络管理报告,其报表系统功能强大而完善,是基于Microsoft .NET平台,采用最新的Portal技术,允许用户自定义报表内容,每个报表均由不同的模块组成,每个模块根据定义的属性又能自动生成不同类型的图形,图表,数据表等。由于采用了最新的Portal技术,报表中每个模块可以随意移动自己的位置,包括左右位置和上下位置,这种灵活的方式极大的提高了SiteView ECC报表的可用性和实用性,通过排列组合各种报表模块还可以创建定制内容的报表,丰富了报表类型。
SiteView ECC报表系统后台使用SQL Server2000数据库,SQL Server2000数据库强大的功能可以支持SiteView ECC异常迅速的生成报表,同时使用了SQL Server2000数据库后,监测数据可以保存更长时间,数据的计算,统计,分析功能也都有相应的增强。
SiteView ECC报表系统提供了多种形式的报表,默认有Trend报表(趋势报表)、TOP N报表、Health报表(健康报表)和Prediction(预测性报表)四大类,除此之外,通过SiteView ECC的Portal功能,用户还可以定制自己的报表类型。
Trend报表表明一段时间内的趋势情况。Trend报表通过八种类型的图形表现选定的数据在一段时间内的运行情况。下面详细介绍这八种类型:
|
图表类型 |
说明 |
|
线图
|
线图以连线的方式连接各个监测点,通过3D线图可以直观的察看到选定参数的运行情况。. |
|
填充线图
|
填充线图以连线的方式连接各个监测点并填充监测点至X轴的区域,这样的填充图可以更清楚的反应数据。 |
|
百分比占用图
|
百分比占用图表示以所有参数为100%,计算每个参数在其中所占比例。这是另一种观察数据情况的图表方式。 |
|
柱图
|
柱图将每个监测数据点至X轴画出3D的柱形。每个参数以不同颜色的柱表示。通过柱形的高低情况分析数据。 |
|
堆积柱图
|
堆积柱图将每个参数的值堆积画图,与柱图的分别画柱不同,堆积柱图将参数画在一个柱上。 |
|
百分比柱图
|
百分比柱图与百分比面积图的概念是一样的,都是把所有参数计为100%,然后再计算每个参数在其中所占的百分比。 |
|
饼图
|
饼图通过图饼的方式将每个参数所占用的百分比直观的表现出来。 |
|
数据表
|
数据表将会列出所有监测点的数据,错误数据和警告数据将分别以红色和黄色标示出来。 |
2、Top N报表
Top N报表列出同一类型监测中的前N项排序表。通过TOP N报表可以很容易的将数据排序输出,根据排序方式的不同可以清楚的查看到数据的好坏情况。Top N报表是分析数据非常好的一种报表形式。Top N报表的形式如下:
|
|
CPU使用率大于80% |
CPU使用率目标50% |
|
上海服务器CPU |
99% |
49% |
|
重庆服务器CPU |
95% |
45% |
|
广州服务器CPU |
86% |
36% |
|
深圳服务器CPU |
85% |
35% |
|
北京服务器CPU |
83% |
33% |
|
美国服务器CPU |
81% |
31% |
通过TopN报告,你可以了解目前网络上运行最好或最差的网络元素,以及它们离目标的距离,为解决网络故障或升级网络提供数据支持。
SiteView ECC——TopN报告设置选项
SiteView ECC——TopN报告
3、Health报表
Health报表用于察看服务器,路由器或交换机等设备以及各种应用系统的健康情况。SiteView ECC建立了一个打分系统,为不同监测组件建立不同的分数,如CPU使用率超过80% 2分,内存使用率超过50% 3分等,最终整体给一个服务器打一个分数,分数越高系统性能越差。
4、预测报表
预测报表是在Health报表的基础上,根据Health报表的运行情况,对各项参数值今后的运行情况生成一个预测值。预测报表可以根据之前监测的运行情况统计分析以后得出每个参数今后的运行情况值,通过预测报表提供的预测值可以提早监控容易出问题的参数,通过预测报表还可以提早对系统进行升级维护,从而防止意外的服务停顿事件,比如通过磁盘预测参数可以判断出何时磁盘会用完,这样就可以提早几天增加磁盘的容量从而避免因这种可预知的错误而导致的问题。以上只是列举了磁盘的一个例子,针对每个参数的预测值,都可以相应的采取不同的措施,从而避免很多问题,增强了系统的稳定性。
预测报表主要以数据表和图表的形式表现,如下所示:
预测报表
2、性能分析报告:实时报告
SiteView ECC的实时报告功能可以为指定的监测器生成实时的报告,根据监测器监测到的数据进行统计和分析,在报告中显示监测数据的最大值、平均值和最近一次监测的结果,并可以按照不同的要求生成线状图、曲线图等不同的图形,以便网络管理人员随时查看各个监测器的监测数据。
SiteView ECC实时报告可以帮助管理员快速的对某个监测参数的监测数据进行查看、分析和统计,进而对监测设备的性能和运行状况做出判断。实时报告不但可以根据最近一个时间段的监测数据生成报告,而且允许的管理员指定从以前的某个时间到最新监测的时刻之间生成报告。由于SiteView ECC的报告系统使用了专业级的数据库保存数据,所以可以查询数据库中的所有的历史数据,而且可以根据不同的需求快速创建一个较长时间段的报告,大大提高了网络管理人员对监测数据进行分析、统计的效率,进而帮助管理员对可能出现的故障进行判断、预测和解决。
SiteView ECC——实时报告的效果图
3、性能分析报告:历史报告
SiteView ECC所提供的历史报告的功能可以根据管理员的不同层次的管理需求,定制不同监测参数的组合,选择任意的监测时间段,自动生成符合要求的性能分析报告,并将生成的历史报告发送到指定的邮箱。
SiteView ECC的历史报告功能十分强大,管理员可以根据不同的需求指定生成任意时间段的历史报告,而且可以选择自动生成历史报告的时间周期,根据生成历史报告的时间周期的不同,可以把历史报告分为日报、周报、月报和年报;而且,为了满足多层次的分析、统计的需求,SiteView ECC的历史报告功能还允许管理员选择多种不同类型的监测参数组合在一起,对这些指定的监测参数的历史数据进行分析、综合和汇总,生成符合特定业务要求的历史报告。
把不同类型的监测参数组合生成历史报告,便于管理员进行不同需求的统计和分析,例如可以对某个监测设备的所有监测参数进行统计分析,或者是对同类型的监测设备的具体某个监测参数(CPU利用率、Memory使用情况等)进行对比、分析,或者是对某个设备出现故障前的某个时间段的监测参数进行统计分析等。生成的历史报告还可以通过配置模块的相关配置,自动发送到管理员的邮箱,帮助管理员及时了解和统计监测设备的运行状况和历史信息。
SiteView ECC——组合查询报警日志
历史报告的定制条件十分灵活、多样化,通过生成不同类型的历史报告,可以使管理员全部掌握监测设备的运行情况、性能参数、历史故障以及状态趋势,并对网络中的设备的现状和扩容提供有益的参考和依据。
游龙科技公司给网络管理软件树立了更开放、更自动、更智能、更全面、更实用、更好用的新标准。
更开放——作为新一代的网络管理软件,SiteView ECC支持NT, Unix、Solaris、AIX、FreeBSD、Unixware、HP-UX、Linux、OpenServer等所有主流操作系统,适用于各种异构环境。软件采用高度模块化设计,提供开放式API接口,使二次开发和与其它网管系统的无缝集成,变得更加轻松简单。
更自动——数据采集、分析、报警、报告、故障恢复全部可以按任务计划自动自行,真正实现机房无人值守,大幅度降低系统管理人员的工作强度。
更智能——事件关联、连锁诊断、网络应用拓扑等功能,构成了无处不在的故障推理引擎,帮助系统管理人员快速定位故障、迅速发现故障根源。故障自动恢复功能更是通过自动启动各种脚本程序,从而使系统恢复正常。
更全面——SiteView ECC采用分布式架构,面向企业的各种应用,内置了100多种监测器。监测对象从网络设备到服务器资源,从数据库性能到企业商务应用,并可根据用户的需求定制专门的监测器。真正实现了对网络基础架构及其应用的全面深度监测,为企业提供真正业务应用层次的服务水平保证。
更实用——需要重复两次以上的操作都可以通过软件来实现。SiteView ECC采用模拟系统管理员操作的方式采集数据,监测范围覆盖系统管理人员的全部日常操作,而对系统本身运行影响甚微,是一套对系统管理人员真正非常有用的网管系统。
更好用——无需在被监测服务器上安装代理、友好的中文浏览器界面,使系统的安装、实施、使用更加简单方便,只需具备基本网管常识,无需专门培训,就可轻松使用SiteView ECC进行信息平台的运营维护工作。
1、全中文Web界面
SiteView ECC针对国内用户的基本需求特征而开发,使得SiteView ECC在操作上更适合国人的使用习惯。产品采用B/S结构,用户可在任意地方通过IE浏览器进行浏览和操作。游龙科技多年来积累了丰富的系统开发的知识和经验,推出的SiteView ECC管理软件,采用引导式全中文Web界面,不仅功能完善、操作简便,而且也充分考虑了系统的实用性,SiteView ECC采用B/S结构,用户可在任意地方通过IE浏览器进行浏览和操作。
用户在使用过程中能明显感受到SiteView ECC以下几点优势:
1、更符合国人的操作习惯; 2、功能强大,监测全面,基本满足系统管理员对系统运维的需求; 3、界面美观,应用拓扑和服务器、网络设备拓扑方便实用; 4、零学习周期,安装、使用方便,购买、实施成本较低。 5、监测全面,操作简便。 SiteView ECC内置数百种监测器,通过模拟系统管理人员的日常操作,对信息平台的异构基础架构及系统应用进行7X24的自动化、智能化监测和管理。
SiteView ECC采用十分友好的引导式全中文Web界面,每个页面有明确、单一的功能,提示用户本步及下一步需完成的操作。系统管理人员只需具有基本网管常识,无需专门培训,就能熟练地操作使用。
SiteView ECC——主界面
集中非代理式监测将是网管软件今后发展的方向, 因为其无需在被监测对象上安装任何代理软件,对被监测对象的性能影响甚微,系统的维护和升级都十分方便。克服B/S应用系统的界面操作以及传输性能低的缺点,采用增量传输和局部刷新的技术,最高降低应用程序的网络传输压力,达到用户满意的响应速度,轻松实现对多种操作平台的网络环境进行统一集中管理。SiteView ECC早在前几版本就具备了该功能特性。
从一台监测主机同时监测几台到几百台服务器,在被监测的服务器上无需安装任何代理软件即可全面监测服务器的各种资源,包括CPU、内存、服务进程、文件和磁盘分区等。这种监测方式对被监测服务器的性能几乎没有任何影响,也可以避免使用代理软件而引起的一系列潜在安全问题。相对于需要安装代理软件的其他网管工具来说,可以节省大量的软件安装和配置时间,并节省平时对监测系统的管理时间。
SiteView ECC——集中非代理式监测示图
Win2000/XP/2003环境下可以对NT, Unix,Solaris,AIX,FreeBSD,Unixware,HPUX,OpenServer, Linux等不同平台的服务器进行远程监测,还可根据客户的需求动态定制我们的监测系统,从而满足用分散型经营的大型网络系统自动化、智能化集中监测管理的需求。可监测10种以上操作系统。
例:SiteView ECC运行在Windows2000下,安装在一台Win2000上的SiteView ECC能够以集中、非代理方式监测其它平台的应用和服务,对于客户特殊的操作系统还可根据客户的需求动态定制我们的监测系统。目前可监测操作系统如下:
1、 Windows NT/2000 2、 Linux 3、 英文Solaris 4、 英文AIX 5、 FreeBSD 6、 Unixware 7、HP-UX 8、 OpenServer 9、DigitalUnix 10、 Cobalt 11、 True64 12、 Slackware 13、中文Solaris 14、中文AIX
4、基于先进的.NET平台开发
.NET 平台即 Microsoft XML Web services 平台。XML Web services 允许应用程序通过 Internet 进行通讯和共享数据,而不管所采用的是哪种操作系统、设备或编程语言。Microsoft .NET 平台提供创建 XML Web services 并将这些服务集成在一起之所需。
SiteView ECC以.net开发,采用分布式架构,界面美观灵活、功能强大、操作简便。.NET框架开发技术是当前最为流行的开发平台,通过此平台可以更加灵活的实现系统的部署、使用和更新。.NET 平台允许应用程序通过 Internet 进行通讯和共享数据,而不管所采用的是哪种操作系统、设备或编程语言。而国外的网管系统,则大多采用VC或其他几门综合语言为开发平台,在开发平台上有着本质的不同。Microsoft .NET 平台集系统的开放性和应用的集成性于一体,可满足企业用户网管系统对扩展性、个性化应用及系统升级的管理需求。
基于.NET 平台开发的产品具有如下优势特点:
1)高度的扩展
用户可以使用任意一种.NET支持的语言开发监测器。例如:C# ,VB.NET, C++,Javascript.NET,并集成这些监测器到SiteView ECC新版本V6.2中。
2)随.NET升级而升级
微软公司将再未来10年不断加大对.NET平台的研发投入。SiteView ECC构建在.NET平台上。将获得更大的益处。这种益处将反映在对用户技术的不断升级中。
3)Web服务接口的再开发
对数据的维护,SiteView ECC V6.22采用XML WebService。SiteView ECC6.2公开数据结构,且公开操作接口。用户可更灵活的配置自己的SiteView ECC。
5、极高的应用性、协同性和扩展性
企业分布式网络是一个庞大的系统,都是由很多服务器、网络设备和应用系统组成,分布式大规模网络管理都有一个共性需求,就是希望网管系统使用方便、操作简单,能真正实现各省级节点与总部所有运维人员的协同管理。SiteView ECC网管系统完全满足企业用户的协同管理需求,它能起到ECC(企业控制中心)的作用,具有高度的自动化、智能化程度,极高的可用性和易用性,实施和操作都非常简单。
SiteView ECC可以实现对网络系统中中每个关键应用的监测和管理。游龙科技拥有SiteView ECC的全部源代码,能为企业用户提供高效、快速的二次开发,保证用户网络中各个系统和子网络的稳定运行。SiteView ECC通过分布式架构可以对遍布全国或全省的大型网络进行集中管理,它不仅实现了数据采集和用户管理的分离,而且实现了大规模网络的分层分级管理。它采用便于扩展的Xml数据传输,以便于数据结构的进一步扩展。
SiteView ECC从部署上分为数据监测服务器和Web监控平台,这两部分可分别运行在不同的计算机上。Web监控平台可以注册任意多数据监测服务器,且可以使用多个Web监控平台,依次实现可检测任意多网络设备的功能。
如图所示,系统管理员可通过SiteView ECC中央控制系统将不同的数据采集工作分配给其它的SiteView ECC监测服务器完成,从而大幅度降低SiteView ECC对中央控制系统资源的占用,满足大规模、分布式网络数据集中采集和管理的需求,从而实现整个网管系统的线性扩展。
高扩展性的分布式架构
SiteView ECC V6.2通过分布式架构可以对遍布全国的大型网络进行集中管理,它不仅实现了数据采集和用户管理的分离,而且实现了对大规模网络的分层分级管理。以一个全省网络的管理为例,SiteView ECC可采用分布式架构的部署方式实现全网集中管理,通过一台SiteView ECC监测主机实时采集和分析省中心和各地区SiteView ECC子系统反馈的数据,7X24小时对全省范围内网络核心节点、服务器和应用系统的运行状况进行全面监测,而各地区子系统也可单独管理包括市和县区网络在内的本地区网络。相对于以前各省市网管系统单独管理、存在信息孤岛的情况而言,新版本实现了真正意义上的集中管理。
6、全新的数据采集模式
根据级别和网络规模的不同,SiteView ECC分为三种数据采集模式:单机操作、多机协作、集群与数据同步。对于某个地级市的普通数量监测而言,可以采用单机部署;对于监测器超过2000以上的省级骨干网络,可以选择多机协作的模式;而在全国范围内的网络管理,则通过企业总部以“层级监测和数据同步”的方式实现。这种数据采集模式可以满足企业用户不同区域、不同规模、不同级别管理人员对网络管理的需求,同时也为企业提供了健全的网络管理体制。
对于全国性的网络来说,集团总部的网管系统,本身不承担数据采集功能,它只负责汇总和分析由各省采集的数据;而各省的SiteView ECC网管系统又可以各自独立的承担自身的监测和管理任务。可见,SiteView ECC集群式监测,十分满足自身监测量巨大且跨全国区域的管理需求。而这种“两级数据同步采集”技术非常领先,目前很少有网管系统可以实现这个功能。
多数据采集模式
SiteView ECC综合网管系统数据采集根据用户网络规模的不同,分为三种采集模式:单机操作、多机协作、集群与数据同步。对于普通的数量监测而言,SiteView ECC支持单机部署;对于监测器超过2000以上的用户,可以选择多机协作的模式;对于监测量巨大或者跨越地域的用户,SiteView ECC提供集群式监测。
1)单机操作
对于普通的数量监测而言,SiteView ECC支持单机部署。监测服务器和Web服务器且可以安装在一台计算机上。
单机操作架构图
2)多机协作
对于监测器超过2000以上的用户,可以选择多机协作的模式。多台监测服务器共同实施监测并汇总到Web服务器,并交由Web服务器提供操作界面。
多机协作架构图
完善的数据采集子系统
SiteView ECC数据处理层独立负责完成对数据库的操作,支持多种数据库Oracle、SQLServer、MySql等等。相对于传统的直接数据库操作,SiteView ECC数据独立最大优点是它的安全性,因为用户端只能通过逻辑层来访问数据层,减少了入口点,很多可能受攻击的系统功能都被屏蔽在外。完善的数据采集子系统,完全满足了企业网络对安全性和稳定性的管理需求。
集群与数据同步
对于监测量巨大或者跨越地域的用户,SiteView ECC6.2提供集群式监测。将多个多机协作的数据汇总到一台计算机上。
集群与数据同步架构图
两级数据采集实现海量监测
对于全国性的网络来说,通过安装SiteView ECC全网分布式网管系统,管理人员通过总部或管理中心的虚拟网管系统不仅可以马上了解各省网络的运行状况,而且可以定时接收各省提交的报告统计。SiteView ECC定期就会通过邮件以图表的形式发布给相关的管理者。报表内容包括服务器的各种性能指标、网络设备的各种运行指标、故障发生的时间、故障处理的时间和处理方式、网管人员的响应时间、各种性能数据统计分析等等。
总部或信息中心的SiteView ECC网管系统,本身不承担数据采集功能,它只负责汇总和分析由各省采集的数据;而各省的SiteView ECC网管系统又可以各自独立的承担自身的监测和管理任务。同时,对于警报设置和报表统计,总部和各省网络管理人员都可以自定义设置,得到不同的数据信息。“两级数据同步采集”是游龙针对大规模分布式网络的管理特点,专门潜心研制推出的新一代数据采集技术,这种 “数据同步”模式在国内还处于非常领先地位。
7、强大的企业应用系统监测
企业网络大都是一个庞大的系统,由很多服务器、网络设备和应用组成,SiteView ECC就是要做到对网络中每个关键应用的监测和管理。通过SiteView ECC,管理可以迅速对其应用系统、服务器或设备进行定位,检测各关键应用、业务系统、办公系统、财务系统等运行是否正常。同时,SiteView ECC提供美观的网络应用拓扑图,对应用系统的流程进行逐步监测,当系统异常时,通过颜色变化及时定位和提示应用系统故障。通过深入的应用监测,SiteView ECC真正起到了保障企业用户核心业务系统正常运行的作用,这也是企业用户引进SiteView ECC最成功的应用所在。
针对国内企业的特点,SiteView ECC重点加强了对企业应用的监测,可以对中间件、数据库、电子邮件、WWW系统、DNS系统、文件服务系统、商务应用等进行全面深入监测。SiteView ECC凭借其无与伦比的可伸缩性和面向应用的监测特色,可有效提高企业的IT效率。
关于对业务系统的监测,SiteView ECC主要分三步走。首先,SiteView ECC会以用户身份操作业务流程,实现对业务流程可用性监测;其次,SiteView ECC将对业务流程核心应用程序进行监测,实现对业务流程核心性能监测;再次,对业务流程中各阶段所返回的数据进行监测,实现业务流程全进程全范围的监测。
SiteView ECC——Web应用监测原理图
SiteView ECC——自定义某时间段历史报告
8、友好的用户界面
SiteView ECC监测页面信息丰富、操作灵活。用户可自行创建和拖拽界面的各功能模块,右键快捷功能使用户操作更方便、简单,整个管理界面高度人性化。
SiteView ECC可在多个操作系统上运行,用户可自行创建和拖拽界面的各功能模块,使整个管理界面更加人性化。成功源于细节,SiteView ECC完善和新增了无数的细小功能,使用户操作更方便、简单。具体体现在以下几个方面:
•界面更友好,使用更简单
•向导式界面,简单学习即可轻松上手
•贴近Windows用户使用习惯,添加监测等设备操作右键菜单即可完成
•充分利用操作界面,让用户看到更多的数据信息
SiteView ECC——设备视图树形结构
9、强大的国际化支持
由于采用了最新的.net开发技术,SiteView ECC可以非常方便地提供不同语言的版本,而无需进行大量程序的替换。SiteView ECC可提供日、韩、英、繁体中文等多语言版本。
04年游龙以英文版本开始进军美国市场,SiteView ECC多语言功能的实现将是其05年进一步扩展国际市场的有力武器。由于采用了最新的.net开发技术,SiteView ECC可以非常方便地提供不同语言的版本,而无需进行大量程序的替换。目前,SiteView ECC可提供日、韩、英、繁体中文等多语言版本。
SiteView ECC——英文版本
SiteView ECC系列IT运维系统自问世以来,始终把“易用性、人性化”作为开发的基本原则。
SiteView ECC不到15分钟即可完成安装,友好的全中文WEB界面,只需点击和填入必要的信息就可完成全部安装过程。无需任何专门培训,就可轻松管理你的网络。任何疑问可随时查看全中文帮助或直接与我们取得联系,我们为用户提供7X24本地化的技术支持和服务,解除用户的后顾之忧。
由于SiteView ECC采用集中、非代理式监测方式,安装和实施非常方便。SiteView ECC不到15分钟即可完成安装,无论是小范围内的局域网,还是全国范围内的广域网,SiteView ECC都能在很短的时间里部署完毕,帮助用户的网络系统早日实现自动化和智能化。
SiteView ECC采用全中文、引导式WEB界面,只需点击和填入必要的信息就可完成全部操作,使用十分便捷。另外,SiteView ECC备有详实的帮助说明、产品演示、PPT文稿等,用户无需任何专门培训,也无需掌握大量而复杂的网络术语,既可轻松管理整个网络。
11、周密的安全策略设置
现在网络的安全是各企业普遍关注的问题,SiteView ECC具有周密的安全设置系统,能确保用户安全、放心地进行IT运维工作。充分地考虑到了SiteView ECC网络管理软件使用过程中的安全性问题,SiteView ECC可以对用户进行周全的安全设置,不但可通过用户名、密码进行身份认证,而且还可以设定只允许通过指定的一个或几个IP地址访问SiteView ECC主机。
SiteView ECC对安全进行仔细考虑,详细设计,保证系统安全性,安全体系架构主要包括以下几个方面的考虑:
·登录系统的验证 SiteView ECC在用户登录的过程中,除了进行用户名和密码的验证外,还可以通过配置只允许通过固定IP地址访问,实现IP地址的验证,这样可以最大限度的防止通过挂接密码词典的密码发生器破解用户名和密码。
·配置信息本地的加密存储 SiteView ECC对于用户所作的任何配置信息全部采用EDS的128位加密方法进行本地存储,这样即使SiteView ECC所在的主机被突破,也无法获得其它设备的任何信息(如IP地址、帐户名称等)。
·帐户的安全性
SiteView ECC在运行某些监测时(如CPU,磁盘,内存等),将使用用户提供的帐户,这些帐户可以由用户设置权限(如只读权限、Guest等),以保障被测设备的安全。
·远程登录的加密
SiteView ECC在运行某些监测时(如CPU,磁盘,内存等),将使用用户提供的帐户进行远程登录,这种登录过程可能被恶意截获,形成潜在的威胁,因此SiteView ECC可采用加密的登录过程(即SSH),以保障远程登录的安全性。
12、电信级高可用性
在各种应用软件以及网络运维系统中,电信行业比其他行业要求更全面、更稳定、更先进。因而,从某种角度看,能否适合电信行业企业的使用,决定着一个IT网络运维系统的研发技术水平的高低。
SiteView ECC是电信级的网管系统,使用多种计算机编程语言优势,实现高性能的SiteView ECC网管系统。SiteView ECC为用户提供双机热备份解决方案,可实时备份系统数据和配置信息,确保系统长期、稳定、高效运行。
SiteView ECC支持双机冗余热备份架构,可实现SiteView ECC网络软件的电信级高可用性。若装有网管软件的机器出现问题,系统出现故障就无法迅速查寻、定位,这将会给企业的正常运营造成很大的影响。SiteView ECC完全可以消除用户在这方面的顾虑,它采用双机冗余热备份的方式,不仅将对系统的影响降至最低,而且实时对系统进行备份。备份监测主机实时对SiteView ECC监测主机进行扫描,一旦发现故障,即远程重启SiteView ECC监测主机,同时启动自身的SiteView ECC备份系统,从而有力地保障企业信息平台7X24高效、稳定地运行。
游龙科技的核心管理团队来自包括亚信科技、美国霍尼韦尔公司的资深职业经理人和技术精英,分别具有10年以上中美两地IT行业的工作经历。他们拥有先进的技术,时刻关注国际前沿技术,对网管软件领域具有前瞻性的认识,专注于一个产品,确保了SiteView ECC的先进性、高可用性。
由于SiteView ECC具备了电信级的高可用性,因而也获得了各大电信企业的亲睐,目前SiteView ECC已经为移动梦网(27个省)、中国电信、中国网通、中国联通、中国铁通等成功实施了IT运维系统,并得到了这些电信用户的一致认可。
13、先进的概念,稳定的性能
先进的实体管理概念
在SiteView综合网管系统中,实体管理概念使操作更简便、列表更丰富,它通过列表添加新的设备、应用组,省去了逐一重复的手动添加过程。管理人员通过设置组和子组将不同的地区、服务器、网络设备、系统应用等进行分类管理,以方便查找、浏览信息,以及发现问题等。这些细致入微的设计理念,充分展示了SiteView综合网管系统的专注专业和成熟稳定。通过对实体的监测,该网管系统不仅满足了管理人员快速查找信息、分类管理的需求,而且在操作上更加简便快捷。
性能更高速稳定
SiteView ECC采用增量传输和局部刷新的技术,最高降低应用程序的网络传输压力,达到管理人员满意的响应速度。同时,SiteView ECC也采用便于扩展的Xml数据传输,使用多种计算机编程语言其优势,实现高性能的网络管理。对于大规模网络用户来说,通过SiteView ECC,IT运维人员可从总部实现监测管理全国几千台高端服务器、oracle、weblogic、EMC/HP存储设备、核心交换机等,每天高达400万次数据采集,实现核心电信应用的运维管理。作为全国性的大规模网络管理系统,SiteView ECC综合网管平台在很大程度上实现了电信级用户对网管系统在高负荷情况下高速运行和性能稳定的管理需求。
下述实施环境的构成和配置将视实际情况和软件的升级有所调整。
|
安装运行SiteView ECC™系统要求 |
|
操作系统 |
各种版本的Win2000,2003 |
|
CPU |
P4 3.0G以上 |
|
内存 |
512M以上 |
|
硬盘空间 |
20GB以上,推荐80GB |
|
Internet Explore |
6.0以上版本 |
注:监测参数越多,数据要求保存的时间越长,需要预留的硬盘空间就越大。
|