您现在的位置 : 路由人 > 路由器介绍 > 正文 IP地址冲突 路由人教你更换IP地址 / 如何防蹭网的终极解决办法 / 连接上192.168.1.1没有账号、密码输入框 /

XenServer彻底64位元化,扩增GPU虚拟化与快取技术

2015年初推出的伺服器虚拟化平台新版,不只是市占最高的VMware vSphere,开放原始码的XenServer也是,而且还早了将近一个月,而且版号迈进了6.5。这一版最大的改变是更充分地支援64位元环境,以往受制于32位元环...
 
\
2015年初推出的伺服器虚拟化平台新版,不只是市占最高的VMware vSphere,开放原始码的XenServer也是,而且还早了将近一个月,而且版号迈进了6.5。这一版最大的改变是更充分地支援64位元环境,以往受制于32位元环境的4GB记忆体上限而需额外处理的部分,现在终于克服了伺服器虚拟化平台发展至今,VMware vSphere独领风骚,市占已超过一半,接着是微软Hyper-V紧追在后,Citrix主推的XenServer则又次之,2015年一开春,XenServer和vSphere都陆续发布新版本,前者早在1月正式推出6.5版(先前代号叫做Creedence),现在已经可以下载,后者则在2月宣布了6.0版,但全球发布(GA)的日期未定,很有可能是在3月上半。
 
XenServer是基于开放原始码专案Xen的Hypervisor,所开发出来的商业软体,在6.5这一版当中,该产品开始提供完整的64位元核心架构,用户可藉此运用近期推出的伺服器硬体与作业系统平台,以因应企业与电信服务商等级的资料中心虚拟化环境需求。
 
现在,XenServer也支援Intel处理器所内建的TXT(Trusted Execution Technology)安全防护技术,Hypervisor因此得以具有侦测与避免遭到窜改存取行为的能力,可预防应用系统执行在被骇客侵入的VM上。新版也提供加注资产标签(Asset Tagging)的机制,使各个工作负载能够搭配基于地理位置的标签,让管理者限制它们只能在特定地区来执行。
 
XenServer对于GPU虚拟化的支援也继续延伸,6.5版开始支援Nvidia GRID绘图卡最新推出的vGPU技术,不只是因应桌面虚拟化应用环境的高阶3D绘图应用程式执行需求,还可将所需的运算伺服器的密度提升50%。
 
更彻底支援64位元环境,可完整存取4GB以上记忆体空间,驱动程式的稳定度提升,并可支援更多新硬体装置
 
6.5版XenServer强调采用了64位元的核心架构,对于网路与储存应用的效能,也随之大幅提升。不过,这里所谓的64位元核心架构,指的是Xen Hypervisor在执行时,第一个载入的控制领域(control domain)──dom0,是整个伺服器虚拟化平台管理VM及驱动实体硬体装置的地方。原本dom0是CentOS 5.7版,现在升级到5.10版。
 
 
 
图中的箭头处就是所谓的控制领域dom0,它本身也是一台VM,但作用跟一般VM不同,它负责管理主机、主机共用区,以及提供给所有VM的储存与网路I/O。XenServer的Dom0到了6.5版之后,正式64位元化,可存取更多记忆体与硬碟、网路装置,连带地,每台主机可负载的VM数量也能提升,并且能适用于当前伺服器出货普遍采用64位元组态的方式。
 
Xen hypervisor早已支援64位元的执行模式,所以能承载32位元与64位元的Guest OS,然而,在之前版本的XenServer,dom0核心都是32位元。
 
32位元dom0会面临什么样的限制?主要是对于下层记忆体(low memory)的作法。就如同大家所熟知的,32位元环境面临的主要限制,在于系统最大可存取的记忆体容量只有4GB,后来发展出许多延伸的方式来突破,但这些作法也会影响效能,导致作业成本提高的后果。
 
甚至,后来在32位元Linux作业系统上,还发展出所谓的下层记忆体与上层记忆体(High Memory)的配置,前者负责与作业系统核心有关的一切处理,包括核心记忆体的对应与核心驱动程式,后者则是针对使用者空间(userspace)的处理。由于低层记忆体要处理的东西太多,形成资源不够用的局面,而这样的架构也影响到32位元dom0,XenServer安装后,预设只能存取到752MB的下层记忆体。
 
XenServer在先前32位元dom0环境所遇到的问题,还不只是这样。
 
在32位元BIOS下,MMIO(Memory-Mapped I/O)区域所坐落的实体位址空间,只能在1GB和3GB之间,dom0如果建立了MMIO hole,可选择重新对应记忆体的位置,让它投射到虚拟位址空间上,核心必须对应与MMIO hole大约等量的记忆体,而对32位元核心来说,就必须放到下层记忆体。
 
再加上,许多驱动程式会自行将核心记忆体对应到MMIO hole,以便在开机时能够成功载入,但如果下层记忆体容量低到不足以满足MMIO hole重新对应的需求时,就有可能导致无法稳定执行驱动程式的状况。虽然XenServer支援PAE,可定址超过4GB的记忆体空间,但对于有些驱动程式的执行来说,还是没帮助,因为它们固定放在32位元的记忆体实体位址空间,在这种情况下,还是会无法存取到4GB以上的记忆体空间,而导致载入失败。
 
而到了64位元BIOS环境,MIMO区域改置于实体记忆体的最上层,所以,也就没有过去这种上下层记忆体的对应管理问题,等于也提升了驱动程式的稳定度。
 
此外,许多当前的电脑硬体与周边装置,都已充分支援64位元处理器与4GB以上的记忆体,而提供了对应的驱动程式,XenServer 6.5现在采用64位元dom0,等于可藉此支援这些新的硬体;同时,由于所能存取的核心记忆体容量不再受限于先前组态,使得XenServer主机端所能搭配的装置数量与类型都更为丰富。
 
例如,每台主机可同时运用的虚拟磁碟数量,6.5版XenServer提升到2048台(6.2版是512台);对于仅提供64位元驱动程式的新一代硬体装置,例如PCIe SSD,XenServer现在也可支援。
 
64位元dom0带来的另一个好处是,XenServer可运用64位元编译器设定,在编译时,能促使事件传输通道(Event Channel)的数量与程式码执行路径,达到最佳化处理效果,并且能够善用新一代处理器所特有的延伸指令集。
 
采用4.4版Xen Hypervisor
 
XenServer 6.5所采用的Xen Hypervisor版本,也提升到2014年3月所推出的4.4版。Xen 4.4的特色,是增加了事件通道数量(从1023扩张到131,071,有128倍之多),可因应VM内部需搭配大量磁碟、网路卡虚拟装置的应用。
\
 
 
Xen Hypervisor是图中箭头所指的地方,这里提供了控制介面和虚拟硬体,它和Dom0需相互搭配,以便管理整台实体主机和VM的资源。在XenServer所搭配的Xen是4.4版。
 
在XenServer前一版(6.2版)时,曾采用了过渡时期的作法,来提供4096个事件通道,然而,这只能满足每台主机500台VM的组态(若以这个数字去除以500台VM,每台VM所能搭配的虚拟装置只能到8个,并不多)。现在,Xen 4.4拥有多达13多万个事件通道后,等于可让XenServer 6.5环境下的每台主机、VM拥有更多虚拟装置。
 
同时,这一版Xen对于grant-copy锁定请求的处理,也变得更有效率,可大幅增加VM硬碟与网路I/O吞吐效能。
 
XenServer 6.5所搭配的Linux核心,也提升到3.10版,该版核心是以长期稳定为前提而设计的,因此适合XenServer使用。相较之下,6.2版XenServer搭配的是2.6.32版核心,之后推出的2.6.37版,是第一个原生支援Xen dom0执行的Linux核心,从那时候起,众家标准Linux版本都可以透过PVOPS(paravirt_ops)的核心形式执行──它是Linux核心基础架构的一部分,可让Linux在Hypervisor上以半虚拟化的方式执行。
 
强化对于Nvidia vGPU支援,强化桌面虚拟化应用
 
伺服器虚拟化平台与Nvidia vGPU之间的技术应用,谈了好几年,到了2015年终于比较完整,在2013年底推出的XenServer 6.2 SP1率先完成多种模式的支援,而VMware vSphere则是到了2015年推出的6.0版才完成。GPU虚拟化技术的发展至此,终于到达最终阶段的里程碑。
 
 
图中是XenServer的vGPU支援架构与彼此的细部运作方式,主要分为三大部分,最底层是Nvidia GPU,中间是Xen Hypervisor,上层是dorm0和Windows VM,需要安装Nvidia的核心模组、外挂,以及用户端驱动程式。
 
由于XenServer 6.5支援vGPU,因此,能够整合XenServer的Citrix CloudPlatform与其他开放云端管理平台,也将跟着原生支援这项GPU虚拟化技术。
 
Citrix表示,若用XenServer支援vGPU的方式,来供应XenDesktop与XenApp环境的3D绘图应用程式执行,在伺服器配置的密度上,将可提高50%,可因此降低成本,并兼顾使用者体验的改善。
 
过去几年以来,XenServer与vSphere陆续支援了不同的GPU虚拟化技术,包括透过软体让多台VM共享GPU的模式(GPU Shared)、单台VM独占单颗GPU的模式(GPU pass-through),然后,可同时支援多台共享或单台独占的硬体GPU虚拟技术(Hardware Virtualization of the GPU),却较晚就绪。
 
以最早支援的XenServer 6.2 SP1来说,每台主机只能支援到64台VM;到了XenServer 6.5,vGPU支援相关软体套件直接内建在主系统的安装ISO映像档中,无需再额外安装,而且,主机端可依照搭配的Nvidia GRID硬体绘图卡数量,支援更多实体GPU存取。以目前来说,每台XenServer主机运用vGPU加速的VM,最大可支援96台(搭配3张GRID K1,每张K100绘图卡最大可支援32个使用者)。
 
XenServer 6.2支援了3种GPU虚拟化方式,由左而右,分别是GPU Sharing、GPU Pass-through、vGPU。6.5版支援的vGPU程度更高,可支撑高达96台应用vGPU的VM。
 
6.5版XenServer也支援Nvidia最近推出的GRID vGPU设定档,像是K120Q、K160Q、K180Q,以及K220Q与K280Q,以K120Q为例,虽然只有512MB,却可支援32个一般使用者的双萤幕显示,解析度高达2560x1600,。值得注意的是,虽然XenServer本身已内建支援,仍须至Nvidia网站下载最新版驱动程式,与之搭配。
 
 
上述两张图是Nvidia官网的vGPU相关驱动程式软体,若要应用vGPU功能,可选择Nvidia GRID vGPU这个产品型号项目,接下来选XenServer版本与语言别,即可下载。目前可选择XenServer 6.2和6.5版,vSphere 6.0号称支援vGPU,但该产品目前(3月7日)还没正式发布,所以,Nvidia网站并没有列出vSphere 6的选项。
 
你也可以应用其他Nvidia GPU虚拟化功能,以Quadro K6000系列为例,就可以选择VMware ESXi 5.1版或5.5版,但这里就没看到XenServer的项目了,关于这个问题,还需要跟Nvidia和Citrix确认一下原因,也许是vGPU一推出之后,可以满足所有需求吧?
 
工作负载平衡器重回XenServer怀抱,并提供新的分散式虚拟网路交换控制器
 
这套产品也重新提供企业等级的工作负载平衡器(Workload Balancing,WLB)的虚拟设备,以及新的分散式虚拟网路交换控制器(Distributed Virtual Switch Controller,DVSC),支援Amazon如此大型的云端环境使用。
 
\
 
在XenServer 6.2版取消提供的工作负载平衡器(WLB),在6.5版中又回来了,这项功能其实跟vSphere的DRS(Dynamic Resource Scheduler)很类似,可以根据主机端的负载情况搭配政策,将正在执行的VM,自动线上迁移到其他台主机。
6.5版的WLB增加了更多功能、改善操作介面与稽核机制,授权方式也有变更(XenServer企业版和XenApp白金版、XenDesktop白金版均可使用)。
 
目前,WLB包含4种功能,包括收集XenServer系统效能资料,例如处理器、储存与网路的负载,以及分析效能状态的历程与趋势、对资源不足情况提出警告、自动平衡工作负载等等。因此,它可以产生效能监控报表、警示管理者系统可能会出现使用率过高的部分,并且根据历史资料,自动将VM工作负载配置到不同XenServer主机上。
 
WLB虚拟设备在XenServer 6.2版时,曾被移除、不再提供,然而,到了最新推出的6.5版,该功能又回归。有了WLB,系统管理者可以深入掌握系统效能,例如,透过细致的效能监控报表的产生、警告管理者去发现系统热区(system hot spots)所在,并且设法使其最佳化,例如根据历史资料的分析,自动调整工作负载的执行位置,以及基于现有的处理器、储存与网路负载,动态搬移工作负载至其他地方。
 
WLB也提供了进阶的资源池存取踪迹稽核记录(Pool Audit Trail)功能,管理者可以指定稽核记录收集资料的粗细粒度,之后,可以依据特定使用者、物件和时间等条件,来搜寻与过滤这些资料。
 
这台虚拟设备也支援线上升级,企业可透过YUM的更新机制,连至正在执行的SLB伺服器,或是从Citrix网站下载升级套件,然后直接套用、不停机。
 
在网路端应用方面,XenServer 6.5所提供的开放虚拟交换器(Open vSwitch,OVS),也从先前的1.4版升级到2.1.3。新版OVS支援Megaflow的作法,在绝大多数状况下,有助于减少流量表(Flow Table)所需记录的项目,也可以改善dom0的网路负荷程度,能处理大量伺服器VM连接众多用户端的应用。
 
在OVS的网路Flow处理中,会比对网路封包标头,并给予对应的处理动作,像是转送或丢弃,而作为伺服器应用的VM之言,本身可能需负荷大量用户端连线,而每一个连线都需要一个Flow,如果主机端的VM数量增加,dom0的OVS流量表会填入相关资料,导致OVS使用者空间处理的回圈,其他节点连至VM与VM对外发出的网路吞吐量,也会因此降低。同时,在XenServer 6.2包含的OVS 1.4环境下,Flow必须拥有确切符合的标头,才能传输。而换成新的OVS之后,XenServer 6.5的主机与VM,可望承载更多网路流量。
 
前面提到,新版XenServer也更新了分散式虚拟网路交换控制器。先前XenServer 6.2所采用的是DVSC-Controller-17223,到了6.5版,XenServer改用DVSC-Controller-37734.1,主要来自被VMware并购的网路虚拟化厂商Nicira,当中最大改变是修正了几个重大安全漏洞,例如OpenSSL、Shellshock。
 
除此之外,网路存取而言,XenServer 6.5主机对主机的总吞吐量(Aggregate network throughput),也从先前的3Gb/s提升到25Gb/s,等于增加了7倍,而网路Flow的平均延迟缩短了15倍,改善更为显著(6.2版是800毫秒,6.5版则为50毫秒)。
 
XenServer也改良一般网路传输与IPv6环境下的效能。例如系统预设支援GRO(Generic Receive Offload)的处理卸载机制,VM接收网路效能可因此提升2倍。只要伺服器端的实体网路卡可相容或支援GRO,入埠的网路封包
就能由网卡端以透明的方式合并,这有助于dom0处理传入资料时所受到干扰的频率,会跟着变少,等于节省处理器的计算周期,并且也能更容易搭配与运用10Gb与40Gb的新一代资料中心高速网路。
根据Citrix本身的测试数据,他们看到单一串流网路吞吐量,甚至最大可因此增加4倍。
此外,XenServer 6.5也采用Grant Mapping的方式来传输网路流量,而不是用Grant Copy,因此节省了dom0的处理器资源,于是,总体网路吞吐量可增加2倍。
 
总体而言,6.5版加入不少改善网路吞吐量处理的技术,如此一来,大量VM不论是发出或接收资料,都能以高速的方式进行。
 
 
存取储存装置的速度大幅改善
 
这次XenServer改版,同时引进了新的记忆体内读取快取(In-memory Read Caching),目的是为了改善VM存取磁碟的效能,该功能可减少存取实体储存装置的I/O量。快取的辅助加速,在伺服器虚拟化平台似乎越来越普遍,像VMware从vSphere 5.5开始支援vFlash Read Cache,微软Windows Server 2012 Hyper-V也支援CSV Cache和Storage Spaces Write-back Cache,但各自的作法,以及所利用的、针对的对象都不太一样。
 
 
 
透过单一模版方式来同时启动多个VM,可透过这种集中化机制,节省不必要的I/O负担。
 
这项新的快取技术应用,主要是针对常用的VM模版映像(golden images)。原本,XenServer系统可将少数对于特定储存区块的上的VM写入资料,存放在每台VM所配置的差异磁碟(differencing-disks)上,若搭配这种读取快取技术,相关VM资料从外部的实体磁碟读取之后,可暂存在主机端记忆体内,以提升虚拟磁碟效能。若基于这样的架构,而且许多VM都是复制自同一个VM,改善系统效能幅度更大。
 
 
 
XenServer新增了记忆体内的读取快取,让所有VM的I/O都在主机端的记忆体执行,而不是去存取本机或外部储存阵列端的磁碟。
 
 
 
记忆体内快取还可搭配XenServer既有的IntelliCache,做到两阶式快取,以及非持续性写入动作的快取。
 
Citrix认为,若将其应用在XenDesktop的Machine Creation Service(MCS),能更彻底减少从硬碟端读取储存区块的数量,而且可因应需频繁读取磁碟资料的行为。对于那些因繁重I/O而导致服务等级下降的例子,快取的助益会更趋于明显,就像桌面虚拟化环境面临的开机风暴(使用者在很短时间内纷纷执行开机),或是VM的排程扫毒作业。设定在同一段时间内密集进行。
 
搭配固态硬碟时,XenServer在储存读取的总体吞吐量(Aggregate storage read throughput)表现上也很亮眼。根据Citrix所公布的效能测试数据,6.2版是2.2GB/s,而6.5版提升到9.9GB/s,幅度有3.5倍之多;相对地,对于储存写入的总体吞吐量(Aggregate storage write throughput),XenServer 6.2版是2.8GB/s,6.5版则到7.8GB/s,增加了到近1.8倍。
 
 
 
XenServer对于储存采用了最佳化的资料路径(datapath),可将总体吞吐量扩大到更理想的地步,以因应大量VM的存取需求。这项措施让系统在承载多台VM时,I/O得以维持在较高的标准上。例如,XenServer新版支援Tapdisk3,可改善多个磁碟同时存取的效能,提供更巨大的总体虚拟磁碟吞吐量。据Citrix估计,提升幅度达到1倍。
 
面对大量VM同时开机时所产生的巨量I/O负担(俗称开机风暴),新版XenServer改善程度很大,这主要受益于In-memory Read Caching技术的采用。Citrix宣称开机风暴的时间原本是471秒,新版缩短至140秒,加速比例达到70%;在这段过程中所传输的资料量,也大幅减少──原本需要18GB,新版XenServer则不到1GB,能做到这样,有赖于In-memory Read Caching的快取特性之外,再加上,该技术也运用VM共用基本映像档的方式,因此,大幅降低XenServer主机端存取外部储存阵列的I/O量。
 
 
 
在XenServer 6.5环境下,同时使大量VM开机时的速度会加快,原因在于支援了新的记忆体内读取快取技术。当VM全都共用相同的映像档时,读取快取能有效降低对储存阵列的I/O冲击。
 
基于Intel处理器架构的安全开机功能支援,也有所改良
 
在企业版上,XenServer可应用Intel处理器所提供的安全开机功能──TXT(Trusted Execution Technology) Measured Boot,但用户需安装相关增补套件软体,才能应用。该套件是在2013年推出的,XenServer也针对6.1版和6.2版发行了对应版本,而到了6.5版上市,这个TXT Measured Boot套件更新了tboot(Trusted Boot)版本。
 
Tboot是一套开源的核心前执行(pre- kernel)或VMM模组,当中采用了Intel处理器所普遍内建的TXT技术,以便测量与验证作业系统核心或VMM的系统启动程序,防止有心人士从开机程序当中渗透到作业系统或VMM当中。
 
除此之外,XenServer 6.5版更新的Measured Boot套件,也支援一些新功能,像是加注资产标签(Asset Tagging),让管理者可以在伺服器上,标示任何有用的资讯,例如所处的地理位置、所配置的硬体规格与性能,或是法规遵循要求。
 
有了这项机制,能让XenServer主机在启动VM时,验证是否具有管理者所给予的标签,以符合特定的条件和加密凭证要求。
 
支援近期推出的x86伺服器级处理器,虚拟化平台的最大组态也有所增长
 
距离XenServer上次大改版(2013年6月)已经有好几年,6.5版一推出,该平台也强调可支援较新款的x86伺服器级处理器,像是Intel在2014年初推出的Xeon E7 v2系列(Ivy Bridge EX),以及下半年发表的Xeon E5-2600 v3(Haswell EP),对于AMD Opteron处理器也不偏废,开始支援2014年初推出、采用Piledriver架构的6338P和6370P(Warsaw)。
 
在整体平台的最大组态上,XenServer也调高了主机端与VM端的部分规格。以单台主机而言,6.5版和6.2版一样,可支援160颗实体处理器、1TB记忆体和500台VM,不过,它支援的虚拟磁碟装置数量,有了突破,从原本的512台,增加到2048台,而且所支援的LUN(Multipathed LUN),也提升到256个之多(6.2版是150个)。
 
 
 
最大组态向来是众家伺服器虚拟化平台的必争之地,但XenServer就算是6.5版的规格来看,仍落后其他厂商许多,唯一的亮点,是每一台主机可支援的虚拟磁碟,高达2,048台。
 
若以单一VM来看,在6.5版的XenServer环境下,每台可配置的记忆体从先前的128GB,提升到192GB。
 
 
 
虽然XenServer 6.5部分最大组态有所调整,只有一项居于领先,主机端可同时存取的虚拟磁碟数量是2048台(VMware vSphere 6.0也是),但绝大多数规格仍赶不上VMware vSphere 5.x和微软Windows Server 2012 Hyper-V,甚至比不上Red Hat Enterprise Virtualization当前版本 3.4,尤其是记忆体容量。例如,这三家厂商的产品,至少都提供了1TB的主机或VM配置(相当于Windows Server 2008 R2 Hyper-V)。
 
 
 
XenServer目前的授权方式,分为4种:免费版、标准版、企业版,以及XenApp与XenDesktop白金版。图中所列的标准版和企业版售价,似乎是不含技术支援的价格。
 
 
 
XenServer标准版和企业版之间的售价、定位、功能的比较。
 
 
 
XenServer现行版本的功能差异比较。
 
产品资讯
 
●建议售价:提供免费版,也可选购标准版每颗处理器永久授权为45,000元,含1年软体维护费用,或是企业版每颗处理器永久授权为81,000元,含1年软体维护费用
 
●原厂:Citrix(02)8758- 2931
 
●XenServer主机端硬体需求:64位元x86处理器1.5 GHz、2GB记忆体、16GB硬碟空间
 
●XenCenter系统需求:Windows Vista~8.1、Windows Server 2003~2012R2、.NET Framework 4、750MHz处理器、1GB记忆体、100MB硬碟空间
 
●VM端支援作业系统:Windows XP~8.1、Windows Sever 2003~2012 R2、CentOS 4.5~7.0、RHEL 4.5~7.0、SLES 10~11、Oracle Linux 5.0~7.0、Debian 6.0~7、Ubuntu 10/12/14
延伸阅读:
  • 本月热点
  • 随机推荐
路由人提示:如需转载本站无线连接及路由器设置等技术文章请您注明出处,谢谢!
Copyright © www.LuYouRen.com, All Rights Reserved.
  苏ICP备12075116号