浏览人次:【10668】
多年来,针对大型主机及开放系统运算环境的灾难复原(Disaster Recovery;DR)资料镜射一直在持续进行着。可惜的是,由于此类解决方案的高成本与复杂度,通常只有IT预算充裕的大型组织,才有办法建置。
然而,市场对于低成本灾难复原解决方案的需求从来不曾停歇,因为无论何种规模的组织,都了解其储存资料的价值,以及任何故障所衍生出来的高成本。事实上,许多组织虽然都已开始着手建立灾难复原的策略与须知,不过由于预算和其他方面的限制,仍尚未实际部署任何解决方案。
幸运的是,新一代低成本资料镜射解决方案,可将复杂的灾难复原功能提供给所有规模的组织。解决方案的关键特色包括:
●相容于目前各种储存设备
●在不同厂商的设备之间镜射资料
●运用快照强化的镜射功能,确保资料完整性,并在发生灾难或其他事故后快速复原
本文将介绍多镜射(multiMirror)快照强化型非同步镜射解决方案的使用时机及方式,并探讨如何运用该技术提供高效能、资料完整性,以及快速复原等优点。
同步与非同步镜射
在同步镜射环境中,当一个应用试着要将资料写入磁碟时,会将讯息同时传送至自身及远端的储存装置。因此,当两端装置确认将资料写入磁碟时,系统才会认定此动作已完成。换言之,已启动写入作业的应用,必须收到确认讯息之后,才能继续进行下一个动作。
而非同步镜射的环境,只要自身储存装置完成请示后,即使远端系统尚未收到或尚未完成处理请示,每一个写入动作仍可完成其程序。
从效能观点来看,即使两个储存装置的距离很近,同步模式仍会导致一定程度的效能下滑,原因就在于应用必须获得两端系统的确认后,才能继续下一个动作。另一方面,由于非同步模式无须获得远端储存装置的确认,就认定写入作业的请示已完成,因此系统的效能几乎和非镜射系统相同。
就成本而言,同步模式通常需要较高的频宽和设备,以维持可接受的效能水准。其原因包括:
●双向传输:由于每一个写入动作必须传送和接收远端系统的确认讯息,因此传输基础建设必须有足够的频宽与效能,以避免此流程发生故障。
●尖峰时段的延迟:因为尖峰时段有可能会耽搁资料作业的整体效能,或造成因长时间的延迟而导致应用动作失败等状况,因此设计作业网路时应考虑到最坏的状况。
●扩充能力:储存区域网路(Storage Area Network;SAN)本身能支援多部主伺服器,但随着SAN的主机数量陆续增加,同步镜射的基础建设可能无法轻易或有效地以低成本进行高容量的资料传输扩充。
因此,同步解决方案通常需要某种程度的超额配置,包括频宽及交换器的连结埠等资源,借以确保在尖峰时段依然能维持良好的效能。
另一方面,非同步解决方案通常仅需极少的频宽,因为双向传输的流量比同步解决方案要少得许多,且通讯的耽搁与延迟不会影响应用效能。此外,非同步解决方案将动作放入一个伫列,直到有足够的频宽来完成每一个动作,故能弹性调适尖峰时段的作业。
专业的储存解决方案厂商必须有能力同时提供同步与非同步镜射解决方案,并客观地分析每一个客户的需求,再推荐合适的解决方案。
镜射时的资料完整性
选择镜射解决方案的考量因素之一,就是确保资料在复制于各个站点之间时,能否维持资料完整性。若无法确定复本资料在需要时确实可用,那么便失去了镜射复制资料的意义。
镜射必须在资料完整性方面解决两大问题。第一、多数的灾难并非瞬间发生。灾难通常会持续数分钟,甚至数小时,例如间歇性的停电、通讯中断、磁碟故障等。而间歇性的故障是最难处理,因为它们能在整个过程中不断的破坏资料完整性。第二、事故发生所需的复原时间。在同步镜射模式中,无论是损毁或完整的资料,都会立即复制到第二储存装置作备份。换句话说,当资料或档案系统在某一端已损坏,在另一端的镜射备份也同样会受损。因此,要复原这种损坏状况,通常必须花费数小时或数天的时间,有时甚至无法复原该资料或档案系统。
非同步镜射的快照强化
为解决上述两项资料完整性的问题,多镜射(multiMirror)快照强化型镜射技术因此诞生。该技术结合平台独立性、随意地、低容量的非同步镜射能力,以及瞬间(point-in-time)的快照功能,不仅确保各个占点之间的资料完整性,还可在灾难发生后迅速回复正常运作。 multiMirror采用的各种快照功能,潜藏许多不同重要的差异。相较于其他系统,这些快照具有以下优点:
●LSI不会在磁碟卷册里建立全额容量的复本,而是建立瞬间的磁碟卷册快照,且设定初始的容量为零。
●快照的磁碟空间无需预先配置或保留,因此能更有效地运用现有的储存容量。
●一致性的群组,能让系统建立磁碟卷册的逻辑群组快照,例如资料库中的资料与纪录档案。
●排程功能让使用者能设定建立快照的频率,例如每隔数分钟。
●感知应用的一致性功能,让资料库等应用在建立快照之前,能暂停运作,以确保每一个快照内容皆能维持该资料完整性。
《图一 multiMirror快照强化镜射作业流程图》 |
multiMirror的快照强化镜射作业流程如下:
●针对营运中的资料,建立零容量的快照(Snapshot 1)。
●Snapshot 1针对有异动的营运中资料累积储存,并维持一份复本。
●在使用者设定的时程点,Snapshot 1 进行“冻结”后,系统会自动建立下一个快照(Snapshot 2)。
●Snapshot 1的内容,从Site 1镜射复制至Site 2,接着Snapshot 1的内容将保存于两个站点,而保存时间由使用者自行设定。
●现在,每站点皆有一个完全相同的资料复本,其资料为特定时间点的内容。
●每一个后续快照皆重复进行上述的流程。
运用镜射卷册快照进行各项关键储存作业
使用快照强化镜射最大的好处之一,就是能把相同的快照复本用在其他的用途。每一个快照都是独立的读取和写入卷册,因此可立即使用。快照的其他用途包括:
●零停机备份(Zero-downtime Backup):可利用快照复本取代营运中资料,在背景模式下进行备份。备份可在不影响正常营运或应用下开始与结束。
●应用测试(Application Testing):快照可在不干扰营运资料或应用下,用于应用测试。
●决策支援(Decision Support):快照可在不干扰营运资料与应用下,用于更新资料库与其他决策支援系统。
《图二 multi Mirror快照强化镜射作业流程图》 |
●可立即读取和写入快照画的镜射资料于各站点之间。
●在任何位置所做的快照,皆可用在非镜射动作,例如零停机备份、非干扰式应用测试,以及决策支援系统(DSS)更新等。
●可保存无上限快照,供日后使用。此外,当不再需要时也可随时删除。
透过有限的频宽连线来优化效能
任何镜射解决方案的主要成本,就是各资料中心间的通讯月租费。一般来说,连线的频宽越低,月租费就越低。因此,镜射解决方案可运用低频宽连线,且维持效能,借此大幅降低总持有成本。
然而,「I/O程序(ordering)」问题通常会限制低频宽连线的运用。这是因为IP无法确保每一个I/O皆按顺序传输,因此当资料透过任何种类的IP连线进行传输时,该问题就有可能发生。举一个常见I/O程序情况为例,镜射解决方案必须能解决:
●两个I/O在数秒内变更同区域的资料;
●I/O运用IP镜射到其他位置;
●远端位置无法收到有序的I/O。例如,先收到第二个I/O,接着再收到第一个I/O;
●除非远端位置重新排定I/O顺序,否则远端位置将采乱序模式,并造成其资料库的内容将无法和来源资料库保持一致。
在上述举例中,远端镜射与来源资料不再维持同步的状态。此外,若主站点发生故障或其他破坏,远端资料库将发生毁损且适用。
为了确保I/O正确地套用于远端资料集中,并尽可能降低站点之间所需的传输频宽,因此,multiMirror结合「最新数据变更(Last Block Changed)」演算法,并分析每一个快照内的动作,然后再进行传输。若快照内相同的资料区块变更许多次,那么Last Block Changed演算法只会传送最后一次异动的部分。其技术不仅减少镜射备份的资料量,还可确保站点之间传送资料时,即使不按次序传送到目的地,两站点的资料内容仍可保持一致。
除了解决资料镜射所遇到的I/O程序问题之外,Last Block Changed技术亦能避免非同步镜射的问题:
●由于相同资料中的重复异动会被弃置,因此每一个快照容量便能降低。如此一来,不仅无需大容量的缓冲区,亦不会发生缓冲区溢位的问题,而干扰到镜射的作业。
●传输远距离所导致的延迟,将不会影响资料的完整性。
●在任何传输中断期间,快照仍会持续累积资料的变更内容,直到传输连线复原,然后再与远端站点同步更新变更内容。
图三为Last Block Changed技术:
《图三 Last Block Changed技术流程图》 |
●Snapshot 1将累积一段时间内所产生的资料异动。
●在这期间,Block 1的内容可能已异动许多次,而Block 2与Block 3可能只变更过一次。
●接着,快照内容会暂时冻结资料,最后透过Last Block Changed技术,将最后的异动传送至每一个资料区块。如此一来,便可大幅减少镜射的资料量,并减少站点之间所需的传输频宽,和排除I/O顺序所衍生出的各种问题。
●当远端站点收到快照内容并完成处理后,两个站点的资料复本内容,都将会是一致的,并与快照当初冻结时的内容相同。
感知应用的资料一致性
除了排定快照的频率之外,multiMirror亦能针对与应用相关的每一个卷册或卷册群组,建立感知应用的快照。例如,当针对一个资料库建立快照时,资料与纪录卷册皆会包含在内,而且应用会暂停运作,以确保完成在线动作之后,才会建立快照。当快照撷取完成后,应用会回复正常运作。
使用者可透过multiMirror的命令行介面(CLI),或第三方的管理程式来管理感知应用的快照。
低成本的随意(Any-to-Any)镜射
由于multiMirror是以网路为基础的镜射解决方案,因此在连结主伺服器与储存设备的光纤通道交换器的网路中,multiMirror是一个与设备元件无关的独立层。由于不受限的关系,让multiMirror能执行任意平台的镜射,这表示,资料可随时从任何装置镜射到任何位置。
任意镜射的成本远比专利型镜射解决方案来得更具成本效益,这是因为其他厂商的镜射资料解决方案仅限于同家厂商的同型号装置。因此,透过任意镜射功能,使用者可自由选择合适的站点和储存装置,无须担心厂商在资料移动与复制方面所设下的限制。
分担伺服器的镜射与储存作业
传统的镜射解决方案通常有暗藏降低效能的缺点。例如:
●伺服器执行的镜射会使用主机CPU来管理资料复制,因此会造成正在执行的应用,产能下降的负面影响。此外,每一个伺服器的镜射流程必须单独管理,进而增加储存管理员的负荷。
●储存设备执行的镜射,在复制时会增加储存控制器的负荷,或需使用专属的镜射控制器,进而限制用来执行日常作业的控制器数量。此外,资料通常只能镜射同家厂商的同型号储存装置,并限制用户在远端站点采用低价装置。
另一方面,multiMirror非同步镜射解决方案能运用网路设备来处理资料复制的流程,进而避免上述的问题发生。此外,这些设备在使用时,是独立于伺服器和储存装置,借此能发挥许多优势:
●资料镜射与伺服器或储存装置的作业无关,因此也不会影响其效能。
●资料可在任何厂商的储存装置之间进行镜射(随意镜射)。
●所有镜射流程皆集中管理。
其他非同步镜射的快照强化优势
除了上述讨论的优点之外,以下为其他让快照强化镜射成为可靠,且低成本灾难复原解决方案的原因:
●当通讯连线暂时中断时,快照便加到镜射伫列。在连线复原之前,额外的快照会持续建立并加入到伫列。在连线复原之后,伫列中所有的快照皆会传送到备援的第二站点。
●当发生预先规划或意外的停机时,第二站点会使用最后收到的快照迅速上线运作。该动作可确保第二站点是使用与主站点一致的资料内容,并立即进行营运。
●当发生资料毁损时,管理者可迅速将第二站点退回至最后该资料良好的时间点。此外,使用线上快照来复原系统,可将复原时间缩短至数分钟。
结语
MultiMirror可支援快照的非同步镜射技术,并结合非同步镜射在成本与扩充性,以及瞬间资料完整性与线上复原快照能力的优点。相较于其他镜射解决方案,建置multiMirror与快照强化镜射技术的主要优势包括:
●降低总持有成本;
●使用极少的频宽达到更高的效能;
●在不同厂商的储存装置之间进行随意镜射;
●在遭遇资料损毁或长时间的灾难时,能维持资料完整性;
●迅速连线回复至最后该资料良好的时间点。
---本文由LSI撰写提供---
|