1、快照技术培训1目 录2什么是快照?常见快照技术什么是快照3Snapshot(http:/www.snia.org/dictionary)A fully usable copy of a defined collection of data that contains an image of the data as it appeared at the point in time at which the copy was initiated.A snapshot may be either a duplicate or a replicate of the data it represents
2、.参考译文:快照是特定数据集的一个完整可用拷贝,该数据集包含源数据在拷贝点的静态映象;快照可以是数据再现的一个副本或者复制。快照的价值4快速备份/恢复 快照可迅速生成,并可用作传统备份和归档的数据源,缩小甚至消除了数据备份窗口;快照存储在磁盘上,可以快速直接存取,大大提高数据恢复的速度。保存多个恢复点目标 基于磁盘的快照使存储设备有灵活和频繁的恢复点,可以快速通过不 同时间点的快照恢复数据。重新定义数据用途 快照提供一份接近实况数据的拷贝,可供测试、归档、查询使用,既保护生产系统又赋予备份数据新的用途。常见快照技术分类5全拷贝快照分离镜像(Splitting a mirror)差分快照写即拷贝
3、(CoW:Copy On Write)写即重定向(RoW:Redirect On Write)随机写(WA:Write Anywhere)全拷贝快照分离镜像(Splitting a mirror)写操作镜像子系统(阵列,逻辑卷管理器,存储网络)源镜像写操作镜像子系统(阵列,逻辑卷管理器,存储网络)镜像关系终止源镜像6分离镜像的生命周期写操作源镜像镜像卷源镜像原始数据写操作分离镜像读和备份记录写操作分离镜像写操作1.分离镜像2.从分离镜像备份3.再同步镜像再同步源镜像7全拷贝快照的特点8空间占用:每一次全拷贝快照需要与源盘相同大小的数据空间创建过程:每一次全拷贝快照都需要完全数据同步读写操作影响
4、 源卷的读操作不受影响 源卷的写操作受数据同步的影响 创建完成后,快照(卷)的读写操作保持最优常见快照技术分类9全拷贝快照分离镜像(Splitting a mirror)差分快照写即拷贝(CoW:Copy On Write)写即重定向(RoW:Redirect On Write)随机写(WA:Write Anywhere)CoW的实现p源 盘快照前写块1acdefghi012345678SAN访问阵列源卷1.写操作(p写入块1)p b10CoW的实现p源盘快照快照前写块1z快照后写块6apcdefhiSAN访问阵列源卷快照索引和日志地址数据1.写操作(p写入块1)2.产生快照3.快照后写入z到
5、块6:不一次性写入先将块6内容移入日志z写入源卷012345678116gg zCoW的实现pz源盘快照快照前写块1快照后写块6gp读块6读块1apcdefzh6gi012345678SAN访问阵列源卷快照索引和日志地址数据1.写操作(p写入块1)2.产生快照3.快照后写入z到块6:不一次性写入先将块6内容移入日志z写入源卷4.从快照读时组合索引/日志和源卷1.如果快照是可读/写,快照盘上的写操作直接 更新索引和日志12CoW的特点13 源卷状态:源卷保持最新状态 写操作步骤:当一个新的写操作执行时:1.首先读出写操作将要覆盖地址的当前数据2.将读出数据保存至专用空间并建立索引3.新的写操作执
6、行(写入目标地址)读写路径影响 源卷的读路径基本无影响 源卷的写操作受拷贝影响 对快照(卷)的读写路径都有影响 两次快照之间的多次写操作 第一次写动作,需要一次读,二次写操作 后续的写动作,只需直接写入到源卷,不再需要拷贝操作RoW的实现p源盘快照前写块1acdefghi012345678SAN访问阵列源卷1.写操作(p写入块1)p b14RoW的实现p源盘快照快照前写块1z快照后写块6apcdefghi012345678SAN访问阵列源卷快照索引和日志地址数据1.写操作(p写入块1)2.产生快照3.快照后写入z到块6:源卷块6内容不变z写入日志6z15RoW的实现pz源盘快照快照前写块1快照
7、后写块6gp读块6读块1apcdefgh6zi012345678SAN访问阵列源卷快照索引和日志地址数据1.写操作(p写入块1)2.产生快照3.快照后写入z到块6:源卷块6内容不变z写入日志4.从快照读时只访问源卷检索16RoW的实现pz源盘快照前写块1快照后写块6快照gp读块6读块1apcdefhiSAN访问阵列源卷快照索引和日志地址数据1.写操作(p写入块1)2.产生快照3.快照后写入z到块6:源卷块6内容不变z写入日志4.从快照读时只访问源卷1.如果快照取消,快照日志必需全部执行,以保 证源卷的状态更新到最新gz1701234567866zzRoW的特点18 源卷状态:源卷状态冻结 读写
8、操作步骤:1.到源盘的新的写操作被存入日志(并索引):2.读源卷时,先检索日志3.读快照时,源卷需要引用4.当快照取消时,写日志必须全部执行以与源卷保证数据状态同步更新 读写路径影响 源卷的写操作基本无影响 源卷的读路径潜在受影响 快照(卷)的读写路径最优化 源卷的状态不是最新,快照卷故障将会导致源卷数据丢失WAFL介绍19WAFL:是Netapp的专利文件系统。将底层的存储空间虚拟成文件,使用inode链条来组织 所有的零散快。Inode分为两层:root inode 和 inode。root inode处于硬盘的固定位置,指向innode地址;innode位置不固定,可形成链式innode
9、存放数据文件;19AFSijABCDAFSijABCD快照AFSijABCD快照A1i1AFSijABCD快照A1i1B1AFSijABCD快照A1i1B1A2i2不会覆盖写,数据永远写到空闲的数据块中。基于WAFL文件系统的WA实现NetApp的快照技术是基于其WAFL文件系统实现的拷贝20WA的特点21 磁盘块被虚拟化1.源盘使用真实块的映射重定向2.新写操作定向到空闲块,而不是直接覆盖块3.映射反应当前状态和潜在维护多个“快照”性能通常不因源盘/快照改变 性能受数据碎片影响1.快照过程会产生大量的碎片,性能受影响,需要定时整理 快照区大小需要预分配,并受到空间限制1.快照区与源数据区需要在同一个文件系统中,因此大小需要预分配,并受到卷大小的限制快照技术的对比22快照技术分离镜像COWROWWA空间占用原卷相同要求数据空间可变要求数据空间可变要求数据空间可变是否依赖原数据 卷?NOYESYESYES原卷状态最新最新冻结冻结原卷写操作影响YES(同步镜像影 响)YES(copy影响)NONO原卷读操作影响NONOYESYES快照卷读写操作 影响NOYESNONO覆盖写NOYESYESNOTHANKS谢谢