首页 > 论文范文 > 计算机论文 > 计算机论文范文:基于对象存储文件系统研究综述(二)

计算机论文范文:基于对象存储文件系统研究综述(二)

二、基于对象的存储技术
新的存储需求推动存储技术的发展。高性能计算(HPC,high-performance computing)推动新的计算结构的出现,这促进了存储体系结构的发展,逐渐形成了基于对象存储的体系结构。基于对象存储结构同时具有NAS和SAN的所有优点,如高级的数据抽象、跨平台的数据共享、基于策略的安全控制,直接数据存取、高可伸缩性、高安全性等,基于对象存储系统成为了网络存储的主要发展方向。
基于对象的存储系统是存储领域研究的一个新热点。这种体系结构的核心是对象,对象是容纳了应用数据和一个可扩展的存储属性的基本容器。传统的文件被分解为一系列存储对象,并分发到一个或多个“智能磁盘”上,这种磁盘被称为对象存储设备(OSD,Object-based Storage Device)。每一个对象存储设备具备本地处理功能、用于数据和属性缓存的本地内存和本地的网络连接。对象存储设备构成了分布式存储结构的核心,它将许多传统的存储分配行为从文件系统层转移,从而解决了当前存储系统的一个瓶颈问题。
基于对象存储系统同时具有NAS和SAN的所有优点,如高级的数据抽象、跨平台的数据共享、基于策略的安全控制,直接数据存取、高可伸缩性、安全性等,基于对象存储系统可以是全集中式的、半集中式或全分布式的。目前公认较好的是半集中式的文件系统,即由一个元数据服务器管理文件系统的名字空间、存取控制、负载均衡、错误恢复等,并完成文件到OSD对象的映射,由客户直接存取OSD设备上的数据。其结构如图1所示

图1 半集中式对象存储系统体系结构
Figure1:the system structure of object-based storage

(一)对象存储研究现状
当今集群系统以其性价比优势成为高性能计算体系结构的一种趋势,随之对存储系统提出了更高的要求。集群计算逐渐成为一种有成本效益的并行/分布式计算资源,其具有可伸缩、高可用、高性能、易管理和高性价比的优势,集群系统在大规模计算机的应用中成为一种发展趋势。
针对Linux集群对存储系统高性能和数据共享的需求,国外已开始研究全新的存储架构和新型文件系统,希望能有效结合SAN和NAS系统的优点。
1.国内研究现状。目前国内在分布式存储文件系统方面还处于研究阶段,国家973项目《下一代互联网信息存储组织模式及核心技术研究》[3]正在集中研究基于下一代互联网的多层次,可扩展的面向对象网络存储系统体系,形成基于存储对象模式的系统理论。有很多科研机构和大学实验室都把网络存储技术和分布式文件技术作为重点来研究。
中科院计算所研究的“曙光”系列机群服务器上的文件系统COSMOS和DCFS,为曙光超级服务器提供了一个分布式的文件系统环境。为了获得较好的I/O性能,DCFS机群文件系统中的元数据服务器采用二级的树状结构、文件属性缓存、集中式目录缓存管理等技术,存储服务器主要采用了多线程和缓存技术。DCFS将整个名字空间根据目录关系划分成多个子空间,分配到不同的元数据服务器管理,取得较好的性能、扩展性和可用性。
2.国外研究现状Panasas公司的PanFS[4]是一个基于对象存储的Linux分布式机群文件系统。它是该公司的核心部分。由于采用了基于对象的磁盘设备,元数据服务器的很大一部分负载(据分析有9%)都转移给了基于对象的存储设备。同时由于存储设备可以很好地理解和应用对象(也就是文件或者目录),因此可以更好地组织对象的数据布局,也能很好地满足对象的性能要求。文件系统的数据由客户端通过网络直接和对象磁盘交换;元数据通过元数据服务器进行管理。客户端文件系统向应用提供符合POSIX标准的文件接口,可以缓存数据,并且对数据进行分片存储。元数据服务器维护整个系统的元数据一致性,维护系统缓存的一致性等。因为文件系统的很大一部分工作已经由对象磁盘分担,元数据服务器可以服务于更多的客户端,提供更好的性能。
Cluster File Systems 公司的Lustre[5]是面向下一代存储的分布式文件系统。它采用基于对象的磁盘作为整个文件系统的存储设备,但是又不限于对象磁盘,因为它可以通过软件的形式来模拟。它使用了Sandia开放的Portals 网络传输协议,支持多种网络(TCP/IP,Quadrics,Myrinet,InfiniBand 等)。它也采用数据和元数据分开传输和存放的机制提供系统的性能。Lustre 创造性的带意图的锁(intent lock),明显地减少客户机和文件系统元数据服务器之间的消息传递,也缩小了每次操作的延迟。它采用标准的XML、LDAP、SNMP等协议来进行系统管理;还加入了失效接替等特性,提高了系统的可用性。
Zfs[6]是由位于以色列的IBM实验室、Haifa大学和Mount Carmel共同研制的文件系统,是对DFS项目的扩展。zFS是一个基于OSD的全分布式文件系统,它使用OSD作为存储媒体,所有的客户机都可以直接存取OSD设备。zFS系统中没有专门的服务器,其存储管理工作由OSD负责,文件管理工作被分散在客户机中,由各客户机互相协商共同完成。zFS的大设计目标是:更好的可伸缩性。
CEPH系统是美国加利福尼亚大学存储研究中心研制的文件系统。其体系结构如图2所示:

图2 CEPH文件系统体系结构
Figure 2 the system structure of CEPH file system
CEPH文件系统由客户(Clients)、元数据服务器集群(Metadata Cluster)、面向对象存储设备(OSD)三部分组成.三部分分别有不同的功能,它们有机地结合在一起协同工作,成为一个文件系统,提供文件系统具有的功能。OSC管理基于对象存储设备,对其上存储的文件数据进行存储和管理,并向客户端提供文件数据I/O;MDC管理文件系统的元数据,将文件元数据和目录形成全局统一的命名空间;Clients与MDC进行命名空间操作的交互,向应用程序提供一个全局统一命名空间的文件系统,与OSC进行文件数据I/O的交互,为应用程序提供文件服务。
(二)对象存储系统体系结构
1.数据对象。数据对象(Data object)简称对象,是对象存储体系结构中重要的组件,是对象存储系统中数据存储的基本单元。对象中封装了数据和关于数据的属性,包含数据和其它足够的信息允许数据自治和自我管理。对象不同于作为传统存储系统中基本组件的文件和块,对象是应用数据(文件数据)和定义数据各方面的存储属性(元数据)的组合。元数据是“关于数据的数据”,描述了对象的属性,比如对象的访问许可权限,数据分布等。对象存储系统中,以对象ID标识对象,访问对象时通过基于对象ID的简单接口访问对象,对象内部包含一定长度的字节,这些字节的开始点以及长度是很重要的,有了它们,可以通过三元组( object, ofset,length )找到对象内部的任意字节。对象存储系统有三种不同类型的对象:根(Root)对象,组(Group)对象和用户(User)对象。存储设备上的根对象标识存储设备和设备自身的属性,包括其总的大小和可用容量;组对象提供存储设备上对象逻辑子集的目录;用户对象包含实际需要存储的应用数据。
2.对象存储设备。对象存储设备(OSD,O bject-basedS torageD evice),是目前磁盘存储中智能化的产品,能够存储和管理服务对象而不是简单地将数据存放到磁道和扇区上。对象存储系统中,应用数据(文件数据)由对象存储设备存储与管理。对象存储设备是对象存储体系结构定义的一种新的、更智能的磁盘接口。对象存储设备是一种包含存储介质、磁盘或磁带的网络附接设备,它有自己的CPU、内存、网络和磁盘系统,具有充分的管理本地存储数据的智能性,计算节点在取得访问许可的情况下能够直接和对象存储设备通信访问存储数据,而不必使用文件服务器作为事务的中介,避免了文件服务器作为计算节点访问数据的中介可能出现的瓶颈。而且,如果文件系统将数据条块化分布在一定数量的对象存储设备上,综合的1/0速率和数据流通率将线性增长。例如,单个的附接到吉比特(Gigabit)以太网的对象存储设备可以达到对网络的400Mbps的数据输送能力和1000/秒个存储器1/0操作,如果数据在10个对象存储设备上条块化并且能并行访问,综合的数据率将达到4000Mbps和10000个/秒I/0操作。
3.可安装文件系统。可安装文件系统(IFS,In stallableF ileS ystem)和用户节点相结合,可以从操作系统接受POSIX文件系统命令和数据,与基于对象的存储系统进行交互,使基于对象的存储系统满足用户读数据或者写数据等数据请求。
基于对象存储的可安装文件系统应该具有以下功能:能够为应用层提供POSIX接口,允许应用程序对底层的存储系统执行如Open,Close,Read和Write等的文件操作;计算节点中有缓存机制,缓存数据的交换;对数据的存储采用条块化管理;具有iSCSI协议,发送和接受对象存储设备上的数据;客户端可以从根目录下mount文件系统,按照其具有的权限访问相应的目录。
4.元数据服务器。元数据服务器(MDS,Meta-Data Server),是对象存储系统中多个计算节点之间的中介,维持所有节点上缓存数据的一致性,保证计算节点共享数据。
对象存储系统中,元数据服务器存储和管理元数据。目前对象存储体系结构的设计是单个的元数据服务器,其有两个功能:一是向计算节点提供存储数据的逻辑视图(虚拟文件系统Vritual File Systemor VFSla yer)、文件名列表和组织文件的目录结构;二是组织物理存储介质中数据的分布(the inode layer)。元数据服务器能够进行身份验证、文件和目录访问管理、实现cache一致性、进行容量管理,并保证扩展性。
对象存储系统将存储数据的逻辑视图(VFSla yer)与物理视图(thein odela yer)分开,通过对工作负载进行分布可以克服NAS中出现的元数据服务器瓶颈,从而提升对象存储设备的潜在性能。元数据的VFS部分完成典型的NFS服务器中大约10%的元数据工作负载,而剩下的90%的元数据工作负载由inode层存储在存储介质块上的物理分布数据做的。元数据作为“关于数据的数据”,是存储系统的中心信息,缺少了元数据,对象数据将成为“孤儿”数据,变成无用的信息,元数据的管理对于确保整个存储系统的可靠性、高性能等具有决定性作用。在大型应用中,单个的元数据服务器可能无法承担元数据服务的工作,从而使元数据服务成为存储系统的瓶颈,影响存储系统的整体性能。我们可以采用可伸缩的集群方式来管理元数据,将元数据的服务负载分布到集群中的节点上,以集群作为一个整体来完成元数据服务工作。
5.网络结构。网络结构(NetworkF abric)建立起计算节点到对象存储设备和元数据服务器之间的连接,使它们之间能够互相通信。
网络是对象存储系统的关键元素。网络提供连通性的结构,在单一的结构中绑定对象存储设备、元数据服务器和计算节点。随着廉价的吉比特以太网的应用,可能以达到甚至超过特定的如光纤通道(fibre channel)存储传输速度来传输存储流量,给对象存储系统带来了好处。以太网的日益普及降低了组件成本,更重要的是,建立可靠的以太网的知识非常普及,降低了管理成本。然而,对象存储系统只和TCP/IP结合在一起,而不是以太网,可以利用其他传输方式如Myrinet和InfiniBand对TCP/IP的支持建立对象存储系统。对象存储系统有三中主要的网络协议:
(1)iSCS1协议。iSCSI协议在TCP/IP包中封装了SCSI,是传输命令和数据到OSDs的基本传输协议。SCSI命令数据块(CDB, Command Data Blocks)将读写数据命令传输到存储设备,采取和数据本身一样的方式传送。iSCSI协议得到扩展并能支持对象命令集合,但仍然保持在iSCSI协议定义的范围内。
(2)ORPC命令传输。对象存储系统在计算节点和元数据服务器之间的通讯中使用了一种单独的协议,这就是轻权的远程过程调用(lightweightR emoteP rocedureC all,R PC) ,使得与元数据的快速通信比较容易。
(3)其他服务协议。对象存储系统的建立还需要很多标准的TCP/IP服务。例如,使用NTP (Network Time Protocol,网络时间协议)实现计算节点和存储系统间的同步,使用DNS (Domain Name Server,域名服务器)简化地址的转换和维持,使用各种路协议允许计算节点和存储系统分离。这些服务全部建立在TCP/IP协议之上,具有广泛的可用性和互操作性,利用好这些协议,对象存储系统可以得到很大的好处。
三、对象存储系统展望
基于对象的存储技术是存储领域的新兴技术,它提出了一种新的存储体系结构,以数据对象作为数据存储和管理的基本单元。基于对象存储的文件系统在可扩展性、可靠性、易用性等方面都有显著提高,随着网络化存储技术的不断成熟,基于对象存储的文件系统将成为重要的发展方向。
基于对象存储技术的研究还处在起步阶段,很多方面需要不断研究、实现和完善。本文做了一部分工作,实现了文件系统原型,但算法还未能与系统结合起来,下一步可以将算法与具体的系统结合起来作实际的测试研究;另外,管理元数据采用的元数据管理集群可以有很多灵活的体系结构,可以探索采用各种不同的体系结构并结合相应的算法,实现更好、更高性能的方案。
四、结束语
本文对当前的热点——基于对象存储技术作了简要介绍。我们充分地相信,随着应用需求不断深入以及技术的不断发展,将涌现更多更好的存储新技术。同时为企业数据提供更加安全可靠、速度更快、更易于管理的存储平台。
参考文献:
[1]郭玉东,尹青.基于对象的网络存储[M].北京:电子工业出版社,2007:3-5
[2]Feng Wang.OBFS:A File System for Object-based Storage Devices[C].21st IEEE/12th NASA Goddard Conference on MssT2006.2006
[3]Sage A. Weil.  Ceph: Reliable,Scalable,and High-Performance Distributed Storage. Ph.D. thesis, University of California, Santa Cruz, December, 2007.
[4]林琳,陈展虹.分布式网络存储系统元数据服务器群的设计与实现[J].2008年4期
[5]刘群,冯丹,王芳.高可靠性元数据服务器研究[J].计算机工程,2008年9月
[6]周功业,王琰,鲁春怀,面向对象的智能化磁盘OSD的研究与实现[J].计算机工程与科学,2007.29卷3期
[7]Keir Fraser,Steven Hand.Safe Hardware Access with then Xen Virtual Machine Monitor.[D]University of Cambridge Computer Laboratory.
[8]赵俊杰,詹永照.网络存储安全系统研究综述[J].计算机应用与软件2008年25卷2期
[9]M. Szeredi. File System in User Space. [D]http://fuse.sourceforge.net,2006.
[10]S. A. Weil, K. T. Pollack, S. A. Brandt, and E. L. Miller. Dynamic metadata management for petabyte-scale file systems. In Proceedings of the 2004 ACM/IEEE Conferenceon Supercomputing (SC ’04). ACM, Nov. 2004.

论文发表首选优普论文发表网

本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。QQ:522-52-5970

综述   文件系统   存储