数据模型

数据特征的抽象
数据模型(Data Model[2])是现实世界数据特征的抽象,用于描述一组数据的概念和定义。数据模型从抽象层次上描述了数据的静态特征、动态行为和约束条件。[1]数据模型将不同的联系通过筛选、归纳、总结、命名等抽象过程产生出概念模型,用以表示对现实世界的描述,然后转换成真实、容易被人们理解和便于计算机处理的数据表现形式。[4]
20世纪60年代中后期,出现了结构化模型,这是数据模型中最基础的模型之一,主要包括层次模型网状模型关系模型和面向对象模型等。20世纪90代末期,随着互联网应用和科学计算等复杂应用的快速发展,开始出现半结构化模型,用以支持结构化模型不能支持的半结构化数据(文本文件、超链接等),该模型包括XML模型、JSON 模型、RDF模型、图模型和超模型等。进入 21世纪,随着电子商务商业智能等应用的不断发展,终端用户对数据库查询分析的需求得不到满足,于是数据分析模型成为研究热点。2010年以来,随着大数据工业应用的快速发展,为解决海量数据造成的存储瓶颈以及管理复杂性等问题,以NoSQL和NewSQL数据库系统为代表的大数据模型成为新的研究热点。[4]
数据模型作为数据架构管理的核心模块,主要功能包括数据模型管理、实体关系管理、逻辑转物理模型、数据模型变更管控、模型可视化等。[5]数据模型可以应用在医疗、政务、交通、金融和商业等领域,[6][7][8][9][10]

发展历程

20世纪60年代中后期,随着信息管理系统(IMS)的出现,结构化模型被提出,它是最早被提出来的数据模型,也是数据模型中最基础的模型之一。结构化模型主要包括层次模型网状模型关系模型和面向对象模型等。IBM公司的IMS系统为代表的层次模型、DBTG提出的网状模型和提出的关系模型,层次模型的典型代表是1968年美国IBM公司研发的信息管理系统(information management system,IMS)。[4][3]1970年,关系数据库之父埃德加·弗兰克·科德(Edgar Frank Codd)[11]在其发表的论文《A Relational Model of Data for Large Shared Data Banks》中提出了关系模型[12][4]