随着业务数据量不断增长的同时,数据结构也变得越来越灵活多样,数据不再局限于规整的结构化数据,半结构化、非结构化数据在数据域处理中的占比逐年上升,因此对不同模态的数据进行智能化数据处理的需求越来越迫切。
(资料图片仅供参考)
中国信通院在数据库发展研究报告(2021 年)》中指出,在后关系型数据库阶段,数据结构越来越灵活多样、业务类型越来越复杂多变,为应对此类现状,越来越多的用户选择通过多模型数据库实现“一库多用“,将各种类型的数据进行集中存储、查询和处理,满足对结构化、半结构化和非结构化数据的统一管理需求。
Transwarp ArgoDB是星环科技自主研发的分布式分析型数据库,基于多模型统一架构支持关系型存储,宽表存储、搜索引擎、事件存储、图存储、键值存储、时序数据存储等10种数据模型,满足多种数据模型处理场景和复杂业务需求。ArgoDB提供多模分析、实时数据处理、存算解耦、混合负载、数据联邦、异构服务器混合部署等先进技术能力,一站式满足OLAP、AETP、多模型融合分析、联邦计算、数据仓库、实时数仓、湖仓集一体等场景。2019年8月,ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计的数据库产品。
在架构上,ArgoDB基于存算解耦,实现了多模数据库的“四个统一”:
统一的SQL编译引擎 ,支持SQL 99/2003 标准语法,兼容TD,Oracle,DB2等多种方言,对不同模式的数据提供统一接口,将多个操作访问入口变为一个入口,将多种数据库语言变为一种语言,降低开发和迁移成本,简化用户操作。
统一的计算引擎 ,将多套计算引擎变为一套引擎,将多份计算资源变为一份资源,提供高性能的分析计算和执行效率,满足跨模型数据复杂关联分析场景。
统一的存储管理系统 ,同时支持分析型行列混合存储、支持具有搜索功能的文本存储等多模异构存储,并保证数据的强一致性,数据只需一次入库,即可通过异构存储的访问能力支撑多样化复杂分析场景,降低运维成本,将分散存储管理变为统一存储管理,极大简化系统架构,减少开发运维成本。
统一的星环云原生操作系统 ,支持 ARM+X86的混合架构,用户可以利旧硬件,大幅降低成本。
统一的元数据管理+统一的事务管理+完备的多模优化器支撑了对不同模态数据的统一读取调度,高效便捷地实现多模态融合分析。
以国内某三甲医院为例,经过十多年的信息化建设,该医院已经初步建立了HIS(医院信息系统)、LIS(实验室信息管理系统)、PACS(影像归档和通信系统)、电子病历等多套信息系统,并积累了大量的临床数据。 除了结构化、半结构化数据,还有海量、高价值的医疗影像等非结构化数据。 为了存储、查询和处理这些不同类型的数据,这些系统独立建设、缺乏集成、元数据不统一和标准不统一,给数据的查询和处理带来重重困难。为了解决这些问题,加速医院业务数字化发展,医院基于多模型数据库ArgoDB建设了临床数据中心底层大数据平台, 将医院中各种类型的数据(例如电子病历、医疗影像、检验报告、生物样本和文献等)集中在ArgoDB中存储、查询和处理,并能够满足跨不同数据模型的复杂分析需求 ,从而充分发掘医疗数据的宝贵价值,最终提高医疗质量、降低医疗成本。
随着数据与业务的并行发展,对数据的融合分析处理逐渐成为数据库技术发展趋势。当数据仓库与数据湖数据集市协同处理时,带来的是数据孤岛的打破,以及数据计算边界的拓宽。
基于ArgoDB打造的湖仓集一体架构,能够实现在同一平台中,避免数据移动,将原始的、加工清洗的、模型化的数据,共同存储于一体化的“湖仓集”中,既能面向业务实现高并发、精准化、高性能的历史数据、实时数据的查询服务,又能承载分析报表、批处理、数据挖掘等分析型数据集市业务,真正意义上为用户提供湖仓集一体的场景解决方案。
通过ArgoDB打造的湖仓集一体方案,用户可以基于统一访问接口,将多种数据库语言变为一种语言,最大程度上降低数据湖、数据仓库、数据集市业务过程中业务接口的调整,降低用户开发成本和使用门槛,提高数据处理效率。统一计算引擎将多份计算资源变为一份资源,降低集群复杂度和运维难度。统一存储管理,将分散存储管理变为统一存储管理,对使用者屏蔽不同数据源的数据存储,降低业务数据管理难度。
通过ArgoDB一体化多模数据库架构实现全数据,全场景,全融合,最大限度降低企业TCO,打造面向数据模态融合扩展的湖仓集一体化平台。
此外,基于ArgoDB打造的湖仓集一体方案可以无缝衔接AI技术,帮助业务挖掘更多数据价值。