AWS张侠:数据湖到了重要发展期
admin
2021-01-12 17:02:07
0

原标题:AWS张侠:数据湖到了重要发展期

数据,是企业加速业务创新的法宝;数据,是企业在激烈的市场竞争中立于不败之地的利器;有时候,数据的重要性堪比石油和黄金……这些说法一点也不夸张。但前提是,数据要想真正发挥价值,必须要有好的数据管理平台,能够及时捕捉、存储和分析,这也是以AWS为代表的大型企业力推数据湖解决方案的最根本原因。那么,问题来了,什么是数据湖?

数据湖为什么重要?

“简单理解,数据湖就是一个中心数据存储的容器,用户不仅可以存储结构化以及非结构化的任何数据,还可以对数据进行快速缩放、查询和分析。”AWS首席云计算企业战略顾问张侠博士,用“河”和“湖”的字面意义,进一步解释了数据湖和传统的数据库以及数据仓库的区别。

AWS张侠:数据湖到了重要发展期

传统数据处理方式,就像“一条小河”,里面有ERP、CRM等各种业务系统,用户可以设计“一个河道”,数据库在最底层,数据经过整理进入数据仓库,然后通过商务智能工具来展示。简单理解,在传统数据处理过程中,用户大概知道能有多少“水”,还可以通过“闸门”管控水量。但是,在互联网时代,各种各样的视频、移动终端信息如“洪水猛兽”,形成大规模的海量数据,用户来不及整理和使用。这时,一个新的设想打开了人们的视野,假设有那么一片洼地,没有河道,所有数据先蓄积到里面,然后通过有效的工具进行查询和处理,这便是数据湖。

在张侠看来,数据湖有几个重要特点。第一,存的是原始的自然数据,既可以是结构化数据,也可以是非结构化数据;第二,因为使用了云计算,用户可以快速缩放海量数据;第三,在数据查询过程中,除了能进行建目录、数据迁移和抽取等动作,还能进一步归类、进行数据分析等等。另外,数据湖不仅是高可用、高持久、海量数据处理的选择,同时还能满足安全、合规和审计等要求。

相关内容