从 AWS re:Invent 2022 展台展示中可以看出分析领域的趋势
我是NTT数据和智能事业部的nttd-saitouyun。
我去年参加了2022年12月的AWS re:Invent活动。我在展览展区(通称为Expo)里花了很多时间(每天4小时,连续2天),下面是我收获的感受。

Expo是什么。

参观博览会感想:总体来说

博览会参观感受:数据管理解决方案
我参观了以下的展台。给我留下深刻印象的是,有很多基于SaaS的数据整合解决方案,即ETL/ELT。所有这些解决方案都是基于图形用户界面(GUI)的工具,通过连接加工组件来创建数据流。
在只进行了演示而无法仔细区分每个产品的详细差异之后,我注意到每个产品都强调了“简约性”和“容易上手性”。我认为现在有一种趋势,即将以前由基础设施工程师和数据工程师专业执行的数据处理变得“轻松易行,任何人都可以做到”。
由于AWS推出了Amazon DataZone和AWS Glue Data Quality等数据管理服务,因此我们不能忽视数据管理领域的动向。
顺便提一下,说到数据管理解决方案,我们部门的合作伙伴Informatica公司非常有名,他们的展位非常受欢迎!在Informatica公司,他们也积极推进产品的云化,追求简单易懂。
参观博览会感受:数据存储解决方案
我总结了听到的解决方案的概要。您看表格,应该立即理解的关键词是”实时”。我还多次听到了”事件驱动”和”低延迟”等词语。
我认为过去常常是将数据集中起来,批量处理数据,然后将结果反馈给最终用户。但是,未来的趋势是实时处理和监控数据,并在事件发生后立即为最终用户采取行动,从数据生成到行动的时间缩短,以实现更高级的解决方案和更好的客户体验。

参观博览会的感想:数据湖和数据仓库类解决方案
除了Databricks和Snowflake之外,还有以下解决方案。
关键词是“数据湖仓库”。
数据湖仓库是“数据湖”和“数据仓库”的合成词。它是将数据湖的可扩展和多样化数据处理功能以及数据仓库的高数据质量和治理功能相结合的解决方案,称为数据湖仓库。虽然这个词最初是由Databricks提出的,但现在已经被AWS、微软、谷歌和甲骨文等各大公司广泛使用。

此外,Databricks、Dremio和Starburst也在会议中就数据湖仓库进行了相关的演讲。
-
- AWS re:Invent 2022 – Build your data lakehouse with Starburst Galaxy (PRT014)
-
- AWS re:Invent 2022 – Build your open data lakehouse with Dremio and AWS (PRT085)
-
- AWS re:Invent 2022 – How Thermo Fisher streams data insights on the Databricks Lakehouse (PRT320)
- AWS re:Invent 2022 – How Corning built E2E ML on a data lakehouse platform with Databricks (PRT321)
如果您想更多地了解数据湖仓库,请阅读以下文章。这是我在 IT Leader 的合作撰写的文章。
- サイロ化を解消し「データとAIの民主化」を加速 DWHとデータレイクの溝を埋める決定打とは?
最后
不知道怎么样?我尽力写出了我的真实感受,如果能稍微传达到当地的潮流就太好了。
在AWS re:Invent中,展示展台可能会给人平淡无奇的印象,但我认为它是这个活动中最能感受到最热烈氛围的地方。
会议的演讲可以后来观看,但展台只能在现场见到,所以我推荐你在当地参加!与现场的工程师进行讨论将是宝贵的经验!
招募队友中!
NTT Data的Data&Intelligence事业部目前正在招募以下职位。
https://nttdata.jposting.net/u/job.phtml?job_code=808
https://nttdata.jposting.net/u/job.phtml?job_code=807
解决方案介绍
– 提供一种一体化解决方案,用于分析和利用数据资产的环境
– 采用最新的云技术,并根据客户需求定制我们独特设计的参考架构(Datalake+DWH+AI/BI)
– 提供可视化、机器学习、深度学习等功能,以一体化方式准备数据资产的环境,可以利用前所未有的数量和质量的数据,高效推动数字化转型。
– https://enterprise-aiiot.nttdata.com/tdf/