世界要闻：剑拔弩张的 Databricks 和 Snowflake，用个 Apache Iceberg 都能掐架！

当前位置：首页 > 资讯 > >正文

世界要闻：剑拔弩张的 Databricks 和 Snowflake，用个 Apache Iceberg 都能掐架！

来源：InfoQ 时间：2023-07-04 05:50:33

X 关闭

作者 | Lindsay Clark

译者 | 核子可乐

(资料图片仅供参考)

策划 | Tina

这几天，全球两大数据平台巨头 Snowflake、Databricks 均召开了各自的年度大会，这两个技术会议对于做数据系统的从业者来说非常有吸引力。虽然 AI 尽管火爆，但从会议内容来看，竞争的关键还是在数据，因此我们重点关注了两者在数据湖仓技术方向上的发展。这两家都在使用 Apache Iceberg，值得注意的是，有分析师指出，企业需要能同时支持数据湖和数据仓库的单一平台，但目前此类技术还没有真正实现。

随着本地确认支持 Apache Iceberg 和 Hudi 两种表格式，Databricks 正努力扩大其数据湖方案的市场吸引力、巩固在机器学习领域的主导地位，并希望将业务延伸至数据仓库类工作负载领域。

与此同时，其竞争对手 Snowflake 也推出了 Iceberg Tables 更新，宣称要进一步打破数据孤岛。

两家公司都宣称将支持非结构化数据湖式工作负载，可在同一系统之内实现基于 SQL 的数据仓库报告和分析，同时运用分析引擎处理保存在其他位置的数据。在 Delta Lake 中，Databricks 推出了所谓通用格式（UniForm），允许以 Apache Iceberg 或 Apache Hudi 的格式读取存储在 Delta 中的数据。

就在本届旧金山年度供应商盛会正式召开的几天之前，Databricks 公司营销副总裁 Joel Minnick 证实，Delta 是“在开源经历方面参与时间最长、得到广大企业客户好评的智能湖仓格式。”

所有三种表格式均基于 Apache Parquet 数据格式。他提到，“其中的区别在于，这些格式各自会创建出相似、但又不尽相同的元数据”，从而影响数据向应用程序和分析工作负载的表达方式。

结果就是，Delta、Hudi 和 Iceberg 之间存在一定的不兼容性。为了帮助客户简化问题，Databricks 特意为此推出了新的通用格式，简称 Uniform。

Minnick 表示，UniForm 会自动生成全部三种格式的元数据，并自动识别用户想要读取或写入的对应格式。

“之后，它会自动帮用户转换出系统需要的适当元数据。也就是说，只要在 Delta Lake 上构建，那就是在为全部三种格式做构建，直接消除智能湖仓格式带来的复杂性、转译工作完全由不同的连接器来完成。”

Apache Iceberg 是一种开放表格式，专为大规模分析工作负载而设计，同时支持 Spark、Trino、Flink、Presto、Hive 和 Impala 等查询引擎。在 Snowflake、谷歌和 Cloudera 去年宣布支持之后，Iceberg 过去几年来积蓄的生态力量终于成型。也有不少专业厂商参与其中，包括 Dremio、Starburst 和 Tabular——其中 Tabular 是 Iceberg 项目团队当初效力于 Netflix 时的开发成果。

事实上，Databricks 公司联合创始人兼 CEO Ali Ghodsi 去年曾在采访中表示，Iceberg、Hudi 和 Delta 这三种表格式其实非常相似，而且很可能在大多数供应商处得到全面应用。今年，SAP 和微软都宣布将支持 Delta，且两家公司均表示将及时解决 Iceberg 和 Hudi 之间的数据格式冲突。

但作为 Iceberg 的坚定支持者，Databricks 的最大竞争对手 Snowflake 当然不可能毫无行动，而是选择在同一周内举行了自己的年度聚会。

这家云数据仓库与平台企业的市场估值一度达到过惊人的 1200 亿美元，此次宣布了其 Iceberg Tables 内部预览版。此版本号称将打破数据孤岛，只是并不支持 Hudi 和 Delta 格式。

该公司称，组织可以在自己的存储系统中以 Apache Iceberg 格式处理数据，且无论存储数据是否由 Snowflake 工具进行管理，均可使用该公司提供的性能管理与治理工具。

Snowflake 还宣布在 AWS 上推出原生应用程序框架的开放预览版。其思路是帮助开发人员构建和测试 Snowflake Native Apps，借此运用 Snowflake 中的现有数据。据称，配套软件市场上现已有超过 25 款应用可供使用。

Amalgam Insights 公司 CEO 兼首席分析师 Hyun Park 表示，在数据湖领域，Iceberg、Hudi 和 Delta 格式之间将必有一战。

“目前，不少第三方正在与 Iceberg 合作，认为其是最易于使用的数据格式。而且坦率地讲，企业客户也害怕赋予 Databricks 太大的权力。”

然而，Databricks 同时支持这三种格式的举措，意味着其也可以为 Iceberg 客户——也就是 Snowflake 和 Cloudera 的客户——提供服务。

“这是一种颇为明智的方式，能够跨越全部数据湖格式实现智能分析。”

Park 还认为，Iceberg 虽然在技术普及度上更胜一筹，但在性能层面却面临挑战。与此同时，投资者则希望 Snowflake 能够向其他领域扩张自己的力量。Park 表示，“Snowflake 承载着市场估值和股东的期待，因此正努力在应用开发和机器学习等各类平台上充当数据解决方案。”

咨询公司 Forrester 首席分析师 Mike Gualtieri 对 Snowflake 在第三方应用领域的表现则并不满意。“我认为这没什么说服力，因为与企业所需的完整应用解决方案相比，Snowflake 这种专注于应用数据的思路太过狭义、甚至可以说是微不足道。”但他也承认，Snowflake 确实在数据湖方面取得了进展，这对供应商和喜欢该平台的客户来说肯定是个好消息。

过去几年来，数据湖和智能湖仓之间的边界开始日渐模糊。Databricks 率先创造了智能湖仓的概念，并在其平台上提供 SQL 和类似商务智能的查询功能；而 Snowflake 则开始支持非结构化数据。

Gualtieri 指出，“这两种技术之间存在冲突。企业最需要的是统一的平台，所以 Snowflake 不能单纯宣传自己有多么优势、有多像 Teradata。甚至连处理非结构化数据的能力和机器学习技术都没那么重要，毕竟这些都能通过合作伙伴关系来填补。”

最重要的是，企业客户需要的是单一平台，但用户的具体期望和技术间的割裂现状正阻碍着统一市场的形成。

Gualtieri 解释道，“Teradata 和 Snowflake 确实类似：它们都具备一定的机器学习功能，大家可以用它们满足很多需求。Databricks 的功能也确实要丰富得多。但对于那些已经习惯了在 Spotfire 或者 Tableau 中获取报告的商务智能用户来说，他们希望执行查询后就立即得到结果，而不是像查询数据湖那样等待三秒甚至更久。目前，双方在功能和技术水平方面仍然存在差距，短时间内根本不可能实现统一。”

目前，很多组织其实是数据管理与数据分析双线并进。Snowflake 和 Databricks 均拥有大量跨国客户，前者的知名主顾有卡夫亨氏食品集团、康卡斯特和 EDF Energy；后者则坐拥丰田、壳牌和同为 Snowflake 客户的 AT&T。

Gualtieri 表示，数据湖 / 智能湖仓之间的鸿沟恐怕需要三年时间才能打破，就是说到那时双方才能提供对方的全套功能。在这段时间之内，Snowflake 与 Databricks 两派的冲突恐怕还将持续。

参考链接：

/2023/06/29/databricks_snowflake_tables/

本文转载来源：

/article/2MFSI1sQwTvTNJlOlyFS

X 关闭

最近更新

世界要闻：剑拔弩张的 Databricks 和 Snowflake，用个 Apache Iceberg 都能掐架！

2023-07-04 05:50:33

资讯
非白酒板块7月3日涨1.45%，百润股份领涨，主力资金净流入5920.79万元

2023-07-04 04:02:09

资讯
公募REITs上市两周年：不畏浮云遮望眼

2023-07-04 01:35:25

资讯
奴仆宫在哪个位置_奴仆

2023-07-03 22:56:44

资讯
每日看点!广东河源市东源县发生3.7级地震，震源深度9千米

2023-07-03 22:22:37

资讯
日本、荷兰先后出手，光刻机的靴子终于落地，ASML说了实话快讯

2023-07-03 21:35:48

资讯
这山水很中国！60秒走进海南热带雨林国家公园全球今日讯

2023-07-03 20:56:32

资讯
大李颖孙燕（大李颖）

2023-07-03 20:01:32

资讯
六智信息股东蔡智增持7.6万股权益变动后直接持股比例为30.09%

2023-07-03 19:47:12

资讯
环球即时：东京闹市区一咖啡厅发生爆炸，至少4人受伤

2023-07-03 19:09:48

资讯
实拍新疆遭强沙尘袭击：遮天蔽日最新消息

2023-07-03 18:27:34

资讯
天天滚动:这两年张坤咋这么惨，未来怎么看？

2023-07-03 17:52:15

资讯
鸟尊专题展亮相山西青铜博物馆

2023-07-03 17:25:05

资讯
7月3日国内二甘醇市场收盘快讯

2023-07-03 17:14:49

资讯
今热点：建投能源：目前公司尚无运营抽水蓄能项目

2023-07-03 16:41:13

资讯
看热讯：罗普特：累计回购约272万股占比1.45%

2023-07-03 16:16:02

资讯
吃什么长高最快最有效?

2023-07-03 15:53:43

资讯
2023开封事业单位联考面试资格确认注意事项_资讯

2023-07-03 15:22:35

资讯
集中供暖水温多少度（集中供暖注水后一直响不停是为什么）|环球今热点

2023-07-03 15:12:25

资讯
四川德格突发山体滑坡致国道中断现已恢复半幅通行_焦点观察

2023-07-03 14:38:13

资讯
越南高考中文题曝光引热议，网友：原来看得懂完型是这种感觉当前快讯

2023-07-03 13:59:57

资讯
淘宝包邮免费礼物,淘宝上面300元的衣服付邮费免费送活动是不是真实的？|环球聚焦

2023-07-03 13:18:10

资讯
全球热资讯！关于对离退休老党员组织生活弱化问题的思考

2023-07-03 12:58:55

资讯
美国未战先怯，大陆使出三板斧直接绝杀！马英九亲信呼吁不要拒统|每日热闻

2023-07-03 12:01:57

资讯
当前快看：放货物的模板_放货柜英文

2023-07-03 11:39:26

资讯
全球微速讯：大港街道兴华里社区开展“安全使用燃气共享平安生活”主题宣传活动

2023-07-03 11:13:05

资讯
天天短讯！抱团+融合，威海乳山牡蛎“养”出百亿级产业链

2023-07-03 10:55:44

资讯
交通运输行业周报：5月快递行业需求维持中速增长，菜鸟推出自营速递

2023-07-03 10:20:25

资讯
訚字怎么读（关于訚字怎么读的基本详情介绍）

2023-07-03 10:15:15

资讯
快讯：体感49℃！除了热，还有暴雨…

2023-07-03 09:46:22

资讯
全球快报:灵台县城市更新城区污水系统提升工程（一期）监理中标结果公告

2023-07-03 09:14:14

资讯
内地影市上半年票房大涨5成，《消失的她》总票房破23亿，关注影视板块投资机会世界滚动

2023-07-03 08:55:47

资讯
彩蝶恋桃花打一个动物彩蝶恋桃花-焦点快看

2023-07-03 08:22:25

资讯
环球新资讯：巴西前总统罗塞夫：美国滥用美元特权将其武器化破坏全球供应链

2023-07-03 07:41:23

资讯
全球热讯:广西南宁：高校毕业生“零门槛”落户

2023-07-03 06:30:36

资讯
什么是山药蛋派?_全球看热讯

2023-07-03 05:26:07

资讯
当前速讯：武汉经开区无人驾驶巴士可刷“武汉通”

2023-07-03 03:05:20

资讯
智齿拔完后洞多久恢复_拔智齿后吃什么恢复快

2023-07-03 00:52:58

资讯
世界动态:“‘Z世代’画像中国”｜离开香格里拉时，他恋恋不舍：我是个云南人

2023-07-02 22:19:50

资讯
消息称苹果AirPods Pro充电盒将换用USB-C接口，测听力功能开发中|环球热消息

2023-07-02 21:09:04

资讯
现车最高降4.5万，特斯拉降库存还是冲销量

2023-07-02 19:58:17

资讯
环球热头条丨武汉市未来几天天气预报

2023-07-02 19:10:21

资讯
一场成都车展成为众车企们冲锋前的集结阵地

2023-07-02 18:09:49

资讯
焦点报道:002169智光电气

2023-07-02 17:10:34

资讯
农庄里，藏着东莞本地人的独家配方|全球微头条

2023-07-02 15:34:20

资讯
宝山区持续优化营商环境，助力医疗器械企业成长_环球观热点

2023-07-02 14:53:27

资讯
每日资讯：2023山东职业学院招生计划山东职业学院招生简章

2023-07-02 13:02:07

资讯
今日关注：青春“快闪”为党庆生

2023-07-02 12:07:31

资讯
升级款“脸基尼”火了有店铺狂卖30万件-环球快消息

2023-07-02 11:15:38

资讯
女生拒绝中途加价，被扔别处！司机还上门打人|最新

2023-07-02 11:10:26

资讯
基因链断裂会怎样（基因链）-视点

2023-07-02 09:53:38

资讯
和胜股份：和胜新能源扩产项目奠基，投产后年产值可达20亿元

2023-07-02 09:21:45

资讯
焦点热门:京雄快线建设确保清水北流

2023-07-02 08:40:41

资讯
全球热门:以信念为话题的作文题目_以信念为话题的作文题目

2023-07-02 07:45:25

资讯
天天看点：新一轮大范围强降雨来了，京津冀等地高温将短暂减弱

2023-07-02 07:07:31

资讯
全球讯息：“谢大脚”于月仙：无儿无女去世近2年，丈夫的选择让人泪目...

2023-07-02 06:16:46

资讯
天天快讯:重要提醒：个人档案，不能私拆！

2023-07-02 04:03:09

资讯
托布谈自己的名场面：每次我遇到错位时老詹说我就应该要球天天观察

2023-07-02 01:07:38

资讯
怪物猎人世界灵脉的古龙骨怎么获得_魔兽世界龙骨怎么获得

2023-07-01 22:49:14

资讯
世界关注：【路试】全新林肯冒险家加持“林肯之道2.0”，好似脚踏清风

2023-07-01 21:38:14

资讯
海南旅游发展研究院揭牌助力旅游业高质量发展_最新

2023-07-01 20:30:13

资讯
武夷山在哪个省的_武夷山在哪个省精彩看点

2023-07-01 19:11:55

资讯
焦点热议:去胎毒的孕妇饮食疗法_孕妇饮食要注意什么

2023-07-01 18:52:37

资讯
更年期如何调理失眠（更年期如何调理）_每日精选

2023-07-01 17:48:25

资讯
快消息！朔州市平朔建设工程质量检测有限责任公司_对于朔州市平朔建设工程质量检测有限责任公司简单介绍

2023-07-01 16:57:30

资讯
山东法院劳动争议案超11万

2023-07-01 15:53:10

资讯
泰顺六人书法篆刻作品展亮相西湖区文化馆

2023-07-01 14:58:49

资讯
猪价继续走低再次跌破14元每公斤，政策收储预期较强|当前热点

2023-07-01 14:06:01

资讯
又一名归化球员要回归中超？巴媒：俱乐部名字暂时保密

2023-07-01 12:52:58

资讯
要闻：死神vs火影3.3怎么选隐藏人物水门_怎么隐藏qq号码

2023-07-01 12:01:18

资讯
魅族16th对比魅族16s 每日快看

2023-07-01 11:05:21

资讯
世界快看点丨欧媒刊文：美国长期双标信誉正严重下滑

2023-07-01 10:55:31

资讯
惠泰医疗：6月30日融券净卖出1.6万股，连续3日累计净卖出1.78万股-全球最资讯

2023-07-01 10:08:23

资讯
北京市市长殷勇会见英国伦敦证券交易所集团首席执行官_天天热门

2023-07-01 09:38:21

资讯
极氪汽车6月交付10620辆同比增长146.9%_简讯

2023-07-01 09:01:15

资讯
乌龙闯情关主题曲太多乌龙闯情关主题曲

2023-07-01 08:10:05

资讯
嘉实基金管理有限公司关于旗下基金投资新五丰向特定对象发行股票的公告_天天热头条

2023-07-01 07:17:00

资讯
四川茶叶品牌哪个好（四川茶叶品牌有哪些）信息

2023-07-01 06:25:13

资讯
煉子鸡怎么做才好吃?

2023-07-01 05:34:42

资讯
工业废水mvr蒸发器_工业废水

2023-07-01 02:57:57

资讯
2：17！日本女排拦网被狂虐，八强名额不稳，送中国队大礼

2023-07-01 01:05:15

资讯
中国央行货币政策委员会：坚决防范汇率大起大落风险

2023-06-30 23:08:43

资讯
明日之后五星典藏ksg（明日之后mp5典藏值得晋星吗）

2023-06-30 22:03:38

资讯
这个小区竖起了安全墙

2023-06-30 21:32:48

资讯
满帮一季度业绩超预期，华兴资本给予“买入”评级环球新消息

2023-06-30 20:50:28

资讯
每日速看!河北省氢能产业创新联合体成立推动氢能产学研用一体化发展

2023-06-30 19:29:24

资讯
凌玮科技(301373.SZ)子公司成都展联拟终止代理BYK产品|世界焦点

2023-06-30 18:35:44

资讯
【速看料】南通创新区紫琅人才公寓申请咨询电话

2023-06-30 17:27:57

资讯
巨人网络(002558)龙虎榜数据(06-30)_天天资讯

2023-06-30 16:08:49

资讯
金山区城市数字化转型推进大会今天举行！

2023-06-30 15:30:16

资讯
中国—非洲国家卫生与植物卫生（SPS）合作论坛召开促进中非互利共赢

2023-06-30 14:43:05

资讯
淘宝买家秀怎么发布超链接（淘宝买家秀怎么发布）

2023-06-30 13:47:33

资讯
《卧龙苍天陨落》首个 DLC 差评如潮，流程短 BUG 多

2023-06-30 12:57:54

资讯
天天速递！美国一女乘客误以为绕路被绑架，对着网约车司机后脑勺开枪

2023-06-30 11:58:44

资讯
天天实时：清平乐：柳青瑶国乐风华涂色集

2023-06-30 11:17:09

资讯
袁悦、白卓璇晋级温网女单正赛_天天速看

2023-06-30 10:34:19

资讯
今日快看!庆余年中为什么所有人都在保护范闲_原著里五竹是个机器人吗

2023-06-30 09:37:03

资讯
每日动态!富临集团控股公布2023财年年度权益分配方案

2023-06-30 09:13:05

资讯
广撒网又一女子晒聊天记录，曝光内马尔私聊“勾搭”她|最新消息

2023-06-30 08:42:12

资讯
宝安区区级财政专项资金管理办法全球热讯

2023-06-30 08:51:30

资讯

世界要闻：剑拔弩张的 Databricks 和 Snowflake，用个 Apache Iceberg 都能掐架！

推荐内容

最近更新