分析印度杂志
现在读
在Spark 3.0上使用RAPIDS提高ETL工作负载的性能
分析印度杂志

在Spark 3.0上使用RAPIDS提高ETL工作负载的性能

  • 作为数据科学家和工程师,您面临的两个最大挑战是数据的指数级增长和缓慢的处理速度。
在Spark 3.0上使用RAPIDS提高ETL工作负载的性能

随着数据的增长,运行ETL(提取、转换、加载)流程以支持无数下游工作负载所花费的时间也在增长。目前,Apache Spark已经成为大规模精简ETL工作负载和分析处理的事实上的标准。有了Apache Spark,组织可以在创纪录的时间内处理大量数据。Spark为ETL(提取、转换、加载)、机器学习和来自不同来源的各种数据集的图形处理提供了一组易于使用的api。目前,Spark正在数百万台本地服务器和云服务器上运行。

2020年,NVIDIA在Apache Spark 3.0中引入了端到端GPU加速。这使得数据科学家和机器学习工程师首次能够将GPU加速应用于ETL工作负载。这种能力还提供了将人工智能的力量和大数据的潜力结合在一起所需的性能和规模。

为了帮助理解和欣赏这项技术的真正潜力,英伟达和Micropoint以及《Analytics印度杂志》将于2021年10月20日组织一场关于“在Spark 3.0上使用RAPIDS提高ETL工作负载的性能”的网络研讨会。

会议将由英伟达资深企业架构师Saurav Agarwal主持,他负责大数据、高级分析和ML。他将讲述最常用的数据架构和ETL工作负载,以及如何在Adobe Spark 3.0上使用gpu和RAPIDS来加速它们。

另请参阅
英特尔炼金术士

现在注册

本次网络研讨会将涵盖-

  • 行业中的ETL/数据架构和工作流
  • 使用Spark上的开源插件加快工作流程的实践示例
  • 介绍有关性能优化和加速的最佳实践。
  • 介绍NVIDIA RAPIDS以及它如何帮助提高ETL工作负载的性能

谁应该参加?

  • 数据科学、数据工程、分析和大数据爱好者
  • 数据工程专业人士和有志之士
  • 有抱负的数据工程师
  • 对分析领域感兴趣的工作专业人士
  • 数据科学和分析专业人士寻求支点
  • 工程/技术背景的学生

现在注册

演讲者细节:

Saurav阿加瓦尔- - - - - -高级企业架构师-大数据,高级分析和ML

Saurav拥有近十年的数据行业经验,在大数据平台上实施人工智能/数据科学/分析解决方案,包括大型数据湖系统。他是一位经验丰富的高级架构师和经验丰富的数据工程师,具有构建分布式实时数据科学管道的经验。Saurav在企业数据领域(包括Hadoop和Spark生态系统)拥有丰富的架构和实施经验,并参与了多个大型项目,涵盖了汽车、供应链、医疗保健、银行、金融科技等领域的端到端数据领域解决方案。他的主要项目包括为一家初级医疗保健提供商提供流式心脏病预测警报,并为一家大型金融科技公司及其各种合作客户建立一个拍字节规模的数据湖。

日期:2021年10月20日

时间:下午6时至7时(IST)

现在注册

你怎么看?

188BET网页

滚动到顶部
Baidu