加入收藏 | 设为首页 | 会员中心 | 我要投稿 无锡站长网 (https://www.0510zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

内存大数据查询引擎性能优化研究取得进展

发布时间:2023-01-09 16:31:09 所属栏目:大数据 来源:未知
导读: 在Spark SQL框架应用中,配置参数优化是常常面临的问题。现有的机器学习优化方法大多时间成本高、无法很好适应所处理的数据量变化。
近日,中国科学院深圳先进技术研究院先进计算与数字工程

在Spark SQL框架应用中,配置参数优化是常常面临的问题。现有的机器学习优化方法大多时间成本高、无法很好适应所处理的数据量变化。

近日,中国科学院深圳先进技术研究院先进计算与数字工程研究所异构智能计算中心提出低时间成本、能够适应输入数据集大小变化的配置自动优化方法LOCAT。该方法由三个核心技术组成。该研究首先设计了query与配置参数敏感性分析技术。在收集训练样本时,从给定工作负载中识别并删除与配置参数不敏感的query。其次,对于其余的query,LOCAT通过计算相关性系数来识别重要的配置参数,然后应用核主成分分析来降低配置参数搜索维度。最后,LOCAT设计了感知数据集大小的贝叶斯优化来搜索最优配置,以便能根据数据集的大小自动优化性能。基于TPC-DS、TPC-H与HiBench测试基准的实验表明,分别在8台高性能x86服务器的集群环境与4台高性能ARM服务器的集群环境下大数据引擎,较当前最先进的自动调优解决方案,LOCAT降低优化时间成本达9.7倍,而且获得了高达2.8倍的性能提升。

相关成果以LOCAT: Low-Overhead Online Configuration Auto-Tuning of Spark SQL Applications为题,发表在ACM SIGMOD(数据管理国际会议)2022上。

大数据引擎运营中心_百度大数据引擎怎么用_大数据引擎

LOCAT框架

(编辑:无锡站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!