摘要:在大数据治理应用中,数据分析是必不可少的一环,且具有耗时长、计算资源需求大的特点,因此优化其执行效率至关重要.早期,由于数据规模不大,数据分析师可以利用传统的矩阵计算工具执行分析算法,然而随着数据量的爆炸式增长,诸如MATLAB等传统工具已无法满足应用需求的执行效率,进而涌现出了一批面向大数据分析的分布式矩阵计算系统.本文从技术、系统等角度,综述了分布式矩阵计算系统的研究进展.首先,本文从发展成熟的数据管理领域的视角出发,剖析分布式矩阵计算系统在编程接口、编译优化、执行引擎、数据存储四个层面面临的挑战.其次,本文分别就这四个层面展开,探讨、总结相关技术.最后,本文总体分析了典型的分布式矩阵计算系统并展望了未来研究的发展方向.