本人的Spark练习代码。 主要是分布式优化及分布式机器学习。 Admm、Fista、ProximalAlgorithm 为分布式优化求解齐次线性方程组算法。 Gradient: 基于RDD,优化logistics regression模型,使用的库为spark.mllib Classify与Boosting: 基于DataFrame,使用的为spark.ml