pandas、spark计算相关性系数速度对比

pandas、spark计算相关性系数速度对比 相关性计算有三种算法:pearson、spearman,kenall。 在pandas库中,对一个Dataframe,可以直接计算这三个算法的相关系数correlation,方法为:data.corr() 底层是依赖scipy库的算法。 为了提升计算速
posted @ 2020-07-02 15:55  MyStitch  阅读(2239)  评论(0编辑  收藏  举报