摘要: pandas、spark计算相关性系数速度对比 相关性计算有三种算法:pearson、spearman,kenall。 在pandas库中,对一个Dataframe,可以直接计算这三个算法的相关系数correlation,方法为:data.corr() 底层是依赖scipy库的算法。 为了提升计算速 阅读全文
posted @ 2020-07-02 15:55 MyStitch 阅读(2239) 评论(0) 推荐(0) 编辑