对于汇总n天的log这种扫一次或几次的非严重迭代运算的场景,spark相比于hadoop而言的性能是继续有优势、差不多还是差了?
还有就是除了文档里面机器学习的几个算法,大家在日常还有哪些比较合适的应用场景,以及集群的规模(cpu个数,内存数),希望大家分享。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。