真实世界的体验

虚拟机的限制

真实世界的体验意味着一个人可以在真实的生产环境中操作真实的机器。 在真实环境中工作的经验常常与仿真环境中的经验大相径庭。 显然,真实的环境比仿真的环境更受大数据世界的重视。 为了使之成为可能,我们提出了 CloudxLab。 Cloudxlab 基本上是一个计算机集群(互相连接的计算机) ,它预先安装了必要的技术堆栈,包括 Apache Hadoop、 Apache Spark、 Kafka、 Python、 R 和其他相关技术。

与诸如 Hadoop 的虚拟机之类的仿真环境相比(基本上是一台需要下载并在单台计算机上运行的虚拟机),基于集群的学习提供了更加真实的体验。 虚拟机只在一台机器上运行,而大多数大数据技术组件在多台计算机上运行。

例如,任何 MapReduce (Hadoop 中最重要的组件之一,用于使用并行的,分布式演算法处理大型数据集的集群) 任务只能在单个机器上运行,这违背了大数据技术使用的并行( parallel ),分布式运算的整个概念。 这就是为什么学习大数据工具一个拥有多台计算机的集群是势在必行的。 使用 CloudxLab 可从集群服务上获得大数据技术的真实体验。

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: