Anaconda规模

分布式计算

笔记

该产品已停产。该产品文档的存档副本是为仍在使用它的客户提供的。

Anaconda Scale 提供了在集群中轻松部署 Anaconda® 包和分布式计算框架的功能。它可以帮助您管理多个 conda 环境和包——包括 Python 和 R——on 集群节点。

Anaconda Scale 提供了在集群上部署 Anaconda 的不同选项,包括:

  • 集中管理安装 Anaconda,包括 Python 和 R 等多种环境
  • Cloudera CDH 的 Anaconda 包裹,包括自定义生成的包裹
  • 使用 Spark 作业部署 conda 包和环境

功能

  • 跨多个集群节点轻松安装 Anaconda(包括Anaconda Accelerate)
  • 使用 Dask 提供分布式计算服务
  • 使用单用户 Jupyter Notebook 执行交互式分布式计算
  • 在 Amazon EC2 上轻松启动和配置基于云的集群

兼容性

Anaconda Scale 可与 Spark 或 Dask 等分布式计算框架一起使用,并与 Cloudera CDH 或 Hortonworks HDP 等企业 Hadoop 发行版一起使用。Anaconda Scale 已经过以下 Hadoop 发行版和 Spark 版本的测试:

  • Cloudera CDH 5.3.x 到 5.11.x
  • Hortonworks HDP 2.2.x 到 2.6.x(使用 Apache Ambari 2.2.x 和 2.4.x)
  • Spark 1.3.x 到 2.0.x

许可证

Anaconda Scale 可用于Anaconda Enterprise。如果您想将 Anaconda Scale 与裸机、本地或基于云的集群上的集群一起使用,请联系我们