将 Anaconda 与 Cloudera CDH 一起使用

在具有Cloudera CDH的集群上使用 Anaconda Scale 有不同的方法 :

  • Cloudera CDH免费提供的Anaconda 包
  • Cloudera CDH 的自定义Anaconda 包裹
  • 使用 Anaconda Scale 在所有节点上的 Anaconda 动态托管版本

免费提供的 Anaconda 包基于 Python 2.7,包括免费 Anaconda 发行版中提供的默认 conda 包。

Anaconda Enterprise 用户还可以利用 Anaconda Repository 为 Cloudera Manager 创建和分发他们自己的自定义 Anaconda 包

如果您需要比 Anaconda Parcel 提供的更多动态功能,Anaconda Scale 可让您动态安装和管理多个 conda 环境(例如 Python 2、Python 3 和 R 环境)以及跨集群的包。

使用 Anaconda 包裹

有关使用 Cloudera Manager 在 CDH 集群上安装 Anaconda Parcel 的更多信息,请参阅Anaconda Parcel 文档

过渡到 Anaconda Scale 的动态托管版本

要从用于 CDH 的 Anaconda 包过渡到 Anaconda Scale 的动态托管版本,请按照以下说明在 CDH 集群上卸载 Anaconda 包,然后过渡到集中管理的 Anaconda 版本。

卸载 Anaconda 包

如果在CDH集群上安装了Anaconda Parcel,卸载parcel:

  1. 在 Cloudera Manager Admin Console 的顶部导航栏中,单击 Parcels 指示器。
  2. 在 Anaconda 地块列表的右侧,单击停用按钮。
  3. 出现提示时,单击确定以停用 Anaconda 包并重新启动 Spark 和相关服务。
  4. 单击 Anaconda 地块列表右侧的箭头,然后选择从主机中删除。
  5. 在确认对话框中,确认从集群节点中删除 Anaconda 包。

有关管理 Cloudera 包的更多信息,请参阅 Cloudera 文档

过渡到集中管理的 Anaconda 安装

卸载 Anaconda 包后,请参阅Anaconda Scale 安装说明以获取有关安装集中管理版本 Anaconda 的更多信息。