安装 (AEN 4.1.2)

概览

此安装过程涵盖了安装由前端服务器、一个或多个网关和一个或多个计算节点组成的基本 Anaconda Enterprise Notebooks (AEN) 系统所需的步骤。

如果您对安装说明有任何疑问,请联系您的销售代表或优先支持团队。

组件

AEN 平台由三个主要服务组组成: AEN ServerAEN GatewayAEN Compute。这些服务可以分布在多台服务器上(推荐),也可以在一台机器上运行。

服务器

服务器组件是行政前端系统。这是用户登录系统、存储用户帐户、管理员可以管理系统以及与数据库交互的地方。

服务器是所有用户的主要入口点。它负责设置项目并确保将用户发送到给定项目的正确数据中心

Anaconda Enterprise Notebooks 使用MongoDB来存储内部数据。这通常与服务器在同一台主机上运行,​​但也可以部署在单独的主机上。

服务器使用NGINX来处理面向用户的 Web 界面。NGINX 充当请求代理。实际的服务器 Web 进程运行在仅侦听 的高编号端口上localhost,并且 NGINX在那里转发请求。NGINX 服务器还负责静态内容。

网关

网关是验证用户的反向代理,并自动把它们引导到正确的AEN计算机为他们的项目。

网关提供对一组计算节点的单一访问点,并充当代理服务来管理 URL 和端口到计算节点上运行的服务的授权和映射,从而为用户提供一致的统一界面。

通常,出于防火墙原因,使用 AEN 的组织中的每个物理位置都需要一个网关。

用户不会注意到网关,因为它会自动将请求路由到适当的计算节点。

计算节点

计算节点是应用程序(例如 Jupyter Notebook 和 Workbench)实际运行的地方。这些也是用户在终端会话中或使用SSH访问节点时会看到的主机。它是所有用户可见的程序运行的地方。每个项目都与一个或多个计算节点相关联,而这些节点又是单个数据中心的一部分。计算节点只需通过 AEN 网关可达,因此它们可以被防火墙完全隔离。

组件组织

../../../_images/ae-notebooks/4.1.2/install/components.png

图片1

从组织上讲,每个 Anaconda Enterprise Notebooks 安装都只有一个服务器实例。可以配置一个或多个网关实例,每个计算节点只能连接一个网关。由单个网关提供服务的计算节点集合将被称为数据中心。新数据中心可以随时添加到 AEN 安装中。

例如,具有两个数据中心的 Anaconda Enterprise Notebooks 部署,其中一个网关有 20 台物理计算机的集群,第二个网关有 30 台虚拟机,将安装和运行以下服务补充:

1 个  AEN 服务器 实例
2 个  AEN 网关 实例
50 个 AEN 计算 实例 ( 20  +  30 )

Anaconda Enterprise Notebooks 用户主要通过项目、一组conda环境、Jupyter Notebooks 和其他用户团队可以访问的应用程序与系统交互。

项目与 AEN 环境中的单个数据中心相关联。用户团队包括一个Owner,即创建项目的用户。

由于 Anaconda Enterprise Notebooks 是基于 Web 的,因此它在服务器上使用可配置的 HTTP 端口。

安装程序

Anaconda Enterprise Notebooks 安装程序仅适用于付费客户。如果您对 Anaconda Enterprise Notebooks 的演示感兴趣,请联系我们

分布式安装

在分布式安装中,服务器和网关在不同的主机上运行。

单盒安装

服务器和网关都需要单独的外部端口,因为它们是在单机安装中运行在同一主机上的独立服务 。

安装要求

在安装 AEN 之前,请确保您拥有适当的硬件和软件资源。

硬件要求

有关所有 Anaconda Enterprise 硬件要求,请参阅系统要求

注意:我们建议将 ``/opt/wakari`` 和 ``/projects`` 放在同一个文件系统上。如果项目和 conda env 目录位于不同的文件系统上,则计算节点上将需要更多磁盘空间,性能会更差。

软件需求

  • 所有节点上的 Red Hat/CentOS 版本 6.5 到 7.2(支持其他 Linux 发行版,但此安装文档假设 Red Hat 或 CentOS。)
  • 由于 Jupyter 在 $HOME 中查找配置文件和扩展,因此需要 Linux 主目录。
  • /opt/wakari:能够在这里安装并且至少有 10 GB 的存储空间。
  • /projects:大小取决于项目的数量和大小。至少 20 GB 的存储空间。

需要 Linux 系统账号

一些 Linux 系统帐户 (UID) 在安装过程中添加到系统中。如果您的组织需要特殊操作,以下是 UID 列表:

  • mongod (Red Hat) 或mongodb (Ubuntu/Debian):由 RPM 或 deb 包创建
  • elasticsearch:由 RPM 或 deb 包创建
  • nginx : 由 RPM 或 deb 包创建
  • AEN_SRVC_ACCT:在安装 Anaconda Enterprise Notebooks 期间创建,默认为“wakari”
  • ANON_USER:一个账户,如publicanonymous对计算节点如果未找到该用户,AEN_SRVC_ACCT将尝试创建它,如果失败,项目将无法启动。
  • ACL:这些目录需要使用 Posix ACL(访问控制列表)支持 (Posix.1e) 安装的文件系统。检查mounttune2fs -l /path/to/filesystem | grep options

附加软件要求

AEN 服务器
  • Mongo 版本:>= 2.6.8 和 < 3.0
  • NGINX 版本:>= 1.6.2
  • 弹性搜索:>= 1.7.2
  • Oracle JRE 7 或 8
  • bzip2
AEN 网关

没有额外的软件先决条件。

AEN 计算节点
  • 混帐
  • bzip2
  • bash(红帽默认)或 zsh
  • X 窗口系统

注意:如果您不想安装整个 X Window System,您仍然需要安装以下软件包以支持 R 绘图:

须藤 yum的 安装 libXrender  libXext  libXdmcp  libSM  libICE  libXt \
 DEJAVU - SANS -字体 幻觉记忆-衬线-字体 幻觉记忆-字体-通用\
 fontpackages -文件系统

安全要求

  • root 或 sudo 访问
  • 处于 Permissive 或 Disabled 模式的 SELinux

将 SELinux 更改为许可或禁用模式的一种方法是编辑 /etc/sysconfig/selinux 文件并将 SELINUX 参数值设置为禁用或许可。使用 root 或 sudo 访问权限编辑以下文件:

/ etc / sysconfig / selinux

编辑以下内容并重新启动以使更改生效:

# 这个文件控制着系统上 SELinux 的状态。
# SELINUX= 可以采用以下三个值之一:
# enforcing - 强制执行 SELinux 安全策略。
# permissive - SELinux 打印警告而不是强制执行。
# disabled - 没有加载 SELinux 策略。

SELINUX =强制执行

# SELINUXTYPE= 可以采用以下两个值之一:#targeted 
    - 目标进程受到保护,
    #mls - 多级安全保护。

SELINUXTYPE =目标

使用 验证更改getenforce

网络/TCP 要求

请注意,所有端口号都是可配置的,但默认值如下所示。

方向 类型 默认端口 协议 可选的 可配置 注释
入站 TCP 80 HTTP 或 HTTPS 是的 服务器
入站 TCP 8089 HTTP 或 HTTPS 是的 网关
入站 TCP 5002 HTTP 是的 计算

其他要求

假设满足上述要求,则 AEN 不需要额外的依赖项。

注意:虽然不是运行软件的必要条件,但这些说明使用curlwget来下载安装过程中使用的软件包。您可以使用其他适当的方式将需要的文件放入安装目录中。

安装步骤

执行下表中链接的步骤以完整安装所有 Anaconda Enterprise Notebooks 组件。

根据您设置数据中心的方式,可能需要执行以下可选安装过程:

其他安装后信息: