蒙戈适配器

MongoAdapter 模块从 Mongo 数据库集合中读取数据并生成一个包含加载的 NumPy 数组。目前实现了以下功能:

  • MongoAdapter 引擎是用 C 编写的,以确保以最少的内存使用量快速加载数据。
  • Python 切片符号可用于指定要从数据源读取的记录子集。
  • MongoAdapter 引擎具有自动类型推断,因此用户不必指定输出数组的 dtypes。

方法

MongoAdapter 模块包含以下用于创建 MongoAdapter 对象的构造函数:

MongoAdapter(主机、端口、数据库、集合)
MongoAdapter 构造函数
host - 运行 Mongo 数据库的主机名。
port - Mongo 数据库运行的端口号。
数据库 - 要连接到的 Mongo 数据库
集合 - Mongo 数据库集合
set_field_names(名称)
在创建输出 NumPy 数组时设置要读取的字段名称。
get_field_names ()
返回从 Mongo 数据库读取数据时将读取的字段名称。
set_field_types(类型=无)
为每个字段设置 NumPy 数据类型,指定为字段名称/索引和关联数据类型的字典。(例如:{0:'u4', 1:'f8', 2:'S10'})
get_field_types ()
返回字段名称/索引和关联的 NumPy dtype 的字典。

MongoAdapter 对象包含以下属性:

大小(只读)
Mongo 数据库中的文档数 + 构造函数中指定的集合。

基本用法

  1. 为数据源创建 MongoAdapter 对象

    >>> import iopro
    >>> adapter = iopro.MongoAdapter('localhost', 27017, 'database_name', 'collection_name')
    
  2. 使用切片符号将 Mongo 集合文档加载到 NumPy 数组中

    >>> # read all records for 'field0' field
    >>> array = adapter['field0'][:]
    
    >>> # read first ten records for 'field0' and 'field1' fields
    >>> array = adapter[['field0', 'field1']][0:10]
    
    >>> # read last record
    >>> array = adapter['field0'][-1]
    
    >>> # read every other record
    >>> array = adapter['field0'][::2]