蒙戈适配器¶
MongoAdapter 模块从 Mongo 数据库集合中读取数据并生成一个包含加载的 NumPy 数组。目前实现了以下功能:
- MongoAdapter 引擎是用 C 编写的,以确保以最少的内存使用量快速加载数据。
- Python 切片符号可用于指定要从数据源读取的记录子集。
- MongoAdapter 引擎具有自动类型推断,因此用户不必指定输出数组的 dtypes。
方法¶
MongoAdapter 模块包含以下用于创建 MongoAdapter 对象的构造函数:
- MongoAdapter(主机、端口、数据库、集合)
- MongoAdapter 构造函数host - 运行 Mongo 数据库的主机名。port - Mongo 数据库运行的端口号。数据库 - 要连接到的 Mongo 数据库集合 - Mongo 数据库集合
- set_field_names(名称)
- 在创建输出 NumPy 数组时设置要读取的字段名称。
- get_field_names ()
- 返回从 Mongo 数据库读取数据时将读取的字段名称。
- set_field_types(类型=无)
- 为每个字段设置 NumPy 数据类型,指定为字段名称/索引和关联数据类型的字典。(例如:{0:'u4', 1:'f8', 2:'S10'})
- get_field_types ()
- 返回字段名称/索引和关联的 NumPy dtype 的字典。
MongoAdapter 对象包含以下属性:
- 大小(只读)
- Mongo 数据库中的文档数 + 构造函数中指定的集合。
基本用法¶
为数据源创建 MongoAdapter 对象
>>> import iopro >>> adapter = iopro.MongoAdapter('localhost', 27017, 'database_name', 'collection_name')
使用切片符号将 Mongo 集合文档加载到 NumPy 数组中
>>> # read all records for 'field0' field >>> array = adapter['field0'][:]
>>> # read first ten records for 'field0' and 'field1' fields >>> array = adapter[['field0', 'field1']][0:10]
>>> # read last record >>> array = adapter['field0'][-1]
>>> # read every other record >>> array = adapter['field0'][::2]