# MongoDB Source组件使用说明
# 组件说明
MongoDB 连接器。用于从MongoDB数据库读取数据。
# 配置项说明
配置名称 | 数据类型 | 是否必填 | 默认值 | 描述 |
---|---|---|---|---|
节点名称 | String | 是 | - | 当前创建的节点名称,由用户自定义且不可为空。命名可包含字母、数字、下划线。 |
节点编码 | String | 是 | - | 当前创建的节点编码,以此标识此组件,由用户自定义且不可为空。命名可包含字母、数字、下划线。 |
选择数据源 | String | 是 | - | 从下拉选项中选择列出的当前项目已经关联的数据源。 |
选择库 | String | 是 | - | 从下拉列表中选择数据库。 |
集合名称 | String | 是 | - | MongoDB 中的集合(Collection)是一组文档的容器,类似于关系型数据库中的表。 |
Schema | String | 是 | - | MongoDB的BSON和SeaTunnel数据结构映射。可以自动获取,也可以手动编写。 |
匹配查询 | String | 否 | 在MongoDB中,用于过滤文档以进行查询操作的匹配条件 | |
投影查询 | String | 否 | - | 在MongoDB中,投影查询是一种查询操作,用于选择性地返回文档中的字段。通过使用投影操作符,我们可以指定需要返回的字段,以及是否要排除特定的字段 |
分片键 | String | 否 | _id | Mongodb分片键。 |
分片大小 | Int | 否 | 64 | Mongodb分片的大小。 |
每批次获取文档数 | Int | 否 | 2048 | 设置每个批处理从服务器获取的文档数量。设置合适的批处理大小可以提高查询性能,避免一次获取大量数据带来的内存压力。 |
查询最长执行时间 | Int | 否 | 600 | 该参数是MongoDB的查询选项,用于限制查询操作的最大执行时间。maxTimeMin的取值以分钟为单位。如果查询的执行时间超过了设置的时间限制,MongoDB将终止操作并返回错误。 |
空闲游标不超时 | Boolean | 否 | 是 | MongoDB服务器通常在一段时间(10分钟)不活动后会对空闲游标进行超时处理,以防止内存过度使用。将此选项设置为true以防止这种情况发生。但是,如果应用程序处理当前批文档的时间超过30分钟,则会话被标记为过期并关闭。 |
字符串映射 | Boolean | 否 | 否 | 该操作将对单个MongoDB数据项执行字符串映射。 |
可选参数 | 否 | - | 其他参数,用户可以根据需求进行配置。 |
# FAQ
Q:MongoDB输入组件无法获取元信息;抛异常:Command failed with error 13 (Unauthorized): 'not authorized on admin to execute command {listDatabases: 1, nameOnly: true }'on server 192.168.16.80:27017. The full response is {"ok: 0.0errmsg"not authorized on admin to execute command { listDatabases: 1, nameOnly: true }code":13,"codeName":"Unauthorized"}'
A:MongoDB数据源配置的用户角色权限不够,没有读取数据库的权限。详见MongoDB官方手册:https://www.mongodb.com/zh-cn/docs/manual/reference/built-in-roles/ (opens new window)