# Neo4j Sink组件使用说明
使用示例
# 组件说明
Neo4j Sink连接器。用于将数据写入Neo4j。
Neo4j的版本目前支持4及以上,3版本的可能会导致读取的库不正确。
# 配置项说明
| 配置名称 | 数据类型 | 是否必填 | 默认值 | 描述 |
|---|---|---|---|---|
| 节点名称 | String | 是 | Neo4j | 当前创建的节点名称,由用户自定义且不可为空。命名可包含字母、数字、下划线。确保唯一性。 |
| 节点编码 | String | 是 | 自动生成 | 当前创建的节点编码,以此标识此组件,由用户自定义且不可为空。命名可包含字母、数字、下划线。确保唯一性。 |
| 选择数据源 | String | 是 | - | 从下拉选项中选择列出的当前项目已经关联的数据源。 |
| 选择数据库 | String | 是 | - | 从下拉列表中选择数据库。 |
| 写入模式 | String | 否 | 逐一写入 | 逐一写入:每条数据独立提交事务,适用于小数据量或需要精确控制事务的场景。 批量写入:一批数据一次提交,大幅提升写入性能。需配合max_batch_size控制批次大小。 |
| 查询 | String | 是 | - | 查询语句。 |
| 查询参数位映射 | List | 是 | - | 参数占位符与输入字段位置的映射。关键字名称是参数占位符名称。关联值是输入数据行中字段的位置。位置从0开始计算。 |
| 最大事务重试时间 | Int | 否 | 30 | 最大事务重试时间(秒)。如果超过,事务将失败。 |
| 最大连接超时时间 | Int | 否 | 30 | 等待建立TCP连接的最长时间(秒)。 |
| 可选参数 | Map | 否 | - | 其他参数,用户可以根据需求进行配置。 |
# 最佳实践建议
大数据量写入优先选BATCH模式:吞吐量可提升数倍至数十倍,建议max_batch_size设置为1000~5000(需测试调整)
鉴权方式选择:优先username/password;若使用企业SSO,可选用bearer_token或kerberos_ticket
错误重试:生产环境建议max_transaction_retry_time设为30秒以上,应对网络抖动
连接协议:优先使用neo4j://(路由协议,支持集群),单机测试可用bolt://