# XML输入组件使用说明
# 组件说明
该组件提供了读取存储在 XML 文件中的信息。
# 配置项说明
配置名称 | 数据类型 | 是否必须 | 默认值 | 描述 |
---|---|---|---|---|
节点名称 | String | 是 | - | 当前创建的节点名称,由用户自定义且不可为空。命名可包含字母、数字、下划线。 |
是否将XML源定义在一个字段中 | Boolean | 是 | false | 如果该组件有上一节点,且需要从该节点中获取变量的值,作为XML源的定义,则选中此选项。 |
源字段名 | String | 是 | - | XML源字段名选择。 |
选择类型 | String | 是 | - | 可选择“HDFS”类型或“LOCAL”类型。 |
选择数据源 | String | 是 | - | 当前输入绑定的数据源名称,从下拉选项中列出的指定的关联类型(HDFS)的数据源进行选择。 |
文件目录 | String | 是 | - | 读取数据的文件/目录来源。 |
正则匹配 | String | 是 | - | 指定要用于选择上一个选项中指定的目录中文件的正则表达式。 |
正则排除 | String | 是 | - | 排除满足此正则表达式指定条件的所有文件(位于给定位置)。 |
循环读取路径 | String | 是 | - | xml文件中的层次结构。 |
编码方式 | String | 是 | UTF-8 | xml文件的字符编码类型。 |
考虑命名空间 | Boolean | 是 | - | 若XML文件使用命名空间则需要勾选此参数。 |
验证XML | Boolean | 是 | - | 在解析之前验证XML格式是否正确。 |
输出中包括行号 | Boolean | 是 | - | 显示行数(从 1 开始),为递增列。 |
行数字段 | String | 是 | - | 行数字段。行数字段。 |
记录数量限制 | String | 是 | - | 限制输出的行数,代表下游节点接收到的最大数量,0 代表输出所有行。 |
是否添加文件名到结果 | Boolean | 是 | false | 此组件运行时,会把读取的文件名输出1列。 |
字段列表 | - | 是 | - | 名称:字段的名称。XML路径:要读取的元素节点或属性的路径节点:要读取的元素类型:节点或属性类型:字段的类型(String,Date或Number等)。格式:控制输入数据的格式(整数、有小数位、日期格式等)。长度:字段的长度取决于以下字段类型:Number:一个数字中有效数字的总数;String:字符串的总长度;Date:字符串打印输出的长度。精度:对于Number:浮点数的数量。对于String,Date,Boolean:未使用。 |