# 词根管理
# 功能概述
词根是语言学中的一个概念,它指的是词语的核心部分,表示词语的基本含义。词根不能独立成词,但它具有很强的构词能力,是构成词语的语素之一。词根可以单独构成词,也可以彼此组合成词,还可以加上前缀、后缀、词尾等构成新词。
在数据资产平台中主要被用来标准化模型定义,保证相同含义的字段名称能够采用相同的英文定义。由于词根本身的梳理工作量较大,并且需要配合企业内部数据管理规范实现严格的控制落地,因此目前平台并没有做强逻辑控制,更多的以推荐方式提供参考依据,辅助标准管理员和模型开发人员能够更快速、更标准化的完成配置设计工作。
# 功能入口
【数据标准】-【标准配置】-【词根配置】
# 词根匹配规则
- 全部匹配
当中文名称和某个词根完全匹配,则直接返回英文名称。 - 分词匹配
对中文名称进行分词,分词后的结果与词根库匹配,如果能够匹配成功,则按照分词顺序拼接英文名称,分隔符默认是下划线"_",可以在接口中自定义。
例如“证件编号”,其中“证件”词根英文名为"certification",“编码”词根英文名为“code”,则最终输出结果为“certification_code”。 - 未匹配
对于未匹配的情况,接口会提示某个词汇暂无词根,具体情况以使用页面为准。
# 使用场景
目前数据资产平台已经实现的词根匹配的场景主要包含:
- 数据标准:新增数据元,通过点击“词根匹配”按钮触发,根据标准中文名称匹配生成字段名/标准英文名。
- 数据标准:新增指标标准,通过点击“词根匹配”按钮触发,根据标准中文名称匹配生成字段名/标准英文名。
- 数据模型:新增模型实体(概念实体/逻辑实体/物理实体)或字段,根据实体名称或字段名称自动匹配,生成实体名和字段名。
# 字段说明
参数 | 说明 |
---|---|
中文名称 | 词根中文名,主要用于分词时对应匹配。 |
英文名称 | 与词根相匹配的英文名称,一般使用英文全称。默认系统中使用的词根匹配都会使用英文名称作为匹配结果返回。 |
英文简称 | 英文简称,词根匹配接口支持使用简称返回,这样可以有效优化字段长度。 |
备注 | 词根相关描述说明。 |
# 操作说明
# 词根管理
登录账号后,打开菜单栏,点击“数据资产”,再点击左侧的标准管理下拉菜单,选择“词根管理”进入到词根管理页面。
# 新增词根
点击上方的“新增词根“按钮进入到新增词根页面。 输入信息后点击“提交”即可新增词根。
# 批量导入
点击上方的“批量导入”按钮,上传数据文件,点击确定,完成词根批量上传操作。 上传后系统会自动解析附件,将解析后的数据在列表上列出,点击提交按钮完成导出操作。
# 相关操作
- 编辑词根:列表页点击“编辑”按钮进入到编辑词根页面,输入信息后点击“提交按钮”完成词根编辑。
- 删除词根:列表页点击“删除”按钮进入到删除确认框,点击“确定”即可删除词根。
- 批量删除:在数据前方选择该数据库的单选框,然后点击“批量删除”按钮可以完成批量删除操作。
- 导出:支持当前页导出、导出所选和全部导出。