通用数据采集
刻行时空平台提供了一种依据时间段对机器端数据进行上传的通用数据采集方案,方便用户快速的获取机器端数据。用户在平台侧创建采集任务,确认数据时间范围。机器端 Agent 获取到任务后依据配置的文件地址,扫描文件数据,将符合时间要求的文件上传至平台。
配置采集规则
进入【组织管理】-【设备】-【编辑数采规则】,配置整体的数采规则信息。
mod:
# mod 名称,默认 default,支持监听设备端指定目录下的文件,定制版请联系刻行
name: 'default'
conf:
# 启用开关,true/false,默认启用
enabled: true
# 设备端的监听目录,作为项目中数据采集任务与规则采集的指定目录
base_dirs:
- /home/bag/
- /home/log/
# 自动更新
updater:
# 数采客户端自动更新开关,true/false,默认关闭
enabled: false
具体的配置文件信息介绍,请查看文档数采规则
设备安装 Agent
进入【组织管理】-【设备】-【添加设备】,获取设备 Agent 安装命令
安装命令支持指定相关的设备 ID 文件路径以及关联字段名,若不设定则会随机生成 ID 绑定当前设备。
将设备添加至项目
进入对应的项目,选择【项目设备】-【添加设备】-【从组织设备选择】,选择添加刚才安装的设备到当前项目。
创建采集任务
在项目中 ,通过【任务】-【采集任务】-【创建任务】,选择对应的设备,填写需要采集的时间段信息和相关的描述信息,点击创建任务。
等待采集任务完成
创建完任务后,机器端 Agent 获取对应的任务信息后依据任务的时间段和配置的文件地址信息进行处理,然后上传符合要求的文件至刻行平台。依据机器端的网络速度和上传文件的数量,单次任务完成时间长短不同,请耐心等待。
在任务采集完成之后,任务详情中关联了此次任务关联的 record 信息,点击查看 record 即可查看相关的文件信息。单次的数据采集任务就完成了,就是如此的简单。
数据的后续处理
当数据上传至平台之后,用户可以结合平台提供的自动化能力,对数据进行后续的处理,提升数据流转速度,提升研发效率。
这里以【自动解压缩】为例,当上传的数据包含压缩包时,通过自动化的能力自动的将压缩包文件解压,避免了下载数据 - 解压 - 上传解压数据的繁琐流程。
配置解压触发器
在【自动化】-【触发器】-【创建触发器】中,创建新的触发器。文件通配符填写 *.tar.gz
和 finish.flag
, 其中判断存在压缩包,而且文件上传结束后触发(Agent 在文件上传结束会上传 finish.flag 标记文件标识文件上传过程结束)。
触发解压
在刚才的 record 中手动上传一个压缩包文件,查看对应的解压工作流已经自动触发。
等待解压操作执行完成,查看文件列表,已经存在一个对应的解压文件夹。