目录:
在模型设计创建的表在表管理中如何可视化?
在模型设计中,如何实现表之间的关联关系?
如何将本地结构化csv或txt数据文件直接加载到表中?
Q:在模型设计创建的表在表管理中如何可视化?
A:在表管理中,点击加载表,选择数据源类型和数据库,查询出来的表点击选择就可以把表加载到表管理中。
图 表加载图
Q:在模型设计中,如何实现表之间的关联关系?
A:在模型设计面板,通过拖拉拽方式把表模型放到面板,把有关联的表可以通过箭头线段连接起来即可实现。
图 模型关系设计图
Q:如何将本地结构化csv或txt数据文件直接加载到表中?
A:在表管理中,在相应数据结构匹配的表操作下点击上传,填写覆盖方式(可以追加也可以全量替换),然后选择本地文件即可。
图 文件数据上传图
图 文件数据上传图
数据开发相关常见问题
目录:
脚本发布有什么作用?
如何创建一个MR脚本?
如何创建一个Spark脚本?
脚本批量导入时出现异常导致脚本导入不完全如何处理?
如何把脚本回滚到之前的版本?
python脚本中用到的包应该放到哪?
如何在Khan脚本中运行oracle脚本?
Q:脚本发布有什么作用?
A:
1.只有发布的脚本才可以进行版本控制,可以进行回滚操作。
2.如果工作流中要配置编辑好的脚本,脚本只有发布才可以在工作流中调度。
Q:如何创建一个MR脚本?
A:进入数据工厂,点击数据开发-脚本管理,点击+,选择MR
图 脚本选择图
图 表参数图
参数1:选择jar包存放在HDFS的位置
参数2:填写函数名,如com.bfd.wordcount
参数3:填写相应参数,如输入输出路径
Q:如何创建一个Spark脚本?
A:进入数据工厂,点击数据开发-脚本管理,点击+,选择Spark
图 表参数图
参数1:选择jar包存放在HDFS的位置
参数2:填写函数名,如com.bfd.wordcount
参数3:填写相应参数,如输入输出路径
Q:脚本批量导入时出现异常导致脚本导入不完全如何处理?
A:手动删除已经导入的脚本,然后重新提交压缩包进行导入。
Q:如何把脚本回滚到之前的版本?
A:点击查看历史版本,选择相应版本点击回滚。
图 历史版本图
图 版本回滚图
Q:如何在KHan脚本中运行Oracle脚本?
A:在KHan脚本的第一行添加 set dialect = 'oracle' ;即可。
图 KHan脚本图