TBDS开发前必读 - TBDSUDC/tdbs-document GitHub Wiki

TBDS开发前必读

TBDS支持的两种开发模式

基于工作流的开发模式

​ 界面配置式的任务调度系统,实现周期性的任务调度;

​ 实现任务调度自动化流程,使得相互依赖的任务可以按照依赖顺序自动运行;

​ 拥有数据导入、数据存储、数据处理、结果导出、数据展示全访问功能;

后台调用组件接口的开发模式

​ 直接调用Hadoop、Kafka、HBase、Spark,Flink等组件的接口开发应用程序;

​ 后台提交Hadoop等组件的程序到TBDS数据集群运行;

​ 开发者自己实现不同任务之间的依赖关系。

TBDS与开源版本的区别

  • 开源hadoop不具备用户身份认证功能。应用系统提交的用户、linux shell场景下用户、程序代码里面提交的用户,都可以传递到hadoop服务端。开源hadoop不对用户做身份认证,认为所有用户都是合法用户。
  • TBDS4.0 的所有合法用户都需要管理员在TBDS门户页面创建,并且需要取得合法的安全密钥(id和key)。拥有密钥的用户才是合法用户,如果密钥与用户不对应、或者密钥不正确,则用户身份认证失败,无法连接到大数据集群。
  • 应用系统提交过来的用户、linux shell场景下的用户、程序代码里面提交的用户,传递到TBDS server端,都需要做身份认证。用户名、id和key必须完全对应,被认可为合法用户,才能进一步对大数据集群进行操作,防止不法开发者使用大数据集群。

TBDS身份认证流程

1563345184634

故:对开发人员来说,身份识别的认证是TBDS和开源版本的重要区别之一