官方网站链接:https://dataspace.princeton.edu/jspui/
简介
DataSpace是一个简单易用的大数据集群资源管理系统。用户可以通过可视化界面或Rest API创建自己的数据空间,实现空间内数据的数据资源和计算资源隔离,并且支持对空间中的数据资源进行共享。
应用场景
云海Insight大数据平台提供海量异构数据的统一管理和处理能力,不同来源、不同归属的数据通过统一的平台进行汇集。DataSpace的大数据空间管理功能,可以保证不同部门或组织的数据所有者对数据拥有独享权利,也支持将自己的数据共享给其他部门或组织。
然而资源的池化和共享带来了数据安全与隐私保护的问题以及不同使用者间的资源争抢问题。
功能特性
1. 管理多种数据资源
可以管理HDFS、HBase、Hive、Kafka等多种数据资源。
2. 支持数据资源隔离性
通过资源同步,将数据资源加载给资源所有者,并且在Ranger中添加Policy,保证数据资源的隔离性。
3. 支持数据资源共享性
通过数据资源的开放订阅及数据资源的指定共享,可以实现用户有权利访问到其他用户的数据资源,进行数据融合和计算分析。
4. 可视化交互式操作
提供丰富的操作界面,方便用户便捷完成集群资源隔离和共享的操作过程。