企业数据智能管理治理平台设计与建设技术方案.docx
《企业数据智能管理治理平台设计与建设技术方案.docx》由会员分享,可在线阅读,更多相关《企业数据智能管理治理平台设计与建设技术方案.docx(63页珍藏版)》请在第一文库网上搜索。
1、企业数据智能管理治理平台设计与建设方案目录1.1 总体建设方案概述31.1.1 数据治理论述51.1.2 数据治理流程71.1.3 基础库治理步骤81.1.4 治理过程产出111.2 平台建设总体设计111.2.1 平台设计理念121.2.2 平台架构设计131.2.3 平台技术特点151.3 数据治理建设方案161.3.1 数据标准管理161.3.2 元数据管理201.3.3 数据质量管理251.3.4 数据集成管理301.4 数据管理建设方案311.4.1 数据资产管理311.4.2 数据异常管理441.4.3 数据架构管理471.4.4 数据开发管理481.5 数据智能建设方案541.5
2、.1 数据血缘541.5.2 智能标签561.5.3 数据探索581.5.4 画像分析591.1总体建设方案概述数据管理平台涵盖了数据的全局治理和过程管控,是数据可用的前提,只有 确保数据的标准化、规范化,可信可用,才能进一步通过数据运营、数据应用帮 助大数据中心实现数据资产管理,发现内部数据问题、发掘数据价值,进而实现 数据资产的盘活和有效利用。数据管理平台基于元模型驱动模式,构建一体化的数据资产管控,实现全流 程、全生命周期和全景式的三全治理,确保每一份数据资产皆可靠、可信、 可用。通过对数据、应用、系统综合管理,构建标准化、流程化、自动化、一体化 的数据管理体系。数据治理将分散、多样化的
3、数据通过汇集、标准化、清洗等操作对数据的质 量进行全面的提升和监控,形成城市大数据的管理和控制机制,并提供一站式数 据治理体系,持续不断的挖掘和提升数据的应用价值。从功能角度,数据治理系 统包括数据标准管理、数据目录管理、数据质量管理、数据集成、工作流、数据 地图/数据血缘、数据管理数据安全、多租户、元数据管理、系统安全等功能。制定相关标准规范及管理制度,通过相应平台工具汇聚区内各单位公共数据 及市级落地数据资源,形成区级数据池,同时经过数据清洗、转换、融合、治理 后高质量的公共数据资源,形成区级综合数据平台。数据治理系统通过对数据全生命周期、端到端的全链路透明化管控,实现数 据模型标准化、数
4、据关系脉络化、数据加工可视化、数据质量度量化,实现数 据资产的统一管理及全业务流程的实时监控,有效解决数据资源不可知、数据质 量不可控、数据关系不可联、数据脉络不清晰的痛点问题。数据治理就是将数据转化为资产的手段和方法,采用的数据治理子系统和工 具,以分布式存储和运算为基础,通过人工智能和机器学习技术,辅之以适量的 人工训练和专家反馈不断优化数据理解和数据关联。数据治理子系统给围绕闵行 区大数据资源平台的应用建设目标,包含数据地图、数据质量、智能监控、数据 保护伞以及安全卫士,提供全面的数据治理能力,提供数据提取、数据清洗、数 据标准化、数据转换、数据关联、数据比对等方面服务。在数据打通过程中
5、,同 时做好数据质量管理,主要包括四个方面数据缺失补缺、数据重复去重、数据错 误纠正、数据不可用补救。数据治理子系统通过标准API接口、用户自主上传与自主数据抽取技术将 用户内部数据直接导入数据池,利用全局数据处理技术在数据池中解决大量数据 的集成处理,将数据统一整合、集成,最终形成可以提供高质量数据的数据集成 平台,提供规则、无错漏、清洁、有价值、易使用的集成数据环境。/K 在线服务 一ZFS/深度学习知识图谱KJ数据特征、专家智,r 行业知识库更新令 数据湖+人工智能,济第三方联 。O第3分析数据理解数据关联 数据整合数据安全南内部数据(含暗数据)专家少员参与数据治理流程图数据治理子系统支
6、持现有的绝大多数数据格式的导入和识别。通过结合人工智能技术,数据治理系统能够将数据自动识别并抽取存入数据湖中,与传统ETL 不同的是,数据治理系统的全局数据处理技术在应对多系统、多部门、多环节、多数据、多表单的使用场景时更加科学。全局数据处理能够避免在全局数据汇总 前的信息流失,最大程度的在完成数据集成的同时保持数据的高保真、高还原。1.1.1数据治理论述大数据治理工作从数据汇聚开始,到最终服务业务,主要包括以下几个阶段:大数据治理方法论G上云汇集数据管理汇聚融合服务业务审模型治理 厂基础数据、r. 资源层匚目录C数落变U离线数据实时数据数据治理N 整合数据t 资源层CepaP)Q 5业务治理
7、应用数据 /面向应用,/主题数据 资源层 4 I、资源层CADMTA规则引擎预警中心)督知识A数据资产大屏 A标签查询A安保监控大屏A全息画像 服务A数据开放 API开放/为了无法计算的价值I O阿里百第一阶段:数据汇聚,融合管理从政务办公网、感知网、社会协同单位收集各类数据,形成大数据中心的数 据基础,并对汇集的原始数据开展基于数据管理视角和业务应用视角的治理及应 用工作。基于数据管理视角,对业务元数据、技术元数据进行集中采集和管理,从站 位全局服务闵行区大数据创新应用的角度梳理大数据资产,构建数据资源目录和 数据资产管理应用,达到数据资源的规范化和可视化;汇聚后的原始数据仍处于 零散、不可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 企业 数据 智能 管理 治理 平台 设计 建设 技术 方案
