CONA概述

明略智能数据治理产品CONA 是一款通过人工智能算法实现大规模数据自动化治理的数据产品,并通过人机结合的方式实现高效精准的数据治理。能够大规模自动化的采集、清洗、归类、关联所有数据,形成统一数据视图给后续系统服务

CONA产品愿景

CONA,即Connect All the data,就是关联所有数据的意思,该软件能够大规模自动化的采集、清洗、归类、关联所有数据,形成统一数据视图给后续系统服务。“关联”是它核心的定义,在我们进行大数据挖掘之前,往往需要把关系型数据的Schema关联起来。CONA是一款通过一款人工智能算法实现大规模数据自动化治理的数据产品,并通过人机结合的方式实现高效精准的数据治理。

machine driven, human guided(机器驱动,人类指导)!

CONA是明略数据的首创,国内外还没有相关竞品能够自动地完成从关系数据到知识图谱的自动构建。CONA完全基于Spark/Hadoop平台构建,海量数据源治理时候,扩展性非常好。同时CONA基于机器学习的数据自动转换能力能够将大量从事数据治理工作的人力解放,投入到真正的业务实现工作中去。

CONA产品亮点

从关系表到知识图谱目标数据模型的迅速构建

以60个表为例,构建速度逐步缩短至3天,这里面需要经验和知识的积累,会积累很多常用的知识图谱数据元素结构。

复杂数据转换规则的设计与实现

尤其对于机器学习规则、嵌套规则、组合规则、数据字典规则等的设计与实现。

高精度全局正确性验证

内部团的定义、各种环节各种校验规则的实现,进行了大量的积累和沉淀。

自洽性高的内部元数据管理

源表、目标表、映射、规则等内部存储机制的设计与实现,同时兼容后续版本的演进。

适配性高的任务调度

实现满足数据增量、全量、全量式增量、回滚等任务的自动化调度。

CONA典型使用场景

以公安领域实际数据治理为例,公安业务面对大量原有业务系统中近千张表,通过传统数据治理工具可能需要半年以上的时间。而CONA能够缩短到2周,极大地提高了数据治理和关联的效率,从而极大地降低了行业大数据和行业人工智能的实施成本。

A. 北京市海淀区中关村东路1号院1号楼 清华科技园 创新大厦A座10层

T. 010-82151987 F. +8610-84678165

©2015 MININGLAMP. All rights reserved 京ICP备15016868号