实验室研究特色
发布时间:2020-06-02
1.大数据知识工程基础理论与处理框架
作为大数据知识工程的理论基石,吴信东教授提出了HACE原理和大数据知识工程模型BigKE。2014年,吴信东教授提出的HACE原理作为多源异构数据挖掘的理论基础,其科学价值在于摒弃了传统的数据挖掘的背景,以具有先见性的眼界将大数据引入到数据挖掘的架构中,并提出了大数据的多层处理框架。2015年,基于HACE原理,吴信东教授与郑南宁院士、陆汝钤院士等基于HACE原理提出了大数据知识工程模型BigKE,该模型用以解决碎片化知识建模与多源数据源的在线学习、碎片化知识的非线性融合、需求驱动下的自动化知识导航问题。
2.多源海量数据的信息提取、分析与聚合技术
多源动态的复杂物理信息系统为用户自主选择和配置多源海量信息提供了理想的支撑环境和技术手段,使得基于多源海量动态信息的满足用户个性化需求的知识发现与服务成为可能。多源海量动态的信息不仅具有异构、低质量、不确定、多模态、多尺度等特征,还具有多维度的复杂内联关系,在应用于挖掘或发现受信任的知识时,需要解决海量信息碎片化知识的提取、分析与聚合问题,对于大数据知识工程,碎片化知识的提取还需要语义的归一化和非线性融合等处理,实验室结合多源海量数据的多种存在形式对碎片化知识的提取与聚合技术开展研究并取得了一定的成果。
3.网络群体决策分析与动态大数据服务
在网络大数据的多源海量特征下,信息呈现的动态演化特征存在一定的突变机理,大数据知识工程旨在以良好的体系结构,构建以需求驱动的个性化实时动态知识服务系统。在云计算环境下,用户的需求和行为偏向表现出实时性、动态性、演化性,根据地理、年龄、社交媒体等信息,对用户进行动态的分类并研究其行为和偏好、建立合理的网络群体决策分析机制,是实现动态知识服务系统需要克服的关键问题。本实验室在现有的研究基础上,努力探究网络数据平台下的体系结构设计与用户分析,旨在提供高质量的大数据知识服务。