近年来,金融大数据、物联网、云数据中心等新应用的快速发展产生了海量数据。在金融科技大环境下,经济学院成立了“金融数据挖掘和人工智能”研究小组,相关研究近期取得重要进展,成果《Optimization and Improvement of Data Mining Algorithm Based on Efficient incremental Kernel Fuzzy Clustering for Large Data》发表在国际SCI、EI双检索期刊《Cluster Computing》上。
模糊聚类算法中最敏感的部分是初始聚类中心,初始聚类中心的随机选择容易导致局部最优解。增量核模糊聚类算法没有对初始聚类中心的选择进行优化。而是直接将聚类结果转移到后续数据块,很容易形成误差积累,最终影响聚类结果。张翠芬副教授提出了一种基于距离的优化方法对现有的增量核模糊聚类算法进行优化,并给出了改进的算法流程。对比实验结果表明,改进后的算法具有较高的准确率和精度,但在运行时间上仅有微小差别。
研究小组于2017年10月向《Cluster Computing》杂志投稿,其间历经多次修改,于2018年3月5日由斯普林格出版社在线出版。该成果发表将进一步促进小组下步的研究工作。