2018年6月27日下午,计算机学院在教1楼第一阶梯教室举办了“ AnySCAN: 一个有效的随时框架与大型网络集群的主动学习”学术讲座。
本次讲座邀请阿肯色大学小石城分校信息科学系教授徐晓伟博士。徐晓伟博士于1998年获得慕尼黑大学计算机科学博士学位。徐博士曾任德国西门子公司的资深研究科学家,他的研究领域包括机器学习,数据挖掘, 大数据,生物信息学。徐博士是著名的ACM SIGKDD 时间检验奖(ACM SIGKDD Test of Time)的获得者。他的基于密度的聚类算法DBSCAN已被广泛应的用于教科书和软件系统中。根据谷歌学术的统计数字,徐博士的论文引用率超过了据挖掘领域内国际前十位最具影响力的学者。
讲座主要内容:大数据具有非常高的复杂性, 可以通过图也称为网络将其复杂的关系表示出来。网络社区结构是顶点的集合,它具有相对密集的内部连接。网络社区结构在真实的网络中很常见,其中社会网络包括基于共同位置、兴趣、职业等的社区团体。网络社区结构可以帮助我们创建一个网络的大规模地图, 其中每个社区结构就像是网络中的元节点一样, 这样使大规模海量网络数据的处理变得更加有效。目前随着网络变得越来越大, 现有的网络聚类算法无法有效地发现有意义的网络社区结构。我们在这个方面提出了一个叫做AnySCAN 的算法, 它将机器学习中的任何时间理论算法(Any Time Algorithm Theory)应用于结构聚类算法(SCAN)。此外, 我们也根据机器学习中的积极的学习(Active Learning)策略提出了在AnySCAN 中进一步提高算法收敛的方法。AnySCAN 的积极学习策略能够在大型网络上用很快的速度找到跟原始SCAN算法完全相同的聚类结果。最好我们将AnySCAN应用在现实世界和合成网络的广泛实验,结果证明我们提出的方法大大的优于现有的网络聚类方法。这个报告的内容已经发表在国际顶级大数据会议2017 IEEE International Conference on Data Mining, 会议论文的入用率是9%。
讲座吸引了计算机学院相关领域研究教师、研究生以及感兴趣的本科生的积极参与。在报告过后,大家与徐晓伟博士进行热烈的交流讨论。
Copyright © 北京信息科技大学
京公网安备:110402430033号