|
|
一种面向程序理解的程序语义聚类技术 |
陈颖 |
扬州大学 信息工程学院,江苏 扬州 225127 |
|
Semantics-driven Program Clustering for Program Comprehension |
CHEN Ying |
School of Information Engineering, Yangzhou University, Yangzhou 225127, China |
|
摘要 针对源代码中一些非结构化的自然语言描述信息进行语义聚类,辅助开发人员开展程序理解。主要利用自然语言处理技术对程序中的标识符和注释进行预处理,将程序转换成词频矩阵;然后利用潜在语义索引技术对该词频矩阵进行层次聚类,并对每个聚类的标记进行推荐,辅助开发人员理解程序。在开源项目JEdit上进行验证,结果显示对该5万行规模的项目代码进行聚类时耗不足1分钟。因此,该技术能够快速对程序进行语义聚类,辅助开发人员快速理解程序。
|
|
关键词 :
程序理解,
语义聚类,
潜在语义索引,
语义标注
|
收稿日期: 2019-02-04
|
|
基金资助:江苏省教育信息化研究基金项目(20180104);中国民航信息技术科研基地开放基金项目(CAAC-ITRB-201704) |
通讯作者:
陈颖
|
作者简介: 陈颖(1985-),女,扬州大学信息工程学院硕士研究生、助理研究员,研究方向为软件工程。 |
|
|
|