近日,我院崔展齐教授作为团队—智能软件分析及测试创新撰写论文《基于大语言模型的数据库管理系统模糊测试方法》被我国计算机类核心期刊《计算机研究与发展》官方账号推荐转发。
论文提出了一种利用LLM进行初始种子构建与测试用例生成的DBMS模糊测试方法CLCC。通过引入LLM,CLCC生成的测试用例在SQL语句数量和SQL关键字丰富度方面优于现有方法,从而能够覆盖更多的DBMS功能模块,提升了测试的边覆盖效果。实验结果表明,CLCC在边覆盖指标上优于现有模糊测试工具SQUIRREL、SQLRight和ParserFuzz。
CLCC(curated LLM case construct)是一种基于大语言模型(large language model,LLM)的DBMS模糊测试方法。该方法在模糊测试前,利用LLM对初始种子进行构建,并在模糊测试过程中,根据边覆盖情况筛选种子,引导LLM生成测试用例。与SQUIRREL、SQLRight和ParserFuzz进行的对比实验表明,CLCC测试SQLite、MySQL、MariaDB、DuckDB和PostgreSQL的边覆盖数量比SQUIRREL增加了14.96%~49.31%;测试SQLite、MySQL和PostgreSQL的边覆盖数量比SQLRight增加了6.09%~17.10%;测试SQLite、MySQL和MariaDB的边覆盖数量比ParserFuzz增加了17.95%~41.20%。
《计算机研究与发展》是中国科学院计算技术研究所和中国计算机学会联合主办的学术性期刊。多年来,该刊一直被评为我国计算机类核心期刊,是国务院学位办指定的评估学位与研究生教育的“中文重要期刊”;已被多个国际著名的检索系统收录,如美国《工程索引》(EI)、日本《科学文献速报》、俄罗斯《文摘杂志》等;其影响因子和总被引频次在同类学术期刊中名列前茅。CCF推荐A类中文期刊、计算领域高质量科技期刊T1类。
计算机学院
撰稿/图片 王海龙