ENG
首页 > 科研 > 科研团队

文档处理与知识工程团队

2022-01-18
  计算机学院文档处理与知识工程团队长期致力于以下方面的研究:以置标语言为基础的信息共享技术、非结构化信息处理技术;智能文档技术;办公软件基础标准体系;电子出版;自然语言处理以及知识计算。
  团队成立于2007年前后,坚持开展学术活动。成立以来,在相关领域承担“核高基”国家科技重大专项课题、“863”课题、国家社会科学基金重大项目课题,国家重点研发子课题,国家自然科学基金项目,北京市自然科学基金、省部级重点项目,以及研究所与企业委托项目;在国内外各类刊物和会议上发表了约200余篇论文,发表专著2部,取得专利10余项,部分实现了成果转化。主持起草国际标准1部,国家标准9部,团体标准2部;参与起草国际标准2部,国家标准3部。
  作为主要起草单位制定的国家标准“可扩展置标语言XML”和“XML使用指南”促使XML成为我国信息产业的基石;作为主要起草单位之一制定的“中文办公软件文档格式规范”(简称“标文通”或UOF),以开放的XML为基础,研究制定包括文字处理、电子表格和演示文稿的统一文档格式,可以保持文档的长久生命力和互操作性。该标准采用自主知识产权,利于推广使用,改变了我国各办公软件的文档不能相互兼容的局面,为从根本上保障国家信息安全起到重要作用,该标准在国内外引起广泛反响。目前,在国家科技重大专项等的支持下,“标文通”得到了国内外主流办公软件厂商的支持,在各主流办公软件中均得到实现,大大提高了国内办公软件产业的竞争优势,推动了办公软件市场的快速发展。目前UOF成为信创联盟国产办公软件格式的测试基准,为研制自主可控的基础软件,突破国外技术垄断,避免“卡脖子”风险起到重要作用。此外,我们还为标准宣贯撰写了使用指南,为产品检测开发了测试工具,为标准应用开发了格式转换工具等。其中,我们作为主要研制单位开发的OOXML-UOF文档格式转换器受到微软的高度肯定,被认为是目前功能最强的文档格式转换工具,特为团队颁发“互操作特别贡献奖”。
  目前我单位正在国内外标准制定机构发挥更加积极的作用。作为国家电子文件管理与推进联盟数字出版工作组和办公文档工作组组长单位,完成了我国的首部电子书格式标准,正在牵头制定正在制定和推进新一版的中文办公软件文档格式国家标准。此外,团队成员作为作为中国专家和代表团团长,参与ISO/IEC JTC1 SC34国际标准组织的工作,担任“文档语义支持”标准的主编,积极为我国争取在国际标准制定中的话语权和主动权。
  目前团队的重点工作聚焦在文档语义分析基础上的文档资源高效利用方面,包括文档中的知识提取,文档格式自动优化,计算机文档辅助写作,以及文档的质量评价等等。多项研究达到国内外先进水平。
  团队与国内的学术机构和领军企业开展了多方面的合作交流。曾主办首届和第二届“全国文档信息处理学术会议”,参加中国计算机学会中文自然语言处理专委会举办的历次“中文自然语言处理与中文计算国际会议”。与中国电子技术标准化研究院、数字出版国家重点实验室、方正、金山、永中、福昕、泰山软件、江阴瀚坤等数字出版企业和办公软件企业开展合作,培养和输送优秀人才。
  团队成员:李宁(负责人)、侯霞、施运梅、田英爱、梁琦、牛科、冯雪、赵淳、温源、张晔。
 
COPYRIGHT @ 北京信息科技大学 京公网安备110402430033号 京ICP备17006670号-1
关注官方微信
关注官方微信
Copyright © 2012 北京信息科技大学 | 京公网安备:110402430033
关注官方微信
关注官方微信

Copyright © 北京信息科技大学

京公网安备:110402430033号

回顶部