针对目前正在分散异构的大领域软件开采中难以高效地晓得消息和创造常识的题目,将语义网引入软件工程周围,对众源异构数据举办细粒度语义相闭,提出本体修建、相闭抽取和创造的措施,完成基于本体的软件工程相闭数据的自愿修建。该措施对软件工程本体举办观点抽取、统一、实例消解和属性消歧,从软件堆栈布局化数据集合抽取出完全无冗余的相闭数据;并采用同义词、动宾短语和布局相干三个特质愚弄自然说话收拾( NLP)本事和消息检索(IR)本事从软件堆栈中创造潜正在的相闭数据。尝试结果注解乐鱼体育,所提出的措施能从分散式软件工程数据集合自愿修建和协调天生软件工程本体,并有用地创造潜正在的相闭数据将其扩充到软件工程本体中;与Baseline、Phraing和o-csⅡ三种措施比拟,相闭数据创造的召回率、精准率和F值都有明显进步。