项目概述:本项目主要研究和开发基于模式的高准确搜索系统。该项目的关键技术为:(1)定义了一种模式语言,以表达词语之间的二元和多元关系,包括语法关系和语义关系;(2)从INTERNET的信息海洋中抽取各种模式,建立一个模式库,分析得出每个模式的各种特征与属性;(3)针对新的网页数据,对其进行自然语言处理,主要包括词法分析和句法分析,在此基础上,分析与抽取各个词语间的模式关系,包括二元关系、多元关系,建立包括关键字索引和模式索引的索引库;(4)针对一个查询请求,进行查询分析,得到检索关键词和模式,进行匹配检索;(5)查询结果的展示。
本项目的创新之处在于利用词语之间的关系模式来显著提高信息搜索准确性(查准率)。这种技术可以与经典的向量模型技术叠加,所以,可以显著提高信息搜索的准确性,而不会影响召回率。
该项目的成果可以应用到广域网的信息检索,也可以应用到特定领域的信息搜索。具有良好的市场前景。技术上具有一定的竞争优势。预计融资要求为300万元,可以以风险投资或项目合作的方式进行。