为了从大量的生物医学文献中提取有关生物实体的生物医学信息,第一步是在这些文献中识别它们的名称,由于生物实体命名法的不规范和含混不清,这仍然是一项艰巨的任务。 当前流行的方法(机器学习技术)的识别性能仍有很大的改进空间。 本文提出了一种基于条件随机场的方法,该方法用于识别包括基因,蛋白质,细胞类型,细胞系在内的生物实体的名称,并研究通过利用包括括号对,启发式语法在内的上下文线索来提高性能的方法结构和互动词提示。 在JNLPBA2004和BioCreative2004任务1A数据集上的实验结果表明,