Code
ParsCit 一个开源的CRF参考文献解析包
译自:ParsCit: An open-source CRF reference string parsing package (部分)
0 摘要
我们这样描述ParsCit:一个自由,开源的参考文献解析包。ParsCit的核心是一个被训练完成的CRF模型,它被用来标记参考文献字符串的序列。这个启发式的模型对一个纯文本文件进行分割和识别。这个包可以直接运行,或者作为一个web服务器使用。
我们用3个不同的数据集来比较ParsCit,并用它和之前已出版的作品比较。