怎样读一篇论文

说明: 在 2013 年的 8 月,University of Waterloo 的一个教授,S. Keshav 写了一篇论文 How to Read a Paper,内容是,如何读一篇论文。这篇论文发表后,很快受到大家的强烈关注。文中介绍了一些阅读论文的一些步骤,希望大家能更好的阅读那些文献。即便不读文献,在读其他各种工具文的时候,也颇有借鉴意义。当时,我的邮件列表里面满是对这篇论文的推荐。当时读完后感觉很赞,本打算拼着渣英语不管,也要翻译下来分享下,可惜当时正被某人各种push中,所以事情一拖再拖。

如今已然半年过去了,但既然稍有时间,还是把这件事情了结下吧。 (more…)

ParsCit 一个开源的CRF参考文献解析包

译自:ParsCit: An open-source CRF reference string parsing package (部分)

0 摘要

我们这样描述ParsCit:一个自由,开源的参考文献解析包。ParsCit的核心是一个被训练完成的CRF模型,它被用来标记参考文献字符串的序列。这个启发式的模型对一个纯文本文件进行分割和识别。这个包可以直接运行,或者作为一个web服务器使用。

我们用3个不同的数据集来比较ParsCit,并用它和之前已出版的作品比较。

(more…)

ParsCit: An open-source CRF reference string parsing package

当今世界,文献资料的数量几乎是以指数级别的增长,而文献的传播过程中,往往并非仅仅通过电子版的数据传输. 由于各种条件限制,文献数据有时候甚至是Word->PDF->纸质打印资料->扫描进文件->再次整理资料这样螺旋式的传播. 而在再次整理资料的时候,往往不免要遇到这样或者那样的奇怪的数据,比如1变成了i,有些数据彻底错位等等. ParsCit ,一个开源的package,正是试图通过CRF的分析方法,将文献后的reference再次整理为有序的数据. (more…)