说明: 在 2013 年的 8 月,University of Waterloo 的一个教授,S. Keshav 写了一篇论文 How to Read a Paper,内容是,如何读一篇论文。这篇论文发表后,很快受到大家的强烈关注。文中介绍了一些阅读论文的一些步骤,希望大家能更好的阅读那些文献。即便不读文献,在读其他各种工具文的时候,也颇有借鉴意义。当时,我的邮件列表里面满是对这篇论文的推荐。当时读完后感觉很赞,本打算拼着渣英语不管,也要翻译下来分享下,可惜当时正被某人各种push中,所以事情一拖再拖。

如今已然半年过去了,但既然稍有时间,还是把这件事情了结下吧。

论文原作者 S. Keshav , 来自 David R. Cheriton School of Computer Science, University of Waterloo, email 是 keshav@uwaterloo.ca。论文原文在 google scholar 上有,可以很容易找到(比如这个地址),其实内容也不难理解,所以估计才没有人有兴趣翻译。而译文,鉴于我的渣水平,还请轻喷。

(后记:我觉得理解我翻译的内容可能比理解原文还要困难 TAT)

废话到此,正文如下:

摘要

研究者们花费了大量的时间阅读研究论文。然而,这项技能很少有人教导,这导致了很多精力被不必要的浪费了。本文意在讲述一个实际而有效的阅读研究论文的三步阅读法(three-pass method). 我还会描述如何利用这个方法来做个文献综述。

1. 介绍

研究者由于以下几个原因必须要阅读论文: 为一次会议或者一门课的论文进行评审(review),或在他们的当前领域,或为一门新的领域准备文献综述。一些典型的研究者可能会每年花费数百小时来做这件事。

学会高效地阅读一篇论文是一个重要却鲜有人教导的一个技能。因此,开始当研究生的人们必须通过他们自己的尝试和错误开始学习怎样阅读论文(Beginning graduate students, therefore, must learn on their own using trial and error.)。学生们浪费了大量的精力在这过程上,并且屡遭挫折。

多年以来,我使用一个简单的"三步阅读法"来防止自己在快速浏览一篇论文的时候被细节所淹没。它让我能够估计概览一组论文需要的时间。此外,根据我的需要和可以在此花费的时间,我可以调节对论文阅读的深度。这篇论文描述了这个方法和其在做文献综述时的用法。

2. 三步阅读法

其关键思想是,你应该阅读这篇论文多达三次,而不是从头一路披荆斩棘直达结束。每过一次论文需要达到一些特别的要求,并且是在前一次的基础上: 第一步让你对这篇论文有一些基本的了解;第二步让你抓住这篇论文的概要而不是具体细节;第三步帮助你深度的理解这篇论文。

2.1 第一步

第一步是快速扫视快速浏览整篇论文。你也可以决定是否进行任何其他步骤。这一步需要花费五到十分钟,包括如下几步:

  • 仔细阅读标题,摘要和介绍。
  • 阅读章节和子章节的标题,但是略过其他。
  • 如果有的话,瞥一眼其中的数学内容,确定其潜在的理论依据。
  • 阅读其总结。
  • 瞥一眼其参考文献,快速回忆下(是否有)你曾经阅读过的(mentally ticking o the ones you've already read)。

在第一步结束的时候,你需要可以回答下面五个'C':

  • 类别(Category) : 这是篇什么类型的论文?一个计算型的论文?对某个已存在的系统的分析?一个研究原型的描述?
  • 上下文(Context) : 这篇论文和哪些其他论文有联系?哪些理论基础被用来分析这篇论文?
  • 正确性(Correctness) : 这些假设看起来是否有效?
  • 贡献(Contributions) : 这篇文章的主要贡献是什么?
  • 清晰性(Clarity) : 这篇论文写的是否清晰明了?

有了这些信息,你可能就可以选择不用深入的阅读(也不要打印出来,少伤害一点树木)。原因可能是这篇论文不吸引你,也可能是你该论文所在领域没有足够的了解(you don't know enough about the area to understand the paper),或者作者做了错误的假设。第一步是寻找到那些不在你领域,但总有一天被证明是相关的一些论文。

顺便的,当你写一篇论文的时候,你也可以期望它能被大多数综述者(和阅读者)通过第一步。小心的选择连贯的章节和子章节的标题,简明而易于理解的摘要。如果综述者在通过第一步后无法理解一篇论文的主旨,这篇论文通常会被拒绝继续研读;如果阅读者无法在五分钟内理解一篇论文的亮点,它恐怕无缘被继续看下去。基于这些理由,一个使用单个精心挑选的图片来总结其论文的内容作为一个"图像式摘要"是个聪明的主意因而近来被在科学杂志上越来越多的出现。(For these reasons, a "graphical abstract" that summarizes a paper with a single well-chosen figure is an excellent idea and can be increasingly found in scientic journals.)

2.2 第二步

在第二步中,更加仔细地阅读这篇论文,但是略过细节比如证明。少量记录关键点,或者在边角做一些评论将会帮助你的阅读。来自 Uni Augsburg 的 Dominik Grusemann 建议你"记录下你不理解的术语,或者你也许打算问作者的问题(note down terms you didn't understand, or questions you may want to ask the author)"。如果你作为一个审阅者(referee)的角色,当你写综述和在程序评议会给出答复意见(back up your review during the program committee meeting)的时候,这些评论将对你有所帮助。

  • 仔细查看论文中的图形,图解和其他说明。特别注意其图表。这些轴线是否被适当的标注了?这些结果是否被使用了错误的柱状图,所以这个结论在统计上是有效的?这些通常的错误将会被分别识别出来(Common mistakes like these will separate rushed, shoddy work from the truly excellent.)。
  • 记住标记相关的未阅读的参考文献,以备将来阅读(这是一个很好的了解论文背景的方法)。

对一个经验丰富的阅读者,第二步也将花费多至一个小时。通过这一步后,你应该可以抓住这篇文章的主要内容。你应该可以对其他人总结出这篇论文的主要着力点和论点。对那些你有兴趣,但不能够不在你研究重心的论文这种程度的详细已经足够了。 有时候,即便第二步结束你依然没有理解这篇论文。这可能因为这个主题对你还是比较新的,带有不熟悉的术语和缩略语。或者作者也许使用了一个你不理解的证明或者实践计较,所以这篇论文大部分无法被理解。这篇论文也许使用了一些未经证实的断言和大量的参考文献。或者仅仅是已经很晚了,你已经很累了。你可以选择如下:(a)把这篇论文丢一边,希望你不用理解这篇论文也能成功完成你的工作 (b) 过一会儿再阅读,或许等先阅读完背景 (c) 坚持下去继续到第三步。

2.3 第三步

要想完全理解一篇论文,尤其是当你作为一个综述者,你需要进行第三步。第三步的关键是尝试虚拟重现(virtually re-implement)这个论文:就是说,使用和作者同样的假定,重新创建这个工程。通过比较重新创建的工程和已有的工程,很容易的,你不仅可以发现这篇论文的创新,还可以看到看到其隐藏的失误和假定。

这一步需要对细节对袭击及其注意。你需要在每段陈述中识别和挑战每一个假定。此外,你应该思考你自己如何呈现一个特别的主意。 这个真实的和虚拟的对照可以给论文中证明和陈述技术带来强烈的洞察力,你可能会把这些带入你全部的工具中。通过这一步,你也应该记录下对将来工作的这些想法。

这一步初学者可能会花费相当多的小时,即便是老练的阅读者,也要花费超过一小时,甚至两小时来完成。这一步结束的时候,你应该可以凭借记忆重新组建整个论文的结构,同时能确定其优点和弱点。尤其是,你应该可以指出其含蓄的假定,缺少的相关工作的引用和通过实验或者分析技术的潜在问题。(In particular, you should be able to pinpoint implicit assumptions, missing citations to relevant work, and potential issues with experimental or analytical techniques.)

3. 做一些文献综述

做文献综述是对论文阅读技能的一大考验。这需要你阅读数十篇的论文,可能还涉及你不怎么熟悉的领域。什么论文是你需要读的呢?在三步阅读法中,你可以得到一些帮助。

首先,使用一个学术搜索引擎,比如 google scholar,CiteSeer ,用一些方便的关键词来寻找三到五篇最近的这个领域高引用次数的论文,对每一篇论文进行三步阅读法之第一步,然后阅读他们的"相关工作"部分,如果你足够幸运的话,可以找到一篇最近的综述论文。如果你可以寻找到这样一篇综述,就大功告成了。阅读这篇综述,庆祝你的幸运吧。 否则,第二步,寻找这些论文参考文献中共有的引用和一些被重复的作者名字,这些是那个领域的关键论文和研究者。下载这些关键论文,然后把他们放一起。然后到这些关键研究者的网站上,看他们最近发表了哪些论文。这会帮助你确定在那些领域的顶会,因为最优秀的研究者通常在顶会发表论文。

第三步是到那些顶会的网站上,查看他们最近的最近的通讯。一个快速的扫视通常可以确定最近高质量的相关工作。这些论文和之前找到的那些论文一起,组成了你的综述的第一个版本。对这些论文进行两步阅读。如果它们都引用了一篇你还没有找到的一篇更早的论文,寻找并阅读它,按照需要以此类推。

4. 相关工作

如果你需要读一些论文来做个综述,你也可以读 Timothy Roscoe的论文"Writing reviews for systems conferences"[3]。如果你打算写一篇技术文档,你应当参考 Henning Schulzrinne的综合网站[4]和George Whitesides的相关步骤的激情纵览[5]。最后,Simon Peyton Jones有一个包括全部研究方面技能范围的网站[2]。 Iain H. McLean of Psychology, Inc. 使用三步阅读法把临床心理学(experimental psychology)相关的论文汇集打包为一个可以下载的"概览矩阵"[1],通过少量修改,应该可以用于在其他领域的论文。

5. 致谢

这个文档的第一版本是由我的学生: Hossein Falaki , Earl Oliver 和 Sumair Ur Rahman 起草的,在这里需要感谢他们。同时, Christophe Diot 充满洞察力的评论和 Nicole Keshav 鹰眼般的编辑也让我很受帮助。

我也希望让这个文档成为动态的,当我收到评论后,我会更新这它。如果你有什么评论或者建议,请花费一点时间发邮件给我。感谢这些年来来自各位的令人鼓舞的反馈。

6. 参考文献

Categories: Life

Yu

Ideals are like the stars: we never reach them, but like the mariners of the sea, we chart our course by them.

19 Comments

幸福是什么意思 · February 5, 2014 at 13:18

Google Chrome 28.0.1500.95 Google Chrome 28.0.1500.95 Windows 7 Windows 7

关注了,论文啊。

Leniy · February 7, 2014 at 10:39

Google Chrome 32.0.1700.107 Google Chrome 32.0.1700.107 Windows 7 Windows 7

看paper还要这么麻烦啊。

    yu · February 7, 2014 at 12:55

    Google Chrome 32.0.1700.77 Google Chrome 32.0.1700.77 GNU/Linux x64 GNU/Linux x64

    @Leniy 当需要快速读上很多paper,大概的了解某一领域的内容的时候,一些好的方法还是挺省时间的

微历史 · February 10, 2014 at 10:44

Firefox 26.0 Firefox 26.0 Windows XP Windows XP

论文对我好遥远

tiandi · February 11, 2014 at 09:34

Google Chrome 27.0.1453.110 Google Chrome 27.0.1453.110 Windows 7 Windows 7

只有写论文的时候才会去看这些。

be.truth · May 15, 2014 at 20:52

Firefox 29.0 Firefox 29.0 Windows XP Windows XP

这种教人看论文的论文。递归算法。-.-

csrgxtu · July 25, 2014 at 11:26

Firefox 30.0 Firefox 30.0 Ubuntu x64 Ubuntu x64

tao yan guo nei de lun wen, da bu fen zai che dan.

    yu · July 25, 2014 at 15:47

    Google Chrome 36.0.1985.125 Google Chrome 36.0.1985.125 Mac OS X  10.9.4 Mac OS X 10.9.4

    难道真有人看国内的论文?
    一般情况下国内论文不都是实验室菜鸟刷点出门装用的么,稍微好点的学校,硕士博士都得发国外的journal & conference 才能拿得到学位的说..

fioan_jie · September 24, 2015 at 09:30

Google Chrome 44.0.2403.89 Google Chrome 44.0.2403.89 Windows 7 x64 Edition Windows 7 x64 Edition

useful,and i should find my direction on literature

    yu · September 24, 2015 at 14:19

    Google Chrome 44.0.2403.125 Google Chrome 44.0.2403.125 GNU/Linux x64 GNU/Linux x64

    @fioan_jie thanks

csc · December 8, 2015 at 20:35

Google Chrome 47.0.2526.73 Google Chrome 47.0.2526.73 Windows 10 x64 Edition Windows 10 x64 Edition

博主是通过什么方法了解到我的所在学校的。。。??

    yu · December 9, 2015 at 01:05

    Google Chrome 47.0.2526.73 Google Chrome 47.0.2526.73 Mac OS X  10.11.1 Mac OS X 10.11.1

    @csc 您好, 您是指文末的一段附言中的内容么?

    其实查看源码就可以看到, 我只是使用 JS 向 argcv.com/api/ip 发送了一个请求, 服务端根据来访 IP 抽取出您的地址而已.

    您可以访问 http://www.ipip.net/ip.html 获得同样的结果.

      csc · December 9, 2015 at 15:31

      Google Chrome 47.0.2526.73 Google Chrome 47.0.2526.73 Windows 10 x64 Edition Windows 10 x64 Edition

      @yu 感谢博主指导

zx · March 30, 2016 at 19:37

Google Chrome 49.0.2623.87 Google Chrome 49.0.2623.87 Windows 10 x64 Edition Windows 10 x64 Edition

非常感谢,作为刚入门的研究生,导师不愿意教文献的阅读方法,只是每周扔4篇文献,觉得很费力很不科学。多谢博主的文章!!

    yu · March 30, 2016 at 23:05

    Google Chrome 49.0.2623.87 Google Chrome 49.0.2623.87 Mac OS X  10.11.4 Mac OS X 10.11.4

    @zx 客气.
    此外, 我不是本文的创造者, 只是大自然的翻译工.
    祝学业顺利, 为科学事业加上新的 contribution.

Xiaotao · May 4, 2016 at 00:46

Google Chrome 50.0.2661.94 Google Chrome 50.0.2661.94 Mac OS X  10.11.4 Mac OS X 10.11.4

看完了,明天就试试!赞一个!

    yu · May 4, 2016 at 15:02

    Google Chrome 50.0.2661.86 Google Chrome 50.0.2661.86 Mac OS X  10.11.4 Mac OS X 10.11.4

    @Xiaotao
    Recommended by Jie.
    Why not TODAY.

      Xiaotao · May 4, 2016 at 15:04

      Google Chrome 50.0.2661.94 Google Chrome 50.0.2661.94 Mac OS X  10.11.4 Mac OS X 10.11.4

      @yu Necessary sleep ensures high-quality work :D

        yu · May 4, 2016 at 15:09

        Google Chrome 50.0.2661.86 Google Chrome 50.0.2661.86 Mac OS X  10.11.4 Mac OS X 10.11.4

        @Xiaotao Excellent answer.

Leave a Reply

Your email address will not be published. Required fields are marked *