本文是本文是CCSIT Research Skills Workshop 2的笔记。
密码:ResearchSkillsWorkshop-2
Research Proposal Workshops 2
本节课是Research Proposal workshops的第二节课。在上节课我们集中讲解了Research Proposal,具体而言:
- 我们首先讲解了什么是Research Proposal。其实Research Proposal就是一种有特殊目的的文章,我们在文章里要回答一些特殊的问题。
- 然后我们讨论了为什么要写Research Proposal(Research Proposal的重要性)。具体来说就是首先它帮助大学选出来更加符合他们的MS/PhD项目的学生,其次它能够帮助我们更好的展示我们自己。
- 接下来我们讨论了一下三种类型的研究,例如:应用研究、实证研究以及理论研究
而一个Research Proposal的标准的结构如下图:
上节课经过讨论,我们讲解了如何找到当前研究领域内的空白,就对应了title
和Research questions
这两个部分。具体来说:
- 首先想清楚研究的动机,即Research Motivation
- 然后通过阅读文章、向老师寻求帮助等方法来找到一个没有被人研究的领域
- 然后按照清晰、简洁、复杂、争论的原则,从这个领域中抽出来一个问题
而本节课主要关注与Literature Review,因为在我们的Research Proposal、最终的论文中都需要有Literature Review部分。讲解以下内容:
- Importance of motivation
- What is literature review and why write it?
- How to search relevant literature?
- How to identify key themes, dabates, and gaps in the field?
- How to structure and write your literature review
1. Importance of motivation
现在假设我们已经选择了一个课题了,我们对这个课题非常的感兴趣,那么我们现在需要做的一个事情就是向别人解释我们的动机,即解释我们为什么选择这个课题
因为我们可以选择一个课题并且通过努力给出来这个课题的结论,可是一个重要的问题就是,为什么人们要要关注你的研究?或者说你的研究的影响是什么?
因此我们首先就需要通过说清楚我们的Motivation,在Motivation中来解释课题的影响和重要性。
而我们一般说影响的时候,其实包含两个方面的影响:
- 如果成功做完了你的项目的话,这个项目带来的给学术界的影响
项目带来的社会影响
此外,我们还需要在Motivation中讲清楚为什么我们认为没有人之前做过相关的课题
距举例来说,现在某人的课题是使用AI来对病人的病理性心音进行分类。这个项目的社会影响在于,该项目的成果可以用于向贫困地区提供医疗保健和诊断服务,避免了这些地区的人们因为贫困而无法方便的接触到医生和体检项目。而该项目的学术影响在于他可以探究从信号中提取到重要特征的不同的方法
2. What is literature review?
当说到文献综述的时候,我们首先需要明白的就是文献综述的作用。文献综述的作用是对于特定的课题的文献进行评论,以展示评论者在该领域的位置以及学术储备。
通常来说,在文献综述中我们需要对已有的文章进行高度凝练的总结,然后比较这些文章的方法,确定他们的局限性以便于解释我们的研究是怎样发挥作用的
3. Why write a literature review
选择写一个literature review原因自然就是因为literature review有用,因此下面就将说说literature review的作用:
- 首先literature review可以展示我们对课题的熟悉程度以及我们的学术背景
- 他也会促使我们形成研究的理论框架和研究方法
- 可以将我们的理论与其他研究者的成果和理论进行定位
- 还可以展示我们的研究是如何弥补了当前领域的一个空白,或者说对一个还在争论中的问题做出贡献
4. Search for relevant literature
A. Key to find relevant literature: Massive reading
一般来说,查找我们的问题相关的文献是很难的。例如下面这个漫画,为了我们的这篇paper,我们一共找了248篇paper,可是我们实际上只读了其中的107篇,然后我们只理解了其中的5篇,而最后和我们的论文直接相关(方法基于此)只有2篇。可是最后我们的参考文献却列了246篇
所以,为了找到真正能够给我们的方法提供启发的文献,我们需要找到248个文献,阅读107个文献。因此,在寻找真正能够给我们提供启发的文章是很困难的。
唯一有效的找到这些inspiring的文章的方法就只能通过大量的阅读
B. Helpful tips
下面给出来一些寻找文献的方法:
A. 使用数据库进行查找
首先列出来一些和我们的问题相关的关键字
然后使用这些关键字来在不同的数据库上进行查询。我们可以在期刊和会议的数据库上进行查询:
- 学校的电子图书馆
- IEEE Xplore
- ACM Digital Library
- dblp Computer science bibliography
- PubMed
- arxiv
B. 使用逻辑操作符帮助查找
我们在数据库上进行查找的时候,可以使用逻辑操作符来帮助我们进行快速的查找,例如:
- AND:交集,例如,social media AND body image AND generation Z
- OR:并集,例如,generation Z OR teenagers OR adolescents
- NOT:差集,例如,apple not fruit
5. Evaluate and select sources
我们上面已经通过文献的数据库和各种搜索技巧找到了合适的文章,那么我们接下来需要干的,就是对这些文章进行筛选。
而筛选一篇文章的方法就是需要去阅读这篇文章。但是因为文章很多,每一篇文章有很长,因此一个问题就是我们真的需要去从头到尾“阅读”这篇文章吗?
换而言之,有没有办法可以加速我们在筛选文章时候的阅读速度呢?这个问题其实是没有统一的答案的。每个人都有不同的方法
而Keshav在他写的如何读一篇论文的论文中给出了一个很有用的读论文的三遍法:
- 第一遍:读完title、abstract、Introduction、sub-headings和conclusions
- 第二遍:读完这个文章,忽略掉证明,但是要看论文中的图和表
- 第三遍:亲自复现这篇文章
而在完成第一遍阅读之后,只有符合要求的、高质量的论文才可以进行第二遍阅读。具体来说,在完成第一遍阅读之后,需要回答下面五个问题:
- Category:文章是哪类的paper?是提出了新方法的文章?还是对已有的方法进行了改进?还是对主流的观点进行了重构Rethinking?
- Context:文章和其他的哪些论文有关?文章和哪些理论有关?
- Correctness:文章的假设合理么?
- Contributions:文章的核心贡献是什么?
- Clarity:文章的文笔如何?读起来是否清晰易懂?
通过回答这五个问题,我们就可以判断这篇文章是否是一篇值得我们读的文章
此外,其他一些可以辅助我们完成评估论文的判断标准有:
- 作者在这个研究领域的专业知识积累(之前发的文章)、他的学历
- 作者的研究是否有经验上的支持?作者的研究是定性还是定量?
- 作者的观点是否是过于biased?有没有考虑其他的观点和方法?
- 所选的文章是否有助于我们对这个领域有更深入的理解?
6. Themes, dabates, and gaps
为了完成一个literature review,我们需要在里面说明:
- 当前研究的趋势和模式:例如Transformer是当前的趋势,而模式就是套用transformer在各种各样的任务上
- 当前研究的主题:阅读的文献中共有的主题和concept,例如很多文章中都出现了attention机制
- debates、conflicts以及contradictions:看看哪些文章在哪些观点上有冲突
- pivotal publication:这个领域内的有影响力的paper以及其他出版物。例如Attention is all you need。
- Gaps:文献中没有提到的地方或者他们的方法的不足
7. Structure Literature Review
有多种方式可以组织我们的文献综述
A. Chronological
按照时间顺序进行讨论是追踪课题随着时间发展而改变的最简单的方式。然而按照这样的方式来进行文献的讨论的话,要尽量避免只是简单的罗列和组织素材。
我们需要讨论研究方法和关键的争议的转折点,因为他们深刻影响,或者说决定了该领域未来研究的走向
我们必须解释,研究的发展是怎样,以及如何发生的。例如网络变得越来越深和网络不能太深这个发展和debates
B. Thematic
另外一种组织文献综述的方式是按主题进行讨论。例如我们的课题是跨领域的,例如将transformer从NLP运用到CV上。那么我们就会发现我们的文献综述就喝NLP、Transformer、CV这几个中心主题有关。
因此我们此时就可以把我们的文献综述分成不同的小节,每个小节分别论述不同的主题
C. Methodological
一种组织文献综述的方式就是按照方法进行讨论。例如如果我们的文章提出了新的方法,可以讨论相同任务的文章他们的方法,我们比较不同的方法得到结果和结论
D. Theoretical
最后一种组织方式是按照理论来进行组织。例如同样是Batch Normalization。我们可以从Internal Covariate Shift这个理论、观点、流派来进行讨论,也可以从Smoothing Loss Surface这个理论来进行讨论
8. Structure of Literature Review
一般来说,一个文献综述可以分为以下三个部分:
A. Introduction
在Introduction部分,我们需要讲清楚的内容有:
- 为什么要写综述,为什么综述里讨论的话题很重要
- 综述讨论了那些话题
- 综述的结构是什么样的?
B. Body
Body部分需要注意:
- 每一段都和我们的主题有关,每一段都处理了一个不同的方面
- 一段中需要包含对几个文献的评论,以形成一个清晰地脉络
- Body中可以包括历史背景、研究方法、早前研究、已经得出来的结论等段落
C. Conclusion
最后,Conclusion部分要包含下面的内容:
- 对文献中的主要的共同观点和分析进行总结
- 任何还需要进一步进行研究的欠缺之处或者领域
- 我们对这个课题的整体观点的总结