논문 읽는 법, Survey 논문 쓰는법 - goofcode/UR GitHub Wiki

How to Read a Paper

원본

처음부터 끝까지 한번에 읽는 것보다는 3개의 pass로 나누어 각 pass에서의 목표를 수행

  1. 논문의 전반적인 아이디어 이해
  2. 디테일을 제외한 논문의 내용 이해
  3. 깊은 이해

The first pass

5m ~ 10m

개괄적인 내용을 파악하는 quick scan

  1. title, abstract, introduction을 잘 읽는다
  2. section, sub-section heading을 읽는다(다른 것은 무시)
  3. 기반 이론을 파악하기 위해 수학적인 내용을 훑는다
  4. conclusions을 읽는다
  5. 이미 읽은 논문을 체크하며 references를 훑는다

이를 끝낸 뒤에는 다음 물음에 답할 수 있어야 함

  1. Category : measurement / analysis of existing system / description of a research prototype
  2. Context : 관련된 논문이 무엇인가? 문제를 분석하기 위해 사용된 이론적 근거는 무엇인가?
  3. Correctness : 가정이 맞는가(valid)?
  4. Contributions : 어떤 공헌(contribution)을 하는가?
  5. Clarity : 잘 쓰여졌는가?

위 정보를 통해

  • 관심 없는 주제인지
  • 해당 논문을 읽기에 배경지식이 부족한지
  • 논문 작성자가 부적절한 가정을 하고 있는지 확인하고

따라서 논문을 더 읽을지 말지(뽑을지 말지) 결정할 수 있다.

The second pass

less than 1h (for experienced reader)

조금 더 관심을 가지고 읽지만, 증명과 같은 디테일은 무시

읽으면서 남는 공간에 comment를 단다

이를 끝낸 뒤에는 다음이 가능해야 함

  • 논문의 내용을 이해(grasp)하고
  • 주요한 골자를 supporting evidence와 함께 다른 사람에게 요약(summarize)

관심은 있지만 research speciality가 아닌 분야의 논문에 적절하다.

The third pass

many hours(for beginner), 1~2h(for experienced)

완전한 이해를 위한 pass, reviewer라면 필수

논문을 다시 구성(re-implement) 해 보는 것

  • 저자와 같은 가정을 하고,
  • 같은 논문을 다시 만들어 본다.

이를 통해 무엇이 혁신적인지를 알아낼 수 있고, 뿐만 아니라 숨겨진 실패와 가정 또한 파악할 수 있다.

실제 논문과 만들어진(virtual) 논문을 비교함으로써, 증명과 표현 기법들에 대한 날카로운 통찰을 얻을 수 있고, 이를 자신의 것으로 만들 수도 있다.

이 단계 이후에는 다음이 가능해야 한다

  • 논문의 구조를 기억으로부터 재구성
  • 논문의 강점과 약점을 파악
  • 모호한 가정, 관련 연구 인용 누락, 실험적/분석적 방법의 잠재적 문제점을 파악

Literature Survey

  1. Google Scholar, CiteSeer에서 keyword로 3~5편의 최근 인용수가 높은 논문을 찾는다. 각 논문에 first pass를 하고, related work section을 읽는다
  2. 여기서 survey 논문을 찾았다면, 끝
  3. 찾지 못했다면 공통 인용 논문과 저자 이름을 찾는다. 이들이 해당 분야의 핵심 논문과 핵심 연구자들이다. 해당 논문들을 다운로드하여 챙겨두고, 핵심 저자들의 웹사이트에 방문하여 최근에 어디에 출판했는지를 파악한다. 이는 해당 분야에 최고 권위 컨퍼런스가 무엇인지 알 수 있게 해준다.
  4. 이러한 컨퍼런스들의 웹사이트에 방문하여 최근 proceeding을 살펴본다.
  5. 이 논문들과 위에서 챙겨 두었던 논문들이 survey의 가장 처음 version이 된다.
  6. 모든 논문들에 대해 2 passes를 진행한다.
  7. 이들이 모두 아직 읽지 않은 핵심 논문을 인용하고 있다면 이를 추가하고, 이를 반복한다.