Data Scientist에게 가장 중요한 역량중 하나는 최신 알고리즘 및 방법론에 대한 논문을 빠르게 이해하고,
그 중 양질의 논문을 이해하고, 내가 진행하는 Task에 적절히 녹여낼 수 있는 능력일 것이다.
그래서 오늘은 AI분야에서는 매일 쏟아지는 새로운 논문들 중 양질의 논문을 찾는 방법에 대해 정리해보려한다.
Conference paper? Journal paper?
논문을 찾다보면, 컨퍼런스 or 저널 이라는 워딩을 많이 볼 수 있다.
먼저, conference와 journal은 논문이 발행된 곳을 의미한다.
그렇다면, conference에서 발행된 paper와 journal에서 발행된 paper은 어떻게 다를까?
1) Conference paper
conference는 학계, 연구자, 전문가들이 철저한 연구를 거친 연구를 서로 공유하고 발표하는 자리로, 서면 문서와 구두 발표를 포괄하는 개념이다. conference에서 발행된 논문은 학자들이 연구한 내용을 제한된 수의 페이지로 정리하여 발표한 간략하고 정확한 문서를 의미한다.
2) Journal paper
journal 논문은 저널에 출판하기 위한 목적으로 작성된 문서로, Conference paper와 비교하여 훨씬 더 철저하고 엄격한 검토를 거치는 내용으로 분량도 Conference paper에 비해 훨씬 많다.
정리하면, conference paper는 학회에서 연구결과를 간단히 공유하고 발표하기 위한 간략한 문서이고, journal paper는 Journal에 출판하기 위한 목적으로 훨씬 까다로운 심사와 상세한 연구내용을 담고있는 문서로 정리할 수 있다.
머신러닝 분야를 연구하다보면 Conference paper와 Journal paper을 모두 참고해야하는데,
아무래도 Conference paper가 학회 발표목적의 간략한 문서로 만들어지다보니, 좀 더 최신의 연구성과들을 담고있어,
Conference paper를 읽을 기회가 비교적 많을 것이다.
그리고 우리는 수많은 Conference paper중에도 양질의 paper를 선별해서 보고 싶은데, 모든 논문을 하나하나 읽어가며, 양질의 논문을
걸러내기는 어렵다.
좋은 논문을 찾기 위한 방법은 크게 두가지가 있다
첫번째, 좋은 컨퍼런스(또는 저널)를 통해 찾는 방법이다.
우리가 좋은 논문을 걸러내기 위해서는 논문을 거를 Filter가 필요한데, Conference가 이 Filter 역할을 할 수 있다.
대개 좋은 Conference는 paper를 게제하기 위한 심사기준이 더 까다롭다.
그렇기 때문에, 아무래도 좋은 Conference에 게제된 논문은 좀 더 까다로운 심사를 충족한, 양질의 논문으로 가정할 수 있을 것이다.
그렇다면, 좋은 Conference를 어떻게 판단할 수 있을까?
Google Scholar에서 AI분야의 Top Conference Ranking을 제공하고 있긴 하지만, AI 전체 카테고리에서 순위를 산정했기 때문에, 각 task별로 좋은 conference를 찾기에는 무리가 있어 보인다.
* Google Scholar Conference Ranking : https://scholar.google.es/citations?view_op=top_venues&hl=en&vq=eng_artificialintelligence
* Research.com : https://research.com/conference-rankings/computer-science/machine-learning
리서치 닷컴이라는 사이트도 있지만, Machine Learning 전체 범위에 대한 Top conference를 산정하기 때문에 마찬가지이다.
계속, 검색해보던 중 각 Task별로 우수 학회를 조회할 수 있는 사이트를 발견할 수 있었다.
* Conference Ranks : http://www.conferenceranks.com/#
'Rank'가 어떤 기준으로 선정되었는지는 알 수 없으나, 우선 위 사이트를 참고하여 AI 분야의 가장 대표적 주제인
Computer vision과 NLP분야의 우수 학회를 서칭해보았다.
Computer Vision 우수 학회
- WACV (IEEE Workshop on Applications of Computer Vision)
- ICCV (IEEE International Conference on Computer Vision)
- ECCV (European Conference on Computer Vision)
- CVPR (IEEE Conference on Computer Vision and Pattern Recognition)
- NIPS (GAN이 처음 발표되었던 학회) <- 요건 별도로 찾은 것
NLP 우수 학회
- EMNLP (Empirical Methods in Natural Language Processing)
- IJCNLP (International Joint Conference on Natural Language Processing)
- RANLP (Recent Advances in Natural Language Processing)
- NLPCS (International Workshop on Natural Language Processing and Cognitive Science)
그 중 NLP분야에서 가장 핫한 학회인 EMNLP를 검색해 직접 들어가 보았다!
검색한 사이트에 들어오면 해당 학회에서 발행된 수많은 논문들이 주제별로 출력되는것을 확인할 수 있다.
이렇게, Conference를 통해 직접 가장 최신의 논문들을 훑어볼 수 있다.
다만, conference를 통해 논문을 찾게되면 가장 빠르게 새로 발행된 논문을 볼 수 있다는 장점이 있지만, 그럼에도 불구하고 너무나도 많은 논문들 사이에서 옥석을 가려내는것이 쉬운일이 아니다.
꼭, 가장 최신이 아니더라도 사람들이 많이 인용하고, 핵심이 되는 논문을 살펴보려 한다면,
두번째 방법, 주제별로 핫하고 유명한 논문만 모아놓은 사이트에서 논문들을 확인할 수 있다.
https://paperswithcode.com/methods
위 사이트에서는
1) ML분야의 카테고리별로 분류
2) 카테고리 내 상세 주제로 분류(생성, 분류, 회귀 ...)
3) 상세 주제에서 가장 많은 논문이 발행된 순서대로 알고리즘(방법론)을 소개하고 그에 대한 논문과 오픈소스를 함께 정리하여 공유하고 있다.
사실, Conference에서 발행된 논문들을 즉시 확인하는 정도의 수준이 아니라면, 대부분의 최신 논문과 오픈소스를 확인할 수 있어,
해당 사이트에서 충분히 양질의 논문을 찾아볼 수 있지 않나 싶다.
좋은 논문을 찾기 위한 방법을 알아보려 시작했지만, 결국 같은 고민을 하는 사람들이 잘 정리된 사이트를 만들어 두었기 때문에,
앞으로는 고민할 필요없이 위 사이트를 이용해서 논문을 접하면 될 것 같다.
'PAPER_REVIEW' 카테고리의 다른 글
[RAG] RAPTOR(Recrusive Abstractive Processing for Tree-Organized Retrieval) Parth Sarthi et al. 2024 (8) | 2024.11.19 |
---|