소소한 정보: arXiv에 논문을 올릴 때 주의사항

많은 수학자들은 논문을 쓰면 출판되기 전에 그 논문을 preprint(출판전 논문)의 무료 저장소인 arXiv.org에 업로드하여 다른 사람들이 찾아볼 수 있게 합니다. 개인 홈페이지라면 PDF 파일을 올리겠지만, arXiv에는 TeX 원문 파일을 업로드하는 것을 권장합니다. arXiv에 있는 논문의 원문 소스를 다운받으려면 “Other formats”를 클릭한 후 “Download source”를 클릭하면 됩니다. 다른 분은 어떻게 논문에 그림을 그렸나 참고하는데 쓸 수 있지요.

주석 삭제하기

보통 논문을 여러 사람이 함께 쓰다보면 TeX의 주석 표시인 % 표시 뒤에 별별 내용이 다 적히는데, 그걸 지우지 않으면 틀린 증명을 임시로 지워둔 것 등이 있어서 누군가 tex 코드를 다운받아서 보게 된다면 상당히 부끄러울 수 있습니다. 따라서 arXiv에 업로드하기 전에는 반드시 주석을 모두 삭제하는 것을 권장합니다.

심지어 arXiv의 논문에서 tex 파일 내 주석에 어떤 말이 많이 사용되었는지 연구한 논문도 있습니다. 2013년에 나온 연구결과에 의하면 수학 논문의 90.4%가 주석을 지우지 않았다고 합니다.

주석을 삭제하기 위해서는 arXiv 홈페이지에 있는 perl 명령어를 이용하면 편리합니다. 맥에서는 터미널을 열고 아래 명령을 입력합니다.

perl -pe 's/(^|[^\\])%.*/\1%/' < main.tex > main-arxiv.tex

그 후 arXiv에 업로드할 때는 새로 생성된 파일인 main-arxiv.tex을 업로드하면 됩니다.

참고로, python으로 만들어진 주석 삭제 도구 arxiv_latex_cleaner도 있습니다.

참고문헌 정리하기

TeX으로 논문을 쓰다보면 bibtex을 사용하여 참고문헌을 정리하는 것이 편리합니다. 단, arXiv에 bib 파일을 올릴 필요가 없습니다. 보통 연구를 하다보면 bib 파일에는 수많은 논문의 정보를 저장하게 됩니다. 필자의 경우 대학원생때부터 관리하던 bib 파일 안에 현재 3000개 이상의 논문 서지 정보가 들어있는데, 이 큰 파일을 굳이 업로드할 필요가 없습니다. BibDesk라는 프로그램으로 서지 정보를 관리합니다.

먼저 latex을 돌리고 나면 생성되는 bbl파일을 열어서 그 속 내용물을 전체 복사하여 main-arxiv.tex 파일의 뒷 부분에 붙여넣고, 뒷부분에 있는 아래와 같은 두 줄은 아래처럼 주석처리하면 됩니다.

%\bibliographystyle{abbrv}
%\bibliography{mybib}

같은 내용을 따로 올리지 말 것

가끔 arXiv를 보다보면 “arXiv admin note: text overlap with arXiv:…”과 같은 경고문이 코멘트에 달린 것을 볼 수 있습니다. 그것은 그 논문이 다른 논문과 내용이 많이 겹친다는 경고이며 표절의 가능성을 암시하는 것이라 조심하는 것이 좋습니다. 이 웹사이트에서는 자동으로 내용 중복을 검사하여 저런 코멘트를 달아줍니다.

예를 들어 논문 하나를 업로드한 후, 나중에 수정본을 다시 업로드할 때, 마치 새로운 논문처럼 업로드하면 저런 경고가 붙는 것을 피할 수 없습니다. 수정본을 업로드하는 기능이 있습니다. 간혹 논문 하나가 둘로 쪼개진다는 등 사정이 있는 경우에는 코멘트란에 그 내용을 적어두는 것이 좋습니다. 아울러 논문을 여러 개 쓸 때, 반복되는 부분, 특히 정의나 배경지식 설명 부분을 그냥 복사 붙여넣기 하면 자기 표절에 해당하므로 피해야 합니다.

최신 preprint 구독하기

arXiv에서 관심있는 분야의 새로운 preprint 정보를 매일 이메일로 받아볼 수 있습니다. 받는 논문이 너무 많다면 arxivist.com이라는 웹사이트를 추천합니다. 이 사이트에서는 사용자의 관심사에 맞추어서 5개 논문을 자동으로 선별하여 매일 이메일로 보내줍니다.

Leave a Comment

Your email address will not be published. Required fields are marked *