[box type=”info” head=”성질 급한 사람들을 위한 한 줄 요약.”] 문대성은 논문을 표절했는가? 그렇다.
문대성의 논문이 표절이라는 근거는 정당한가? 약간 따져볼 점이 있다. [/box]
원론적으로 말하면 논문 표절은 언론이 따질 문제가 아니다. 모든 것이 정상적이라면 문대성의 박사학위 논문은 표절은 그에게 박사학위를 수여한 국민대가 심의해서 결정할 일이다. 하지만 한국의 학계나 대학의 자정 능력에 대해 심각한 의문이 만연하고, 그런 의문이 전혀 근거 없는 것도 아니기 때문에 언론에서 이 문제가 오르내리는 것은 피할 수 없는 일이다.
하지만 논문 표절이라는 것은 여러 모로 고려해야할 미묘한 사안들이 있기 때문에 단순히 문구만 가지고 따지기는 어렵다. 언론에서 논문 표절을 따지게 된 것은 그럴만한 사정이 있기 때문이지만 아무래도 이런 미묘한 점까지 고려하기는 어렵기 때문에 언론에서 논문 표절을 다룰 때는 획일화된 잣대를 들이대기 쉽다. 그리고 이것은 과학에 대한 오해를 퍼트리기도 한다.
과학 논문에서는 간결하고 정확한 표현을 중시하기 때문에 다른 사람이 쓰더라도 비슷한 내용이면 비슷한 표현을 쓰기가 쉽다. 어떤 경우에는 학술지 등에서 정해진 표현을 쓰도록 강제하는 경우마저 있다. 이런 표현들을 두고 단순히 말이 같다고 표절이라고 한다면 같은 분야에 있는 사람들은 모두 서로 서로 표절을 하고 있다는 이상한 결론에 빠지게 된다. 따라서 표절을 따질 때는 그 분야에 대해서 어느 정도 이해를 할 필요가 있다.
일단 문대성의 논문과 문대성이 표절한 김백수의 논문의 관계에 대해 살펴보자. 김백수의 논문은 2006년에 명지대에 박사학위 논문으로 제출한 “태권도 선수의 웨이트 트레이닝과 PNF훈련이 등속성 각근력, 무산소성 능력 및 혈중 스트레스 요인에 미치는 영향”이고 문대성의 논문은 2007년에 국민대에 박사학위 논문으로 제출한 “12주간 PNF 운동이 태권도 선수들의 유연성 및 등속성 각근력에 미치는 영향”이다. 제목만 보면 두 논문은 거의 똑같은 주제를 다루고 있는 것처럼 보이지만 약간의 차이가 있다. 문대성의 논문에서는 웨이트 트레이닝의 효과가 빠졌고 유연성에 미치는 영향이 더 들어갔다. 이것이 사소한 차이로 여겨질지도 모르겠지만 대부분의 과학 연구는 이러한 사소한 차이를 다루는 것이다.
모든 연구에는 각각의 한계가 있기 때문에 대부분의 연구자들은 앞서 다른 사람들이 수행한 연구에서 한두 가지 변인을 추가하거나 빼면서 선행 연구를 재현하는 동시에 해당 주제에 대해 발전된 이해를 도모한다. 만약 문대성이 김백수의 연구에서 웨이트 트레이닝의 효과와 PNF의 효과가 적절히 구분되지 않았다든가 유연성의 향상이라는 점을 잘 고려하지 않았다는 한계가 있다든지 이런 지적을 하면서 김백수가 발견한 사실들을 재확인하는 동시에 더 발전된 연구를 수행한 것이었다고 한다면 이것은 정상적인 과학 연구의 범위에 속할 수 있었다. 물론 문대성은 전혀 그렇게 하지 않고 김백수의 논문을 베끼기에 급급했을 뿐이지만 이것은 표절이 모두 드러난 뒤에나 할 수 있는 이야기고, 제목만으로 간단히 평가할 수 있는 문제는 아니라는 것이다.
대부분의 언론 기사에서도 다뤄지고 있지 않지만 문대성의 논문을 보면 김백수의 논문은 참고문헌으로 들어가 있지도 않다. 문대성이 김백수의 논문을 참고한 것은 그 자신도 이미 인정했다. 그렇다면 앞서도 말한 것처럼 김백수의 논문을 적절히 인용하면서 그 한계를 지적하고 사소하더라도 자신이 기여한 바를 밝혔다면 표현이 일부 겹치더라도 큰 문제가 되지 않을 수 있었을 것이다.
다시 말해서 언론은 표절 여부를 따질 때 고려해야할 미묘한 사항들을 무시하고 아주 거친 잣대를 들이대었는데 문대성이 워낙 심하게 표절을 한 나머지 그런 거친 잣대조차 피할 수가 없었다. 쉽게 말해 경찰이 어설프게 용의자를 범인으로 몰았는데, 그 범인은 더 어설프게 범죄를 저질러서 부정조차 할 수 없었던 형국이랄까.
좀 더 이 문제를 자세히 살펴보기 위해 문대성과 김백수의 논문을 비교한 진중권의 글을 살펴보기로 하자. 이 글은 문대성의 표절에 대해 가장 많이 인용된 글이기도 하고 문대성과 김백수의 논문을 가장 자세히 비교한 글이기도 하다. 이 글을 다시 검토함으로써 과학 논문의 표절을 따질 때 고려해야할 미묘한 사항들이 무엇인지 살펴보고, 문대성 건에서 언론이 그 사항을 어떻게 놓쳤는지도 알아보자. 그리고 이 모든 것을 복기해 보고 나면 문대성이 얼마나 심하게 표절을 했는지도 더 잘 이해할 수 있을 것이다.
자, 과정에서 가장 중요한 것은 도대체 이 연구 자체가 얼마나 독창성이 있는가 하는 것이리라. 두 논문에서 세운 가설을 비교해 보자. 먼저 문대성은 PNF 훈련에서 다음과 같은 효과가 발생할 것이라는 가설을 세웠다.
가설 1. “슬관절과 족관절의 유연성 능력이 더 향상될 것이다.”
가설 2. “슬관적 등속성 각근력이 더 향상될 것이다.”
가설 3. “족관절 등속성 각근력이 더 향상될 것이다.”김백수의 연구 가설을 살펴 보자.
가설 1. “슬관절의 등속성 각근력에 차이가 있을 것이다.”
가설 2. “족관절의 등속성 각근력에 차이가 있을 것이다.”
가설 3. “무산소성 능력에 차이가 있을 것이다.”
가설 4. “혈중 스트레스 요인에 차이가 있을 것이다.”한 마디로, 세 가설 중의 두 개가 이미 김백수의 연구를 통해 검증된 것이다. 문대성은 연구의 ‘목적이 다르다’고 말하나, 그가 세운 연구 목적의 2/3는 김백수의 것과 일치한다.
– 진중권, “이것은 표절이 아니다: 문대성이냐, 마그리트냐”
우선 “더 향상될 것이다”와 “차이가 있을 것이다”는 똑같은 표현처럼 들리지만 전혀 다른 말이다. “차이가 있을 것이다”는 “더 향상될 것이다”와 “덜 향상될 것이다”를 모두 포함하기 때문이다. 이전 연구가 차이 여부까지만 검증했는데 다음에 나온 다른 연구가 그 바탕 위에 향상을 검증해낸 경우였더라면, 선행 연구를 재확인하면서 더 발전된 연구를 수행한 정상적인 과학 연구에 속한다.
즉, 이미 김백수의 연구를 통해 확인된 가설이라고 해도 더 발전된 연구를 통해 재검증할 필요가 있다. 진중권은 이러한 점들을 별로 고려하지 않고 대충 말이 비슷하다는 것만 본 것이다. 문대성은 이런 점을 들어 스스로를 방어할 수도 있었지만, 워낙 많은 부분을 그저 베껴댔기 때문에 이제 와서 그런 말로 변명을 한 들 누가 믿어주지는 않을 것 같다.
나머지는 김백수의 문단에서 몇몇 표현이나 문장을 생략하여 압축하는 방식이다. 가령 다음 두 문단을 비교해 보라.
본 연구에서 수집된 자료는 SPSS WIN 10.0 program을 이용하였으며, 각 변인별로 평균과 표준편차를 산출하였다. 또한 집단 간 그리고 집단 내 차이를 분석하기 위하여 2×3 반복측정 이원 변량분석을 실시하였으며, 유의수준 α = 0.5 효과의 유의한 차이가 있을 경우 사후검증은 Bonferroni 방법을 이용하여 분석하였다. (문대성 34쪽)
본 연구에서 수집된 자료는 SPSS WIN 10.0 program을 이용하였으며, 각 변인별로 평균과 표준편차를 산출하였다. 또한 (각각의 운동)집단 간 그리고 집단 내 차이를 분석하기 위하여 3×3 반복측정 이원 변량분석을 실시하였으며, (….) 사후검증은 Bonferroni 방법을 이용하여 분석하였다. 모든 통계 자료는 유의수준 α = 0.5에서 검증하였다. (김백수 55쪽)
– 진중권, “이것은 표절이 아니다: 문대성이냐, 마그리트냐”
진중권이 인용한 이 대목은 통계 분석 방법을 보고하는 부분으로서 앞서 말했던 “정해진 표현”에 해당한다. 문대성과 김백수는 분석에 사용한 컴퓨터 프로그램, 산출한 통계치, 분석방법, 유의수준, 사후검증을 순서대로 보고하고 있는데 이것은 거의 정해진 순서여서 누가 쓴다고 해도 비슷할 수밖에 없고, 원래는 전혀 표절의 근거로 삼을 수 없는 부분이다.
사실 문대성의 논문은 김백수의 논문과 똑같은 것 같지만 분석방법에 있어서 “3×3 반복측정 이원 변량분석”을 자신의 연구에 맞게 “2×3 반복측정 이원 변량분석”으로 바르게 쓰고 있다. 아주 무턱대고 베낀 것만은 아니라는 뜻이다. 여기서도 문대성은 변명할 여지가 확실하게 있었다.
그렇지만 워낙 터무니없는 실수까지 베낀 바람에 그런 변명을 할 여지도 날려버리고 말았다. 이것은 원래 김백수의 실수인데 “유의수준 α = 0.5″라는 표현이다. 여론조사에 대한 언론 보도를 보면 맨 마지막에 “오차범위는 신뢰수준 95%에서 얼마”라는 멘트를 하곤 한다. 이 유의수준이라는 것은 신뢰수준의 반대말로 신뢰수준 95%면 유의수준은 5%이다. 그리고 퍼센트는 100으로 나눈다는 뜻이므로 0.05가 된다. 논문에서는 신뢰수준이 95%일 때 소수점 앞의 0은 대개 생략하고 “α = .05″라고 쓴다. 김백수는 이것을 잘못 써서 “α = 0.5″라고 했고 신뢰수준이 50%라는 우스꽝스러운 말이 되어버렸다. 그런데 문대성은 이것마저 그대로 베껴버리는 바람에 정해진 표현에 따라 썼을 뿐이라는 변명을 할 수가 없게 되었다.
다른 부분들도 마찬가지인데 하나하나만 놓고 보면 아주 거친 잣대로 비교했기 때문에 어떻게 변명할 여지가 없는 것이 전혀 없지 않다. 이런 잣대를 들이댄다면 억울하게 표절로 몰릴 정상적인 논문도 얼마든지 있을 법하다. 다만 문대성의 경우 전혀 억울할 일이 없고 그냥 무작정 베껴서 스스로 변명할 여지를 발로 차버렸을 뿐이다.
다시 문대성의 논문을 되새겨 보자. 이 논문은 어떻게 보면 아주 간단한 연구를 다루고 있다. PNF훈련을 태권도 선수들에게 시키고 일정 간격으로 운동의 효과를 측정한 것이다. 이런 실험은 누구나 할 수 있다. 운동을 하면서 체중을 가끔씩 달아보는 모든 사람이 소박하지만 이런 실험을 하고 있는 것이다. 게다가 문대성에게는 이미 앞선 연구자가 비슷한 연구를 해놓았기 때문에 그 연구를 따라하면서 사소한 개선을 덧붙이기만 하면 되었다. 통계 분석은 다른 전문가의 도움을 받으면 된다. 조금 손이 많이 가는 부분이라면 서론에서 연구의 의의를 밝히는 부분인데 이것도 책과 논문을 읽고 요약하는 것에 지나지 않는다. 박사과정 학생이 아니라 평범한 대학생이라도 적절한 지도를 받으면서 시간과 노력을 조금만 들이면 쓸 수 있을 정도로 간단한 그런 논문이다. 문대성은 그 정도 노력도 들이지 않았을 뿐이다. 그 뿐이다.
다른 두 기사에서, 기사의 내용을 보강 또는 보완 하는 방식으로 전문가를 통한 검증을 들고 있는데, 두 기사 모두에 예시로 사용될 수도 있을 글인 것 같습니다. 이 경우에는 검증의 주체가 기사 작성의 주체이기도 하지만;
하여튼 작성자도, 언급되고 있는 분야도 잘 모르는 독장의 입장에서는 기사의 논조에 대한 의심이 있었습니다. 예컨대 새로운 연구가 선행 연구를 참고하되 특정한 변인을 추가하거나 차이를 둠으로써, 해당 분야에 대한 연구의 개선으로 인정될 수 있다-는 말이 보편적 견해인지, 주관적 견해인지 판단할 수가 없거든요. 독자 자신이 그 분야를 잘 알지 못하면 결국 글의 작성자를 신뢰할 수 있는가, 아닌가 하는 점이 관건이 될 겁니다. 개인적으로는, 유의수준에 대한 표현 오류 부분까지 읽고나서야 비로소 어느 정도 기사 내용 전체에 대한 신뢰가 생겼습니다.
여기까지 댓글 작성 내용은, 사실 본 기사에 관한 것이기보다는 앞서 임예인 님과 이승환 님께서 다루신 주제에 대한 일종의 반응입니다.
그리고 이제 본 기사에 대한 의견을 말씀 드리자면, 이 글이 지적하는 부분은 굉장히 중요하다고 생각합니다. 기사에서는 표절에 관한 언론의 단정이 근거가 취약하고, 섣부르다는 점을 중점적으로 분석하고 있는데 이런 접근법과 그 논조에 공감합니다. 설사 결론이 사실에 부합하지 않더라도, 추론의 과정이 타당하다면 전제나 혹은 논리전개의 오류를 검토함으로써, 점증적으로 사실에 다가설 수 있기에 장기적으로는 문제의 소지가 적지만, 결과가 사실에 부합했기 때문에 빈약한 검증 과정이나 근거가 무시되는 일이 반복되어, 결과가 사실과 부합하지 않는 경우가 생기면, 그때는 거의 아무런 대응을 할 수가 없을 테니까요.
이런 사실판단이 포함된 기사를 취재하는 기자들은, 과학철학 교양강좌 등을 좀 들어두면 좋을 것 같다는 생각이 듭니다. 과학이 어떻게 이론을 법칙으로 정립하고, 오류 가능성을 어떻게 검증하는지, 그런 방법론들이 과거에는 어떤 인정을 받았고, 지금에 와서는 어떻게 부인 또는 개선되고 있는지 등등… 그래서 건실한 과학도의 가설에 대한 유보적 – “내 가설은 부인되지 않는 한 유효하며, 부인되는 순간 개선 또는 폐기될 수 있다.”는 식의 – 추론 습관을 갖춘다면, 느리지만 정확한, 그래서 정확하기로는 누구보다도 빠른 양질의 기사를 쓸 수 있지 않을까 싶습니다.
아참… 여러 번 나눠적다 보니 깜박했네요.
“다른 부분들도 마찬가지인데 하나하나만 놓고 보면 아주 거친 잣대로 비교했기 때문에 어떻게 변명할 여지가 없는 것이 전혀 없지 않다.”
이 문장은 조금 이상합니다. 문맥을 볼 때, ‘모든 경우에 있어 변명의 여지가 전혀 없다’-는 것이 아니라, ‘어떤 것들은 변명의 여지가 아주 없는 것은 아니다’-는 내용으로 보이는데, 저 문장을 그대로 이해하면, ‘어떻게 해도 변명할 수 없는 경우들이 (드물지만) 있다.’ 정도가 되거든요.
또 하나의 가설,
위의 통찰력 있는 글, 매우 흥미롭게 읽었고 많은 부분 동의합니다.
글을 읽고 나서야 비로소 리트머스의 진중권의 글을 읽어보게 되었으며, 위에서 지적한 바와 마찬가지로 연구방법에서의 유사성에 기인한 표절 (혹은 복사)의 판정이 일반인에게는 표절에 관한 잘못된 인식을 심어줄 수 있다는 점 동의합니다. 위 글에서 지적된 통계분석의 예 뿐 아니라 신체변인의 측정 부분 및 등속성 측정기구의 운용법 역시 연구방법에 관한 묘사가 유사하다는 이유로 무조건 표절이라고 보는 대는 무리가 있을 터입니다. (물론 문대성의 논문에서는 argue하기 힘들 정도로 같긴 하지요 ^^)
진중권의 글에서 지적한 여러가지를 보면서 제가 가진 “또 하나의 가설”은 문대성의 논문이 완전한 표절이라기 보다는 원 연구(김백수의 학위논문)의 데이터의 일부를 발췌하여 새로운 연구로 포장한 것이라는 겁니다. 물론 원문을 보지 않아 가설 또는 추측에 불과합니다. 즉 다시 말해 언론에서는 문대성의 논문이 여러 부분에서 다른 학위논문의 표현을 가지고 왔다는 데 주목하지만 실제 더 중요한 것은 그 연구가 진행되었는지 여부가 아닐까 합니다.
즉 제가 주목하는 가능성은 두 연구가 동일한 것이고 실제 측정은 12주까지 이루어졌을 것이며 다행히 8주째부터 통계적으로 유의한 결과가 나와서 김백수의 학위논문이 되고, 그 이후 12주까지의 데이터를 추가적으로 분석하여 문대성의 raw data가 되었을 것이라는 겁니다. 아마도 실험의 성격상 다양한 생체 parameter가 측정되었을 것이며 이러한 신체능력의 측정이 최소한 몇 주 단위로 반복되었을 수 있겠죠. 당시 학위논문에서는 8주간의 변화를 가지고 결론을 만들었을 것이나 그 이후 문대성의 학위논문에서는 동일 실험에서 12주까지의 데이터만으로 새로운 연구로 둔갑되었을 가능성도 존재합니다. 실제 대부분의 실험에서 특정 parameter를 반복해서 측정가능한 경우 (예를 들면 특정 장치 설치후 측정한 소음의 변화) 굳이 처음과 마지막이 아니라 중간 사이사이에 데이터를 같이 확보하는 것이 변화의 추세를 보여주기 위해 필수적인 것을 고려하면 위의 가능성이 더 농후해 보입니다.
마지막으로 한가지 흥미로운 것은 위에서 필자께서 지적한 대로 김백수의 논문 및 문대성의 논문에서 p 값의 유의성 기준을 0.5로 적는 어처구니 없는 실수를 합니다. 그러나 이것이 완전한 실수인지 의심스러운 것이 김백수의 논문에서 “표6에서와 같이 (각속도 60도에서) 우측 슬관절 신근은 그룹 사이에 통계적인 차이가 없는 것으로 나타났으나(F=2.492, P=0.111), 측정시기에서는 (통계적으로) 유의한 차이가 있는 것으로 나타났다(F=0.987, P=0.427) (김백수 56쪽).”라는 문구가 있군요. 0.111을 유의하지 않고 0.427을 유의하게 본 희한한 내용입니다. 우습긴 하지만 이것이 박사학위논문의 심사 수준이라는 것을 생각하면 짠한 심정이 들기도 합니다;;. 물론 제가 원문을 보지 못하고 리트머스 웹페이지의 내용을 근거로 http://blog.ohmynews.com/litmus/176475 쓰는 것이라 진중권의 인용의 오타일수도 있겠죠.
뭐 어쨌든 좋은 글 잘 읽었습니다.