담배와 폐암간 오래된 논란에 대해서
11 min read

담배와 폐암간 오래된 논란에 대해서

담배는 폐암을 유발할까?

1950년 후반, 통계학, 의학계를 둘러싸고 아주 격렬하게 토론이 벌어진 주제가 있었습니다. 바로 "담배는 폐암을 유발하는가?"입니다. 어떤 사람들은 당연히, 담배가 폐암을 유발한다고 말합니다. 하지만 여전히 이 문제는 명확하게 정리가 된 바가 없습니다. 여전히 "크게 관련이 있어보일뿐"이라는 말로 정리가 되고 있을 뿐입니다. 오늘 이 글에서는 이 아직 끝나지 않은 토론의 이야기를 다뤄보려고 합니다.

담배시장과 폐암환자수의 급격한 동반 성장

담배를 생각하면 어떤 이미지가 연상되십니까? 아마도 하얀 종이에 둘러싸인 갈려진 담배잎이 바로 상상되실 겁니다. 이런 형태의 담배를 우리는 보통 "시가렛(Cigarette)"이라고 합니다. 하지만 100년전까지만 해도 담배시장에서 아주 소수들만 피는 특이한(?) 형태의 담배였습니다.

통계에 따르면 1902년 미국 담배시장에서 단 2%(!)만이 시가렛시장이었다고 합니다. 그래서인지 재떨이보다는 시거 후 침을 뱉는 타구대가 오히려 주위에 많이 있어던게 사실입니다. 하지만 이런 시장을 순식간에 뒤바꾼 일이 있었습니다.

기계가 자동으로 말아주는 시가렛은 니코틴 함량은 시가보다는 작았지만, 너무 편했습니다. 담배를 피고 싶을 때마다 말 필요가 없었습니다. 그리고 여기에 20세기 이후 등장한 대량생산과 새로운 마케팅 캠페인은 담배시장의 판도를 뒤엎어버리게 됩니다. 1952년 담배시장의 81%은 시가렛이 차지하게 되었습니다. 그 뿐만이 아닙니다. 시장도 엄청나게 커져버렸습니다.

게다가 갑자기 증가하는 폐암 환자의 수도 이러한 정부의 행동에 힘을 실어주게 됩니다. 특히나 시계열로 보았을 때 흡연인구의 수와 폐암환자의 수가 비슷한 패턴을 갖고 있는 것이 확인되면서 이런 이야기는 점차 수면위로 떠오르게 됩니다.

하지만 이러한 데이터에 반박하는 의견들도 만만치 않았습니다. 특히나 1900년과 1950년대 사이에는 너무나도 많은 일이 있었기 때문에 위 시계열 데이터로만은 한계가 있다는 지적이 많았습니다. 도로포장 및 화석연료 사용의 증가, 대기오염 등이 대표적인 예였습니다. (Richard Doll, 1911)

과학자, 문제를 바라보기 시작하다

담배와 폐암을 둘러싼 다양한 이야기가 오고 갈 때, 영국의 의사 리차드 돌(Richard Doll)과 통계학자 어스틴 브랜포드 힐(Austin Bradford Hill)은 팀을 이루어 이 문제를 과학적으로 접근해보려고 했습니다. 통계학자로서 힐은 무작위 배정 임상시험(Randomized Controlled Trials)를 활용하는 것이 효과적인 것을 알았지만 그럴 수 없었습니다. 자칫하면 사람을 대상으로 한다는 윤리적인 논란에 휩싸일 수 있었기 때문입니다.

그래서 그는 대신에 이미 암을 진단받은 환자와 건강한 자원자들을 인터뷰하고 비교하는 형태로 실험을 진행해보려고 했습니다. 대상자들은 과거의 행동 패턴이나 건강에 대한 이력에 대해 답해야 했고, 혹시 모를 편향을 막기 위해서 누가 실험군이고 누가 통제군인지는 알 수 없었습니다. 이렇게 시험하는 것을 환자 대조군 연구 (case control study)라고 합니다. 하지만 이런 형태의 실험으로는 담배와 폐암간 인관과계를 찾을 수 없었습니다.

해당 실험은 실험계획단계부터 다소 오류가 있는 실험이었습니다. 이미 걸린 사람들을 대상으로 진행하는 실험이었기 때문입니다.다시 말해서, 흡연이 폐암을 유발할 확률 이 아닌 폐암환자가 흡연자일 확률을 확인하는 실험이었습니다. 게다 게다가 이미 병원에 입원한 환자들이 모집단의 대표성을 잘 띄는 표본이이라고 말하기는 어려웠기 때문에 결과와 상관없이 이미 공격 받을 만한 소지가 너무 나도 많은 실험이었습니다.

합리적이면서도 억지스러운 반대의 목소리

결국 돌과 힐 박사(Richard Doll, Sir Austin Bradford Hill)는 이 문제를 다른 형태로 접근하기 시작하였습니다. 바로 전향적 연구(Perspective Study)라는 것인데요. 6만명의 영국 의사들에게 흡연습관에 관한 설문지를 배포하고 5년동안 지속해서 관찰하였습니다. 그렇게 5년을 관찰해본 결과 놀라운 결과들이 보이기 시작하였습니다. 흡연자의 폐암으로 인한 사망률이 비흡연자 대비 24배 높았던 것입니다. 유사한 조사를 진행하였던 미국 암 학회(The American Cancer Society)도 비슷한 결과를 보여지기 시작하였습니다. 이번에는 정말로 담배가 암을 유발한다는 유력한 실험 결과를 수집한 것 같았습니다.

하지만 이 때, 저명한 통계학자이자 담배와 암간의 인과관계를 부정한 피셔(Fisher) 박사는 해당 결과에 대해서 여전히 믿기 어렵다라는 의견을 내놓습니다. 바로 흡연자와 비흡연자는 체질적으로 많은 면에서 다를 수 있다는 것이었습니다. 예를 들어 위험을 보다 무릅쓴다거나, 음주를 더 많이 할 것이라든가 등의 체질적으로 다를 수 있는 부분이 있기 때문에 담배와 폐암의 직접적인 인과관계를 설명하기에는 해당 실험이 문제가 있다는 주장이었습니다. 사실 돌과 힐의 입장에서 이러한 반박은 말은 되지만 실험을 할 수 없기 때문에 어떻게 대응할 수 없는 주장이었습니다. 심지어 학계의 권위적인 피셔 박사의 말이기에 더더욱 그러했습니다.

이렇게 어이없지만, 합리적이기에 반박을 해야 했던 피셔의 의견을 산산조각 내버린 사람이 나타납니다. 바로 제롬 콘필드(Jerome Cornfield) 였습니다. 그는 역사전공자로 미국 농무부에서 일하면서 독학으로 통계를 공부한 사람이었습니다. 그는 피셔박사의 이론에 정공법으로 대응합니다.

피셔박사의 말처럼 폐암에 걸릴 가능성을 잘 설명해주는 흡연 유전자(Smoking Gene)가 교란변수로 있다고 치겠습니다. 만약 흡연자가 폐암에 걸릴 가능성이 9배는 비흡연자 대비 높다고 하면 당연히 교란변수도 비흡연자 대비 9배는 더 흔하게 보여야 할 것입니다. 다시 말해서 비흡연자의 11%에게서 흡연 유전자가 발견된다면 흡연자의 99%에게는 해당 유전자가 발견되어야 할 것입니다. 그런데 비흡연자의 12%에게서 해당 유전자가 발견된다면? 여기서부는 숫자로 계산이 안되죠. 말이 안된다는 뜻입니다. 결론적으로 유전자의 차이가 사람이 흡연을 하는 것 만큼 복잡하고 예측이 안되는 것과 아주 밀접하게 연결되어 있다고는 말하기 어렵다는 결론이 나옵니다.

아래 다이어그램은 피셔박사와 콘필드간의 논쟁을 다이어그램으로 표시한 것입니다. 5.1처럼 흡연유전자, 흡연, 그리고 폐암간의 인과관계를 5.1처럼 그리게 될 경우 콘필드의 논리에 대응할 수가 없습니다. 따라서 5.2가 적절한 인과관계 다이어그램이라고 볼 수 있다는 결론을 내릴 수 있습니다.

이렇게 피셔의 합리적이지만 매우 억지스럽던 의견은 사그라들게 됩니다. 참고로 콘필드의 분석방법론은 민감도 분석(Sensitivity Analysis)의 기초가 되어 크게 발전하게 됩니다. 각설하고 콘필드의 분석을 시작으로 점차 많은 분석결과들이 점차 담배와 폐암간의 인과관계가 있다는 쪽으로 나오기 시작합니다. 심지어 담배회사 내부에서도 비슷한 결과가 계속 등장하게 되면서 점차 오랜 시간 싸워온 인과관계 논란이 슬슬 막을 내리기 시작하였습니다.합의점을 도출하다. 그러나...

그리고 1년이 넘게 연구를 한 끝에, "통계적인 방법론으로는 담배와 폐암간에 어떠한 인과관계를 증명하기 위한 근거를 수립할 수 없다"는 결론을 발표하게 됩니다. 그리고 5개의 인과관계 판단 기준을 함께 발표합니다. 그 기준은 다음과 같습니다.

  • 관련성의 일관성 (Consistency): 다른 연구에서도 동일한 결과를 확인할 수 있어야 합니다.
  • 관련성의 강도 (Strength of association) :당연히 상관정도가 커야 합니다.
  • 관련성의 특이성(specificity of association): 하나의 원인이 하나의 결과를 유발해야 합니다
  • 시간적 선후관계(temporal relationship): 원인이 결과에 선행해야 합니다.
  • 합리성(coherence): 기존학설과 일치해야 합니다.

이제 관찰적 연구에서는 해당 근거를 바탕으로 인과관계의 가능성을 제시할 수 있게 되었습니다. 하지만 솔직히 말하면 모두 정성적인 기준으로 모두 다 마음만 먹는다면(?) 쉽게 충족시킬 수 있는 기준들입니다. 예를 들어 30개의 연구가 동시에 동일한 교란변수를 무시한다면 관련성의 강도, 일관성 등을 한 번에 통과할 수 있게 됩니다.그럼에도 학문적으로 인과관계를 수용하려고 한 시도라는 차원에서 의의가 있다고 볼 수 있습니다.

Reference