대학소식

[2023 여름 자몽 시리즈] 03. 로날드 피셔

자연대 홍보기자단 자:몽 5기 | 주정원

통계학과 유전학의 많은 개념을 정립하여 각 학문의 기틀을 다진 로날드 피셔에게 자몽상을 수여합니다!
   
   


(
사진=애덜레이드 대학(University of Adelaide) R. A. Fisher 디지털 아카이브)

자몽이 바라본 노벨상


노벨위원회는 ‘인류를 위해 크게 헌신한 사람’에게 노벨상을 수여한다. 인류에게 헌신하겠다는 목표를 가지고 있지 않거나 가지고 있더라도 자신 나름의 방법대로 실천하는 사람이라 하더라도, 또 학술적 탐구의 이유가 사명감보다는 자신의 흥미에 있다 하더라도 학술적으로 뛰어난 업적을 남긴 사람은 결과적으로 인류에게 큰 공헌을 하게 된다. 특히 전에는 없던 학문 분야를 새로이 만들었다면 그것은 가히 학술적으로 뛰어난 업적이라 할 수 있을 것이다. 그리고 그 결과는 자신의 독창성을 여실히 발휘한 성과라 할 수 있다. 이번 기사에서는 독창성을 발휘하여 새로운 학문의 장을 연 학자의 업적을 인류를 위한 큰 헌신으로 해석했다.

통계학의 아인슈타인이자 뉴턴


 20세기 통계학에서 가장 중요한 인물로 평가받는 로날드 피셔(Ronald A. Fisher, 1890-1962)는 통계학자이자 유전학자이다. 그는 영국 런던에서 태어나 1909년에 케임브리지에 장학생으로 입학하여 수학과 천문학을 공부했다. 그는 진화 생물학과 우생학에도 관심을 가졌다. 그는 1912년에 최대 우도 방법을 고안한 논문을 출판하였다. 1914년에는 런던의 사립학교에서 물리학과 수학을 가르쳤다. 피셔는 가르치는 것을 좋아하지는 않았지만 생계를 위해서 일을 계속해야 했다. 1918년 그는 양적 유전학의 기틀을 세우는 기념비적인 논문을 발표했다. 이 논문은 심사관들이 이해하기 어려웠기 때문에 2년간 출판이 지연되기도 했다. 유전학자 제임스 크로우는 이것을 알버트 아인슈타인이 특허청 일을 하면서 광전 효과, 브라운 운동, 특수 상대성 이론, 질량-에너지 등가 원리 에 관한 기적적인 논문을 쓴 것과 비교하기도 했다. 1919년 농경 연구 기관인 로텀스테드 시험장(Rothamsted Experimental Station)에서 막대한 양의 곡물 데이터를 처리하는 통계학자가 되었다. 이 시기 그는 많은 통계적 개념을 제시하였다. 유전학자이자 수학자인 앨런 오웬은 피셔가 1925년 출판한 책이 양적 유전학에서 차지하는 입지는 아이작 뉴턴의 『프린키피아』가 물리학에서 차지하는 위치와 같다고 적은 바 있다. 1929년 그는 왕립 학회 회원으로 선출되며, 1933년에 런던 대학 우생학 교수를, 이후 『연간 우생학』 편집자, 케임브리지 대학 벨푸어 유전학 교수를 거쳤고 기사 작위를 받았으며 왕립 학회의 코플리 메달을 수상하였다. 코플리 메달은 중요한 업적을 남긴 물리학자, 생물학자에게 수여하는 상이다. 이후 그는 호주 연방 과학기술연구회의 시니어 리서치 펠로우로 지내다 1962년 생을 마감한다.

통계학과 양적 유전학의 기초를 다지다


 피셔는 1918년에 출판한 논문인 <멘델 유전학에 따른 친족 간 상관관계>(The correlation between relatives on the supposition of Mendelian inheritance)에서 분산(variance) 개념을 처음 소개하였다. 이 논문은  친족에게서 나타나는 표현형을 멘델 유전학에 기초하여 통계학적으로 검토한 것으로, 제임스 크로우가 호평한 업적이기도 하다. 나아가 1921년 그는 분산분석법을 개발하고 우도의 개념을 고안하였다. 변량이란 관측이나 시행을 통해 얻을 수 있는 값을 말한다. 분산은 변량들과 평균의 차이를 제곱하여 합을 낸 통계량으로, 변량들이 얼마나 평균으로부터 멀리 떨어져 분포해 있는지에 대한 통계적 지표이다. 정규분포는 자연계에서 자주 발견되는 확률분포로, 변량이 평균이 1이고 분산이 1인 정규분포를 따른다면 그 변량은 표준정규분포를 따른다. 분산분석법(ANOVA, ANalysis Of VAriance)이란 1가지 이상의 요인과 변량 사이에 상관관계가 있다고 가설을 세우고 그것이 참인지를 검정하는 방법이다. 또한 확률변수의 결과를 관찰하였을 때 그 결과가 나올 가능성이 가장 높은 확률분포를 우도(likelihood)가 가장 큰 확률분포라고 한다. 


 1924년 그는 확률분포 z를 제안하는데, 이것은 현재 이용하는 F분포의 효시이다. z분포를 따르는 확률변수는 F분포를 따르는 확률변수의 로그의 절반이다. 또 1925년 피셔는 <<연구자들을 위한 통계적 방법들>>(Statistical Methods for Research Workers)을 출판하였다. 이 책에서 그는 가설의 유의성을 검정하는 척도로 유의확률(p값)을 유의수준 0.05와 비교하는 것을 제안한다. 정규분포에서 제97.5 백분위수에 대응되는 변량이 1.96이라는 것 역시 이 책에서 유래했다. 어떤 확률변수가 어떤 값보다 작을 확률이 n/100일 때, 그 값을 제n 백분위수라고 한다. 자유도가 k인 카이제곱분포란 정규분포를 따르고 서로 독립인 확률변수 k개의 각각의 제곱의 합이 따르는 확률분포를 말한다. F분포란 두 확률변수 V1, V2가 각각 독립이고 자유도가 k1, k2인 카이제곱분포를 따를 때 (V1/k1)/(V2/k2)가 따르는 확률분포를 말한다. 이때 F분포는 두 변량의 분산이 동일한지 검정하는 등분산 검정과 분산분석법에 대한 검정에 쓰인다. 이렇게 확률변수의 결과를 통해 확률분포를 추론하는 방법을 최대 우도 방법이라고 한다. 

 1930년 피셔는 <<자연선택의 유전적 이론>>(The Genetical Theory of Natural Selection)을 발표하며 자연 선택 이론을 멘델의 유전 법칙과 통합하였으며, 집단유전학의 새로운 분야를 정의하고 성선택의 개념에 힘을 실었다. 그는 이 책에서 유전적 변이의 정도가 높을수록 생명체의 적응 정도가 낮아진다는 사실을 밝혀내고, 피셔의 원리 등 많은 개념을 새롭게 소개했다. 멘델 유전학이란 그레고리 멘델이 제시한 유전 법칙이 적용되는 유전학을 말하는 것으로, 유전학을 형질이 발현되는 개체의 수를 조사하여 연구하는 양적 유전학의 효시라 할 수 있다. 멘델의 유전 법칙은 부모의 유전자가 생식세포 분열을 거치며 분리된다는 분리의 법칙, 서로 다른 형질을 결정하는 유전자는 서로 다른 형질의 빈도에 영향을 주지 않는다는 독립의 법칙, 대립유전자 중 하나만 발현된다는 우열의 법칙을 말한다. 현재는 염색체 비분리 현상이 발견되며 분리의 법칙이, 한 염색체에 여러 유전자가 놓인 연관이 발견되며 독립의 법칙이, 공동 우성과 중간 유전이 발견되며 우열의 법칙이 맞지 않는 사례를 찾게 되었다. 성선택이란 생명체가 번식 상대를 무작위적으로 택하는 것이 아니라 선호에 따라서 고르는 것을 말한다. 유전적 변이란 염색체의 염기 서열 등에 돌연변이가 생기는 것을 말한다. 피셔의 원리란 두 성이 있는 종의 경우 암수의 개체수 비율이 1:1로 수렴한다는 것이다. 군집의 관점에서는 일견 암컷의 수를 늘리는 것이 군집의 크기를 늘리는 데에 유리할 것으로 여겨지지만 실제로는 그렇지 않다는 것이다.

 런던 대학 교수 시절 피셔는 인간 혈액 그룹의 유전학을 연구하였고 Rh혈액형을 설명하였다. Rh 유전자형과 표현형을 표기하는 피셔-레이스 명명법은 현재도 쓰인다. 런던 대학 교수 시절 피셔는 인간의 혈액형을 설명하는 유전학을 연구하였고, Rh 혈액형의 개념을 정립했다. Rh 혈액형은 혈액을 구성하는 적혈구에 존재하는 항원 C, c, D, E, e의 존재 유무에 따라 결정된다. T 세포 수용체, 항체 등과 특이적으로 결합할 수 있는 특성을 뜻하는 항원성이 가장 강한 D 항원이 존재하면 Rh+형, 존재하지 않으면 Rh-형으로 분류한다. 이때 항원을 C, D, E 등의 알파벳으로 표기하는 것이 피셔와 레이스가 고안한 피셔-레이스 명명법이다.

현대 실험설계와 머신러닝, 집단유전학의 이론적 기반을 마련하다


 피셔는 통계학의 다양한 개념을 정립하여 변량의 특징을 설명하고 실험이 통계적으로 유의미한지 판단하는 기준을 만들었다. 덕분에 통계학의 이론적 기반이 다져졌으며 자연과학, 의학, 사회과학 등 분야를 막론한 연구에서 통계적인 방법으로 신뢰성을 보장할 수 있게 되었다. 또한 멘델의 유전 법칙을 기반으로 유전학을 연구하였고, 자연 선택 이론을 멘델의 유전 법칙을 활용하여 수학적으로 설명하였으며 자신의 유전자를 보전하기 위한 동물의 행동에 대한 여러 개념(성선택 등)을 고안하였다. 이에 따라 집단 유전학이라는 분야가 발전하는 데에 크게 기여하였다. 그는 통계학과 유전학이라는 학문의 성립에 기여하고 서로 다른 분야 간의 통합을 통해 학문적 발전을 이끌어냈으며 현재의 머신러닝, 다양한 분야의 실험설계, 생명공학 기술의 발전에도 많은 기여를 했다.

 피셔는 생전에 이러한 공로를 인정받아 많은 상을 수상하였다. 그러나 현대에 와서 피셔의 흔적은 곳곳에서 지워졌다. 이것은 피셔가 우생학에 긍정적인 입장이었기 때문이다. 피셔가 근무한 로텀스테드 연구소는 피셔의 이름을 딴 숙박 시설 건물의 명칭을 변경한다는 소식을 알리며 다음과 같이 밝혔다. “피셔는 20세기 초 유럽과 미국의 지식인들 사이에서 드물지 않았던 우생학의 철학을 지지했다. 그는 그의 과학적 이론을 지적 능력에 대한 질문을 포함하는 인종 간의 차이를 탐구하는 데에 적용했다. 그 이후에 인권과 과학 윤리의 진보는 우생학 이론에 대한 전면적인 거절로 이어졌다. 피셔가 농업 과학과 응용 통계학의 많은 측면의 발전에 무척 많이 기여했음을 인지하지만, 로텀스테드 연구소와 로스 농업 신탁은 인종차별적이거나 차별적인 시각을 지지하는 유사과학적 논거를 완전히 거부하며, 어떠한 형태로의 인종차별적이거나 차별적 시각이나 행동 역시 완전히 거부한다. 우리는 우리의 일의 모든 측면에서 평등과 다양성을 약속하며 더욱 정의롭고 공정한 세계를 이루기 위해 끊임없이 일해 나가겠다.”

세 번째 자몽상의 주인공, 로날드 피셔


 피셔가 대학을 다니던 시절에는 통계학이라는 학문이 없었다. 기초적인 통계학 개념인 분산도 피셔가 제시한 것이다. 그러나 그는 독창적인 탐구력을 발휘하여 우도, F분포, 분산분석법, 가설 검정 등과 같은 통계학의 다양한 개념을 정립하고, 변량의 특징을 설명하고 실험이 통계적으로 유의미한지 판단하는 기준을 만들었다. 덕분에 통계학의 이론적 기반이 다져졌으며 자연과학, 의학, 사회과학 등 분야를 막론한 연구에서 통계적인 방법으로 신뢰성을 보장할 수 있게 되었다. 뿐만 아니라 그는 유전학에 대한 관심을 바탕으로 멘델 유전학을 통계학적으로 검증하고 자연 선택 이론과 연관지었으며 유전학적 개념과 성선택, 피셔의 원리 등과 같은 동물의 행동에 대한 설명을 여럿 제시하여 집단 유전학의 새로운 분야를 열었다. 피셔는 뛰어난 탐구심과 독창적인 발상, 그것을 뒷받침하는 수학적 논증으로 통계학과 유전학 모두에 큰 공헌을 하였다. 그의 연구는 오늘날 통계학과 유전학에서 굉장히 중요한 위치를 차지하나, 그는 우생학을 지지했다는 점 때문에 공개적인 찬사를 받기 어렵기도 하다. 본 기사에서는 독자들이 잘 알지 못했을 법한 학자를 발굴하고 그의 학술적 공적을 기리는 의미에서, 독창성을 발휘하여 통계학이라는 학문의 장을 열고 집단 유전학에 큰 기여를 한 로날드 피셔에게 자몽상을 수여하고자 한다.
 

자연과학대학 홍보기자단 자:몽 기자 주정원
garden417@snu.ac.kr
카드뉴스는 자:몽 인스타그램 @grapefruit_snucns에서 확인할 수 있습니다.

관련 기사