[2022년 3월 신임교수 인터뷰] 통계학과 박건웅 교수님을 소개합니다!
[2022년 3월 신임교수 인터뷰] 통계학과 박건웅 교수님을 소개합니다!
[2022년 3월 신임교수 인터뷰] 통계학과 박건웅 교수님을 소개합니다!
자연대 홍보기자단 자:몽 5기 | 임성하
*소속: 통계학과
서울대학교 통계학과 박건웅 교수님. (사진 = 서울대학교 통계학과 홈페이지)
통계학은 불확실성에 대한 논리를 연구하는 학문으로 대부분의 학문 분야에서 중요한 역할을 담당하고 있으며 통계학의 연구 분야는 이론과 응용을 넘나들면서 다양하게 나뉜다. 이번 기사에서는 통계적 머신러닝, 그래피컬 모델 등을 연구하고 계신 통계학과 박건웅 교수님을 인터뷰했다.
Q. 새로 부임하신 만큼 아직 교수님에 대해 잘 모르는 학생들이 많으리라 생각합니다. 교수님에 대한 간단한 소개와 신임 교수가 되신 소감을 부탁드립니다.
저는 2022년 3월부로 통계학과로 부임하게 된 조교수 박건웅입니다. 다른 학교에 있다가 서울대학교로 오게 되었는데 그전에도 좋았고 지금도 좋습니다.
Q. 데이터사이언스와 머신러닝 연구실에서 연구하시는 걸로 알고 있는데, 교수님의 연구 분야에 대한 소개를 부탁드립니다.
기본적인 연구 분야는 ‘머신러닝(Machine Learning)’, 그중에서도 ‘통계적 머신러닝(Statistical Machine Learning)’이라고 표현합니다. 엄밀히 따지면 우리나라에 통계적 머신러닝이나 이와 유사한 연구를 하시는 분들이 얼마나 있는지는 잘 모르겠어요. 저 역시 통계적 머신러닝만을 연구하지는 않거든요. 그렇지만 공식적으로는 통계적 머신러닝을 연구하고 있고, 그 안에서도 저는 굉장히 좁은 영역인 ‘그래피컬 모델(Graphical model)’을 주 영역으로 연구하고 있습니다.
*머신러닝(Machine Learning)은 인공지능(Artificial Intelligence)의 한 분야로 기계가 데이터를 기반으로 학습하여 판단 또는 예측의 성능이 향상되는 기술이다.
Q. 그렇다면 그래피컬 모델은 어떤 모델인가요?
기존의 데이터는 보통 행렬 형태로 주어진다고 하잖아요? 데이터가 행렬로 주어질 때 행 간의 관계를 잘 찾아내는 것을 군집화(Clustering) 혹은 커뮤니티 탐지(Community Detection)라고 합니다. 예를 들어 고객 분류를 할 때 고객이 이 회사의 물건을 샀는지 안 샀는지, 물건을 샀다면 어떤 물건을 샀는지 등에 따라 고객의 정보가 행마다 다 달라질 거예요. 그러면 이제 비슷한 부류의 고객들, 행렬 관점에서 보면 비슷한 행들을 묶어내는 게 군집화의 주목적이죠. 이런 식으로 데이터 샘플들이 행렬로 주어졌을 때 행들 사이에 어떤 관계가 있는지 파악하는 것이 한때 많은 주목을 받았다면, 요즘은 행들이 아닌 열들, 즉 변수들 사이에 어떤 관계가 있는지를 찾는 것이 하나의 목표가 되었습니다.
예전에는 변수 간의 관계를 모두 찾아내는 게 굉장히 어려웠습니다. 왜냐하면 변수의 개수에 따라 찾아야 하는 관계가 기하급수적으로 증가하기 때문이에요. 예를 들어 변수의 개수가 2개면 하나의 관계만 찾으면 되는데 3개가 되면 총 3개의 관계를 찾아야 하고 10개가 되면 총 45개의 관계를 찾아야 하는 거죠. 그래서 변수 간의 관계를 찾을 때는 보통 표적 변수(target variable)를 지정해두고 다른 변수들의 경우 그들 사이의 관계는 관심을 두지 않은 채 그들을 통하여 표적 변수를 잘 추정하고 예측하는 것에 초점을 맞췄습니다. 그러다 보니 딥러닝(Deep Learning)을 기반으로 하는 예측은 잘 되었지만, 설명력이 너무 떨어지게 되었습니다. 이런 점에서 설명력이 굉장히 높은 변수 간의 관계를 다 찾아주는 대표적인 모델이 바로 ‘그래피컬 모델’입니다.
* 예측력은 표적 변수의 예측, 설명력은 변수 간의 관계에 초점을 둔다. 예측력에 강점이 있다는 것은 새로운 데이터들이 주어졌을 때 표적 변수를 잘 예측한다는 것이고, 설명력에 강점이 있다는 것은 여러 변수 간에 어떠한 관계가 있는지 잘 설명한다는 것이다.
Q. 변수 간의 관계를 살펴볼 때는 통계학 외의 특정 분야의 지식(Domain knowledge)도 도움이 될 것 같은데, 교수님의 연구에서도 특정 분야의 지식을 활용하시나요?
요즘 빅데이터 환경에서의 데이터들은 예전과 달리 실험을 통해 얻을 수 있는 데이터들이 아닙니다. 예를 들면 CCTV를 통해 이쪽 도로에 몇 명이 지나갔는지 확인하거나 스마트 팩토리(Smart Factory)에 센서를 달아 놓은 후 어떤 식으로 작업이 이루어지는지 관찰하는 것이지, 우리가 이 도로가 얼마만큼 효과가 있는지 알아보기 위해 직접 도로를 막는 실험을 하는 것이 안 되는 환경입니다. 따라서 그런 환경에서 어떻게 우리가 설명력이 있는 방법론을 개발할 수 있을지에 초점을 두고 연구하고 있습니다. 즉, 특정 분야를 위한 방법을 개발하는 것이 아니라 통계학적인 관점과 수리적인 관점에서 우리가 데이터 분석 그래피컬 모델을 어떻게 적용할 수 있을지가 핵심입니다.
Q. 교수님께서 데이터사이언스와 머신러닝을 연구하시게 된 계기가 궁금합니다.
학생 때는 연구 분야를 교수가 어느 정도는 정해줘야 합니다. 자기가 무엇을 하고 싶다는 것이 사실은 큰 의미가 없을 때도 많아요. 저도 사실 금융 데이터 분석을 잘하기 위해서 시계열 데이터 연구를 하고 싶었지만 여러 사정에 의해서 교수님이 연구를 안 하시게 됐어요. 그러다 보니 다른 영역 연구를 해야 하는 상황이었고, 당시에 학교에서 가장 유명한 교수님이 머신러닝 연구도 같이하셨기에 저도 자연스럽게 그 분야를 연구하게 되었고, 그 교수님이 연구하시는 그래피컬 모델 역시 저도 자연스럽게 연구하게 되었습니다.
Q. 교수님과 같은 연구 분야로 진출하기를 희망하는 학생들에게 해주고 싶은 말씀 있으신가요?
그래피컬 모델을 연구하는 그룹 자체가 세계적으로 많이 없어요. 통계지만 이론적인 부분을 다루기 때문에 수학과 굉장히 유사합니다. 수학 문제는 사람들의 집단 지성만으로는 풀기 어렵고 능력치가 높은 사람이 있어야 풀 수 있습니다. 그렇기 때문에 일단 능력을 키우셔야 해요. 그리고 그런 능력을 갖춘 사람들이 이쪽 분야에 많이 없다 보니까 세계적으로도 성과를 내는 그룹이 별로 없습니다. 그래서 이쪽 분야로 오는 사람들이 있으면 제가 아낌없는 투자를 해주겠습니다.
Q. 지금은 서울대학교 자연과학대학 교수님으로서 이렇게 인터뷰에 응해 주시지만, 한때는 교수님께서도 학부생이셨을 것입니다. 당시의 교수님은 어떤 학생이셨나요?
1, 2학년 때는 공부를 잘하지 못했어요. 일단 1학년 때는 제가 1등을 하지 못한다는 사실이 너무 부끄러워서 공부를 더 하기가 싫었습니다. 공부를 못하기도 했지만, 공부를 열심히 해도 공부를 잘하는 애들에게 질까 봐 열심히 하지도 않았어요. 그래서 군대를 빨리 갔고, 갔다 오니까 공부를 잘하는 학생들 일부는 유학을 갔고 일부는 고학년이 되어 있었습니다. 저와 같이 놀던 친구들과는 놀지 않게 되다 보니 공부를 열심히 했습니다. 그러다 보니까 어느 순간 공부를 잘하게 되긴 했어요. 학과에서 상위권이긴 했지만 제가 공부를 진짜 잘한다고 느껴본 적은 없었던 것 같아요.
Q. 학부 졸업 후 대학원에 진학하게 된 계기가 궁금합니다.
대학원에 진학하는 데는 여러 계기가 있었는데, 그중 하나는 공부로 한번 끝을 보고 싶었기 때문이었습니다. 특히 진짜 좋은 학교에서 제 위치를 확인해보고 싶었어요. 하지만 교수가 되고 싶어서 대학원에 간 건 아니었고, 당시 구글과 같은 IT 회사나 골드만삭스와 같은 글로벌한 회사에 가서 돈을 좀 많이 벌고 싶었습니다. 그런 의미에서 유학을 간 거고요.
Q. 그렇다면 대학원 진학 당시의 생각과 다르게 교수의 길을 선택하게 된 계기가 궁금합니다.
일단 대학원에 오면 학생들이 굉장히 힘들어해요. 대학원에 오기 전까지는 경쟁자가 주변 사람들이고 천재가 아닌 이상 지식의 레벨이 서로 비슷합니다. 그런데 이제 대학원에 오면 자기가 어떤 세부 주제를 잡고 논문을 쓰게 돼요. 그러면 이제부터 경쟁 상대는 자기 주변의 학생이 아니고 그 문제를 같이 푸는 사람들로 바뀌게 됩니다. 그렇게 되면 이제 자기가 여태까지 수업을 들었던 교수님이 한편으로는 경쟁자가 되기도 합니다. 저는 학부 시절 때 누군가에게 진다는 경험을 해봤지만, 학부 시절 때 누군가에게 진다는 사실을 받아들이는 과정을 겪지 않은 사람들은 내가 진다는 사실을 받아들이는 게 쉽지 않거든요.
Q. 현재 서울대학교 자연과학대학에는 제각기 꿈을 품고 온 많은 학생이 재학 중입니다. 하지만 대학 생활을 하며 보다 구체적인 미래 등 다시 진로에 대해 많이 고민하게 됩니다. 이런 학생들을 위한 조언 한 말씀 부탁드려도 될까요?
저는 어떻게 보면 다른 교수님들보다는 인턴이나 아르바이트 등을 하면서 회사 생활을 조금 더 해봤지만 한평생 공부를 했고, 공부를 통해서 모든 것의 끝을 봤던 사람입니다. 그래서 제가 진로에 대해 조언을 하기에는 굉장히 어렵지만 하나 확실한 것은 있어요.
Q. 지금까지 인터뷰에 응해 주셔서 감사합니다. 마지막으로 서울대학교 자연과학대학 학생들에게 한 말씀 부탁드립니다.
전문가라고 불리거나 회사의 높은 위치에 있는 40대, 50대분들도 사실은 다 여러분과 같은 학창 시절을 보냈습니다. 그리고 저는 그분들이 학창 시절 때 여러분보다 더 못했다고 장담할 수 있습니다. 20년 후에는 여러분이 사회의 중역이 되실 거라고 믿기 때문에 지금처럼 열심히 하시면 그만큼의 성과가 올 거고요, 너무 스트레스를 받지 않으셔도 된다고 생각합니다. 최선을 다해서 하되 스트레스는 좀 더 적게 받으셨으면 좋겠어요.
자연과학대학 홍보기자단 자:몽 임성하 기자 sh11972@snu.ac.kr
카드뉴스는 자:몽 인스타그램 @grapefruit_snucns에서 확인 가능합니다.