Scilavinka

왜 머신러닝인가?


딥러닝 모델의 등장으로, 그동안 데이터 분석의 효율과 능력을 시험하는 차원에서의 머신러닝에서 벗어나, 과학이나 기술, 금융, 서비스, 마케팅, 비즈니스 분야 등 많은 분야에서 각자의 요구와 필요에 맞게 적용되어 응용되기 시작하였습니다. 그런데 왜 일까요? 왜 이렇게나 많은 분야에서 인공지능을 도입하려고 하는 것일까요?


가장 큰 이유는 인간의 힘으로 처리할 수 있는 데이터의 양보다 압도적으로 많은 양의 데이터가 만들어지고 또 쌓여가고 있기 때문입니다. 이것은 마케팅의 측면에서 보면 그 필요성을 이해하기 쉽습니다. 예를들어, 마트에서 물건을 구매하는 고객의 장바구니에 기저귀가 들어있다면 항상 맥주가 있다는 상관관계를 알아냈다면, 이 두 상품을 서로 가까이에 배치하여 두 상품의 판매 상승을 유도하는데 이용될 수 있을 것입니다. 그러나 이러한 구매 패턴을 판매 데이터 더미에서 하나하나 찾아 내는 것은 시간도 오래 걸릴 뿐만 아니라 결코 쉬운 작업이 아닙니다. 반면에 머신러닝은 이런 데이터 더미 안에서 숨어있는 패턴과 상관관계를 추출하고 구분해 내는데에 특화되어 있는 도구이기에, 마케팅 전략을 세우는데 매우 유용한 것입니다.


그 결과로 우리는 쇼핑 사이트에 접속하면 그동안의 구매 내역과 검색 내역을 바탕으로 나에게 알맞는 상품을 추천 받고, 접속한 사이트들의 방문 목록을 바탕으로 정확히 타게팅된 광고를 제공 받는 일상을 맞이하게 된 것입니다.


그렇다면 과학분야에서는 어떨까요? 과학 분야에서는 왜 인공지능의 힘을 빌리려고 하는 것을까요? LHC에서 생산되는 양성자 충돌 실험 데이터의 양을 보면 그 이유를 쉽게 추측해 볼 수 있습니다. 




LHC에서는 1초에 양성자를 십억 번 이상 충돌하는데, 이 1초 사이에 만들어진 데이터의 양이 1000 테라바이트에 달합니다. 실험이 반복되면서 이 데이터는 일년에 약 200*1000 테라바이트 정도가 만들어지고, 세계 각지의 수퍼 컴퓨터 데이터 센터로 전송되어 총 1000*1000 테라바이트에 달아는 실험 데이터가 매년 생산되고 있습니다. 이뿐만 아니라 2023년 이후에 LHC는 현재의 광도보다 더 향상된 Hight-Luminosity LHC 를 계획하고 있어, 이 장비가 본격적으로 가동된다면 현재보다 100배가 넘는 더 많은 양의 데이터가 매년 생산될 것으로 예상됩니다. 이러한 방대한 데이터 더미 속에서 기존의 전통적인 방식으로 실험 결과를 분석하여 입자 하나하나를 분류해 내는 일은 결코 쉬운 일이 아니며, 그 속도 역시 데이터가 쌓이는 속도를 따라잡지 못합니다.


이러한 이유로 LHC에서는 오래전부터 머신러닝 기법을 이용해 데이터로부터 쿼크의 종류를 분류하는 연구를 수행하여 왔습니다. 2009년에는 의사결정트리 모델을 활용한 분석 알고리즘을 만들어 단일 탑 쿼크를 분리하는데 성공하였고, 2012년 힉스입자의 발견에서도 힉스입자가 광자로 분괴하는 과정을 분류하는데 성공적인 역할을 하였습니다. 최근에는 딥러닝 기술을 접목하여 보다 다양한 종류의 쿼크들과 매개입자들을 분류하는 연구, 그리고 암흑물질을 찾아 내기 위한 연구 등이 활발히게 이루어지고 있습니다.



중력파 천문학


2015년 9월 14일, 지구로부터 약 15억 광년 떨어진 블랙홀 쌍성계가 서로 충돌하면서 만들어진 중력파 신호를 인류가 처음으로 검출해 내는데 성공하였습니다. 이로써 우리는 시공간 위를 수놓은 다채로운 중력파의 무용을 감상할 새로운 눈을 가지게 되었으며, 이로써 중력파 천문학이라는 새로운 분야가 탄생하게 되었습니다. 이 새시대를 맞이하게 한 주역은 다름아닌 레이저 간섭계 검출기 입니다.




레이저 간섭계 검출기는 과거 에테르의 존재를 증명하기 위해 마이켈슨이 고안한 L자 간섭계의 원리를 그대로 차용한 것입니다. 그러나 우리가 검출하고자 하는 중력파의 세기는 시공간을 1/10억*100억 미터 정도 흔들리게 하는 정도에 지나지 않기 때문에 매우 민감해야 했고, 중력파의 긴 파장 때문에 최소 팔길이가 750km는 되어야 할 만큼 할 만큼 거대 해야만 했습니다. 불가능 할 것만 같았던 이 도전은, 공학과 기술의 발전으로 이러한 난제를 하나하나 해결하는데 성공하였고, 중력파 신호를 성공적으로 검출할 수 있게 되었습니다. 그 주역이 바로 미국의 핸포드와 리빙스턴에 4km 규모로 건설된 LIGO가 대표적이고, 프랑스와 이탈리아가 혁력한 Virgo, 영국과 독일 그룹의 GEO, 그리고 일본의 KAGRA가 각각 건설되었거나 건설 중에 있습니다.


현재의 건설되어 있는 지상 기반의 중력파 검출기들은 대부분 쌍성병합이나 초신성 폭발에 의해 발생하는 중력파 신호를 주탐색 대상으로 삼고 있습니다. 그 이유는 순간의 폭발적인 신호를 발생하기 때문에 검출 성공률이 비교적 높기 때문입니다. 하지만 그렇다고 해서 쌍성충돌이나 초신성폭발에 의한 중력파 신호가 쉽게 관측될 수 있다는 것은 아닙니다. 관측 대상이 되는 중력파의 신호 자체가 매우 약하기 때문에, 검출기에 순수한 중력파 신호 뿐 아니라 외부의 환경 요인과 내부의 기계적 결함에 의한 다양한 잡음들에 쉽게 영향을 받기 때문입니다. 그 민감도의 정도를 알 수 있는 유명한 일화가 몇 가지 있는데, LIGO에서 북한의 핵실험 당시에 발생한 지진 신호를 잡아냈다거나, 캘리포니아 해변가에 치는 파도 잡음 때문에 골치를 앓았다는 등의 이야기가 유명합니다.


그래서 중력파 검출기에서는 검출기에 영향을 미치는 다양한 요인들을 파악하기 위해 수많은 센서들이 설치 되어 있습니다. 여기엔 지진계와 가속도계, 전자기장계, 음향측정계 뿐만 아니라 기기 내부의 작동 상태와 환경을 검점하는 센서들까지, 수 십만개 이상의 센서들로부터 장비의 진단 정보를 실시간으로 취합합니다.


이렇게 취합된 정보로부터 선행되는 작업이 바로 잡음의 분류와 원인 파악입니다. 중력파의 정확한 관측을 위해서는 이들 잡음의 영향을 최소화하고 그 원인을 명확히 파악하여 제거하는 것이 필수적이고, 이것으로부터 관측의 정확도와 신뢰가 담보되기 때문입니다.


그 다음으로 이루어지는 작업이 바로 중력파 신호의 탐지입니다. 앞서 언급 하였던 것처럼 중력파 신호의 세기는 매우 약하기 때문에, 실제 중력파가 관측되더라도 수많은 잡음 속에 파묻혀 그 신호를 직접 파악하기 어렵습니다. 그렇기 때문에 잡음 판별 분석이 중요하고, 이렇게 판별된 잡음원을 제거하여 실제 중력파 신호와 그렇지 않은, 혹은 중력파 신호는 아니지만 중력파 같은 신호들, 그리고 그 반대의 경우들을 구분하여 실제 중력파 신호를 탐지해 나갑니다.


이렇게 진짜 중력파 신호가 탐지되면, 이 중력파 신호의 특성을 파악하는 단계를 진행합니다. 이 중력파의 파원이 무엇인지, 블랙홀-블랙홀 쌍성 충돌인지, 블랙홀-중성자성 쌍성 충돌인지, 중성자성-중성자성 쌍성 충돌인지, 초신성 폭발인지 혹은 그 이외의 파원인지 등을 파악하고, 쌍성이라면 각각의 질량이 어느정도이고, 거리는 얼마만큼 떨어져 있으면, 쌍성 반경과 기울기는 얼마인지, 어느정도의 스핀을 가지고 있는지 등의 정보를 파악해 나갑니다.





관측된 신호의 모수들을 추정하기 위해 일반적으로 일반상대성이론을 통해 사전에 시뮬레이션 된 파형들을 이용하여, 관측 신호들 사이의 적합도를 파악해 나가는 방법을 사용합니다. 


이 과정을 쌍성계 충돌의 경우를 예로 살펴보겠습니다. 쌍성계의 경우 서로의 중력에 이끌려 쌍성이 회전하는 Inspiral 과정과 충돌 직전의 병합과정인 merge, 그리고 마지막 충돌 후 안정화 단계인 ringdown으로 나눌 수 있습니다. 여기서 Inspiral 과정의 시뮬레이션은 포스트뉴토니안 이라는 일반상대성이론의 근사 이론으로 쉽게 계산할 수 있지만, 이후의 merge 단계부터는 근사적인 계산이 어려워 아인슈타인 방정식을 온전하게 계산해야만 정확한 결과를 얻을 수 있습니다. 그러나 아인슈타인 방정식은 매우 복잡한 편미분 방정식으로 이루어져 있어 한번의 계산을 위해 슈퍼컴퓨터를 사용해야만 하고, 따라서 비용과 시간이 많이 드는 작업입니다. 이렇게 많은 비용과 시간을 들여서 각각의 질량과 거리, 반지름 등의 변수에 맞게 계산된 파형 은행이 만들어지면, 이 데이터를 기반으로 실제 관측된 신호를 베이지안 통계 방법으로 그 적합도를 추정하여, 최종적으로 검출된 파형의 모수들을 추정하게 됩니다.


이 일련의 모든 과정들은 모두 방대한 데이터와 값비싼 컴퓨팅 장비들 속에서 이루어 집니다. 그리고 중력파 신호의 관측 범위를 보다 넓히고 더 다양한 천체들이 만드는 중력파 신호를 감지하기 위해, 검출기의 성능은 더욱 향상되어 나갈 것이고, 새롭게 건설되는 중력파 검출기의 수도 점차 늘어 나면서, 축적되는 데이터의 양은 기하급수적으로 늘어날 것입니다. 이 모든 작업을 인간의 힘만으로 가능할까요?



중력파 탐색에 머신러닝 활용하기


마지막 질문이 암시하는 것처럼, 데이터를 기반으로 하고 있는 중력파 탐색에 필요한 이 모든 작업에 머신러닝을 활용할 수 있습니다. 여기서 머신러닝 기법이 어떻게 활용되고 응용될 수 있는지 간략하게 살펴보겠습니다.


이상신호 분류


중력파 검출기는 다양한 신호의 영향을 받습니다. 가장 가까이에서는 교류전류의 60Hz 신호가 항상 전자기 잡음으로 기록되고, 주변 사람의 움짐임과 인근 도로의 자동차, 기차의 통행에서 라디오 신호에 이르기까지 모두 잡음으로 기록됩니다. 이러한 수많은 잡음들은 수만개의 샌서들을 통해 기록되고, 기록된 신호로부터 기존에 알고 있는 잡음과 알지 못하는 잡음들을 파악하고 분류하는 작업에 바로 머신러닝이 활용됩니다.


머신러닝의 학습법은 크게 지도학습과 비지도학습, 준지도학습, 강화학습으로 나뉩니다. 간단하게 설명하자면, 지도학습은 머신러닝이 학습해 나가는 과정에서 학습 목표가 되는 예시와 정답을 제시하며 학습해 니가는 과정입니다. 비지도학습은 지도해주는 선생님이 없이 스스로 그 특성을 바악하여 학습해 나가는 과정이고, 준지도학습은 이 두 학습법은 적절히 썩은 방식입니다. 그리고 강화학습은 어떤 환경에서 정의된 상태에서 다음 단계로 나아가는 행동을 할 때, 최선의 선택에 보상을 주어 최선의 의사결정을 할 수 있도록 유도하는 누적적 학습 방법입니다.


이중에서 중력파 검출기에서 검출기에 미치는 이들 이상 신호의 원인들을 파악하는 학습법으로는 지도학습을 적용하고 있습니다. 이유는 사전에 분류하고자 하는 대상들, 가령 고양이나 개, 거북이, 새 등과 같은 대상들이 명확하게 존재하기 때문입니다. 그런데 한가지 문제가 있습니다. 기존에 파악하고 알고 있는 신호들에 그 특성을 사전에 부여해야만 그것을 기반으로 지도학습을 할 수 있다는 것입니다. 이 신호는 라디오파이고 저 신호는 인근 해변의 파도에 의한 신호이고 등등 처럼 말이지요.



그래서 LIGO는 이 작업에 시민과학을 접목하여, 시민들의 협력으로 이 작업을 수행하고 있습니다. Gravity Psy 라는 이름의 이 프로젝트는 현재 홈페이지(https://www.zooniverse.org/projects/zooniverse/gravity-spy)에 접속하여 누구나 참여가 가능합니다. 참가자가 홈페이지에 가입한 뒤 간단한 교육과 훈련을 받고, 쉬운 분류 문제부터 차근차근 해결해 나가며, 점차 어려운 문제를 해결해 나가게 되는 형태를 지니고 있습니다.


이렇게 시민들의 힘으로 분류된 사전 정보를 바탕으로 인공신경망을 훈련하여, 각각의 신호 특성이 맞게 실시간으로 잡음을 분류합니다. 그리고 이 프로젝트를 통해 기존의 분류표에 포함되어 있지 않은 새로운 잡음 원을 발견하는 성과도 있었습니다.



중력파 탐지


중력파 검출기의 수많은 센서들로부터 들어오는 이상신호들을 분류해 냈다면, 같은 방법으로 중력파 간섭계에 메인으로 기록되는 진짜 중력파 신호 역시 머신러닝을 통해 분류해 낼 수 있습니다. 여기에는 기존에 포스트뉴토니안과 수치상대론을 통해 계산한 파형 은행을 통해 실제 중력파 신호를 학습시키고, 그것을 자동으로 빠르게 분류하는 작업이 가능합니다.


몇가지 모델들을 서로 접목해 시계열 데이터에서 곧바로 학습이 가능한 머신러닝 기법들이 다양하게 연구 중에 있고, 일부 모델의 경우 잡은속에 파묻힌 중력파 신호를 시계열 데이터에서, 기존의 전통적은 방법으로 찾아내는 것과 거의 유사한 정확도록 분류해 내는 성과를 보여주기도 했습니다.



파형 은행


앞서 언급한 것처럼 중력파의 파형을 정확하게 시뮬레이션하여 계산하는데에는 많은 시간과 비용이 소요됩니다. 그중에서도 특히 merge 와 ringdown 단계를 계산하는 수치상대론 계산은 수퍼컴퓨터 자원을 써야만 하는 만큼 상당히 비싼 계산 비용을 요구합니다. 만약 이 계산 비용을 줄일 수 있는 방법이 있다면 어떨까요? 여기에 적용되는 머신러닝 기법이 바로, 적대적 생성 신경망 모델 입니다.




아이디어는 이렇습니다. 포스트뉴토니안을 통해 근사적으로 쉽게 계산할 수 있는 inspiral 단계의 파형을 적대적 생성 신경만 모델에 입력하여, 이후의 merge 와 ringdown 단계의 신호를 완전히 얻을 수 있도록 하는 아이디어 입니다. 적대적 생성 신경망 모델의 특징이 판별자 뿐만 아니라 생성자 또한 함께 학습하여 진화내 나간다는 점을 착안하여, 기존의 파형 은행의 데이터를 학습시킴으로써 생성자가 merge 와 ringdown 단계의 파형을 만들어 내도록 만드는 것입니다.


만일 이것이 성공적으로 이루어져서 inspiral 단계의 신호만으로 이후의 쌍성병합 전 과정의 신호를 얻어낼 수 있다면, 비용과 시간 면에서 매우 효율적일 것입니다. 이 과정에서 사용되는 컴퓨터 자원은 오로지 학습하는 과정에서만 사용되고, 이후 신경망이 완성되면 복잡한 계산 없이 곧바로 결과를 산출해 낼 수 있게 되기 때문입니다.


그러나 여기엔 한 가지 문제가 있습니다. 이렇게 머신러닝이 만들어낸 신호를 우리가 어떻게 믿고 신뢰할 수 있느냐의 문제가 남습니다. 아인슈타인방정식을 정밀하게 계산하여 얻은 기존의 결과를 놔두고, 어떤 구조로 작동하여 만들어 졌는지도 모르는 이 인공신경망의 출력물이 어떻게 실제 중력파 파형과 같다고 말 할 수 있을까요?


이 문제는 보다 많은 신경망 연구와 관측 결과가 쌓이면 조금씩 그 신뢰도를 확인해 나갈 수 있을 것입니다.



모수 추정



모수 추정 역시 많은 컴퓨터 자원을 필요로 하는 비싼 과정에 포함됩니다. 그리고 이 과정 역시 다양한 모수들을 적용하여 사전에 계산된 파형 은행으로 학습된 인공신경망을 통해, 해당 모수들을 쉽게 추출해 낼 수 있습니다. 여기에 관한 연구를 주로 딥러닝 기업을 이용해 많이 연구되고 있고, 최근의 한 연구 결과에 따르면 쌍성계의 질량과 거리, 궤도 반지름 등과 같은 모수 추정 결과가 기존의 분석 결과와 거의 같은 정확도를 가지고 있음을 보여주기도 하였습니다.



망치를 든 사람의 눈에는 모든 것이 못으로 보인다


위에서 나열한 내용들만 살펴보면, 중력파 검출기의 상태 분석과 중력파 신호의 탐지 및 신호의 해석, 그리고 모수추정에 이르기까지의 전 과정을 머신러닝 기법 하나만으로 해결 할 수 있을 것처럼 보입니다. 실제로 이것의 구현을 위한 연구가 다양하게 이루어지고, 기존의 방법과 거의 차이가 없는 결과를 내놓거나 지금까지 파악하지 못했던 사실을 머신러닝이 알아 내기도 합니다.


그렇다면 앞으로 머신러닝이 과학의 발전에 어떤 영향을 미칠까요? 아직까지 머신러닝 기법은 여러가지 한계점을 가지고는 있지만, 적어도 머신러닝을 만난 과학은, 기존의 전통적인 실험으로는 도달하지 못했던 영역까지 그 범위를 확장하여 새로운 정보를 얻을 수 있는 기폭제를 만난것 만은 분명해 보입니다. 덕분에 보다 민감해진 중력파 검출기로부터 우주배경 중력파를 탐지해 내어 빅뱅초기 단계의 우주를 직접 관측하는 미래도 꿈꾸어 볼 수 있을지도 모른다는 기대를 품기도 하고, 기존의 아인슈타인의 이론으로는 예측하지 못했던 새로운 천체를 발견할지도 모른다는 상상도 해 봅니다.


그러나 한가지 분명이 해야할 것은 머신러닝은 만능이 아니라는 것입니다. 지금의 시점에서 물리학 뿐만 아니라 과학의 많은 분야들에 머신러닝을 활용하고 있는 이유 방대한 데이터 더미를 인간의 힘으로 분석하기 힘들어졌기 때문이지, 정체되어있던 상황을 타파하기 위한 마법의 주문으로 활용하는 것이 아님을 분명이 해야합니다.




<참고문헌>


조원상, 기계학습 모형을 통한 새로운 물리 모형의 탐사, 물리학과최첨단, DECEMBER 2017, 4

김태정, 힉스와 인공지능, 물리학과최첨단, DECEMBER 2017, 20

방정호, 머신러닝과 양자 알고리즘, 물리학과최첨단, DECEMBER 2017, 25

M. I. Jordan and T. M. Mitchell, Machine learning: Trends, perspectives, and prospects, SCIENCE, VOL 349 ISSUE 6245, 255 

N. Mukund, S. Abraham, S. Kandhasamy, S. Mitra, and N.S. Philip, Transient classification in LIGO data using difference boosting neural network, Phys. Rev. D 95, 104059

Kyungmin Kim et al, Application of artificial neural network to search for gravitational-wave signals associated with short gamma-ray bursts, Classical and Quantum Gravity, Volume 32, Number 24

Rahul Biswas et al, Application of machine learning algorithms to the study of noise artifacts in gravitational-wave data, Phys. Rev. D 88, 062003

DanielGeorge, E.A.Huerta, Deep Learning for real-time gravitational wave detection and parameter estimation: Results with Advanced LIGO data, Physics Letters B, Volume 778

Yann LeCun, Yoshua Bengio & Geoffrey Hinton, Deep learning, Nature, volume 521, 436–444

Daniel George and E.A. Huerta, Deep neural networks to enable real-time multimessenger astrophysics, Phys. Rev. D 97, 044039 

M Zevin et al, Gravity Spy: integrating advanced LIGO detector characterization, machine learning, and citizen science, Classical and Quantum Gravity, Volume 34, Number 6

1 2 3 4 ··· 126