인과 학습을 이야기하기 전에 인과관계는 무엇인지 간단히 생각해보자.
인과관계
어떠한 일어난 일 A가 원인 B에 의하여 발생한다고 해보자.
예를 들어, 달의 인력 B에 의하여 조수 간만의 차 A가 발생할 수 있다.
이때, 조수 간만의 차 A와 달의 인력 B는 상관관계(correlation)에 있다고 할 수 있다.
하지만, 달의 인력 B가 조수 간만의 차 A가 발생하도록 하는 모든 원인은 아니다.
지형이나 달의 위치 등도 조수 간만의 차 A의 원인이 될 수 있다.
이러한 알려진(명시된) 원인 B 외에 관측된 A가 일어나도록 하는 나머지 원인을 설명 C이라고 할 수 있다.
원인에 대한 설명 C는 명시된 어떠한 원인 B로부터 발생되는 일 A를 설명한다.
이러한 설명 C는 일의 발생에 잠재된 원인 또는 인과 설명이라고 할 수 있다.
인과관계와 자주 혼동되는 용어로 상관관계가 있지만, 설명하기엔 오늘 주제에 벗어나므로 첨부한 만화를 보는 걸 추천한다.
이해가 아주 잘 될 것이다.
상상력을 발휘해보자. 과연 나비의 날갯짓만으로 태풍이 일어날 수 있을까?
태풍이 일어나는 원인에는 날씨, 기류 변화 등이 있을 거다.
알려진 원인 B에서 나비효과 A가 발생한다면, 이들의 상관관계를 만족한다.
하지만, 나비 효과의 인과 관계를 설명하기 위해서 알려진 원인 B 이외에 또 다른 원인 C가 잠재될 수 있다.
여기서 원인 C는 날씨 변화나 기류 변화가 될 것이다.
자, 이제 나비효과를 인과관계라고 할 수 있을지에 대해 답할 수 있을 것이다.
다시 본론으로 돌아오자!
인과 학습
그렇다면 인과 학습(Causal Learning)은 무엇일까?
상관관계에서 명시된 원인에 대한 설명을 찾아 인과 관계를 발견하여,
기계로 원인 또는 설명의 변화에 대하여 효과를 예측하는 것이다.
다른 원인이 제공되었을 때, 'what if'에 대한 답을 알 수 있다.
여기서 what if란 원인을 통제, 조작하고 변경하여 상황을 바꾸어 보는 것이다.
(마블의 What If...? 시리즈를 알고 있다면 바로 이해될 것이다.)
현재 신경망 모델의 예측 과정은 '블랙박스'로 여겨진다. 즉, 신경망이 왜 그러한 예측을 했는지 설명할 수 없다.
예를 들어, 안과에서 환자의 안구 사진을 보고 백내장과 같은 안구질환을 예측하는 모델을 생각해보자.
신경망은 어떠한 종류의 안구질환인지 예측할 수 있지만 왜 그러한 예측을 했는지 설명할 수 없고, 이는 의사의 소견을 통해 알 수 있다.
인과 학습에서 훈련된 신경망은 관측 데이터와 레이블 간의 인과 관계를 발견하고, 관측될 수 있는 인과 결과를 예측할 수 있다.
위의 예에서, 환자의 안구 이미지에서 신경망이 어떻게 백내장 질환을 예측했는지 블랙박스로 여겨졌던 그 예측 과정이 설명될 수 있다.
만약 무슨 말인지 혼란스럽다면,
현시대 머신러닝의 한계와 인과 학습의 필요성(이 글의 마지막 섹션)을 먼저 알아보고 다시 의미를 보면 좋을 것 같다.
지도 학습
머신러닝의 대표적인 알고리즘인 지도 학습은 인공지능에게 정답을 알려주고 학습시키는 방식이다.
예를 들어 인공지능에게 개와 고양이 사진을 주면서 ‘이것은 개’, ‘이것은 고양이’ 이렇게 답을 제시하면서 학습시키는 것이다.
지도 학습이 익숙지 않다면, 아래 영상을 추천한다.
한계 ( = 인과 학습이 필요한 이유)
지도 학습의 한계는 무엇일까?
지도 학습에서 머신러닝은 강아지 사진을 왜 강아지라고 인지했는지, 혹은 바둑에서 왜 그 수를 두었는지 정확히 설명하지 못한다.
그리고, 이 점이 바로 인과 학습이 필요한 이유이기도 하다.
딥러닝의 창시자 요슈아 벤지오는 AI를 개발할 때 인지능력을 더한다면 위에서 언급하였던 문제들이 설명 가능하게 된다고 전망했다.
'ETRI 컨퍼런스 2022'에서는 사람이 의식하는 인지능력을 실현할 수 있는 새로운 학습 모델이 필요하다며 인과 학습의 중요성을 언급하였다.
더 자세한 내용은 하단의 참고 기사를 보길 바란다.
즉 인과 학습은 현재 존재하는 머신러닝 알고리즘의 한계를 해결할 수 있는 키가 될 수 있다는 것이다.
사실 우리가 사는 이 세상은 복잡하게 얽힌 인과관계의 연속이라고 생각한다.
그리고 이 인과 관계를 알게 된다는 건 세상을 더 잘 볼 수 있게 된다는 뜻이 아닐까?
다음 글에서는 인과 학습의 예시를 더 살펴보고 관련된 ML 프레임워크를 소개하려고 한다.
[참고]