화를 냈지만, “너는 화내고 있지 않아”라는 기계에게

그래, 나는 소수민족이야.

이야기는 2015년 스승의 날로 거슬러 올라갑니다. 마침 교육부문 기사를 쓰던 제게, ‘이시대의 스승을 찾아오라’는 미션이 떨어졌고, 어찌어찌 경기도의 한 학교로 가게 됐습니다. 결혼을 앞둔 아주 젊은 선생님이었는데, 특수반을 맡고 계셨지요. 이 반 아이들은 매주 한두차례 토스트를 만들고 커피를 내려 교무실에 계신 선생님들에게 판매하고, 수익금을 지역 양로원에 기부하고 있었답니다*.

*참고 | JTBC, 소외된 아이들과 빵 굽는 선생님… ‘모두 웃는 교실’, 2015.5.16. http://news.jtbc.joins.com/article/article.aspx?news_id=NB10889665

여기에서 포인트는 바로 상호작용입니다. 이 반 아이들은 자폐증나 지적 장애 등을 앓고 있는데요. 특히 사회성에서 가장 크게 문제를 보이기 때문에, 이 부분을 어떻게든 보강하기 위해 일부러 선생님들에게 빵을 직접 판매하도록 하고, 직접 지역 단체를 찾아가 수익금을 전달하도록 하고 있답니다.

그래서 저는 이 때의 기억을 가지고, 2016년에 좋은 사람들과 좋은 프로젝트를 설계하게 되었지요*.

*참고 | 유재연·황영규·이지현·나누리, Smart Mirror Project, 서울대학교 융합과학기술개론(2016-1) 수업 프로젝트. 당시에 발표한 PPT 일부 아래 이미지로 첨부.

내용인즉 다음과 같습니다.

    자폐 증상을 앓는 아이들은 상대의 감정에 공감하는 능력과 관련한 거울 뉴런에 문제를 보인다는 이론이 있다. → 그렇다면 아이들이 공감 능력을 학습하면 되지 않을까? → 찾아보니 구글글래스를 활용한 선행연구도 있고, 관련 게임이나 놀이 방식도 인터넷상으로 있다. → 그럼 우리는 좀 더 친숙하게 거울을 활용해 보자!

그래서 우리 팀은 인간의 표정을 통해서 감정을 학습한 기계를 만들고, 거꾸로 그 기계의 지시에 따라 인간이 감정을 맞추어야 미션을 성공하는 스마트미러를 만들기에 이르렀습니다. 데이터는 ImageNet의 3만 5천여개 사람 감정 레이블 데이터를 썼고, DCNN(Deep Convolutional Neural Network)를 활용해 시스템을 설계했습니다. (이 프로그램을 개발한 황영규님의 초상권이…!)

실험은 화남, 행복, 놀람. 세 가지 감정을 랜덤으로 알려주고, 그것에 맞게 표정을 짓는 걸 반복적으로 수행하는 미션으로 진행했습니다. 우리 학교 사람들 스무명을 대상으로 했는데요. 실은 자폐 아동의 섭외가 힘들어서, 바로 이 일반인을 대상으로 하는 실험만 진행하는 것으로 프로젝트를 마쳤답니다. 그런데 그 일반인 대상 실험의 결과 및 피드백이 아주 많은 인사이트를 주었답니다. 바로 이 글에서 하고 싶은 본질적인 이야기이지요.

행복함은 소위 ‘빵 터지듯’ 환하게 입을 벌려 웃고, 놀라워 하는 것도 눈썹을 바짝 들어 눈을 동그랗게 뜨는 것으로 하고, 화나는 것은 입을 삐죽 내민 상태에서 미간을 잔뜩 찌푸려야 기계가 그 감정을 인식했습니다. 무언가 이상한 점 느끼셨나요?
‘아니야. 나는 행복하다고 그렇게 환하게 웃진 않는데. 놀라면 오히려 찡그리는데. 화나면 무표정하단 말야!’

맞습니다. 실험에 참가한 학생들(“몽골과 동·남부 시베리아인에게서 흔히 볼 수 있는 유전자 형, 그리고 동남아시아 및 중국 남·북부에서 흔히 볼 수 있는 유전자형*”을 가진 한국 국적의 사람)의 반응도 딱 이 문장과 같았습니다.
*참고 | http://www.hani.co.kr/arti/science/kistiscience/376612.html#csidxa556aad25ad066086d6c15d432ad321 (2017.11.02 접속)

그 이유는 바로, 기계가 학습한 데이터 때문이랍니다. 해당 데이터셋에는 동양인 샘플이 많지 않았답니다. 소위 말하는 ‘서양사람’의 데이터 위주였지요. 그러다보니 표정도 좀 더 큼직큼직하게, 더 얼굴에 드러나도록 하는 것이 중요했던 겁니다.

실제로 빅데이터를 다루는 사람들은 종종 이런 순간을 맞닥뜨린답니다. 기계가 트레이닝을 할 수 있는 데이터가 한정적이라거나, 편중돼있다거나 하는 이유로 중요한 것은 인식을 못하는 경우가 많아요. 최신 스마트폰은 잘만 인식하면서, 오래된 구식 PCS 폰은 무얼지 감도 못 잡는 경우도 생길테고요. 입력된 텍스트의 영향으로 인종차별적 발언을 하는 인공지능까지도 나올 수 있지요*. 그만큼 데이터 셋이 중요하답니다.

*참고 | https://www.theverge.com/2016/3/24/11297050/tay-microsoft-chatbot-racist

저는 한껏 화를 내봤지만, 기계는 제가 화를 내지 않고 있다고 이야기합니다. 그것은, 아마도 제가 상대적으로 소수인, 한국인이기 때문일지도 모르겠습니다.

#그러니_데이터를_쌓읍시다 !!

Leave a Reply

Your email address will not be published. Required fields are marked *