MIT TechnologyReview와 SCIENCE가 주목한 2017년 이슈

올해 MIT테크놀로지 리뷰와 SCIENCE가 주목한 이슈는 무엇이 있을까요. 마침 정리할 일이 좀 생겨서 문서타입으로 제가 만든 것을 옮겨와 봤습니다.

주로 미래·인류·인공지능기술 중심의 주제가 주로 거론됐고요. 기술이 인간(일자리)을 위협할 거라는 전년도 분위기와는 달리, 올해는 주로 인류의 해묵은 과제를 기술이 해결해줄 것이라는 기대상승 느낌이 강한 편입니다.

간략하게 참고하셔요. 도움이 되기를.

 

참고 사이트:
https://www.technologyreview.com/lists/technologies/2017/
http://www.sciencemag.org/news/2017/11/choose-your-breakthrough-year

 

(MIT 테크놀로지리뷰) 기술과 기초과학 융합 사례에 주목
– 뇌과학·세포학·유전공학 등에서의 기술의 역할 부각
– 얼굴인식·강화학습·양자컴퓨팅 등 기초공학 발전과 이를 기반으로 한 기술(자율주행차·에너지)에 초점

< MIT 테크놀로지리뷰가 선정한 10대 발견 >

10대 주제 주요 내용
뇌 임플란트 – 뇌·척수에 전극칩 이식해 마비신경 되살리는 실험성공
– 척추 손상으로 우측 다리가 마비된 원숭이에게 신경칩 삽입하자 다리 운동 가능해짐
– 인공 신경보철 실험은 계속 진화 중으로 눈에 신경칩 심어 실명 해결하고, 알츠하이머 질환자의 기억력을 복원하는 연구 또한 진행 (2013년 ~)
자율주행트럭 – 우버의 OTTO 트럭 자율주행 첫 시행
– 5~10년 이내 상용화 전망
얼굴인식 결제 – 중국 스타트업 Face++가 얼굴인식 결제 첫 시행
– 얼굴은 개방된 데이터인만큼 보안 문제 제기
– 그럼에도 얼굴인식에 대한 기술 발전은 가파르게 상승
양자컴퓨터의 실용화 – 네덜란드 연구진이 양자컴퓨터의 주요 구성요소 발생 성공시켜 양자컴퓨터를 이론이 아닌 실재로서 구축
– 4~5년 내로 양자(quantum) 규모의 컴퓨팅이 가능할 것으로 예상되며 특히 암호화·소재학·AI등에 활용전망
360도 셀카 – 고성능·저가 360도 촬영 가능 카메라 봇물
– 부가적으로 VR시장 커질 것으로 전망
고온 태양전지 – MIT 연구진, 現 태양전지판보다 더 많은 에너지 발생시킬 수 있는 차세대 광전지 개발
– 빛→열→빛으로 에너지 전환하는 기존방법 대신, 사용가능한 태양의 스펙트럼을 넓히는 데 집중
– ‘태양열광전지(solar thermophotovoltics)’라 불리는 소재 개발하여 전력효율 기존의 2배로 향상할 전망
유전자 테라피 2.0 – 면역체계를 스스로 파괴하는 유전자를 투입해 선천성 면역결핍증(SCID)을 치료하는 방법 효과 검증
– 본 치료법과 혈우병 유전자치료제가 올해 승인되면서 EU·북미 일대 유전병 치료 박차
– 상대적으로 복잡한 유전적 원인 지닌 알츠하이머·당뇨 등 유전자 돌연변이 질환에 대해서도 연구지속
셀 아틀라스 – 인간 세포지도로 불리는 Cell Atlas를 작성하기 위해 인체가 지닌 37.2조개의 세포를 목록화하는 작업 시작
– 생물학의 넥스트 메가 프로젝트로 꼽히는 이 분야에 페이스북 저커버그 부부가 300억불 기부
봇넷(Botnets) – 사물인터넷 증가로 IoT 네트워크에 잠입해 시스템을 해킹하는 봇넷 사례 급증
– 사물인터넷은 보안에 취약한 경우 많아 봇넷에 의해 각종 명령·제어 시스템이 해킹될 수 있음
– 초기에 봇넷이 자리잡지 못하도록 보안SW 설치 필요
강화학습 – 딥마인드가 알파고리(Lee) 능가하는 알파고제로 발표
– 학습 데이터셋 없이 기계가 룰을 익혀 최상의 전략을 스스로 터득하는 강화학습을 기반으로 함
– 강화학습은 특히 자율주행차에서 활용도 높을 것

(사이언스) 미래학·트랜스휴머니즘 등의 영향으로 영생과 인류의 기원에 대한 논의 활발
– 유전학·생물학을 통한 유전정보 편집 이슈가 큰 인기를 끌었고, 이를 통해 불치병을 해결하려는 움직임 확대
– 새로운 종과 더 오래된 화석의 발견, 중력파·저온현미경·유전자가위 등 학계 핫이슈는 지난해에 이어 꾸준히 거론

< 사이언스가 선정한 12대 이슈 (2017.11.27.) >

12대 주제 주요 내용
여러 암에

잘 드는 약

– 특정 암 치료제가 ‘돌연변이성 DNA‘ 지닌 암환자에 주로 반응하는 것으로 밝혀짐
– 해당 약물은 면역계 T세포 표면의 PD-1 수용체를 차단하는 항체로, 같은 폐암환자여도 흡연으로 DNA변이가 온 경우에 더 잘 작동
– 폐암뿐 아니라 기타 DNA 돌연변이 발생한 암질환에 PD-1 항체가 효과 보일 것으로 전망
유전자치료 성공 – 불치성 유전질환인 척수성근위축증(SMA1, 2세 이전 사망률↑)에 대해 유전자 치료 성공
– 치료 유전자를 지닌 단백질 매개체를 혈관 투입하여 신경중추로 옮기는 방법에 성공한 것
– 신경·근육종 뿐 아니라 파킨슨병 등에도 활용 예상
– 매개체로 변형된 DNA는 증식 안 돼 지속투입 필요
500ml짜리 중성미립자 탐지기 – 파인트(pint) 사이즈의 중성미립자 탐지기 발명
– 휴대가 가능하므로 원자력 발전시설을 모니터링하여 플루토늄 생산시 발생하는 중성자 확인 가능
– 세슘 크리스탈을 활용, 중성자 포착시 발광토록 설계
– 기존에는 거대한 크기의 레이저관측기 주로 활용
유전자가위로 작은 돌연변이체 잘라내기 – 배아의 유전성 질환 돌연변이에 대해 유전자가위(CRISPR)로 DNA base editing을 수행 (중국)
– 유전자가위의 ‘포인트돌연변이체’ 대응 한계를 base editing 방법으로 극복
– RNA base-editor 시스템 또한 방안으로 모색되어 유전자가위 활용도 증대될 듯
가장 오래된 얼음코어 – 남극에서 2천7백만 년 전의 것으로 보이는 얼음코어 발견 (종전 최고령은 1천7백만 년)
– 얼음 내부서 발견된 공기방울은 빙하기 근거로 거론
우주 융합 – 중성자 별의 융합이 중력파 일으키는 것을 감마선과 전파(radio wave)를 통해 수차례 발견
생물학 논문 선제출 열풍 – 논문 승인 전에 일단 온라인 아카이빙 하는 경향이 생물학계에서 불고 있음
– 주제 선점 및 취업 등의 이유가 거론
– 학계는 토론 문화 형성 등 이유로 긍정적 반응
인류의 기원 – 모로코에서 발견된 호모사피엔스 두개골이 30만 년 전의 것으로 밝혀짐 (가장 오래됨)
– 이전까지 최고(古) 호모사피엔스 화석은 20만 년
AI 포커 정복 – 캐나다·체코 연구진이 개발한 포커 인공지능프로그램 ‘딥스택(DeepStack)’이 무제한 배팅 포커 게임에서 인간 프로 도박사들을 모조리 누름
– ‘헤즈업 무제한 텍사스 홀덤(HUNL)’ 규칙 기반으로 훈련됐고, 이때 경기 경우의 수는 10^160으로 추산
– 컴퓨터 이용한 통계학적 최적전략 발견 이론(2015.1 발표)을 기반으로 함
새 유인원의 발견 – 새로운 종의 오랑우탄 ‘Tapanuli’ 발견
– 1929년 보노보(Bonobo) 이후 처음 발견된 종으로 현재는 수마트라섬에 800마리만 남음
– Tapanuli 오랑우탄은 다른 종과 달리 2만년 전부터 고립돼 비교적 처음의 유전자 유지
저온전자현미경 – 올해 노벨화학상 수상자 자크 두보셰·요하임 프랑크·리처드 핸더슨의 발명 ‘극저온 전자현미경’
– 단백질의 분자구조를 원자단계까지 촬영할 수 있도록 초단시간에 시료를 냉각해 관찰하는 현미경
– 초저온전자현미경의 발명으로 핵산의 원자 수준 구조 및 지카 바이러스의 구조 밝히는 데도 쓰임
카시니의 마지막 항해 – 20년 동안 탐사를 수행한 NASA 무인탐사선 카시니(Cassini)호가 9월 임무 완료 후 산화
– 97년 발사돼 7년 항해후 토성에 진입한 카시니호는 토성의 위성인 타이탄의 액화 메탄바다, 또다른 위성 엔켈라두스의 지하 바다 등을 발견
– 산화 직전 보낸 토성 사진 80장을 모아붙인 이미지 또한 화제가 됨 (로이터선정 올해의사진)

(상위 4건은 2017.12.4.에 선정된 최종후보들. 11일에 최종 1개 결정)

 

카시니의 마지막항해 사진을 첨부합니다.


Image credit: NASA/JPL-Caltech/Space Science Institute

올림픽 개최국만 얻을 수 있는 데이터는 어때요?

Data-Driven Idea 기반으로 과학기술정책을 고민하는 연구원 1입니다. 전공도 그렇고 해선지, 글을 쓰다보면 늘 이쪽으로 흐르네요. 골자인즉, ‘데이터 관점으로 정책을 구상하자’라는 것이지요.

그런 흐름에서 나온 첫번째 글입니다. 2월에 열리는 평창동계올림픽과 관련해, ICT의 쇼룸도 좋지만 실속있게 비정기 오프라인 데이터를 수집할 수 있는 귀한 기회로 삼았으면 좋겠거든요. (물론! 개인사생활보호 원칙이 철저하게 지켜지는 선에서 말이지요.) 기업들이 ‘당연히’ 모으는 데이터도 있겠지만, 공공에서 수집할 수 있는 데이터는 다시 공공에 돌려줄 수 있는, 그런 방안이 모색됐으면 좋겠어요. 이를테면, ImageNet같은 게 이번 기회에 생긴다든지 하는 것 말이지요. (아, 그래도 ‘한국형 ImageNet’ 같은 표현은 쓰고 싶지 않네요. 한국형은 싫어요.)

모쪼록 작은 울림이 되길 바라며 아래 첨부.

 

유재연(2017), 국가 데이터 수집 기회로서의 평창동계올림픽: 메가 스포츠 개최의 새로운 수익 구조화, 과학기술정책, Vol 27, 11, pp 52-57.

Download: 232_09   Or STEPI Website:  http://www.stepi.re.kr/app/publish/view.jsp?cmsCd=CM0021&categCd=A0504&ntNo=235

 

생명 이야기인데, 기계 의존적으로 묘사하는 건 아직 너무 일러.

나는 그다지 기술결정론적인 사람도 아니고, 그렇다고 반(反)기계를 외치는 사람도 아니다. 그럼에도 불구하고 최근 계속 눈엣가시같은 광고들이 있어서 소개한다. (참고로 내가 그 브랜드를 싫어하는 사람도 아니다. 우리 집에서 해당 브랜드 차량만 벌써 몇 대째 구입하고 있는지 모른다.)

이 두 광고 모두 기술을 통한 안전성을 강조하고 있다. 전자는 감성적으로 접근했고, 후자는 좀 더 기술에 집중한 모습이다. 음, 실제로 최근 해당 차량을 구입하러 갔던 사람으로서 영업인과 이야기를 나눠보았는데. 후자에 나와있는 차선 이탈 보조 장치의 경우 말 그대로 ‘보조’ 장치다. (Assistance!) 오히려 연세 있으신 분들에게는 해당 옵션을 권하지 않는데, 가끔 깜빡이를 켜지 않고 차선을 옮겨갈 경우(-_-내가 제일 싫어하는 운전스타일이긴 하다) 이 이탈방지 시스템때문에 오히려 문제가 되어서 해당 장치의 전원을 내리는 경우도 있다고 한다. 뭐 아무튼, 작동 잘 하는 건 확실한 것 같다.

기술이 문제라는 것이 아니라, 광고들 모두 굉장히 기술 의존적인 시선을 보이고 있다. 비슷한 광고로 다음 것도 있다.

대략 25초쯤에 보면 여성이 자전거를 타고 가다가 교차로에서 차량과 마주치는 장면이 있다. 음, 차량이 알아서 할 것이니 걱정 말라는 시그널같아 보인다. 물론 미래를 그리고 있는 것이기는 하지만, 조금 너무 앞선 모습을 보여주고 있는 것은 아닐까.

이런 아름다운 광고들에 대해 굳이 불편함을 이야기하는 것은, 자칫 이 모든 이미지들이 인간의 주의력이라는 자연적 본능에 대한 불신을 심어주고, 오히려 그것을 기계로 대체해가려는 생각을 너무 전파시키는 것은 아닌가 싶어서이다. 물론, 세계적으로 한 해에 수억 건의 인재가 발생하고 있고, 그런 이유로 기계가 인간의 생명을 지켜주는 일이 하루라도 빨리 와야 하는 것에는 이견이 전혀 없다. 하지만, 그 ‘때’가 벌써 온 것은 아니다. 기술적으로 아직은 불가능하다.

자율주행차도, 여러 종류의 IoT 디바이스도, 아직 인간의 주의력을 넘어설만큼의 능력을 보이지 못한다. 벌써부터 모든 것이 가능한 것처럼 이야기하는 것은 너무 섣부르다고 생각한다. 아직까지는, 그래도 인간의 보조장치로서의 자율기술(표현에 모순이 좀 있지만)이라는 점을 알려야 한다. 인간이 어찌됐든 모든 상황에 주의를 기울여야 한다는 것,  그리고 인간 스스로 자신의 행동 모든 것에 책임을 져야 한다는, 그 기본적인 생각이 변하지 않도록 말이다. 2017년 말이니까, 그래도 이렇게 쓸 수 있는 것이다. (혹시 아나, 내년엔 진짜 생명 지켜줄 차량이 나올지!)

 

데이터는 잘 쌓고 잘 굴려야 해요.

그래서 나는 아마존 주식을 샀습니다

글로벌금융위기가 터지기 직전인 2006년과 2007년 즈음. 국내에서는 펀드붐이 일었습니다. 과외 알바로 30만원을 받아 주로 음주가무에 털어 쓰던 저는 마침 프랑스 유학을 앞두고 있었고, 쬐금 모아둔 돈을 다 쓰고 갈 것이냐 아니면 잘 굴릴 것이냐의 기로에 섰습니다. (달랑 1백만원을 가지고 말이지요) 귀도 얇은 사람답게 시류에 휩쓸려서는 모 증권사에 계좌를 뚫고, 절반씩 똑똑 잘라 한국 펀드와 중국 펀드에 넣어두었습니다.

그렇게 십 년이 흘렀습니다. 그 사이 그 계좌는 비었다 채워졌다를 반복했겠지요. 이미 2008년 위기 이후 제 기억에서 완전히 포기 내지 소멸됐던 그 녀석은, 쥐꼬리만한 퇴직금으로 근근이 학교를 마쳐가던 어느날 갑자기 제 머릿속으로 소환됐습니다. 확인해보니 10년 간 무려 4만원씩이나 불어있었습니다. 차라리 은행에 넣을 것을…

뭔가 기분이 좋아져서 이걸로 도쿄에서 탕진잼을 할까 고민을 하는데 마주앉은 펀드매니저분 등 뒤로 큼지막하게 ‘해외주식투자도 우리와 함께!’라고 써있는 것을 본 겁니다. 나도 구글, 애플, 마소, 아마존, 소프트뱅크, 알리바바의 주주가 되고 싶다-는 그 마음이 갑자기 타오르기 시작했습니다. 저는 그렇게 계좌를 닫지 않고 또다시 새로운 10년을 기약하게 됐지요. 10년 뒤에도 ‘차라리 은행에 넣을 것을…’이라고 쓸지도 모릅니다.

서론이 길었는데, 이때 제가 투자한 곳은 아마존이었습니다. (참고로 이 글은 아마존 주식을 사라는 홍보글이 절대 아닙니다. 네버.) 계기는, 제가 아마존의 클라우드 및 AI 서비스인 AWS(Amazon Web Service)*를 이용한 게 컸지요. 내가 써 봤고, 만족했고, 비교적 잘 아는 것에 투자를 하는 게 맞지 않을까?라는 개똥철학 때문이었습니다.

*참고 | console.aws.amazon.com

위 그림은 해당 서비스의 콘솔 캡처본인데요. 정말 너무 많은 서비스들이 들어있지요. 제가 주로 쓰는 용도를 말씀드리면, WordPress로 개인 홈페이지를 만들어 운영할 때 이 EC2 인스턴스를 쓰고요. 제가 굴리고 싶은 데이터를 S3 스토리지에 넣어서 위 캡처본에는 나와있지 않은 AWS의 인공지능 서비스 Rekognition으로 데이터의 속성을 파악하기도 한답니다. 이 과정에서 IAM이라는 보안툴도 쓰고요. 나중에는 분석툴 Athena도 쓰고, AWS IoT도 활용해보고 싶어요.

짧게 말해 ‘데이터를 모아다 굴리는 곳’이 바로 이 AWS랍니다. 이런 비슷한 시도를 알리바바, MS, 구글에서도 진행하고 있는데요. 실제 전세계 클라우드 컴퓨팅의 독보적 1위가 아마존인데, 그 뒤를 알리바바가 바싹 쫓고 있답니다. (그래서 제 펀드매니저 분은 알리바바와 아마존에 각각 한 주씩 매달 투자를 하고 있다고 하시었습니다만…) 이 두 업체 모두 전자상거래를 운영하고 있다는 공통점이 있지요.

데이터를 잘 모아서 가지고 있는 것만이 클라우드의 역할은 아니랍니다. (그렇게 치면 네이버 드라이브나 구글 드라이브가 사실 쓰기는 훠얼씬 편하겠지요?) 아무래도 보안이슈가 클테니, 이 클라우드 안에서 분석 서비스까지 쓸 수 있도록 연동이 잘 되면 더욱 좋겠지요? 제 상상 속 예를 들어 볼게요.

    Q. 저는 유기농 단무지를 제조하는 업체를 운영하고 있습니다. 우리나라에서 아주 성공을 해서, 이제 해외로 진출을 하고 싶어요. 저는 프랑스를 좋아하니까 프랑스로 보내고 싶어요. 그런데 어떤 사람들이 유기농 단무지를 좋아할 지 고객군이 짐작이 안 됩니다.
A. 고객님~ 그럼 이런 방법은 어떠세요? 유기농 단무지의 이미지 및 재료, 그리고 레시피 데이터까지 모두 저희 서버에 넣어주시고요. 그간 고객들의 구매 데이터(구매를 몇 주에 한 번 하는지, 성별/연령대/지역은 어떠한지)와 판매 데이터(가격 변동에 따른 판매량은 어떠한지, 재료값 상승에 따른 수익 변동은 어땠는지) 등도 입력해주세요. 그럼 아래와 같이 해결할 수 있어요!
먼저 프랑스에서 단무지랑 비슷한 게 오이피클인지, 할라피뇨 고추인지, 정어리인지 확인해볼 수 있을 거예요. 음, 저희 클라우드 업체 자체적인 인공지능 분석에 따르면 프랑스인들의 주요 구매가 요즘 비오(Bio)라는 유기농에 초점이 맞춰져 있으니 승산이 있을 것 같아요. 바게트에 얹어먹는 정어리류처럼 타게팅을 하면 좋겠군요. 단무지를 아주 잘게 썰어서 타르탱(Tartin)처럼 위에 발라 얹을 수 있게끔 하시고, 새콤한 맛이니 식전주(Aperitif) 추천 재료로 마케팅 해보는 건 어떨까요? 주요 고객군은 골족(Gaule) 유전자가 강하고, 주로 안경을 쓰며, 피부에 붉은 기가 좀 있고 키가 170cm 안팎인, 파리에 사는 40대 여성이 될 것 같습니다.

이런 류까지도 언젠가는 할 수 있지 않을까 싶습니다. (컨설팅 업체의 곡소리가 나오는 시나리오일지도.) 뭐, 사람이 하던 일을 기계가 할 수 있게 된다면, 아주 감각적인 센스가 중요한 것이 아닌 이상 일반적인 일들은 이런 식으로 처리될 수도 있지 않을까요. 물론, 데이터가 균일하고 공정하고 또 방대하게 마련돼 있으면서 시스템적으로 정당한 분석을 해준다면 말이지요.

클라우드는 단순한 저장공간이 아니라, 하나의 플랫폼이라고 봐야 한답니다. 아이폰이 처음 발매됐을 때 iOS라는 플랫폼이 등장함으로써 어플리케이션 산업이 커지게 된 것처럼, 그리고 휴대전화의 모델이 완전히 바뀐 것처럼. 클라우드 서비스도 마찬가지로 특히 이런 산업적 측면에서 큰 틀의 플랫폼이 될 것이어요. 이미 많은 업체들이 수년 전부터 이같은 클라우드 서비스를 활용하고 있기도 하고요.

그런데 말입니다. 저는 기우가 듭니다. 이 클라우드 서비스가 저같은 개인 기준에서는 꽤 비싸거든요. 그런데 독점이든, 몇몇 업체에 편중이 되든 해서 더더욱 비싸지면 어떡하지요? 아니면 갑자기 그 업체가 (그럴 일 없겠지만) 순식간에 사라져버린다면 어떡하지요? 저는 과거 싸이월드 사진첩의 이미지 파일들을 외장하드에 옮기는 것도 정말 벅차서 십 년째 미루고 있는데(제발 미니홈피 없애지 말아주세요), 방대한 양의 데이터를 보관하고 활용하느라 이 클라우드 서비스에 의지하는 다른 큰 기업들 입장이라면… 정말 상상하고 싶지 않네요.

데이터를 잘 쌓고 잘 굴리고, 동시에 안정적이면서도 사회적 책임을 다하는, 그런 기업이나 공공의 어떤 기관 또는 업체 또는 정의될 수 없는 무언가가 대안적으로라도 있으면 좋겠다는 생각이 드는 요즈음입니다. 돈도 여력도 모자라는 저같은 시민도, 언젠가는 프랑스에 유기농 단무지를 팔고 싶단 말이에요!

#그래서_아마존주식은 #몇달째_제자리걸음 #십년뒤에_확인할게요 !

화를 냈지만, “너는 화내고 있지 않아”라는 기계에게

그래, 나는 소수민족이야.

이야기는 2015년 스승의 날로 거슬러 올라갑니다. 마침 교육부문 기사를 쓰던 제게, ‘이시대의 스승을 찾아오라’는 미션이 떨어졌고, 어찌어찌 경기도의 한 학교로 가게 됐습니다. 결혼을 앞둔 아주 젊은 선생님이었는데, 특수반을 맡고 계셨지요. 이 반 아이들은 매주 한두차례 토스트를 만들고 커피를 내려 교무실에 계신 선생님들에게 판매하고, 수익금을 지역 양로원에 기부하고 있었답니다*.

*참고 | JTBC, 소외된 아이들과 빵 굽는 선생님… ‘모두 웃는 교실’, 2015.5.16. http://news.jtbc.joins.com/article/article.aspx?news_id=NB10889665

여기에서 포인트는 바로 상호작용입니다. 이 반 아이들은 자폐증나 지적 장애 등을 앓고 있는데요. 특히 사회성에서 가장 크게 문제를 보이기 때문에, 이 부분을 어떻게든 보강하기 위해 일부러 선생님들에게 빵을 직접 판매하도록 하고, 직접 지역 단체를 찾아가 수익금을 전달하도록 하고 있답니다.

그래서 저는 이 때의 기억을 가지고, 2016년에 좋은 사람들과 좋은 프로젝트를 설계하게 되었지요*.

*참고 | 유재연·황영규·이지현·나누리, Smart Mirror Project, 서울대학교 융합과학기술개론(2016-1) 수업 프로젝트. 당시에 발표한 PPT 일부 아래 이미지로 첨부.

내용인즉 다음과 같습니다.

    자폐 증상을 앓는 아이들은 상대의 감정에 공감하는 능력과 관련한 거울 뉴런에 문제를 보인다는 이론이 있다. → 그렇다면 아이들이 공감 능력을 학습하면 되지 않을까? → 찾아보니 구글글래스를 활용한 선행연구도 있고, 관련 게임이나 놀이 방식도 인터넷상으로 있다. → 그럼 우리는 좀 더 친숙하게 거울을 활용해 보자!

그래서 우리 팀은 인간의 표정을 통해서 감정을 학습한 기계를 만들고, 거꾸로 그 기계의 지시에 따라 인간이 감정을 맞추어야 미션을 성공하는 스마트미러를 만들기에 이르렀습니다. 데이터는 ImageNet의 3만 5천여개 사람 감정 레이블 데이터를 썼고, DCNN(Deep Convolutional Neural Network)를 활용해 시스템을 설계했습니다. (이 프로그램을 개발한 황영규님의 초상권이…!)

실험은 화남, 행복, 놀람. 세 가지 감정을 랜덤으로 알려주고, 그것에 맞게 표정을 짓는 걸 반복적으로 수행하는 미션으로 진행했습니다. 우리 학교 사람들 스무명을 대상으로 했는데요. 실은 자폐 아동의 섭외가 힘들어서, 바로 이 일반인을 대상으로 하는 실험만 진행하는 것으로 프로젝트를 마쳤답니다. 그런데 그 일반인 대상 실험의 결과 및 피드백이 아주 많은 인사이트를 주었답니다. 바로 이 글에서 하고 싶은 본질적인 이야기이지요.

행복함은 소위 ‘빵 터지듯’ 환하게 입을 벌려 웃고, 놀라워 하는 것도 눈썹을 바짝 들어 눈을 동그랗게 뜨는 것으로 하고, 화나는 것은 입을 삐죽 내민 상태에서 미간을 잔뜩 찌푸려야 기계가 그 감정을 인식했습니다. 무언가 이상한 점 느끼셨나요?
‘아니야. 나는 행복하다고 그렇게 환하게 웃진 않는데. 놀라면 오히려 찡그리는데. 화나면 무표정하단 말야!’

맞습니다. 실험에 참가한 학생들(“몽골과 동·남부 시베리아인에게서 흔히 볼 수 있는 유전자 형, 그리고 동남아시아 및 중국 남·북부에서 흔히 볼 수 있는 유전자형*”을 가진 한국 국적의 사람)의 반응도 딱 이 문장과 같았습니다.
*참고 | http://www.hani.co.kr/arti/science/kistiscience/376612.html#csidxa556aad25ad066086d6c15d432ad321 (2017.11.02 접속)

그 이유는 바로, 기계가 학습한 데이터 때문이랍니다. 해당 데이터셋에는 동양인 샘플이 많지 않았답니다. 소위 말하는 ‘서양사람’의 데이터 위주였지요. 그러다보니 표정도 좀 더 큼직큼직하게, 더 얼굴에 드러나도록 하는 것이 중요했던 겁니다.

실제로 빅데이터를 다루는 사람들은 종종 이런 순간을 맞닥뜨린답니다. 기계가 트레이닝을 할 수 있는 데이터가 한정적이라거나, 편중돼있다거나 하는 이유로 중요한 것은 인식을 못하는 경우가 많아요. 최신 스마트폰은 잘만 인식하면서, 오래된 구식 PCS 폰은 무얼지 감도 못 잡는 경우도 생길테고요. 입력된 텍스트의 영향으로 인종차별적 발언을 하는 인공지능까지도 나올 수 있지요*. 그만큼 데이터 셋이 중요하답니다.

*참고 | https://www.theverge.com/2016/3/24/11297050/tay-microsoft-chatbot-racist

저는 한껏 화를 내봤지만, 기계는 제가 화를 내지 않고 있다고 이야기합니다. 그것은, 아마도 제가 상대적으로 소수인, 한국인이기 때문일지도 모르겠습니다.

#그러니_데이터를_쌓읍시다 !!

사진 속에는, 우리의 생각이 들어있지 않을까?

우리는 모르지만, 기계는 알아챌지도 몰라!

몇 년 전 이야깁니다. 서울 이태원의 한 호프집에서 소맥을 말아먹던 중, 사진이 취미인 A사장님이 이런 말을 했습니다.

“우리 집에 애가 셋인데, 하나씩 카메라를 다 사줬어요. 그래서 마음대로 찍게 했지요. 매년 파일을 뽑아서 연도 이름을 달아 폴더를 만들어 두는데, 아이들마다 사진이 다르고, 또 그 애들이 매년 찍는 사진이 다르더라고요.”

그때는 “우와아, 멋진 아빠다아!” “애들한테 진짜 좋은 추억이 되겠네요!”라며 감탄만 했는데, 이게 수년 후 저의 주요 관심사가 될 줄이야.

이건 지난 할로윈데이날 대전의 한 와인바에 갔다가 찍은 사진이랍니다. 저는 왜 이런 사진을 찍었을까요? 어떤 사람은 같은 와인에 대해 와인병 전체를 찍었을 수도 있고, 와인잔에 삼분의 일 정도를 붉게 채운 뒤 병과 함께 찍었을 수도 있고, 또는 저처럼 레이블을 찍더라도 와인 자국이 남지 않은 좀 깨끗한 것을 찍었을 수도 있을 것입니다. 음, 저는 이 와인의 스모키 한 잔향도 좋았고, 마침 이런 나눔명조체 같은 폰트(다른 이름이 있겠지요)도 좋고, 그냥 기분도 좋아서 이렇게 찍은 걸 인스타에 올렸지만요.

이것들은 제가 사는 동네(ㅅㅈㅌㅂㅈㅊㅅ)의 최저 기온이 올 하반기 들어 첨으로 영하 1도까지 떨어진 10월 30일 퇴근길에 아이폰6S으로 찍은 사진이에요. 분명 엊그제까진 가을이었는데, 벌써 겨울인가 싶어 찍은 것이지요. 다들 비슷해 보이는데 아주 미묘하게 각도 및 시각 차이가 있지요. 이 세 컷 중 제가 페북에 올린 사진은, 바로 맨 마지막 것이랍니다. 저는 황량한 도시의 겨울 풍경 가운데서도 조금은 반짝이는 불빛들을 붉은 하늘과 대치시켜 보고 싶었는데, 게 중에 마지막 것이 제 마음에 가장 와 닿았답니다. 마치 영화 <바람과 함께 사라지다>의 노을 컷 같았달까요. (전혀 다르지만)

저 같은 개인도 SNS에 올리는 사진을 고르느라 혈안이 될진대, 하물며 신문에 실리는 사진 한 장, 방송에 나오는 한 컷 한 컷에는 사람의 주관이 얼마나 많이 들어가 있을까요? 그래서 늘 선거철만 되면, C일보와 H신문사의 1면 사진 및 주요 후보들의 사진(+기사 톤)을 가지고 말들이 많았지요. 그리하여 지난해 저는 이런 내용을 담은 페이퍼를 쓰기도 하였지요*.

*참고 | 유재연, 서봉원(2017), 보도사진 속 국회의원 선거 후보자의 감정과 당선의 관계, Proceedings of HCI Korea 2017 학술대회 발표 논문집, 2017.2, p146-149.

그래서 약간 환상이 좀 생겼는데, ‘기계가 인간의 (모르고 지나칠 법도 한) 마음을 분석 내지 해석할 수도 있지 않을까?’라는 생각까지 가지게 되었답니다. 요즘 핫한 주제로 치자면 사실 ‘기계에게 인간의 마음을 가지라고 하는 것’에 관심을 가져야 할 텐데, 저는 역으로 기계가 인간에게 “조심해! 너는 지금 편견을 가지고 있어!”라고 가르쳐주기를 바라고 있네요*. 마치 워드나 한글 프로그램에서 내 맞춤법을 고쳐주듯이 말이지요.

*참고 | 유재연(2017), 보도 사진의 통사적 구조와 미디어 편향에 대한 고찰: 유럽과 중동 언론의 분쟁 보도에 대한 시각 데이터 분석을 중심으로, 서울대학교 공학석사 학위논문.

그러려면 철학도 잘 알아야하고, 인지과학도 알아야하고, 코드도 잘 짜야한답니다. 지금까진 이 모든 것을 점프하고 단순화하는 과정에 집중했는데, 이제는 빼도박도 못하게 처음부터 해야겠습니다.

12/21 tech issue

온갖 괴상한 코멘트가 170개나 제 모든 포스트에 추가됐네요. 물론 제가 승인하기 전까진 비주얼리 보이지 않는 것들입니다만. 갑자기 이런 스패머의 공격을 받으니 기분이 영. (ㅎㅎ)

요며칠 재미있는 이슈가 참 많았습니다. 최근엔 amazon rekognition 서비스를 활용하며 뭔가 신통방통한 것을 해 봐야겠다는 생각을 하게 됐고 말이죠. 페이스북의 저커버그는 자비스를 만들어냈다는 동영상을 띄우기도 했고요. 세상이 너무 빨리 변합니다.

이런 가운데 제가 연구하고, 또 쓴 논문도 이번에 처음으로 approved 됐습니다. 사실 논문이라기 보다는 논문 요약본이라고 해야 정확한데요. HCI Korea 2017 학회에 채택된 내용은 조만간 다시 올리도록 하겠습니다.

 

The Limits of Fact-Checking Facebook

요즘 가짜뉴스를 비롯한 온갖 ‘가짜 포스팅’과의 전쟁을 선포한 페이스북에 대해 MIT 테크리뷰측은 다소 부정적인 전망을 내놓았습니다.

사실 최근들어 페북 너무 불편하지 않나요. 평가하라는 것(번역부터 광고에 이르기까지)도 너무 많고, 확인하는 것(사람 태그, 장소 태깅)도 너무 많아요. 결국 집단적인 힘(collective power!)이 DB구축엔 최고 요인인 것 같습니다. (네가 쓰는 서비스가 더 편해지기 위함이야~라는 걸 무개로 말이죠.)

How Google’s Search business and humanity’s information is disappearing

이 글에서 주로 다루는 것은 바로 ‘Dark Matter(암흑물질)’라는 것인데요. 검색엔진에서 찾아낼 수 없는 정보들을 이야기합니다. 이 암흑물질들은 주로 검색엔진에 걸리지는 않고 single-page architectures나 social networks, 앱들에 묻혀있는 정보로 존재하는데요. 이를테면 페이스북에 올라온 포스팅을 구글에서 찾아내지 못하는 것이 여기 해당할 겁니다. 이게 뭐가 문제냐구요. 바로 이번 미대선에서도 볼 수 있듯 정보의 불균형화(bias)와 그에따른 거품(filter bubble) 현상을 일으킬 수 있다는 것이지요. 더구나 소셜서비스 vs. 검색엔진의 패권싸움으로 이어질 수 밖에 없고요. 사실 페이스북도 맘만 먹으면 sns상 검색엔진쯤은 만들기 쉬울겁니다. (제생각엔 해시태그가 일부 역할을 하고 있다고도 봅니다만, 페북은 해시태그가 제대로 작동하진 않죠) 구글에만 의지하면, 외려 정보 바이어스에 노출돼 제한적으로 정보를 다루게 될 지도 모른다는 맥락이 담겨있네요.

그런 가운데,

https://quickdraw.withgoogle.com/

구글은 사물을 판별하는 것을 넘어서서, 사물을 만들어내는 것까지 손을 뻗치고 있나봅니다. 사람으로 하여금 어느 한 단어에 대해 그림을 그려보도록 하고, 이걸 인공지능이 알아맞히도록 하는 웹 페이지를 내 놓았는데요, 전형적인 ‘게임형 데이터 수집’인 셈이지요. 제 어마무시한 작품들은 아직 잘 못알아보고 있지만, 언젠간 저처럼 그림을 그려낼 것이라고 생각합니다. #그래_니네가_다해먹어라

 

그리고 요즘 Github과 arXiv를 합친 GitXiv가 유명하다고 하네요.

GitXiv – Collaborative Open Computer Science

좀 지나간 얘긴가. 아무튼 한 번 애용해봐야 겠습니다. http://www.gitxiv.com

 

 

12/12 tech issue

우리나라는 탄핵 사태로 정신이 없던 사이 수 많은 연구들이 나왔습니다! 개인적으론 국내 상황을 글로벌리 통하게 할 만한 이야기를 쓰고 싶은데, 아직 고민입니다.

이를테면 며칠 전에 올라온 이런 기사가 제 타깃이 될 수 있지 않나.

https://news.vice.com/story/journalists-and-trump-voters-live-in-separate-online-bubbles-mit-analysis-shows

트럼프 지지자와 기자들은 각기 다른 섬에 살고 있다는 이야기죠. 예전에 이런 비슷한 연구가 있었는데요. 2011년 인디애나대 연구진이 낸 논문 Political Polarization on Twitter 이 대표적입니다. 같은 얘기 하는 사람들끼리만 뭉친다는 내용의 조지아텍 연구진(2010) Dynamic Debates: An Analysis of Group Polarization Over Time on Twitter 연구도 있고요.

이번 트럼프 연구는 MIT 미디어랩 http://www.electome.org/ 프로젝트의 일환으로 진행됐습니다. 이렇게 끌고 나가는 프로젝트가 있다는 것이 새삼 부러워집니다. (…)

 

 

Flickering LED lights could treat Alzheimer’s disease

알츠하이머 환자들에게 LED라이트를 활용해 치료를 한다는 내용인데요. 의학적인 부분이 많아 백 퍼센트 이해를 하진 못했습니다만, 저도 전에 비슷한 연구를 한 적이 있습니다. 약자에 대한 연구는 의미는 엄청난데, 장벽이 너무 높지요. 고민이 많은 부분입니다. 최근엔 지체장애인이 숟가락을 편히 들 수 있도록 하는 발명품도 나왔는데요. http://www.boredpanda.com/self-leveling-spoon-liftware-level/   저도 좋은 일에 동참하고 싶네요. ㅎㅎ

 

The Honest Company’s not terrible but not very good 2016

좋은 일은 돈이 안 된다는 말이 있긴 하지만요…

 

AI Begins to Understand the 3-D World

그렇다고 합니다…… 하, 너무 빠르게 발전해요!

 

11/30 tech issue

우려했던 일이 벌어질 기미가 보입니다. 사실 정부는 우리 개개인의 많은 데이터를 쥐고 있지요. 잘 활용하지 못해서 그렇지, 세밀하게 들여다보겠다고 결심하면 뭐든 안 털릴 수가 없을 겁니다.

중국에서 빅 브라더로서 빅 데이터를 활용하기 시작했다는 MIT 테크리뷰 기사부터 보겠습니다.

China Turns Big Data into Big Brother

중국 정부가 시민의 소셜-파이낸셜 행태에 대한 디지털 레코드를 생성해내는 시스템을 테스트하고 있다고 합니다. 소위 말하는 ‘소셜 크레딧 스코어’라는 것인데, 사실 이게 어느 한 개인으로 좁혀 들어가면 어느 한 개인의 여행과 교육에서부터 대출과 보험에 이르기까지 샅샅이 모니터링이 가능한 장치인 셈이지요. 알리바바의 마윈 회장은 범죄자에 한정해서 데이터 분석을 해야만 한다고 언급하기도 했다는데요. 빅브라더가 거버넌스에까지 결국 이르게 되는 것인가, 싶기도 합니다. 이 와중에 미국 의회는 해킹 파워를 높이는 데 주력해야 한다는 분위기라고 하네요. Congress Is About to Expand Government Hacking Powers

 

Social Media Is Killing Discourse Because It’s Too Much Like TV

소셜미디어가 오히려 담론을 사라지게 하고 있다는 소식입니다. 무슨 말이느냐하면, 갈수록 텍스트 대신 비디오로 대체되는 분위기를 이야기 하고 있는 것이지요. 사실 서두에 나온 말인즉슨 “트럼프 시대에는 더 많은 텍스트와 더 적은 비디오가 필요하다”는 이야기가 나왔습니다만.

 

그리고,

The end of the Apple dynasty?

정말 애플왕조는 이제 끝나는 걸까요? 저도 궁금합니다. 맥북을 사느냐마느냐의 기로에 서 있는데 말이죠.

11/22 tech issue

요새 현안 관련 글을 한참 쓰느라 정작 제 홈엔 뜸했습니다. 시절이 하수상하니 궁금한 것도 늘고 풀어야 할 숙제도 쌓이네요. 어제 오늘 쓴 글은 다음과 같습니다.

그날, 7시간
‘이것이 팩트’라는 청와대 홈페이지를 뜯어보았다

더 재밌는 분석들 해보려 노력 중입니다. 납득이 안 되는 여러 사안들, 하나씩 짚어볼 예정입니다.

이런 가운데, 기술부문에선 자꾸만 굉장한 이야기가 터져나오고 있더군요. 우리 너무 뒤쳐지는 것 아닐까 싶기도 하지만, 괜찮아요. 우린 지금 민주주의를 다시 세우는 과정에 있으니까요. (그렇게 다독입시다)

AI Has Beaten Humans at Lip-reading

옥스포드대 컴퓨터공학과에서 개발한 ‘LipNet’이라는 겁니다. GRID 데이터셋을 토대로 앞을 보고 있는 클립에 대해서, 사람이 3초간 읽는 문장을 영상만 보고 알아맞힙니다! 일단 speech recognition에 활용된 뉴럴 네트워크를 썼고요, 어떤 말이 이야기될지에 대한 정보를 학습시켰다고 합니다. 아주 정확하게 또박또박 알아맞히진 않더라도 전체적인 그림을 본다는 것이죠, 그래서 문맥상 나올 문장을 검출해 내는 겁니다. 진짜 중요한 건, 사람의 목소리로 전달되는 소리에 비해 입모양의 움직임은 더 적다는 것입니다. 일단 이 시스템은 93.4%의 정확성을 보였고, 인간은 같은 입모양을 보고 겨우 52.3$를 알아맞히는 데 불과했다고 합니다…

그런데 이 옥스포드의 다른 팀은 구글 딥마인드와 함께 GRID데이터 셋이 아닌 BBC텔레비전 클립을 가지고 훨씬 더 다양한 언어와 조도, 얼굴 위치까지 적용가능한 태스크를 진행하고 있다는데요. 현재까진 46.8%의 적중률을 보이고 있는데, 인간은 기껏해야 12.4%를 알아맞힌 바 있는 태스크라고 합니다. 이런 기술이라면, 시끄러운 장소에서 스카이프로 영상통화를 해도 문제가 없을 거라는 분석도 함께 나왔습니다. 아, 진짜 좋은 기술이네요. 허를 찔린 듯한 기분이 듭니다.

Bizly lets you book on-demand meeting spaces in luxury hotels

대박 좋네요. (설명이 필요 없음…) 20명이 들어갈 수 있는 회의실을 만다린 오리엔탈 호텔에 1시간 150불로 빌린다라… 호텔이 원하는 니치를 꽤 잘 파고든 느낌입니다.

Ola, Uber’s rival in India, launches an in-car entertainment platform for passengers

이거 어디서 많이 본 것 같지 않나요? 우리나라도 몇몇 택시엔 오래전부터 탑승석에 작은 LCD화면이 달려있었더랬습니다. 택시 안내동영상이나 뭐 각종 오락거리가 나오곤 했죠. 요즘도 있는 지는 잘 모르겠는데, 뭐든 타이밍이 아닌가 이런 생각이 듭니다. 올라는 지금(그것도 인도에서) 나왔기 때문에 이슈가 되는 것 아닌지!

 

아, 그리고

Most students can’t tell the difference between sponsored content and real news

이런 건 내가 진작에 빨리 써서 올렸어야 하는 내용 아닌가! 늦었군, 늦었어! ㅠ