11/22 tech issue

요새 현안 관련 글을 한참 쓰느라 정작 제 홈엔 뜸했습니다. 시절이 하수상하니 궁금한 것도 늘고 풀어야 할 숙제도 쌓이네요. 어제 오늘 쓴 글은 다음과 같습니다.

그날, 7시간
‘이것이 팩트’라는 청와대 홈페이지를 뜯어보았다

더 재밌는 분석들 해보려 노력 중입니다. 납득이 안 되는 여러 사안들, 하나씩 짚어볼 예정입니다.

이런 가운데, 기술부문에선 자꾸만 굉장한 이야기가 터져나오고 있더군요. 우리 너무 뒤쳐지는 것 아닐까 싶기도 하지만, 괜찮아요. 우린 지금 민주주의를 다시 세우는 과정에 있으니까요. (그렇게 다독입시다)

AI Has Beaten Humans at Lip-reading

옥스포드대 컴퓨터공학과에서 개발한 ‘LipNet’이라는 겁니다. GRID 데이터셋을 토대로 앞을 보고 있는 클립에 대해서, 사람이 3초간 읽는 문장을 영상만 보고 알아맞힙니다! 일단 speech recognition에 활용된 뉴럴 네트워크를 썼고요, 어떤 말이 이야기될지에 대한 정보를 학습시켰다고 합니다. 아주 정확하게 또박또박 알아맞히진 않더라도 전체적인 그림을 본다는 것이죠, 그래서 문맥상 나올 문장을 검출해 내는 겁니다. 진짜 중요한 건, 사람의 목소리로 전달되는 소리에 비해 입모양의 움직임은 더 적다는 것입니다. 일단 이 시스템은 93.4%의 정확성을 보였고, 인간은 같은 입모양을 보고 겨우 52.3$를 알아맞히는 데 불과했다고 합니다…

그런데 이 옥스포드의 다른 팀은 구글 딥마인드와 함께 GRID데이터 셋이 아닌 BBC텔레비전 클립을 가지고 훨씬 더 다양한 언어와 조도, 얼굴 위치까지 적용가능한 태스크를 진행하고 있다는데요. 현재까진 46.8%의 적중률을 보이고 있는데, 인간은 기껏해야 12.4%를 알아맞힌 바 있는 태스크라고 합니다. 이런 기술이라면, 시끄러운 장소에서 스카이프로 영상통화를 해도 문제가 없을 거라는 분석도 함께 나왔습니다. 아, 진짜 좋은 기술이네요. 허를 찔린 듯한 기분이 듭니다.

Bizly lets you book on-demand meeting spaces in luxury hotels

대박 좋네요. (설명이 필요 없음…) 20명이 들어갈 수 있는 회의실을 만다린 오리엔탈 호텔에 1시간 150불로 빌린다라… 호텔이 원하는 니치를 꽤 잘 파고든 느낌입니다.

Ola, Uber’s rival in India, launches an in-car entertainment platform for passengers

이거 어디서 많이 본 것 같지 않나요? 우리나라도 몇몇 택시엔 오래전부터 탑승석에 작은 LCD화면이 달려있었더랬습니다. 택시 안내동영상이나 뭐 각종 오락거리가 나오곤 했죠. 요즘도 있는 지는 잘 모르겠는데, 뭐든 타이밍이 아닌가 이런 생각이 듭니다. 올라는 지금(그것도 인도에서) 나왔기 때문에 이슈가 되는 것 아닌지!

 

아, 그리고

Most students can’t tell the difference between sponsored content and real news

이런 건 내가 진작에 빨리 써서 올렸어야 하는 내용 아닌가! 늦었군, 늦었어! ㅠ

Leave a Reply

Your email address will not be published. Required fields are marked *