IBM 연구소, 100만 명 얼굴 정보 담은 '데이터셋' 공개... 얼굴 인식 시스템 연구의 새로운 첫 걸음 될까
IBM 연구소, 100만 명 얼굴 정보 담은 '데이터셋' 공개... 얼굴 인식 시스템 연구의 새로운 첫 걸음 될까
  • 이지원
  • 승인 2019.03.07 09:15
  • 댓글 0
이 기사를 공유합니다

IBM 기초연구소는 최근 얼굴인식 기술의 공정성과 정확성 향상을 목표로 DIF 데이터셋을 공개했다. (사진=게티이미지뱅크)
IBM 기초연구소는 최근 얼굴인식 기술의 공정성과 정확성 향상을 목표로 DiF 데이터셋을 공개했다. (사진=게티이미지뱅크)

IBM 기초연구소는 최근 얼굴인식 기술의 공정성과 정확성 향상을 목표로 '얼굴의 다양성(Diversity in Faces: DiF)'이라는 '데이터셋'을 공개했다.

카메라와 알고리즘을 이용해 얼굴을 인식한 후 개인을 식별하는 기술의 실용화는 최근 급속히 확대되고 있으며, 스마트폰의 잠금 해제에 'Face ID' 등의 얼굴 인식 시스템이 이용되거나 경찰의 수사 및 경비에 얼굴 인식 시스템이 도입되며 실제로 성과를 올리고 있기도 하다.

하지만 얼굴 인식 시스템의 정밀도는 아직 완벽함과 거리가 멀다는 것이 현실이다. 예를 들어 영국 경찰이 도입한 얼굴 인식 시스템의 경우에는 오판정률이 약 90%가 넘는 사례도 존재한다.

또한 지난 2017년 6월, 영국 카디프에 열린 WEFA 챔피언스리그 결승전에서 '뉴 사우스 웨일즈' 경찰은 감시 카메라를 이용해 자동 얼굴인식 시스템으로 범죄 용의자를 탐지해 내겠다는 계획을 세웠다. 대규모 스포츠 이벤트는 테러의 표적이 될 가능성이 높다는 것이 그 이유였다. 하지만 결승전 당일 자동 얼굴인식 시스템에 의해 범죄 용의자로 지목된 사람은 모두 2470명에 달했으며, 이 중 무려 2297명이 잘못된 판정을 받은 것으로 드러났다.

위 사례에서 오판정률이 높았던 이유는 인터폴에서 제공한 용의자 사진의 화질이 떨어졌기 때문일 것으로 추측된다.

화질의 문제뿐만 아니라 얼굴인식 시스템의 정확도는 여러 요인에 따라 영향을 받는다. 최근에는 아프리카계 미국인의 얼굴인식 정확도가 백인보다 5~10% 떨어진다는 연구 결과가 발표되며 오인식 비율이 높아지는 원인 중 '얼굴인식 시스템의 편향성'도 존재한다는 지적이 제기됐다.

카메라와 알고리즘을 이용해 얼굴을 인식하는 기술은 최근 급속히 확대되고 있으며, 일상 속 스마트폰의 잠금 해제에서도 쉽게 찾을 수 있다. (사진=게티이미지뱅크)
카메라와 알고리즘을 이용해 얼굴을 인식하는 기술은 최근 급속히 확대되고 있으며, 일상 속 스마트폰의 잠금 해제에서도 쉽게 찾을 수 있다. (사진=게티이미지뱅크)

하지만 IBM 기초연구소의 연구팀은 이를 부정하며 "실제 얼굴인식 시스템의 성능에 영향을 미치는 것은 '내재적인 얼굴의 다양성'이지 인식의 정확도가 개인이나 집단에 따라 달라질 수는 없다"는 입장을 내비쳤다. 이와 더불어 DiF 데이터셋의 공개 목적이 얼굴인식 기술의 '공정성' 향상이라 칭한 것도 곧 이러한 이유인 것이다.

특히 IBM이 이번에 공개한 DiF에는 다양한 성별과 인종의 얼굴 이미지와 그에 대한 주석이 포함돼 있으며, 약 100만 명 분의 데이터가 포함돼 있다고 밝혔다.

IBM 연구소는 "만일 인종이나 성별에 따라 얼굴인식의 정확도에 차이가 발생한다면 이는 알고리즘을 학습시킬 데이터셋이 특정 성별이나 인종에 편중돼 있기 때문"이며 "데이터셋의 표본을 늘리고 인종과 성별의 샘플링의 균형을 맞추는 것으로 해결 가능하다고 판단했다"고 밝혔다. 또한 "DiF 데이터셋의 각각 이미지에는 머리 모양과 얼굴의 대칭, 코의 길이, 이마의 높이 등 얼굴의 객관적 척도와 함께 연령이나 성별 등의 주석 데이터가 라벨링돼 있다"는 말도 함께 전했다.

더불어 IBM 연구소 연구팀에 따르면 주석 데이터에는 얼굴 부위 47곳 이상의 크기와 특징이 정리돼 있으며, 이것이 얼굴인식 시스템의 공정성과 정확성을 향상시키고 알고리즘의 성능을 더욱 강력하게 만드는 학습교사의 역할을 하고 있다고 밝혔다. 또한 보다 공정하고 정확한 얼굴인식 시스템을 개발하기 위한 연구 노력을 계속하고 있지만, 단지 자신들의 연구만으로는 얼굴인식 시스템이 발전할 수 없다고 판단했다.

한편 IBM 연구소가 DiF를 공개한 것은 이를 통해 다른 곳에서 진행되는 얼굴인식 시스템의 연구에도 기여하는 것이 중요한 과학적 의제를 진전시키는 일이라고 판단했기 때문이며, 이번에 공개된 DiF가 얼굴 인식 시스템 연구의 새로운 첫 걸음이 될 수 있을지 앞으로의 귀추가 주목된다.

 

(데일리팝=이지원 기자)
(자료=정보통신기획평가원의 'IBM 100만 명 얼굴 정보 담은 데이터셋 공개, 인식의 공정성이 목표' 보고서를 바탕으로 재구성)