누구나 부업을 한다고 말할 정도로 부업의 홍수를 이루는 시대입니다. 수많은 부업 중에서 내게 맞는 부업을 찾는 것은 정말 어렵습니다.
특별한 재능이 있는 것이 아니고 경력도 많지 않은데 집에서 소소하게 부업을 하고 싶은 분들에게 꼭 추천하고 싶은 부업이 있습니다. 그것은 바로 [데이터라벨러]입니다. 오늘은 먼저 데이터라벨링이 왜 필요하고 데이터라벨러는 무슨 일을 하는지 포스팅해 보고 다음에는 이어서 데이터라벨러로 일하기 위해 필요한 인공지능학습데이터 전문가(AIED) 자격증에 대해 포스팅해 보겠습니다.
1. 4차 산업혁명과 디지털 시대
4차 산업혁명과 함께 '디지털시대'라는 말이 유행어처럼 나오고 있습니다. 우리는 궁금한 것이 있으면 언제든지 인터넷을 이용해서 정보를 찾아볼 수 있습니다. 인터넷은 수많은 문서와 콘텐츠들이 저장된 대형 디지털자료 저장소입니다.
20년 전만 해도 대부분의 서류가 종이로 되어 있었지만 현재 대부분의 종이서류가 디지털서류로 바뀌고 있습니다. 심지어 교과서도 디지털교과서가 나올 정도입니다. 디지털자료의 가장 큰 장점은 언제든지 원하는 자료를 쉽게 찾을 수 있다는 점입니다.
2. 인공지능(AI)의 발달
디지털시대에 빼놓을 수 없는 특징은 바로 '인공지능(AI)'의 발달로 인해 로봇이 등장했다는 것입니다. 인공지능(AI)이 발달하면서 사람이 직접 해야 하는 일을 로봇이 대신하는 것은 정말 놀라운 일입니다. 수많은 디지털 자료를 인공지능 로봇에게 입력하면 자료를 분석해서 다양한 결과를 도출할 수 있게 됩니다.
3. 인공지능이 알 수 있는 언어
인공지능은 어린아이와 같이 새로운 데이터를 입력받아서 스스로 학습할 수 있습니다. 하지만 컵을 보고 인공지능 로봇이 처음부터 '컵'이라고 인식할 수 없습니다. 컴퓨터가 로봇이 알아들을 수 있는 언어로 입력하는 과정이 필요합니다. 컵의 종류가 수없이 다양하기 때문에 한 가지 종류의 모양을 입력해서 '컵'이라고 하더라도 그 후에 다른 모양의 컵을 보면 인공지능은 바로 컵이라고 인식하지 못합니다. 결국 아주 많은 종류의 디지털 데이터를 인공지능에게 입력해야 로봇이 제대로 인식을 하고 명령을 수행할 수 있게 됩니다.
4. 디지털라벨링
인공지능(AI)이 스스로 학습할 수 있는 형태로 데이터를 가공해야 하는데 이렇게 사진을 인공지능이 인식할 수 있게 데이터를 입력하고 가공하는 것을 데이터 라벨링이라고 합니다.
하지만 모든 것을 인공지능에게 라벨링을 할 필요는 없습니다. 예를 들어 고양이 사진을 라벨링 해서 인공지능에게 '고양이'라고 입력을 해 주면 인공지능 스스로 학습을 통해서 비슷한 모양의 고양이 사진을 보고 '고양이'라고 인식하게 됩니다. 물론 고양이의 종류에 따라 다양한 데이터를 라벨링 해서 입력할수록 인공지능은 더 정밀한 작업을 수행할 수 있게 됩니다
5. 데이터 라벨러
디지털시대 또는 인공지능 시대에 새롭게 등장해서 앞으로 전망이 좋을 것으로 예상되는 직업이 바로 데이터라벨링을 하는 '데이터라벨러'입니다. 데이터라벨러에는 세 종류의 일이 있습니다.
1) 데이터 수집
먼저 데이터를 수집하는 일입니다. 인공지능에게 필요한 데이터를 라벨링 해서 입력하기 위해서는 자료가 있어야 합니다. 최근 다양한 기관에서 사진을 모집하는 광고를 하고 있습니다. 요청이 있는 음식, 동물, 사물 등의 사진을 찍어서 올리면 됩니다. 어떤 일인지 궁금해서 데이터 라벨링을 하는 업체에 가입한 후에 사진을 등록해 보았습니다.
특정 브랜드에서 출시하는 햄버거 사진을 찍어서 올리는 일이었습니다. 반드시 접시에 올려놓은 상태에서 45도 각도에서 찍어야 하고 방향을 돌려서 한 장 더 찍어서 총 두 장의 사진을 올려야 작업이 완료됩니다. 접시를 바꿔서 다섯 번까지 등록이 가능합니다. 이렇게 사진을 올리면 검수과정을 거쳐 확정이 되면 채택이 되고 포인트를 받게 됩니다.
2) 데이터라벨링
이제 이 사진을 인공지능이 알아들을 수 있도록 디지털데이터로 변환해야 하는데 데이터 라벨러의 두 번째 일이 바로 이 분야입니다. 사진을 라벨링 하는 작업은 전문적인 분야이기 때문에 일정 교육을 받아야 작업을 할 수 있습니다.
데이터라벨링을 하기 위해서는 데이터에 맞는 라벨링 도구를 사용해야 합니다. 인식에 따라서는 데이터라벨링이 단순 작업으로 보일 수도 있고 오랜 시간 작업하기에 지루하다고 느낄 수도 있으나 제시된 기준에 맞게 작업을 해야 하기 때문에 집중력과 섬세함이 필요합니다. 인공지능 학습을 위한 자료는 이미지, 영상, 소리, 문서 등 다양하고 그에 따라 작업 도구와 사용방법이 다르기 때문에 가이드에 따라 품질이 좋은 데이터라벨링을 하는 것이 아주 중요합니다.
3) 품질검증
데이터라벨러 세 번째 작업은 데이터라벨링이 끝난 작업에 대한 품질을 검증하는 일입니다. 라벨링 하는 작업보다 고도의 기술을 요구하기 때문에 이 작업 역시 교육을 이수하거나 자격증을 취득한 사람만 할 수 있습니다. 잘못된 학습 데이터는 인공지능이 인식할 수 없거나 오류로 인해 전혀 다른 결과를 도출하기 때문에 데이터라벨링 후 품질 검수는 필수입니다.
6. 데이터라벨러의 전망
2022년 12월 뉴스에 '한국진흥정보사회진흥원(NIA)'은 [인공지능(AI) 학습데이터 구축] 직무가 하나의 직업으로 공인됐다'라는 기사를 내보냈습니다. 진흥원에 따르면 인공지능 학습용 데이터 구축 직무는 국가직무능력표준(NCS)에서 하나의 직업으로 확정, 고시됐다고 전했습니다.
아직은 아르바이트로 일하는 경우가 많지만 정식 직업으로 인정되었기 대문에 전문대학이나 특성화고등학교에서 교육이 활발하게 진행될 것으로 보입니다. 인공지능의 활용범위가 넓어질수록 데이터라벨러는 인공지능 데이터 전문가로 활동의 범위가 넓어질 것으로 기대됩니다. 또한 뛰어난 인공지능을 만들기 위해서는 입력되는 데이터의 질과 양이 중요하기 때문에 데이터라벨러라는 직업이 더욱 전문화될 것으로 전망됩니다. 시간과 공간의 제약이 없이 노트북이나 핸드폰으로 온라인 작업이 가능하다는 점이 더욱 많은 사람들에게 인기직종으로 인정받을 수 있는 요소입니다.
※ 함께 읽으면 좋은 글
'부업' 카테고리의 다른 글
전자책 만들기 (0) | 2023.02.08 |
---|---|
디지털노마드, 파이프라인 만들기 (0) | 2023.01.31 |
댓글