메거진

인테리어 공사 AI를 활용한 자동견적시스템 구축 (연재-데이터 수집 및 라벨 1/6)

지엘티코리아 2023. 7. 18. 11:08

 

 
각종 인테리어 공사, 하자, 누수, 파손, 화재 등의 사진정보를 수집( 수천 ~ 수백만) 필요하다. 이렇게 수집된 사진에 라벨링 작업을 수행한다.

라벨링 작업은 건물의 종류와 상세 정보를 포함하는 계층적인 라벨링은 특정 유형의 보수 작업이나 비용과 연관된 패턴을 학습하는데 필요하다.

예를 들어, 아파트와 일반주택의 인테리어 보수 비용이나 필요한 자재가 다를 수 있으며, 건물의 크기, 층, 방 수 등에 따라 보수 작업의 복잡성이나 비용이 달라질 수 있다. 또한, 특정 지역의 노동 비용이 다른 지역과 다를 수 있으므로 지역 주소 정보도 중요하다.

이러한 상세 정보는 AI 시스템이 더욱 정확한 견적을 산출하는 데 도움을 준다. 그러나 이러한 추가 정보를 수집하고 라벨링하는 것은 더 많은 시간과 노력을 요구된다. 따라서 이러한 추가적인 노력이 모델의 성능 향상을 위해 필요한 것인지, 또는 그만큼의 가치가 있는 것인지 평가하는 것이 중요하다. 이는 비즈니스 요구사항, 시스템의 목표, 가용한 리소스 등을 고려하여 결정해야 한다.

 

데이터 라벨링은 시간이 많이 소요되는 작업일 수 있으므로, 이를 쉽게 만들어주는 여러 도구와 프로그램이 있다. 아래는 이미지 라벨링 도구 중 일부이다:

1.Labelbox: Labelbox는 온라인에서 사용할 수 있는 이미지 라벨링 플랫폼으로, 객체 감지, 이미지 분할 등 다양한 라벨링 태스크를 지원한다. 팀이 함께 작업할 수 있도록 설계되어 있어, 여러 사용자가 동시에 라벨링 작업을 수행할 수 있다.

2.VGG Image Annotator (VIA): VIA는 Visual Geometry Group에서 개발한 오픈소스 이미지 라벨링 도구이다. 웹 브라우저에서 직접 실행할 수 있으며, 객체 감지와 세분화 작업을 위한 라벨링 기능을 제공한다.

3.LabelImg: LabelImg는 Qt 및 Python으로 작성된 그래픽 이미지 주석화 도구이다. 객체 탐지 모델을 위한 라벨링 작업을 지원하며, Pascal VOC와 YOLO 형식의 라벨을 생성할 수 있다.

4.COCO Annotator: COCO Annotator는 COCO 데이터셋 형식으로 이미지를 주석 달기 위한 웹 기반 도구이다. 객체 감지, 세분화, 키포인트 주석 기능을 지원한다.

위의 도구들은 대부분 수동 라벨링 작업을 위한 것이다.

자동 라벨링은 보통 이미 훈련된 모델을 사용하여 수행되며, 이는 일부 작업을 자동화하거나 초기 라벨링을 가속화하는 데 도움이 될 수 있다. 예를 들어, 객체 탐지 작업의 경우, 사전 훈련된 객체 탐지 모델을 사용하여 이미지에 있는 객체를 탐지하고 이를 라벨링할 수 있다. 그러나 이 방법도 완벽하지 않으므로, 생성된 라벨을 검토하고 수정하는 단계가 필요하다.

또한, 반지도학습(semi-supervised learning) 또는 자기지도학습(self-supervised learning)과 같은 방법을 사용하여 라벨링 작업을 자동화하는 연구도 진행되고 있다. 이러한 방법들은 라벨이 없는 데이터를 활용하여 모델의 성능을 향상시키는 데 도움이 될 수 있다.

 

객체 탐지(object detection) 작업의 경우 각 객체에 대해 바운딩 박스(bounding box)의 좌표와 해당 객체의 클래스 라벨이 제공된다. 이 정보는 주로 JSON 형태나 XML 형태로 저장되며, Pascal VOC나 COCO 등의 표준 포맷을 따르는 경우가 많다.

아래는 Pascal VOC 포맷의 라벨링 예시