Anomaly detection

데이터 분석에서 이상치 탐지 (이상치 탐지) 는 대부분의 데이터와 크게 달라 의심을 불러 일으키는 희귀 항목, 이벤트 또는 관찰을 식별하는 것입니다. 일반적으로 비정상적인 항목은 은행 사기, 구조적 결함, 의료 문제 또는 텍스트 오류와 같은 일종의 문제로 변환됩니다. 이상 치는 이상치, 참신함, 노이즈, 편차 및 예외라고도합니다.

Anomaly Detection vs Semantic Segmentation

두 기법은 목적과 접근 방식이 근본적으로 다르다.

Anomaly Detection (이상 탐지): "정상이 아닌 것"을 찾는 문제이다. 핵심은 정상 데이터만으로(또는 극소수의 비정상 데이터로) 학습한 뒤, 학습된 정상 분포에서 벗어나는 샘플을 탐지하는 것이다.; 출력은 보통 정상/비정상 이진 판정이거나, 이상 점수(anomaly score)이다.; 픽셀 단위로 확장하면 이상 영역의 히트맵을 생성하기도 한다.

Semantic Segmentation (의미론적 분할): 이미지의 모든 픽셀에 미리 정의된 클래스 라벨을 할당하는 문제이다.; "이 픽셀은 도로, 저 픽셀은 자동차, 그 픽셀은 사람"처럼 각 픽셀이 무엇인지 분류한다.

주요 차이점
구분	Anomaly Detection	Semantic Segmentation
학습 데이터	정상 샘플 위주 (unsupervised / semi-supervised). 비정상 샘플이 거의 없어도 동작.	모든 클래스에 대해 픽셀 단위 레이블이 달린 대량의 지도학습 데이터 필요.
클래스 정의	"정상 vs 비정상"만 구분. 비정상의 구체적 유형을 사전 정의하지 않음. 미지의 결함도 탐지 가능.	학습 시 정의한 클래스만 분류 가능. 미지의 클래스는 처리 불가.
출력 형태	이미지 레벨 점수 또는 픽셀별 이상 점수 맵 (heatmap).	픽셀마다 클래스 ID가 부여된 분할 맵 (segmentation mask).
대표 모델	PatchCore, PaDiM, DRAEM, EfficientAD	U-Net, DeepLab, SegFormer, PTv3

용접 검사와 같은 산업 현장에서의 적용 전략은 다음과 같다:

결함 샘플이 극히 부족한 경우 — Anomaly Detection이 유리하다.
결함 유형별로 충분한 레이블 데이터가 확보된 경우 — Semantic Segmentation이 더 정밀한 결함 분류와 영역 특정이 가능하다.
하이브리드 파이프라인 — Anomaly Detection으로 1차 스크리닝 후 Semantic Segmentation으로 결함 유형을 세분화하는 조합도 자주 사용된다.

결함 탐지 (Defect Detection) vs 이상치 탐지 (Anomaly Detection)

결함 탐지 (Defect Detection): "무엇이 결함인지 이미 정의되어 있는" 상태에서 출발합니다.; 크랙, 기공, 스패터, 언더컷 같은 결함 유형이 사전에 분류되어 있고, 모델은 이 결함들을 식별하고 분류하는 것이 목표입니다.; 따라서 정상 샘플과 결함 샘플 모두를 학습 데이터로 사용하는 지도 학습(supervised learning) 이 일반적입니다.

이상치 탐지 (Anomaly Detection): 반대로 "정상이 무엇인지"만 학습한 뒤, 그 분포에서 벗어나는 모든 것을 이상으로 간주합니다.; 결함의 종류를 미리 알 필요가 없고, 정상 데이터만으로도 학습이 가능한 비지도/반지도 학습 기반입니다.

주요 차이점
구분	Defect Detection	Anomaly Detection
전제	결함 유형이 사전 정의됨	정상 분포만 정의됨
학습 데이터	정상 + 결함 (라벨 필요)	정상 데이터만으로 가능
출력	결함 유형·위치 분류	정상/비정상 이진 판정
미지 결함 대응	학습하지 않은 결함은 놓침	분포 밖이면 탐지 가능
대표 방법론	YOLO, Mask R-CNN, PTv3 등	AutoEncoder, PatchCore, GANomaly 등

Point cloud Datasets

자세한 내용은 Point cloud#산업용 3D Point Cloud 이상 탐지 데이터셋 항목 참조.

Documentations

https://arxiv.org/html/2512.23227v1: Anomaly Detection by Effectively Leveraging Synthetic Images

Favorite site

Wikipedia (en) Anomaly detection
Anomaly Detection 개요： (1) 이상치 탐지 분야에 대한 소개 및 주요 문제와 핵심 용어, 산업 현장 적용 사례 정리
Github - M-3LAB/awesome-industrial-anomaly-detection — 산업 이상 탐지 논문 및 데이터셋 종합 목록