Skip to content

Anomaly detection

데이터 분석에서 이상치 탐지 (이상치 탐지) 는 대부분의 데이터와 크게 달라 의심을 불러 일으키는 희귀 항목, 이벤트 또는 관찰을 식별하는 것입니다. 일반적으로 비정상적인 항목은 은행 사기, 구조적 결함, 의료 문제 또는 텍스트 오류와 같은 일종의 문제로 변환됩니다. 이상 치는 이상치, 참신함, 노이즈, 편차 및 예외라고도합니다.

Categories

  • anomalib
  • VLMDiff (2025) - Vision-Language 모델과 Diffusion을 결합하여 멀티클래스 이상 탐지를 수행한다. 텍스트 프롬프트로 결함 유형을 지정하여 생성과 탐지를 동시에 처리할 수 있다.
  • IAD-R1 (ICCV 2025) - 강화학습(Reinforcement Learning) 기반의 일관적 추론으로 산업 이상 탐지 성능을 향상시킨다. 추론 과정에서의 일관성을 보장하여 false positive를 줄인다.
  • DADNet (2025) - 2단계 산업 Diffusion 이상 탐지 네트워크이다.
    • 1단계: 의미론적 가이드 이상 생성 모듈로 알려진 결함을 합성 → 이상 탐지의 사전 정보로 활용
    • 2단계: 복원된 이미지와 원본 이미지를 비교하는 판별 모델로 이상 영역 검출
    • Joint attention mechanism을 통한 feature aggregation으로 복원 모델 성능을 강화한다.
  • ZoomLDM (CVPR 2025) - 멀티스케일 Latent Diffusion Model로, Self-supervised Learning(SSL) 임베딩을 활용한 배율 인식 조건화 메커니즘을 도입했다.
    • 최대 4096×4096 픽셀의 전역 일관성 있는 이미지 합성 가능
    • 다중 배율(magnification) 간 cross-magnification latent space 활용
    • 디지털 병리학, 위성 이미지 등 기가픽셀 도메인에 적용 가능
    • 단일 배율에서도 기존 SOTA 인코더를 능가하는 representation learning 성능

Anomaly Detection vs Semantic Segmentation

두 기법은 목적과 접근 방식이 근본적으로 다르다.

Anomaly Detection (이상 탐지)
"정상이 아닌 것"을 찾는 문제이다. 핵심은 정상 데이터만으로(또는 극소수의 비정상 데이터로) 학습한 뒤, 학습된 정상 분포에서 벗어나는 샘플을 탐지하는 것이다.
출력은 보통 정상/비정상 이진 판정이거나, 이상 점수(anomaly score)이다.
픽셀 단위로 확장하면 이상 영역의 히트맵을 생성하기도 한다.
Semantic Segmentation (의미론적 분할)
이미지의 모든 픽셀에 미리 정의된 클래스 라벨을 할당하는 문제이다.
"이 픽셀은 도로, 저 픽셀은 자동차, 그 픽셀은 사람"처럼 각 픽셀이 무엇인지 분류한다.

주요 차이점

구분

Anomaly Detection

Semantic Segmentation

학습 데이터

정상 샘플 위주 (unsupervised / semi-supervised). 비정상 샘플이 거의 없어도 동작.

모든 클래스에 대해 픽셀 단위 레이블이 달린 대량의 지도학습 데이터 필요.

클래스 정의

"정상 vs 비정상"만 구분. 비정상의 구체적 유형을 사전 정의하지 않음. 미지의 결함도 탐지 가능.

학습 시 정의한 클래스만 분류 가능. 미지의 클래스는 처리 불가.

출력 형태

이미지 레벨 점수 또는 픽셀별 이상 점수 맵 (heatmap).

픽셀마다 클래스 ID가 부여된 분할 맵 (segmentation mask).

대표 모델

PatchCore, PaDiM, DRAEM, EfficientAD

U-Net, DeepLab, SegFormer, PTv3

용접 검사와 같은 산업 현장에서의 적용 전략은 다음과 같다:

결함 탐지 (Defect Detection) vs 이상치 탐지 (Anomaly Detection)

결함 탐지 (Defect Detection)
"무엇이 결함인지 이미 정의되어 있는" 상태에서 출발합니다.
크랙, 기공, 스패터, 언더컷 같은 결함 유형이 사전에 분류되어 있고, 모델은 이 결함들을 식별하고 분류하는 것이 목표입니다.
따라서 정상 샘플과 결함 샘플 모두를 학습 데이터로 사용하는 지도 학습(supervised learning) 이 일반적입니다.
이상치 탐지 (Anomaly Detection)
반대로 "정상이 무엇인지"만 학습한 뒤, 그 분포에서 벗어나는 모든 것을 이상으로 간주합니다.
결함의 종류를 미리 알 필요가 없고, 정상 데이터만으로도 학습이 가능한 비지도/반지도 학습 기반입니다.

주요 차이점

구분

Defect Detection

Anomaly Detection

전제

결함 유형이 사전 정의됨

정상 분포만 정의됨

학습 데이터

정상 + 결함 (라벨 필요)

정상 데이터만으로 가능

출력

결함 유형·위치 분류

정상/비정상 이진 판정

미지 결함 대응

학습하지 않은 결함은 놓침

분포 밖이면 탐지 가능

대표 방법론

YOLO, Mask R-CNN, PTv3

AutoEncoder, PatchCore, GANomaly

Point cloud Datasets

자세한 내용은 Point cloud#산업용 3D Point Cloud 이상 탐지 데이터셋 항목 참조.

Documentations

https://arxiv.org/html/2512.23227v1
Anomaly Detection by Effectively Leveraging Synthetic Images

See also

Favorite site