U-Net: Convolutional Networks for Biomedical Image Segmentation

논문 원본: https://arxiv.org/abs/1505.04597
논문 요약: U-Net은 Biomedical 분야에서 이미지 분할(Image Segmentation)을 목적으로 제안된 End-to-End 방식의 Fully-Convolutional Network 기반 모델이다. 네트워크 구성의 형태(‘U’)로 인해 U-Net이라고 한다.
발표 피피티:
Abstract
이 연구에서는 적은 수의 주석 데이터로도 효과적으로 학습할 수 있도록 데이터 증강을 적극 활용하는 U-Net 네트워크와 학습 전략을 제안함.
U-Net은 문맥을 포착하는 수축 경로(Contracting Path)와 정확한 위치 정보를 제공하는 확장 경로(Expanding Path)로 구성됨.
- ISBI 챌린지에서 신경 구조의 전자현미경 스택 분할 문제에서 기존 슬라이딩 윈도우 기반 네트워크보다 성능이 우수함을 입증함.
- 동일한 네트워크를 광학 현미경(위상차 및 DIC) 이미지에 적용하여 ISBI 2015 셀 추적 챌린지에서 큰 차이로 우승함.
- 512×512 크기 이미지의 분할을 1초 이내에 수행할 만큼 빠른 속도를 제공함.
Introduction
이 논문에서는 적은 수의 주석 데이터로도 학습할 수 있도록 설계된 U-Net 네트워크를 소개함. 기존 딥러닝 모델들은 많은 양의 주석 데이터가 필요했지만, 의료 영상 분석에서는 수천 개의 주석 데이터를 확보하는 것이 어렵기 때문에, 이를 해결할 수 있는 모델이 필요함.
💡 주석 데이터?
- 기존 CNN 기반 모델의 한계
- 전통적인 CNN은 이미지 분류에는 효과적이지만, 픽셀 단위 분할(Segmentation)에는 적합하지 않음.
- 기존 방법(Ciresan et al. 2012)은 슬라이딩 윈도우 방식을 사용했으나,
- 속도가 느리고(한 픽셀마다 네트워크를 적용해야 함)
- 지역적 문맥 정보(Context)가 부족한 문제가 있었음.
💡 슬라이딩 윈도우 방식?
->
- U-Net
- Fully Convolutional Network (FCN) 개념을 확장하여 Encoder-Decoder Architecture를 적용.
- Skip Connection을 추가하여 작은 객체를 더 정확하게 복원하고, 문맥 정보를 유지함.
- 의료 영상 분석에서 중요한 경계 정보를 보존할 수 있도록 설계됨.
Architecture
Training
Experiments
Conclusion
Reference
https://medium.com/@msmapark2/u-net-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-u-net-convolutional-networks-for-biomedical-image-segmentation-456d6901b28a
https://medium.com/@msmapark2/u-net-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-u-net-convolutional-networks-for-biomedical-image-segmentation-456d6901b28a
https://cord-ai.tistory.com/57
https://viso.ai/deep-learning/image-segmentation-using-deep-learning/