본문 바로가기

Artificial Intelligence/Deep Learning7

Object Detection Object Detection은 물체를 검출 또는 인식하는 문제이다. Computer Vision에서 처리해야하는 Task는 Classification, Object Localization, Object Detection, Instance Detection으로 나눌 수 있다. 1) Classification - image가 주여졌을 때, 이미지가 어떤 카테고리에 속하는지 분류하는 문제 - 입력 image에 분류해야할 Object는 하나 - Classification에 주로 사용되는 CNN이 Object Detection이나 Segmentation의 backborn이 된다. 2) Classification + Localization - 어떤 Object의 위치를 찾아내고(Bounding Box), 그 O.. 2023. 3. 28.
FCN(Fully Convolutional Network) Segmentation Segmentation은 사전적으로 '분할'이라는 의미를 가진다. 운영체제에서 세그멘테이션, 알고리즘에서 세그먼트 트리 또한 분할과 관련된 개념인 것을 알 수 있다. Deep learning에서 세그멘테이션은 기존의 classification과는 다른 문제이다. Classification(분류)은 어떤 input 이 주어졌을 때, input이 어떤 클래스에 속하는지 구별하는 문제 였다면 Segmentation은 (특히, 이미지에서) 각 영역이 어떤 의미를 가지는지 분리하는 것이다. 즉, 이미지의 픽셀 수준에서 분할하고 Classification하는 문제로 생각할 수 있다. Segmenation 문제에서 input에 무엇이 있는지 예측하기 위해서는 이미지의 각 픽셀이 '어떤 의미'를.. 2023. 3. 28.
CAE (Convolutional Autoencoder) CAE (Convolutional Autoencoder) - CAE는 auto encoder를 이미지 학습에 적용할 수 있도록 fully connected layer를 convolution layer로 교체해 autoencoder의 기본 구조를 확장 - Encoder에서는 Convolution 연산을 수행하고 Decoder에서는 Transposed convolution 연산 수행 1) Encoder network - convolution layer - convolutional layer에서의 연산은 아래 이미지처럼 처리된다. - convolutional layer에서 output의 길이는 \(output = \frac{input + 2 * padding - kernel}{stride} + 1\)로 정해진.. 2023. 3. 27.
Autoencoder 1. 오토인코더(Autoencoder) 어떤 지도 없이 잠재표현(latent representation) 또는 코딩(coding)이라 부르는 input data의 밀집 표현을 학습할 수 있는 인공 신경망 코딩은 input data 보다 훨씬 낮은 차원을 가지므로 차원 축소(dimenssion reduction), 시각화 등에 사용되고, 강력한 특성 추출기(Feature Exractor)처럼 동작하기 떄문에 심층 신경망의 비지도 사전 훈련에 사용. 또한, 일부 오토 인코더는 훈련 데이터와 매우 비슷한 새로운 데이터를 생성하는 생성 모델(generative model)로도 활용될 수 있다. 오토 인코더는 단순히 입력을 출력으로 복사하는 방법을 배우는데, latent space의 크기를 제한하거나 input에.. 2023. 3. 5.
Fourier Transform (3) 보호되어 있는 글 입니다. 2022. 1. 20.
Fourier Transform (2) 보호되어 있는 글 입니다. 2022. 1. 18.
Fourier Transform 보호되어 있는 글 입니다. 2022. 1. 17.