머신러닝

활용 가능한 알고리즘 및 모델 리서치

shinetheworld 2025. 1. 11. 13:16

딥러닝 기반 알고리즘

Convolutional Neural Network (CNN)

이미지 분류의 기본이 되어 컴퓨터 비전 문제에 널리 사용되는 딥러닝 모델

이미지의 공간적 관계를 유지하며 특징을 추출하는 합성곱 레이어를 기반으로 작동

 

장점

- 이미지의 공간적 관계와 패턴을 자동으로 학습해 피처 엔지니어링이 거의 필요 없음

- 다양한 CNN 구조로 다양한 이미지 분류 문제에 맞는 선택 가능

 

단점

- 훈련에 수천 개 이상의 이미지가 필요하며, 작은 데이터셋에서는 과적합 위험

- 복잡한 CNN 구조는 높은 계산 비용과 GPU 리소스 필요

- 필터 크기, 레이어 수 등 하이퍼 파라미터 튜닝의 복잡성은 존재

 

관련 모델

LeNet-5: 손글씨 인식 (MNIST)

AlexNet: GPU 2대를 이용해 빠른 연산이 가능해져 병렬적인 구조

VGGNet: 깊이 있는 계층 구조 사용

ResNet: 잔차 학습으로 깊은 네트워크 문제 해결

DenseNet: 모든 레이어가 이전 레이어와 연결

 

Transfer Learning

사전 학습된 네트워크를 재활용

 

장점

- 사전 학습된 모델을 재사용해 적은 데이터로도 좋은 성능을 냄

- 모델 학습 시간이 크게 단축

- 소규모 데이터셋에서도 기존 모델의 지식을 활용 가능

 

단점

- 문제와 도메인이 사전 학습된 모델과 다를 경우 성능이 제한적

- 사전 학습된 레이어의 일부만 수정하거나 고정하는 경우 커스터마이징이 제한적

 

대표 네트워크

Inception, MobileNet, EfficientNet, ResNet

 

Vision Transformer (ViT)

Transformer 구조를 이미지 분류에 적용

이미지를 패치(patch)로 나누고, 텍스트 처리에 사용되는 트랜스포머 구조를 이용하여 글로벌 문맥 관계를 학습

 

특징

패치 단위의 이미지 처리

 

장점

- 이미지 데이터를 처리할 때 전체 이미지의 모든 부분 간 상관관계를 학습하여 객체 간 관계를 학습하는 데 강력

- CNN처럼 필터 설계가 필요하지 않아 CNN보다 더 적은 inductive bias

 

단점

- 작은 데이터셋에서는 과적합 가능성이 높아 CNN보다 더 많은 데이터가 필요함

- 학습에 더 많은 데이터와 이에 따른 고성능 하드웨어가 필요함


기계 학습 알고리즘

Support Vector Machine (SVM)

이미지의 특징 벡터를 기반으로 이진 분류 혹은 다중 분류 수행

선형 혹은 비선형 경계를 통해 데이터를 분류하는 지도학습 알고리즘

선형, RBF, 다항식 커널을 사용 가능

 

장점

- 작은 데이터셋에서 높은 정확도를 제공함

- 이미지의 다차원 특징을 처리할 수 있어 고차원 공간에서도 효과적

 

단점

- 대규모 데이터셋에서는 학습과 예측 속도가 느림

- 문제에 맞지 않는 커널 선택 시 성능이 저하되어 커널 함수 선택이 중요하며, 과적합 가능성이 높음

 

Random Forest

앙상블 학습으로 의사결정 트리 기반

다수의 결정 트리를 사용하여 분류를 수행하는 앙상블 학습 기법

개별 트리의 결과를 종합하여 예측의 정확성을 높임

이미지에서 추출된 특징을 사용

 

장점

- 여러 결정 트리의 평균을 사용해 과적합 방지에 강하고 모델의 안정성 증가 (앙상블 기반)

- 특징 중요도를 쉽게 평가할 수 있어 해석이 용이

 

단점

- 높은 차원의 데이터(수천 개의 피처가 있는 이미지 등)에서는 성능이 제한적

- 데이터 양이 많을 때 많은 트리를 생성하고 시간이 오래 걸림

 

Gradient Boosting Machines (GBM, XGBoost, LightGBM, CatBoost)

결정 트리 기반

이전 모델의 오류를 줄이면서 새로운 트리를 추가해 성능 개선

 

장점

- 복잡한 데이터 구조에서 강력한 분류/회귀 성능을 보여줌

- 다양한 범주형 및 연속형 데이터 형식에 적용 가능

 

단점

- 파라미터 튜닝이 복잡하고, 잘못 튜닝할 시 과적합 가능성이 높음

- 최적의 성능을 위해 많은 하이퍼파라미터를 조정해야 함

k-Nearest Neighbors (KNN)

거리를 기준으로 가장 가까운 k개의 이웃을 참조해 분류를 수행하는 비매개변수 모델

 

장점

- 이해하기 쉽고 구현이 간단함

- 새로운 데이터가 들어오면 바로 분류가 가능해 사전 학습이 필요 없음

 

단점

- 거리 계산이 많아질수록 속도가 저하되어 대규모 데이터셋에서 비효율적

- 피처 수가 많아지면 성능이 급격히 저하되는 차원의 저주 문제에 취약


딥러닝 기반 최신 모델

Capsule Networks

CNN의 한계를 보완하는 신경망

객체의 위치와 방향 정보를 캡슐로 표현

 

장점

- CNN이 가지는 공간 불변성의 한계를 극복

- 객체의 위치와 방향 정보 보존해 객체의 계층적 관계와 공간적 구조를 잘 반영함

 

단점

- 아직 연구 단계이며 실용적 활용이 적음

- 상대적으로 새로운 접근법이기 때문에 구현과 학습이 복잡함

- 계산 비용이 높아 학습 속도가 느린 편

 

YOLO (You Only Look Once)

객체 감지 알고리즘.

분류 외에도 감지 및 위치 예측.

 

장점

- 실시간 객체 탐지 가능

- 전체 이미지에서 한 번의 패스로 다중 객체를 탐지

- 비교적 낮은 계산 비용으로 빠른 처리

 

단점

- 큰 객체에 비해 작은 객체 탐지 성능이 떨어짐

- 낮은 해상도의 이미지는 성능이 저하됨

 

NASNet 및 EfficientNet

Neural Architecture Search 기반으로 효율적 모델 제공.


강화 학습 기반

Deep Q-Networks (DQN)

강화 학습 알고리즘으로 주로 이미지 분류보다는 의사결정 및 제어 문제에 사용

강화 학습과 딥러닝을 결합해 게임 및 시뮬레이션 환경에서 행동을 학습

 

장점

- 강화학습을 심층 신경망과 결합하여 이미지 기반 의사결정 문제 해결

- 복잡한 환경에서 에이전트가 최적의 행동을 학습

- 비선형 관계를 학습할 수 있음

 

단점

- 높은 계산 비용

- 대규모 데이터오 학습 시간이 필요

- 안정적인 학습을 위해 경험 재생 메모리와 타깃 네트워크 등 복잡한 설정 요구


기타

Bag of Visual Words (BoVW)

이미지 특징을 텍스트 문서와 비슷한 방식으로 표현하는 전통적인 이미지 표현 기법

 

장점

- 간단하고 효율적, 이해하기 쉬운 방식

- 특정 물체 탐지, 이미지 분류 등에 효과적

- 작은 데이터셋에서 적절한 성능

 

단점

- 피처 디스크립터와 클러스터링 기반으로 표현력이 제한적

- 공간적 정보 손식 (이미지에서 피처 위치 정보를 사용하지 않음)

- SIFT, SURF와 같은 특징 추출 알고리즘에 따라 성능이 달라짐

 

Histogram of Oriented Gradients (HOG)

이미지의 경계선과 윤곽선을 분석하여 특징 벡터를 생성하는 전처리 기법

엣지 방향 히스토그램을 특징으로 사용

 

장점

- 객체 탐지에서 좋은 성능

- 계산이 상대적으로 효율적

- 공간적 정보 보존

 

단점

- 조명 변화에 민감

- 회전 및 크기 변화에 대한 불변성이 제한적

- CNN 등 현대적 기법에 비해 복잡한 이미지에서는 성능이 떨어짐

 


요약

알고리즘/모델 장점 단점
CNN 자동화된 특징 학습, 다양한 아키텍처 높은 계산 비용, 많은 데이터 필요
Transfer Learning 적은 데이터로도 높은 성능 도메인 의존성, 제한적 수정
ViT 글로벌 문맥 학습 과적합 위험, 높은 데이터 요구량
SVM 작은 데이터셋에서 효과적 대규모 데이터에서 느림
Random Forest 과적합 방지, 해석 용이 고차원 데이터에서 비효율적
Gradient Boosting 높은 성능, 다양한 데이터 지원 복잡한 튜닝, 과적합 가능
KNN 단순한 구현, 사전 학습 불필요 대규모 데이터에 비효율적, 차원의 저주
Capsule Networks 위치, 방향 정보 보존 복잡한 구현, 높은 계산 비용
YOLO 실시간 객체 탐지 작은 객체 탐지 성능 제한
DQN 복잡한 행동과 의사결정 문제에 사용 가능 계산 비용이 크고 설정이 복잡
BoVW 단순하고 효율적, 작은 데이터셋에 적합 공간 정보 손실, 피처 선택에 성능 의존
HOG 경계 기반 객체 탐지에 강력 조명 변화에 민감, 회전 및 크기 변화에 취약

 

딥러닝 사용 가능: CNN, ViT, Transfer Learning.

작은 데이터셋: SVM, Random Forest, Gradient Boosting.

시간 효율성 필요: MobileNet, EfficientNet.


추가) 작은 데이터셋 해결 방법

전이 학습 (Transfer Learning): 사전 학습된 모델을 재사용하여 성능을 개선.

데이터 증강 (Data Augmentation): 이미지 회전, 크기 조정, 색상 변화 등으로 데이터를 늘림.

간단한 모델 사용: CNN의 깊이를 줄이거나, SVM, Random Forest 등 기계 학습 모델 활용.