Programming/인공지능(AI) - 딥러닝, 머신러닝, OpenCV

딥러닝(deep learning)/ 모델 설계

esoog Polaris 2023. 6. 12. 11:11
반응형

# 딥러닝 구조

 

#. 입력층 (Input Layer):
   - 입력층은 딥러닝 모델의 첫 번째 계층입니다.
   - 입력층은 데이터를 모델로 주입하는 역할을 합니다.
   - 데이터는 입력층을 통해 모델 내로 전달되고, 후속 계층들에 의해 처리되어 예측이나 출력을 생성합니다.
   - 입력층의 뉴런 수는 입력 데이터의 특성 수와 동일하며, 주어진 문제에 따라 입력층의 특성 수가 달라질 수 있습니다.

 


#. 은닉층 (Hidden Layer):
   - 은닉층은 입력층과 출력층 사이에 위치한 중간 계층입니다.
   - 은닉층은 입력 데이터에서 특징을 추출하고 중요한 패턴을 학습하는 역할을 합니다.
   - 은닉층은 주로 fully connected 레이어로 구성되어 있으며, 각 뉴런은 이전 계층의 모든 뉴런과 연결됩니다.
   - 은닉층의 유닛 수와 은닉층의 개수는 모델의 복잡성과 표현력을 결정하는 중요한 하이퍼파라미터입니다.
   - 은닉층에서 주로 사용되는 활성화 함수로는 ReLU, sigmoid, tanh 등이 있습니다.

  • 뉴런 수가 많을수록 모델은 더 복잡한 패턴을 학습할 수 있지만, 계산 비용이 증가하고 과적합의 위험이 증가할 수 있습니다.
  • 은닉층의 개수는 모델의 깊이를 결정하는데, 깊은 네트워크는 보다 복잡한 특징을 학습할 수 있지만, 학습과정이 더 어려워질 수 있습니다.



#. 출력층 (Output Layer):
   - 출력층은 딥러닝 모델의 마지막 계층입니다.
   - 출력층은 모델의 최종 예측값이나 결과를 생성합니다.
   - 주어진 문제에 따라 출력층의 뉴런 수와 활성화 함수가 달라질 수 있습니다.
   - 회귀 문제에서는 일반적으로 선형 활성화 함수를 사용하고, 이진 분류 문제에서는 sigmoid 활성화 함수를, 다중 클래스 분류 문제에서는 softmax 활성화 함수를 사용합니다.

  • 이진 분류 문제에서는 하나의 뉴런을 사용하고, sigmoid 활성화 함수를 통해 0과 1 사이의 확률값을 출력합니다.
  • 다중 클래스 분류 문제에서는 클래스 수와 동일한 수의 뉴런을 사용하고, softmax 활성화 함수를 통해 각 클래스에 대한 확률값을 출력합니다.


이와 같이 입력층, 은닉층, 출력층은 딥러닝 모델의 구성을 정의하며, 각 계층은 입력 데이터를 처리하고 다음 계층으로 정보를 전달하여 모델의 학습과 예측을 수행합니다.

 

 

 

 

 

 

# 모델 예제(출처: 모두의 딥러닝)

 

728x90