딥러닝 개요 (Deep Learning Overview)
1. 인공지능, 머신러닝, 딥러닝의 관계 (포함 관계)
이 세 가지 개념은 완전히 다른 것이 아니라, '크기'와 '구현 방법'에 따른 포함 관계입니다.
- 인공지능 (AI) > 머신러닝 (ML) > 딥러닝 (DL)
"인공지능이 **'자동차'**라는 큰 카테고리라면, 머신러닝은 엔진으로 굴러가는 **'내연기관 자동차'**이고, 딥러닝은 가장 최신 기술인 **'전기차'**라고 보시면 됩니다. 모두 자동차(AI)지만, 굴러가는 핵심 원리가 다릅니다."
- 인공지능 (AI): 사람이 직접 짠 '규칙(if-else)'이든 스스로 학습하든 상관없이, 기계가 사람처럼 똑똑한 행동을 하면 모두 AI입니다.
- 머신러닝 (ML): 과거에는 사람이 일일이 규칙을 짰다면, 이제는 '데이터'와 '정답'을 주고 기계가 스스로 규칙(패턴)을 찾아내게 만드는 방식입니다. (예: 랜덤 포레스트, SVM)
- 딥러닝 (DL): 머신러닝의 한 종류인데, 그 규칙을 찾는 방식을 '인간의 뇌 신경망(뉴런)'을 모방한 인공신경망으로 구현한 것입니다.
2. 강 인공지능 (Strong AI) vs 약 인공지능 (Weak AI)
현재 우리가 배우고 쓰는 모든 AI는 약 인공지능입니다.
- 약 인공지능 (Weak AI): 특정 '하나의 문제'만 잘 푸는 AI입니다.
- 알파고는 바둑의 신이지만, 1+1 계산이나 운전은 절대 못 합니다. 챗GPT도 언어 처리만 할 뿐, 물리적인 로봇 청소기 조종은 못 합니다.
- 강 인공지능 (Strong AI / AGI): 사람처럼 자아를 가지고, 모든 상황을 종합적으로 판단할 수 있는 범용적인 AI입니다. (터미네이터의 스카이넷, 아이언맨의 자비스) 아직 인류가 도달하지 못한 영역입니다.
3. 머신러닝과 딥러닝의 극명한 차이점: "특성 추출(Feature Extraction)"
이 부분이 가장 중요한 핵심입니다. 두 기술의 한계를 가르는 결정적인 차이입니다.
"고양이 사진을 주고 고양이를 찾으라고 해볼게요.
머신러닝은 사람이 먼저 '고양이는 뾰족한 귀와 긴 수염이 있어'라고 특징(힌트)을 수학적으로 잘라내서 AI에게 떠먹여 줘야 합니다. 사람이 특징을 잘못 잡으면 AI는 바보가 됩니다.
딥러닝은 그냥 고양이 사진 원본(픽셀) 수백만 장을 통째로 던져줍니다. 그러면 신경망이 스스로 '아, 이 삼각형(귀) 패턴이 고양이의 핵심이구나!' 하고 특징마저 스스로 찾아냅니다(End-to-End)."
- 머신러닝 (ML):
- 사람이 개입하여 데이터의 중요한 특징(Feature)을 추출해 줘야 합니다.
- 정형 데이터(엑셀의 표, DB 숫자 데이터) 처리에 압도적으로 빠르고 성능이 좋습니다.
- 딥러닝 (DL):
- 특징 추출부터 분류까지 사람이 개입하지 않고 한 번에 스스로 학습합니다. (End-to-End Learning)
- 비정형 데이터(이미지, 영상, 자연어 텍스트, 음성) 처리에 있어서 기존의 모든 한계를 부수고 압도적인 성능을 냅니다.
- 단점: 데이터가 엄청나게 많이 필요하고, 연산량(GPU)이 엄청나게 소모되며, 왜 그런 결과가 나왔는지 사람이 해석하기 어렵습니다 (Black Box).
4. 인공신경망 (Artificial Neural Network, ANN) 구조
딥러닝의 뼈대입니다. 인간 뇌의 신경세포(Neuron)가 신호를 주고받는 구조를 수학적으로 모방했습니다.
4.1. 퍼셉트론 (Perceptron) - 하나의 신경세포
- 딥러닝을 구성하는 가장 작은 기본 단위입니다.
- 구조: 입력값($X$) ➡️ 가중치($W$) 곱하기 ➡️ 편향($b$) 더하기 ➡️ 활성 함수(Activation Function) 통과 ➡️ 최종 출력($y$).
- 비유: 선형 회귀(y = Wx + b) 공식을 통과시킨 후, 그 결과를 스위치(활성 함수)에 넣어 다음 신경세포로 신호를 넘길지 말지 결정하는 단일 세포입니다.
4.2. 심층 신경망 (Deep Neural Network, DNN)
단일 퍼셉트론(세포) 하나로는 복잡한 문제를 풀 수 없습니다. 그래서 이 퍼셉트론들을 수백, 수천 개씩 가로세로로 겹겹이 쌓아 올립니다.
"얼굴을 인식하는 딥러닝 층(Layer)을 상상해 보세요.
맨 앞의 입력층은 그냥 사진의 명암(픽셀)만 봅니다.
첫 번째 은닉층은 그 명암을 모아 '선'과 '테두리'를 찾습니다.
두 번째 은닉층은 선들을 모아 '눈, 코, 입' 모양을 찾습니다.
층이 깊어질수록(Deep) 점점 더 복잡하고 추상적인 개념을 스스로 조립해 나갑니다. 그래서 'Deep' Learning입니다."
- 입력층 (Input Layer): 외부 데이터를 받아들이는 입구. (계산은 안 함)
- 은닉층 (Hidden Layer): 실제 계산과 패턴 추출이 일어나는 층. 이 은닉층이 2개 이상 겹겹이 쌓여 있으면 '딥러닝'이라고 부릅니다.
- 출력층 (Output Layer): 최종 결과(예: 개 90%, 고양이 10%)를 뱉어내는 출구.
5. 학습 과정 (딥러닝이 똑똑해지는 원리)
딥러닝은 크게 2가지 방향(순전파 ➡️ 역전파)으로 흐르면서 학습합니다.
- 순전파 (Forward Propagation) - "일단 찍어보기"
- 입력 데이터가 왼쪽(입력층)에서 오른쪽(출력층)으로 층을 거치며 계산됩니다.
- 초기에는 가중치($W$)가 랜덤이므로 엉뚱한 답을 찍습니다.
- 오차 계산: 정답과 찍은 답을 비교해 얼마나 틀렸는지(Loss) 점수를 냅니다.
- 역전파 (Backpropagation) - "오답 노트 고치기"
- 발생한 오차(Loss)를 다시 오른쪽(출력층)에서 왼쪽(입력층)으로 거꾸로 돌려보냅니다.
- "이 오차를 줄이려면 각 층의 가중치($W$)를 얼마나 바꿔야 하지?"를 미분(기울기)을 통해 계산하고 숫자를 업데이트합니다. (최적화 / 경사하강법)
- 반복: 1번과 2번 과정을 수천, 수만 번 반복하면 가중치들이 완벽하게 맞춰져 오차가 0에 가까워집니다.
💡 핵심 요약 포인트
- "딥러닝은 마법이 아니다. 미친 듯이 많은 '선형 회귀(y=Wx+b)' 식을 거미줄처럼 엮어놓고, 오답 노트를 수만 번 고쳐가며 최적의 가중치(W) 숫자를 찾는 수학적 노가다의 결정체다."
- "엑셀 표 분석은 앙상블(XGBoost, 랜덤 포레스트)을 쓰고, 이미지/텍스트 분석은 딥러닝을 쓴다."
- "머신러닝은 사람이 특징을 밥상에 차려줘야 하지만, 딥러닝은 원본만 던져주면 지가 알아서 특징을 찾아 먹는다."
'두두 IT > 딥러닝' 카테고리의 다른 글
| 04. 첫번째 딥러닝-MLP 구현 (0) | 2026.05.26 |
|---|---|
| 03. 선형회귀 pytorch_linear_regression (0) | 2026.05.26 |
| 02. tensor 다루기 (0) | 2026.05.26 |