1. 인공지능(AI), 그리고 AGI의 등장
인공지능은 말 그대로 "기계가 사람처럼 생각하고 행동하게 만드는 기술"입니다. 1955년에 처음 등장한 개념이니 역사가 꽤 깊죠?
- 현재의 AI (Narrow AI): 알파고(바둑), 챗봇(대화), 미드저니(그림)처럼 '딱 하나의 주어진 일'만 엄청나게 잘하는 AI입니다.
- AGI (범용 인공지능): 아이언맨의 '자비스'를 생각하면 쉽습니다. 하나만 잘하는 게 아니라 인간처럼 스스로 학습하고, 추론하고, 처음 보는 문제도 해결하는 '만능 AI'입니다. 아직 완벽히 구현되진 않았지만, 전 세계가 이걸 목표로 달려가고 있죠.
💡 AI가 갑자기 이렇게 똑똑해진 이유는? 과거에는 이론만 있었지 그걸 뒷받침할 기술이 부족했습니다. 하지만 지금은 스마트폰과 인터넷으로 엄청난 데이터(Big Data)가 쌓였고, 이 데이터를 빠르게 계산해 줄 GPU(컴퓨팅 파워)가 발전했습니다. 여기에 오픈소스 생태계와 글로벌 기업들의 막대한 자본이 투입되면서 폭발적으로 성장하게 된 것입니다.
2. AI > 머신러닝 > 딥러닝의 관계
이 세 가지는 자주 혼용되지만 분명한 포함 관계가 있습니다.

- 인공지능(AI): 가장 큰 개념입니다. (사람을 모방하는 모든 기술)
- 머신러닝(ML): 인공지능을 구현하는 '방법' 중 하나입니다. 과거에는 사람이 "이러면 저렇게 해"라고 일일이 규칙(if-else)을 짜줬다면, 머신러닝은 "기계한테 수많은 데이터와 정답을 던져주고, 기계가 스스로 규칙(패턴)을 찾게 만드는 것"입니다.
- 딥러닝(DL): 머신러닝 중에서 인간의 뇌 신경망을 모방한 '인공신경망'을 아주 깊게 쌓아 올린 기술입니다. 특히 사진, 음성, 텍스트 같은 비정형 데이터를 기가 막히게 잘 다루지만, 그만큼 어마어마한 양의 데이터가 필요합니다.
3. 전통적 프로그래밍 vs 머신러닝
이 부분이 스터디의 가장 핵심입니다!
- 전통적 프로그래밍: 사람이 '데이터'와 '규칙(공식)'을 컴퓨터에 넣으면, 컴퓨터가 계산해서 '정답'을 내뱉습니다.
- 머신러닝: 사람이 '데이터'와 '정답(Label)'을 컴퓨터에 넣으면, 컴퓨터가 학습(Fit)을 통해 둘 사이의 '규칙(모델/함수)'을 스스로 찾아내어 내뱉습니다.
📝 데이터의 뼈대 용어 정리
- Feature (특성, X): 컴퓨터에게 주는 힌트이자 입력값입니다. (예: 학생의 공부 시간, 모의고사 점수)
- Label (정답, Y): 컴퓨터가 맞춰야 하는 결과값입니다. (예: 수능 합격/불합격)
- Data Point: 이 데이터들의 한 줄 한 줄 단위(관측치)를 말합니다.
4. 머신러닝의 두 가지 학습법: 지도학습 vs 비지도학습
어떻게 공부시킬 것인가에 따라 크게 두 가지로 나뉩니다.

- 지도학습 (Supervised Learning): 친절한 과외 선생님처럼 '정답'을 알려주면서 학습시킵니다.
- 분류 (Classification): 카테고리를 고르는 문제입니다. (예: 이 사진이 개야? 고양이야? / 이 메일이 스팸이야? 아니야?)
- 회귀 (Regression): 연속된 숫자를 예측하는 문제입니다. (예: 내일 주식이 얼마일까? / 30평 아파트 가격이 얼마일까?)
- 비지도학습 (Unsupervised Learning): 정답 없이 '데이터'만 툭 던져주고 알아서 특징을 묶어보라고 합니다.
- 군집 (Clustering): 비슷한 것끼리 그룹을 짓습니다. (예: 쇼핑몰 고객들을 구매 패턴에 따라 3그룹으로 나눠봐!)
5. 머신러닝 개발 프로세스와 도구들 (CRISP-DM)
머신러닝은 무작정 코드부터 짜는 게 아닙니다. 목표 설정(비즈니스 이해) ➔ 데이터 수집/이해 ➔ 데이터 전처리(가장 중요하고 오래 걸림!) ➔ 모델링(학습) ➔ 평가 ➔ 실제 적용 이라는 체계적인 과정을 거칩니다.
🛠️ 주로 쓰는 파이썬 도구 (라이브러리)
- Scikit-learn (사이킷런): 머신러닝의 정석이자 교과서입니다. 딥러닝을 제외한 거의 모든 머신러닝 알고리즘을 아주 쉽게 사용할 수 있게 해줍니다.
- TensorFlow & PyTorch: 딥러닝을 할 때 쓰는 강력한 양대산맥 도구입니다.
자, 여기까지가 올려주신 내용의 핵심 요약이었습니다. 이해되셨다면 이제 방금 공부한 내용을 바탕으로 실력을 점검해 볼 시간입니다! 편하게 답변해 보세요.
📝 1:1 스터디 확인 퀴즈
Q1. (O/X 퀴즈) 머신러닝은 개발자가 직접 데이터의 규칙(알고리즘)을 명시적으로 코딩해 주어야 정답을 출력할 수 있다. ( O / X ) X
Q2. (단답형) 머신러닝 학습 시, 컴퓨터에게 제공하는 '입력 변수(데이터의 속성)'와 모델이 궁극적으로 맞춰야 하는 '정답'을 각각 영어(또는 한국어 전문 용어)로 무엇이라고 부를까요?
- 입력 변수: ( ) Feature
- 정답: ( ) Label
Q3. (객관식) 다음 중 머신러닝의 학습 방법 연결이 틀린 것은 무엇일까요? 4
- 개와 고양이 사진을 주고 동물의 종류를 맞추게 하는 것 - 지도학습 (분류)
- 고객들의 구매 내역 데이터만 주고, 비슷한 성향의 고객들끼리 그룹으로 묶게 하는 것 - 비지도학습 (군집)
- 앞으로 3개월 뒤의 비트코인 가격(숫자)을 예측하게 하는 것 - 지도학습 (회귀)
- 텍스트, 음성, 영상 같은 비정형 데이터를 처리하기 위해 사이킷런(Scikit-learn)을 주로 활용하는 것 - 딥러닝
'두두 IT > 파이썬' 카테고리의 다른 글
| [머신런닝 5-1] 평가지표 (0) | 2026.05.14 |
|---|---|
| [머신런닝 4-1] 데이터 전처리 (0) | 2026.05.14 |
| [머신러닝 3-2] 데이터셋 분할 & 교차 검증 (0) | 2026.05.12 |
| [머신러닝 3-1] 데이터셋 분리와 모델 검증 (0) | 2026.05.12 |
| [머신런닝 2] 머신러닝 분석 - Iris_분석 (0) | 2026.05.12 |