import pandas as pd # 판다스 도구를 불러옵니다.
df = pd.read_csv('data/movie.csv') # csv 파일을 읽어서 'df'라는 이름의 표로 저장합니다.
df.head() # 데이터가 잘 들어왔는지 위에서 5줄만 확인해 봅니다.
만약에 뒤에 5줄을 보고 싶다면 df.head()가 아니라 df.tail()로 입력한다.
() 안에 아무 숫자도 적지 않으면 Default 5줄이 나타난다.

이렇게 해서 28열이 출력되었다.
df['director_name']
문제에서는 director_name을 컬럼 값을 조회하라는 문제이다. df에 pd.read_csv의 내용이 들어가 있다.
그러면 df 안에 director_name 이라는 컬럼이 있을 것이다. 이것을 불러와서 보여주라는 뜻이다.
df['director_name'] 따움표 안에 조회할 열을 넣어주면 해당 열을 조회할 수 있다.
보통 변수에 넣어서 사용하지만 보여주기 문제이므로 변수에는 따로 넣지 않는다.
df[['actor_1_name', 'actor_2_name', 'actor_3_name']]
1번의 문제를 보고 [ ' ' ] 안에 넣었으나 KeyError이 발생했다.
왜 그랬을까? 바로 여러개를 조회할 때에는 대괄호를 2개 해줘야한다. 이것이 팬시 인덱싱!!
df.iloc[:, [1, 3, 4, 7]]
1, 3, 4, 7번 컬럼을 조회하라는 문제이다.
2번의 문제를 파악할 수 있다면 대괄호를 2개해주고 안에 컬럼 값을 넣어주면 되는 것이지 않을까? 물론 잘 된다.
그런데 문제는 컬럼이 100개, 1000개 라면 그것을 모두 기입하는 것이 가능할까? 위의 문제 몇 개도 작성하는 데 시간이 꽤 걸렸다.
그럴때 사용하는 것은 iloc이다.
iloc는 행과 열을 같이 조회하여 순서는 앞에는 행, 뒤에는 열을 조회한다. [행, 열]
df.iloc[행, 열]을 작성하게 된다.
답을 보면 행 자리에 : 콜론이 있다. 이 뜻은 행 모두를 가져와라 라는 뜻이다.
df.iloc[:, 1:6]
이것도 4번처럼 조회하면 아무런 문제 없이 잘 된다. 그런데 여기서 또 문제가 된다. 연속된 것인데 조금 더 쉽게 작성할 수 없을까?
바로 리스트에서 사용했던 슬라이싱이 떠올렸다.
iloc는 열을 조회하기 때문에 사용해야한다. 슬라이싱의 경우 6까지면 마지막이 나오지 않고 5까지만 나오기 떄문에 6으로 입력했다.
df.iloc[:, 1:6]으로 나온다.
만약에 df에 iloc를 입력하지 않으면 loc가 기본값이다.
💡 핵심 요약
- 파일 읽어오기: pd.read_csv()
- 이름으로 열 가져오기: df['이름'] 또는 df[['이름1', '이름2']]
- 순서(번호)로 열 가져오기: df.iloc[:, 번호]
'두두 IT > 파이썬 퀴즈' 카테고리의 다른 글
| [TODO] Pandas_DataFrame - 3 (0) | 2026.05.04 |
|---|---|
| [TODO] Pandas_DataFrame - 2 (0) | 2026.05.04 |
| [TODO 1] 변수와 데이터 타입 (0) | 2026.04.15 |
| [SKN Family AI 캠프] 파이썬 1차 퀴즈 (0) | 2026.04.14 |
| [PYTHON-QUIZZ] 구구단을 출력 (0) | 2026.04.13 |