판다스란? (Series, DataFrame)

Notice

Recent Posts

Tags more

Archives

관리 메뉴

미식가의 개발 일기

BigData

대체불가 핫걸 2024. 7. 11. 19:48

- 데이터 조작과 분석을 위한 파이썬 라이브러리
- 표 형태의 데이터를 다루는데 매우 효과적
- 2가지 데이터 구조를 제공(데이터 프레임, 시리즈)

import pandas as pd

데이터 프레임의 한 열을 나타내는 자료구조

data = [10, 20, 30, 40, 50]
series = pd.Series(data)

print(series)
print(type(series))

0    10
1    20
2    30
3    40
4    50
dtype: int64
<class 'pandas.core.series.Series'>

import numpy as np

data = [10, 20, 30, 40, 50]
np_data = np.array(data)
print('배열의 타입:', type(np_data))

series = pd.Series(np_data)
print(series)

배열의 타입: <class 'numpy.ndarray'>
0    10
1    20
2    30
3    40
4    50
dtype: int32

data_dict = {
    'a': 10,
    'b': 20,
    'c': 30,
    'd': 40,
    'e': 50
}
series = pd.Series(data_dict)
series

a    10
b    20
c    30
d    40
e    50
dtype: int64

data = [1, 2, 3, 4]
index = ['a', 'b', 'c', 'd']

series = pd.Series(data, index=index, name='MySeries', dtype='float')
series

a    1
b    2
c    3
d    4
Name: MySeries, dtype: int32

여러 행과 열로 구성

columns = ['이름', '취미']
data = [['강민지', '춤'],
        ['강코비', '잠자기']]

df = pd.DataFrame(data, columns=columns)
df

data = {
    '이름': ['강민지', '강코비'],
    '취미': ['춤', '잠자기']
}
df = pd.DataFrame(data_dict)
df

num = pd.Series([1, 2, 3], name='values')

df = pd.DataFrame(s)
df

names = pd.Series(['강민지', '강코비'], name='name')
hobbies = pd.Series(['춤', '잠자기'], name='hobby')

df = pd.concat([names, hobbies], axis=1)
df

-> 같은 방법으로 리스트 안에 데이터 프레임을 넣으면 데이터 프레임과 시리즈도 병합 가능

'BigData' Related Articles