donut

Python pandas series

Module/Pandas

 

 

 

안녕하세요. 오늘 포스팅은 시리즈에 관한 내용입니다.
시리즈란 무엇일까요? 시리즈는 판다스의 데이타 프레임을 이루고있는 데이터 형식이라고 볼 수있는데요,
그럼 간단하게 판다스란 무었인지 알아보고, 시리즈에 대해 포스팅 하겠습니다.

 

pandas

구조화된 데이터의 처리를 지원하는 파이썬 라이브러리.
파이썬으로 엑셀처럼 데이터를 다룰 수 있음.

 

Pandas의 자료구조

시리즈(Series) : 인덱스와 value로 구성된 numpy배열의 확장 객체 데이타프레임(dataFrame) : 열과 행으로 구성된 엑셀 스프레드시트와 같은 구조, 행과 열을 이루며, 시리즈로 이루어져 있다.

In [25]:
#필요한 모듈 세팅
from pandas import Series
 

시리즈 데이터 생성

생성자 파라미터로 리스트, numpy배열을 전달함.
리스트는 인덱스가 개념적으로 존재하나, 시리즈는 인덱스가 명시적으로 존재한다.

In [26]:
#리스트 선언
listTest = [10,20,30,40,50]
listTest
Out[26]:
[10, 20, 30, 40, 50]
In [27]:
#시리즈가공
SeriesTest = Series(listTest)
SeriesTest
Out[27]:
0    10
1    20
2    30
3    40
4    50
dtype: int64
 

시리즈 데이터 다루기

In [28]:
#인덱스를 활용하여 값 확인
print(SeriesTest[0])
print(SeriesTest[1])
print(SeriesTest[2])
 
10
20
30
In [29]:
#시리즈의 값 추출
a = SeriesTest.values
a
Out[29]:
array([10, 20, 30, 40, 50])
In [30]:
#시리즈의 값을 리스트로 변환하기
b = list(a)
b
Out[30]:
[10, 20, 30, 40, 50]
In [31]:
#시리즈에서 값을 추출하여 리스트로 만들기
list(SeriesTest.values)
Out[31]:
[10, 20, 30, 40, 50]
In [32]:
#시리즈의 인덱스만 추출하기
i = SeriesTest.index
i
Out[32]:
RangeIndex(start=0, stop=5, step=1)
In [33]:
#시리즈의 인덱스를 리스트로 변환하기
list(SeriesTest.index)
Out[33]:
[0, 1, 2, 3, 4]
 

시리즈 인덱스 지정하기

In [34]:
IndexTest1 = Series([300, 200])
IndexTest2 = Series([300, 200], index=['커피', '콜라'])
print(IndexTest1)
print(IndexTest2)
 
0    300
1    200
dtype: int64
커피    300
콜라    200
dtype: int64
 

시리즈 조건을 주어 다루기

In [35]:
#일반 크기 비교
test1 = SeriesTest[SeriesTest > 30]
test1
Out[35]:
3    40
4    50
dtype: int64
In [36]:
# and
test2 = SeriesTest[SeriesTest<= 40][SeriesTest >=30]
test2
Out[36]:
2    30
3    40
dtype: int64
In [37]:
#or
test3 = SeriesTest[(SeriesTest<=10) | (SeriesTest >=40)]
test3
Out[37]:
0    10
3    40
4    50
dtype: int64
 

이 포스팅은 이젠아이티학원 주호쌤의 강의를 듣고 복습하며 작성하였습니다.

In [ ]:
 

'Module > Pandas' 카테고리의 다른 글

파이썬 3차원 배열 다루기  (0) 2020.08.02
Python Pandas DataFrame  (0) 2020.07.19