안녕하세요. 오늘 포스팅은 시리즈에 관한 내용입니다.
시리즈란 무엇일까요? 시리즈는 판다스의 데이타 프레임을 이루고있는 데이터 형식이라고 볼 수있는데요,
그럼 간단하게 판다스란 무었인지 알아보고, 시리즈에 대해 포스팅 하겠습니다.

pandas¶

구조화된 데이터의 처리를 지원하는 파이썬 라이브러리.
파이썬으로 엑셀처럼 데이터를 다룰 수 있음.

시리즈(Series) : 인덱스와 value로 구성된 numpy배열의 확장 객체 데이타프레임(dataFrame) : 열과 행으로 구성된 엑셀 스프레드시트와 같은 구조, 행과 열을 이루며, 시리즈로 이루어져 있다.

#필요한 모듈 세팅
from pandas import Series

생성자 파라미터로 리스트, numpy배열을 전달함.
리스트는 인덱스가 개념적으로 존재하나, 시리즈는 인덱스가 명시적으로 존재한다.

#리스트 선언
listTest = [10,20,30,40,50]
listTest

[10, 20, 30, 40, 50]

#시리즈가공
SeriesTest = Series(listTest)
SeriesTest

0    10
1    20
2    30
3    40
4    50
dtype: int64

#인덱스를 활용하여 값 확인
print(SeriesTest[0])
print(SeriesTest[1])
print(SeriesTest[2])

10
20
30

#시리즈의 값 추출
a = SeriesTest.values
a

array([10, 20, 30, 40, 50])

#시리즈의 값을 리스트로 변환하기
b = list(a)
b

[10, 20, 30, 40, 50]

#시리즈에서 값을 추출하여 리스트로 만들기
list(SeriesTest.values)

[10, 20, 30, 40, 50]

#시리즈의 인덱스만 추출하기
i = SeriesTest.index
i

RangeIndex(start=0, stop=5, step=1)

#시리즈의 인덱스를 리스트로 변환하기
list(SeriesTest.index)

[0, 1, 2, 3, 4]

IndexTest1 = Series([300, 200])
IndexTest2 = Series([300, 200], index=['커피', '콜라'])
print(IndexTest1)
print(IndexTest2)

0    300
1    200
dtype: int64
커피    300
콜라    200
dtype: int64

#일반 크기 비교
test1 = SeriesTest[SeriesTest > 30]
test1

3    40
4    50
dtype: int64

# and
test2 = SeriesTest[SeriesTest<= 40][SeriesTest >=30]
test2

2    30
3    40
dtype: int64

#or
test3 = SeriesTest[(SeriesTest<=10) | (SeriesTest >=40)]
test3

0    10
3    40
4    50
dtype: int64

이 포스팅은 이젠아이티학원 주호쌤의 강의를 듣고 복습하며 작성하였습니다.

파이썬 3차원 배열 다루기 (0)	2020.08.02
Python Pandas DataFrame (0)	2020.07.19

donut