Pandas 2

데이터 구조 | 시리즈(Series), 데이터프레임(DataFrame) - 02

시리즈? 데이터프레임? 그게 뭐야? 뭐가 다르지? 뭐가 중요한가? 어떻게 다른지 알아야한다. 생각보다 데이터 구조가 달라 변환하고 활용해야하는 경우가 많다. 사실 다르다기보단 시리즈는 데이터프레임이라고 할 수 있지만, 데이터 프레임을 시리즈라고 하지 않는다. 따라서 시리즈는 데이터프레임 속에 포함된다고 볼 수 있다. 한 개의 시리즈는 데이터프레임이다. 여러 개의 시리즈도 당연히 데이터프레임이다. 하지만, 데이터프레임은 시리즈라고 하지 않는다. column을 분할하지 않는 이상. Series와 DataFrame의 설명부분을 보면 Series는 1D, DataFrame을 2D로 정의하고 있다. Series는 index, DataFrame을 index, columns로 데이터를 부를 수 있다고 한다. 어떤 것..

Pandas 2021.10.07

데이터 구조 | 시리즈(Series), 데이터프레임(DataFrame) - 01

판다스(Pandas)는 데이터를 조작 및 분석할 수 있도록 하는 라이브러리(library)이다. 흔히 엑셀(Excel)에서 볼 수 있는 형태로 생겼기 때문에 '굳이 판다스를 배워야할까? 필요할까?' 싶겠지만 필요하다. 엑셀에선 행이 최대 1,048,576개, 열이 XFD열까지가 최대이지만, 판다스에선 행의 개수나 열에 개수를 굳이 따지지 않아도 된다. 엑셀에서 불가능한 데이터량을 판다스로는 얼마든지 가능하다. 판다스 데이터 구조는 2가지이다. 1) 시리즈(Series)와 2) 데이터프레임(DataFrame) 이번 글에서는 시리즈(Series)를 공부하고, 다음 글에서 데이터프레임을 공부하자. 간단하게 말하자면, 시리즈(Series)는 한 줄짜리 김밥 같은 구조라면, 데이터프레임(DataFrame)은 2층..

Pandas 2021.10.06