반응형

pandas 3

02, PANDAS를 이용한 EAD( 왜도 ,상관계수)

EDA(Exploratory Data Analysis) 탐색적 데이터 분석 데이터를 분석하고 결과를 도출하는 과정에서 있어서 지속적으로 데이터에 대한 탐색과 이해를 기본적으로 가져야 한다는 의미 데이터 종류 수치형 데이터 연속형 : 일정범위 안에서 어떠한 값도 취할수 있는 실수형 데이터 (ex. 온도 ,키, 풍속) 이산형 : 횟수 같은 정수형 데이터(ex 방개수, 가족수 등등) 범주형 데이터 가능한 범주 안에서 값만 취할수 있는 데이터 성별:남,여(영목형) 전공: 경영학,교육학,인문학등(영목형) 장르(명목형) 영화평점(순서형) 직급(순서형) 왜도 (Skewness) 데이터 분포들의 비대칭를 나타내는 통계량 분포가 오른쪽으로 치우쳐져 있고 왼쪽으로 긴 꼬리를 가진 경우 음수 분포가 왼쪽으로 치우쳐저 있고 ..

pandas 2022.08.29

01. PANDAS 기초

pandas란 파이썬에서 데이터를 쉽게 다룰수 있는 라이브러리 2차원형태의 데이터를 집계,전처리 등을 아주 쉽게 할수 있다. 정형데이터를 다루는 라이브러리 pandas의 데이터 구조 데이터 프레임 2차원구조로 되어있는 행렬 데이터 시리즈 1차운 주고로 되어있는 한 종류의 데이터 시리즈가 여러개 모이면 데이터 프레임이 된다. ** 실습 ** 일단 GOOGLE COLAB에 판다스 라이브러리를 불러온다 또한 판다스는 넌파이 기반으로 만들어져 있기 때문에 넌파이도 가져온다 . ** 데이터 프레임만들기 데이터프레임을 만드는 방법이다 . 한 데이터를 2차원형태의 데이터로 만들어 놓고 DataFrame 클래스를 선언하면 끝 ~! data인 변수를 집어 놓고 컬럼명을 따로 설정 하고 싶다고 하면 파라미터에 고정으로 넣..

pandas 2022.08.29
반응형