자격증/빅데이터분석기사

[빅분기] 실기 시험까지 D-27,pandas(데이터프레임 데이터 변환하기)

mabb 2021. 11. 7. 22:45
반응형

 안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다.
빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다.

 

#데이터프레임에서 원하는 열만 필터링 하기
변수명=데이터세트이름[['열이름','열이름','열이름','열이름']]

#데이터세트를 다른 변수에 백업하기
변수명=데이터세트이름.copy()

 

#열 이름 바꾸기
데이터세트이름.rename(columns={'기존열이름':'변경할열이름'},inplace=True)

inplace=True랑 inplace=False의 결과가 같아서 차이를 모르겠음..
최초에 실행했을 때 뭔가 살벌한 에러가 떴으나 다시 지웠다가 쓰니 에러가 없어졌음.
컴퓨터는 알다가도 모르겠음.

 

 

# 기존의 열을 이용하여 새로운 열을 만들 수 있음!

데이터세트이름['새로운열이름']=데이터세트이름[원래변수끼리의 연산]
이건 엑셀에서 기존의 열들을 이용해서 새로운 정보를 만들 때 썼던 것과 같은 작업인듯함.
실행건과 성공건을 가지고 성공률을 만들듯.

#열 삭제는 del
del 데이터세트['열이름']

#특정 데이터를 추출하는 법.

조건을 만족하는 데이터 세트를 새롭게 만든다.
특정 열에 원하는 조건을 &(AND) , | (OR) 와 비교 연산자를 이용하여 새로운 데이터 세트를 구성할 수 있음.

 

 

#데이터 세트의 기존 값을 변경하는 방법

1) replace를 이용
2) 함수를 이용 

 

#데이터셋[변수명].value_count()    # 해당 변수의 값을 카운팅해줌.

#replace를 이용하여 데이터셋의 값을 변경하기

 

#함수를 정의하여 데이터의 값을 변경하는 방법.

함수를 정의하는 법?

def 함수명( 입력값):

반응형