반응형

빅분기실기 14

[빅분기] 실기 시험까지 D-24, 데이터 정제 등

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 어렵다. 교재를 따라하는데 해도해도 계속 헷갈리고.. 데이터 자격검정에서 제공하는 예제문제도 어렵다. 예제 작업형1) mtcars 데이터셋(mtcars.csv)의 qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오. 예제 작업형2) 교재에서 공부한 내용을 토대로 작업형 1번 예제를 직접 해봄. #mtcars 데이터셋(mtcars.csv)의 qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환한 후 #0.5보다 큰 값을 가지는 레코드 수를 구하시오. #mtcars 불러오기 import pandas ..

[빅분기] 실기 시험까지 D-25, dir(), help(), 데이터탐색

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 빅분기 시험에서는 help()를 사용할 수 있음. help(함수) 를 동작시키면 해당 함수에 대한 설명을 볼 수 있음. dir(패지키) 를 사용하면 패키지의 함수 목록에 대해 볼 수 있음. 시험에서 dir()를 쓸 수 있는지의 여부는 모르겠음. #데이터 살펴보기 데이타셋.head() # 0~4행까지 보여줌 데이타셋.info() #칼럼, non-null, dtype 확인 가능 데이타셋.shape() #행, 열 확인 가능 데이타셋['칼럼'].Value_counts() #칼럼에서 값의 개수를 확인 가능. 범주형 변수에서 값 별 개수 파악하기 용이함. #숫자형 데이터세트에서 데이..

카테고리 없음 2021.11.10

[빅분기] 실기 시험까지 D-27,pandas(데이터프레임 데이터 변환하기)

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. #데이터프레임에서 원하는 열만 필터링 하기 변수명=데이터세트이름[['열이름','열이름','열이름','열이름']] #데이터세트를 다른 변수에 백업하기 변수명=데이터세트이름.copy() #열 이름 바꾸기 데이터세트이름.rename(columns={'기존열이름':'변경할열이름'},inplace=True) inplace=True랑 inplace=False의 결과가 같아서 차이를 모르겠음.. 최초에 실행했을 때 뭔가 살벌한 에러가 떴으나 다시 지웠다가 쓰니 에러가 없어졌음. 컴퓨터는 알다가도 모르겠음. # 기존의 열을 이용하여 새로운 열을 만들 수 있음! 데이터세트이름['새로운열이..

[빅분기] 실기 시험까지 D-27, pandas(Series,DataFrame,read,loc)

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. #pandas 판다스 : 자료 구조 및 데이터 분석 처리 패키지. 판다스에는 자료유형이 2가지가 있음. Series와 DataFrame. 데이타프레임 유형이 흔히 쓰는 테이블(표) 형태의 자료유형이라고 함. #Series는 Value와 Index로 구성되는 자료유형. #DataFrame : 데이터프레임은 2차원 행렬구조의 자료유형. csv파일 불러오는 법 pd.read_csv('파일경로/파일명.csv') csv는 데이터베이스나 표 계산 소프트웨어 데이터를 쉼표(comma)로 구분하여 기록하는 파일의 형식. csv파일을 불러오는 기능은 판다스 기능에서 가능함. CSV [ c..

반응형