반응형

자격증 30

[빅분기] 실기 시험까지 D-10, 분류/ 로지스틱회귀모델 / 작업형 2유형 예시문제

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 작업형 2유형 예시문제를 풀어보았다. 데캠 교재를 보고 학습한 내용을 기반으로 코드를 작성하여 보았다. 아직 외워지지 않은 부분도 있고, 특히 iqr로 이상값을 처리하는 것이 감이 오질 않는다.. 내일은 해당 데이터셋을 가지고 구매주기를 예측하는 회귀문제를 선형회귀모델을 가지고 진행해보아야겠다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 5..

[빅분기] 실기 시험까지 D-11, 어렵다 어려워

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 시험이 11일 남았음. 이제 화요일 아침이니까 정말 얼마 남지 않았음. 6시 기상, 12시 취침하여 아침 2시간, 저녁 4시간 공부 시간을 확보하자. 화, 수, 목, 금 , 토 , 일, 월, 화 , 수, 목, 금 1. 작업형 1 준비 : 인터넷으로 예제문제 찾아 연습하기 2. 작업형 2 준비 :기본 코드 달달 외우기 -> 다른 알고리즘으로 응용해보기 3. 필답형: 용어 - 개념 필답 대비 정리하여 달달 외우기 , 빅분기실기대비 app의 문제를 틈틈이 보고 교재 정리하기 기초적인 문법들. 보고 생각해보기 np.abs(arr) np.sqrt(arr) np.square(arr)..

[빅분기] 실기 시험까지 D-18, 전략을 잘 세우자.

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 키보드 잡고 늦은시간까지 씨름을 하였으나 내 자신이 답답함. 기초가 없으니 전략적으로 공부해야하는데 어떤식으로 해야할지 잘 감이 오지 않음. 빅분기 실기는 단답형 / 1유형 / 2유형으로 출제가 됨. 단답형 10문제 30점 1유형 30점 2유형 40점 단답형은 용어정리를 하고 달달외우는 수밖에 없을 것 같다. 1~2일 정도 소요 예상 1유형은 통계나 데이터 전처리 관련 기초작업등을 해낼 수 있어야 가능한 정답 출력형 문제가 나올 것으로 보인다. 정확하게 답을 출력해내야 점수를 획득할 수 있음 2유형은 데이터분석모델의 성능으로 채점을 받는다. 단답형 21점 목표 -> 틈틈이..

[빅분기] 실기 시험까지 D-20, 작업형 제2유형 예시문제 시도(1)

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 작업형 제2유형을 풀려면 어느정도 수준이 되어야 하는지 가늠해보기로함 빅데이터분석기사 작업형 제2유형 예시문제, 출처: 데이터자격검정 고객 3,500명에 대한 학습용 데이터(y_train.csv, X_train.csv)를 이용하여 1)성별예측 모형을 만든 후# 이를 평가용 데이터(X_test.csv)에 적용하여 얻은 2,482명 고객의 2)성별 예측값(남자일 확률)을# 다음과 같은 형식의 3)CSV 파일로 생성하시오.# (제출한 모델의 성능은 4)ROC-AUC 평가지표에 따라 채점) # custid,gender 3500,0.267 3501,0.578 3502,0.885 ․..

[빅분기] 실기 시험까지 D-22, 급 피가 말린다

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 어제는 퇴근 후 개인사정으로 공부를 하지 못함. 오늘은 회사 회식 월요일엔 약속. 다음주 금토일은 기차여행. 실제로 공부할 수 있는 시간은 2주정도 인 것 같음. 실기 시험 접수비 40,800원을 날릴 순 없으니 최선을 다해보자. 데이터분석의 큰 틀을 암기하고 숙달시킨 후 다른 머신러닝 알고리즘을 적용하여 응용할 수 있는 수준을 만들어야겠다. 그 과정에서 세부적인 것들을 공부하고~

[빅분기] 빅분기 실기 필답형 모으기

필답형은 교재의 내용과 색인(index)를 기반으로 정리하기 용어 / 뜻 (뜻 가리기) 뜻/ 용어 (용어 가리기) 로 복습하기 용이하게 하자 블로그에서 퍼옴 ---------------------------------------------------------------------------------------- [출처] 빅데이터분석기사 실기 단답형 정리 1 (21.06.09)|작성자 Yoon 01. 시계열 분석에서는 주어진 자료가 정상성을 만족해야한다. 비정상시계열을 정상시계열 자료로 바꾸기 위해, 평균이 일정하지 않은 경우 현시점에서 이전 시점의 자료를 빼는 방법을 무엇이라고 하는가? 답. 차분(Difference) 02. 기업의 합리적인 의사결정을 방해하는 요소로서 문제의 표현 방식에 따라 동일한..

[빅분기] 실기 시험까지 D-24, 데이터 정제 등

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 어렵다. 교재를 따라하는데 해도해도 계속 헷갈리고.. 데이터 자격검정에서 제공하는 예제문제도 어렵다. 예제 작업형1) mtcars 데이터셋(mtcars.csv)의 qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오. 예제 작업형2) 교재에서 공부한 내용을 토대로 작업형 1번 예제를 직접 해봄. #mtcars 데이터셋(mtcars.csv)의 qsec 컬럼을 최소최대 척도(Min-Max Scale)로 변환한 후 #0.5보다 큰 값을 가지는 레코드 수를 구하시오. #mtcars 불러오기 import pandas ..

[빅분기] 실기 시험까지 D-25, 넘파이↔ 판다스 변환

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. 월요일에는 퇴근 후 약속이 있어서 공부를 하지 못함. 하루 건너뛰고 보니 D-25라 조급함이 생김. 12일 전에 실기시험 접수해야함. 공부하기 좋은 수단을 알게됨. datamanim.com이라는 사이트와 '빅데이터시험대비' 라는 어플리케이션 #넘파이의 다차원배열 형태와 판다스의 데이터프레임 형태를 변환하는 이유 넘파이의 다차원배열 형태가 빠른 연산에 유리함. 판다스의 데이터프레임 형태가 보기 편함. -> 연산 시에 넘파이, 데이터 파악 등 가독성 목적으로 판다스 라고 이해해봄. #판다스->넘파이 //넘파이는 변수명(칼럼,열)이 없음.

[빅분기] 실기 시험까지 D-27,pandas(데이터프레임 데이터 변환하기)

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. #데이터프레임에서 원하는 열만 필터링 하기 변수명=데이터세트이름[['열이름','열이름','열이름','열이름']] #데이터세트를 다른 변수에 백업하기 변수명=데이터세트이름.copy() #열 이름 바꾸기 데이터세트이름.rename(columns={'기존열이름':'변경할열이름'},inplace=True) inplace=True랑 inplace=False의 결과가 같아서 차이를 모르겠음.. 최초에 실행했을 때 뭔가 살벌한 에러가 떴으나 다시 지웠다가 쓰니 에러가 없어졌음. 컴퓨터는 알다가도 모르겠음. # 기존의 열을 이용하여 새로운 열을 만들 수 있음! 데이터세트이름['새로운열이..

[빅분기] 실기 시험까지 D-27, pandas(Series,DataFrame,read,loc)

안녕하세요. 삶의질을 높이기 위해 노력하는 영차영차입니다. 빅데이터분석기사 실기 시험을 위한 본인의 메모 및 공부 목적 포스팅입니다. #pandas 판다스 : 자료 구조 및 데이터 분석 처리 패키지. 판다스에는 자료유형이 2가지가 있음. Series와 DataFrame. 데이타프레임 유형이 흔히 쓰는 테이블(표) 형태의 자료유형이라고 함. #Series는 Value와 Index로 구성되는 자료유형. #DataFrame : 데이터프레임은 2차원 행렬구조의 자료유형. csv파일 불러오는 법 pd.read_csv('파일경로/파일명.csv') csv는 데이터베이스나 표 계산 소프트웨어 데이터를 쉼표(comma)로 구분하여 기록하는 파일의 형식. csv파일을 불러오는 기능은 판다스 기능에서 가능함. CSV [ c..

반응형