MinMaxScaler & StandardScaler
·
데이터 엔지니어링/Python
StandardScaler는 각 열의 feature 값의 평균을 0으로 잡고, 표준편차를 1로 간주하여 정규화시키는 방법입니다# 'f5'컬럼을 표준화(Standardization (Z-score Normalization))from sklearn.preprocessing import StandardScalerscaler = StandardScaler()df['f5']=scaler.fit_transform(df[['f5']]) Scaler를 import한 뒤, 데이터셋을 fit_transform시켜주시면 됩니다.MinMaxScaler는 각 feature의 최솟값과 최댓값을 기준으로 0~1 구간 내에 균등하게 값을 배정하는 정규화 방법입니다.# 라이브러리 불러오기import pandas as pdfrom sk..
[Python] FacetGrid, map, function, etc
·
데이터 엔지니어링/Python
# 다양한 범주형 값을 가지는 데이터를 시각화하는데 좋은 방법=FacetGrid# 생존 여부(Survived)에 따른 연령(Age) 분포S = sns.FacetGrid(train, col='Survived')S.map(plt.hist,'Age',bins=15)# 다양한 범주형 값을 가지는 데이터를 시각화하는데 좋은 방법=FacetGridplt.show()S의 파생변수를 생성한 뒤 Seaborn의 FacetGrid를 사용하여 시각화 진행Map 함수를 사용 # map() 함수는 두번째 인자로 넘어온 데이터가 담고 있는 모든 데이터에 변환 함수를 적용하여 다른 형태의 데이터를 반환# 성별(Sex) 변수를 숫자 범주형 변수로 바꿔줌Sex_mapping = {'male':1, 'female':2}for datas..
[SQL] 데이터 분석 기초 Where 절 : AND, OR, NOT, IN, LIKE, IS NULL, IS NOT NULL
·
DB/SQL
WHERE 절 특정 조건을 불러오고 싶을 때 쓰는 쿼리입니다 비교연산자 between A and B like - ➡️ 1개 문자 % ➡️ 0개 이상 문자 is null, is not null in and, or, not > and가 or 보다 우선순위가 더 높다 select = 사원번호, 급여, 직업을 출력해주세요. from = 사원테이블에서 where = 급여가 3000이여야 합니다. select ename, sal, job from emp where sal=3000; 두 값 범위를 이용해서 조회할때 between a and b : a,b 모두 포함 ( 문자나 날짜에만 사용 ) select ename, sal from emp where sal between 1000 and 3000; LIKE 연산자 =..
Oracle 설치 및 테스트 계정
·
알쓸신잡/Common
노션에만 정리하지 않고 블로그에도 올려놓는 것이 모두에게 도움이 될 것 같아 공유합니다.SQL의 강습은 모두 끝났으니 조금씩 내용 정리하면서 복습하겠습니다 :) 1. SQL 다운로드 방법 SQL Oracle Downloadoracle 18c enterprise edition / sql developer windown 64-bit jdk 8 included 2개 다운로드https://www.oracle.com/database/technologies/xe18c-downloads.html > oracle 18c enterprise editionhttps://www.oracle.com/tools/downloads/sqldev-downloads.html > sql developer windown 64-bit jd..