[Python] Faker 가짜 데이터 생성 (롤 X)
·
데이터 엔지니어링/Python
가짜 데이터 개발 테스트를 하다보면, 캐글에서 데이터를 가져와야하거나 공공데이터에서 데이터를 가져와서 쓸때가 많다. 그러나 로그인부터 적절한 데이터를 찾기까지 귀찮을 때가 있어서 대충 엑셀에다 pk 주고 데이터를 아무렇게나 생성할 때가 많았다. 이제부터 그렇게 하지 말고, 좀 더 쉽고 빠르게 가짜 데이터를 얻는 방법인 Faker라이브러리를 알아보자 라이브러리 설치 !pip install Faker 라이브러리 임포트 from pyspark.sql import functions as F from faker import Faker from collections import OrderedDict import uuid fake = Faker() 화자는 Pyspark 환경에서 사용했음 라이브러리 사용 fake_fi..