일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- json
- 파이썬
- 깃허브
- Cloud
- python
- prompt
- ELK스택
- AWS
- 데이터검증
- databricks
- 백준
- Autoloader
- sql
- 인프런
- openai
- subnet
- 엘라스틱서치
- spark
- ElasticSearch
- EC2
- 코딩테스트
- VPC
- 프로그래머스
- airflow
- DB
- 데이터브릭스
- Kafka
- Elk
- LLM
- associate
- Today
- Total
목록TIL (6)
데이터 히스토리북 (Data History Book)
실수를 표현하는 방식컴퓨터는 기본적으로 2진수를 사용하는 기계이다.정수(ex. 1,2,3) 를 표현하는데에는 무리없이 표현할 수 있지만 소수를 표현할 때에는 무한한 2진수로 표현이 된다.즉, 소수점 0.1을 2진수로 표현한다면 무한 소수로 표현이 된다는 말과 같다.FloatFloat은 부동 소수점을 사용하는 타입으로, 소수점의 위치가 데이터의 형태에 따라 언제든지 바뀔 수 있으며 실제로 소수점을 사용하다보면 float은 소수점 외, 많은 소수점을 가지고 있는 것을 볼 수 있을것이다.즉, float은 decimal과 달리, 이진수 기반의 연산을 지니고 있으며 십진수를 이진수로 변환시킬때 이진소수인 형태를 띄고 정확히 맞아 떨어지지 않는 값들에 대해선 무한소수가 되어 정확하게는 그 값에 근사값이 될 확률이 ..
이슈 발생ppt, pdf 문서 전처리 하던 와중에 ppt 슬라이드 전체를 img하여 전처리 하려고 했으나,pymupdf 라이브러리 내에서 get_pixamap의 기능은 ppt 슬라이드를 이미지화하는 것이 아닌, 뭔가 이미지를 찾아그 이미지를 추출해서 진행하는 코드같았다.슬라이드 자체를 이미지화해야 했기 때문에 코드 수정이 필요했다.https://pymupdf.readthedocs.io/en/latest/recipes-images.html Images - PyMuPDF 1.24.1 documentationPrevious Textpymupdf.readthedocs.io 배치성으로 파이프라인을 구축해야 하다보니, 로컬에서 하나하나 작업할 수 없었고, ppt를 슬라이드화 하려면 pdf로 만들어야했다.구글링해보니..
맥 터미널을 사용하다보면 컴퓨터의 이름과 바탕화면 폴더이름이 너무 길어 명령어를 칠 때 2줄 3줄로 넘어가는것을 확인할 수 있다. 화자는 ls 만 쳐도 1줄이 끝나는데, 터미널 컴퓨터 이름을 삭제하고 원하는 유저명으로 변경해보려고 한다.컴퓨터 이름 삭제vi ~/.zshrc vi로 zshrc file을 연다prompt_context() { if [[ "$USER" != "$DEFAULT_USER" || -n "$SSH_CLIENT" ]]; then prompt_segment black default "%(!.%{%F{yellow}%}.)$USER" fi }i를 눌러 insert하고 위의 코드를 맨 아래에 붙여넣는다. esc를 누르고, :wq(저장하고) 를 해서 파일을 나온뒤 터미널을 다시..