일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- subnet
- DB
- 프로그래머스
- Elk
- 엘라스틱서치
- ElasticSearch
- EC2
- 백준
- Autoloader
- json
- openai
- 코딩테스트
- 파이썬
- python
- Kafka
- 깃허브
- airflow
- 인프런
- 데이터검증
- 데이터브릭스
- Cloud
- spark
- ELK스택
- prompt
- databricks
- associate
- VPC
- AWS
- LLM
- sql
- Today
- Total
목록python (3)
데이터 히스토리북 (Data History Book)
이슈 발생ppt, pdf 문서 전처리 하던 와중에 ppt 슬라이드 전체를 img하여 전처리 하려고 했으나,pymupdf 라이브러리 내에서 get_pixamap의 기능은 ppt 슬라이드를 이미지화하는 것이 아닌, 뭔가 이미지를 찾아그 이미지를 추출해서 진행하는 코드같았다.슬라이드 자체를 이미지화해야 했기 때문에 코드 수정이 필요했다.https://pymupdf.readthedocs.io/en/latest/recipes-images.html Images - PyMuPDF 1.24.1 documentationPrevious Textpymupdf.readthedocs.io 배치성으로 파이프라인을 구축해야 하다보니, 로컬에서 하나하나 작업할 수 없었고, ppt를 슬라이드화 하려면 pdf로 만들어야했다.구글링해보니..
문제 출처두 개의 정 N면체와 정 M면체의 두 개의 주사위를 던져서나올 수 있는 눈의 합 중 가장 확률이 높은 숫자를 출력하는 프로그램을 작성하세요.정답이 여러 개일 경우 오름차순으로 출력합니다풀이 코드n, m = map(int, input().split())cnt = [0]*100for i in range(1, n+1): for j in range(1, m+1): cnt[i+j]+=1max = 0for a, b in enumerate(cnt): if b > max: max = bfor a, b in enumerate(cnt): if max == cnt[a]: print(a, end=' ')코드 설명cnt를 리스트로 만듬i와 j 주사위 조합으로 눈의 ..
Emoji Remove Python code에서 Emoji를 찾아 제거하는 방법을 작성한다. 정규표현식(Regular Expressions) re.compile은 패턴 객체를 반환하는 메서드 !pip install emoji import emoji import re emoji_pattern = re.compile("[" u"\U0001F600-\U0001F64F" # 이모지 아스키코드 u"\U0001F300-\U0001F5FF" # 기호 및 그림 문자 u"\U0001F680-\U0001F6FF" # 교통 및 지도 기호 u"\U0001F700-\U0001F77F" # 알파벳 표현을 다양한 스타일로 표현 u"\U0001F780-\U0001F7FF" # 도형과 모양 포함 u"\U0001F800-\U0001F8..