[TIL] PPT to PDF Convert Python code
·
TIL
이슈 발생ppt, pdf 문서 전처리 하던 와중에 ppt 슬라이드 전체를 img하여 전처리 하려고 했으나,pymupdf 라이브러리 내에서 get_pixamap의 기능은 ppt 슬라이드를 이미지화하는 것이 아닌, 뭔가 이미지를 찾아그 이미지를 추출해서 진행하는 코드같았다.슬라이드 자체를 이미지화해야 했기 때문에 코드 수정이 필요했다.https://pymupdf.readthedocs.io/en/latest/recipes-images.html Images - PyMuPDF 1.24.1 documentationPrevious Textpymupdf.readthedocs.io 배치성으로 파이프라인을 구축해야 하다보니, 로컬에서 하나하나 작업할 수 없었고, ppt를 슬라이드화 하려면 pdf로 만들어야했다.구글링해보니..