Skip to content

mfakca/pdf2text

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

pdf2text

Klasör içerisindeki tüm PDF'leri metne dönüştürür.

1. Kurulum:

Yüklenmesi gerekenler:

Yüklenmesi gereken Python kütüphaneleri:

  • PIL
  • pytesseract
  • pdf2image

2. Kullanım:

pdf2text(pdf_file_path = 'pdf', image_path = 'images', output_text_path = 'outputs', dpi = 500)

pdf_file_path: PDF'lerin bulunduğu klasörün yolu.

image_path: Metne dönüştürmeden önce her bir sayfayı görsel olarak kaydeder. Bu görsellerin kaydedileceği klasörün yolu.

output_text_path: Görseller üzerindeki metinleri txt formatında kaydedileceği klasörün yolu.

dpi: Görüntünün kalitesini belirleyen parametre.


3. Referans:

About

PDF'leri metne dönüştürür

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published