PDF belgesinden metin nasıl çıkartılır

Başka bir uygulamada kullanmak için bir PDF dosyasından metni ayıklamak çok sinir bozucu olabilir.

Acrobat Reader kullanarak metni ayıkla

1. Adım

Dosyayı Acrobat Reader'da açın. Windows'da "Dosya -> Metin belgesini dışa aktar" ı seçin, belgeyi adlandırın ve kaydedin.

2. Adım

Bir Mac veya Linux işletim sisteminde, "Görünüm" menüsüne erişerek ve "Sürekli" veya "Sürekli Yönelme" yi seçerek metni kopyalayın. (İlk seçenek, metni bir sütunda verirken, ikinci seçenek metni yan yana olarak biçimlendirir). "Düzenle -> Tümünü seç" e ve ardından "Düzenle -> Kopyala" ye gidin.

3. adım

Yalnızca metnin bir kısmını çıkarmak istiyorsanız Seçim aracını kullanın. "Metin seç" aracını tıklayın ve ardından istediğiniz bilgiyi seçin. Birden çok sütun biçimine sahip bir belgede, ilk "Sütun Seçimi" aracını kullanmanız gerekecektir. "Düzenle -> Kopyala" ya gidin

PDF'yi HTML'ye Dönüştür

1. Adım

Gmail'i bir kısayol olarak kullanın. PDF dosyasını bir e-postaya ekleyin ve Gmail hesabınıza gönderin. E-postayı açtığınızda ekin yanında bir dizi seçenek göreceksiniz. "HTML olarak görüntüle" seçeneğini seçin ve açılan pencereyi ayrı bir pencerede kaydedin. Grafikleri göremeyeceğiniz halde, HTML dosyası metin belgesinin biçimini korur.

2. Adım

Dosyaları komut satırında ayıklayın ve dönüştürün. Linux kullanıcıları .pdf dosyasını .txt dosyasına değiştirecek bir temel dönüştürme komutunu kullanabilirler: "Pdftotext filename.pdf". Dosyanın adını PDF dosyasının adıyla değiştirdiğinizden emin olun.

3. adım

Bir PDF metin dönüştürme programı indirin. PDFBox ve Kolay PDF to Text Converter gibi bir dizi açık kaynak programı ve ücretsiz program mevcuttur. Bu programların çoğu PDF dosyalarını HTML'ye dönüştürebilir.