Bazı PDF dosyalarında metni seçip kopyalayamazsın; çünkü bu dosyalar aslında “metin” değil, sayfa sayfa görüntü (tarama) şeklinde kaydedilmiştir. İşte bu noktada OCR devreye girer. OCR (Optik Karakter Tanıma), taranmış PDF veya fotoğraf içindeki yazıları algılayıp düzenlenebilir metne dönüştürür. Bu rehberde PDF OCR işlemini Türkçe dahil olacak şekilde adım adım anlatıyor, en sık görülen sorunlara pratik çözümler veriyoruz.
Not: Kimlik, sözleşme, finansal evrak gibi hassas dosyalarda online OCR araçlarına dosya yüklemek yerine mümkünse offline çözümleri tercih et.
PDF’in tarama (görsel) olduğunu nasıl anlarsın?
OCR’a ihtiyacın olup olmadığını anlamanın en kolay yolu şu:
- PDF içinde yazının üstüne tıklayıp metin seçebiliyor musun? Seçebiliyorsan çoğu zaman OCR gerekmez.
- Metin seçilemiyor, sayfa “tek parça resim” gibi davranıyorsa bu PDF büyük ihtimalle tarama PDFtir.
- Arama (Ctrl+F) işe yaramıyorsa tarama olma ihtimali artar.
OCR neden bazen hatalı sonuç verir?
OCR, görüntüden metin çıkardığı için kaliteye çok bağlıdır. Şu durumlarda hata oranı artar:
- Düşük çözünürlük (bulanık tarama, düşük DPI)
- Eğik çekim / perspektif bozukluğu
- Çok küçük punto veya el yazısı
- Arka plan gürültüsü (leke, gölge, damga)
- Dil ayarının yanlış seçilmesi (Türkçe yerine başka dil)
Yöntem 1: Programla (offline) PDF OCR – önerilen
Offline OCR ile dosyanı internete yüklemeden işlem yaparsın. Bu, özellikle hassas belgelerde daha güvenlidir. Kullanacağın programa göre adımlar değişse de mantık aynıdır: PDF’i aç, OCR’ı çalıştır, dili seç ve metni dışa aktar.
En iyi sonuç: Net tarama + doğru dil (Türkçe) + yüksek kontrast
Not: Bazı programlarda OCR gelişmiş özellik olarak ücretli olabilir.
Adım adım: Offline OCR ile PDF’den metin çıkarma
- PDF dosyanı bir PDF/OCR programında aç.
- Menüde OCR / Metni Tanı benzeri seçeneği bul.
- Dil seçimi yap: mümkünse Türkçe (varsa ek dilleri de seçebilirsin).
- OCR’ı çalıştır ve işlem bitince metni kontrol et.
- Sonucu Word veya aranabilir PDF olarak dışa aktar (ihtiyacına göre).
Yöntem 2: Online PDF OCR (hızlı ama dikkat)
Online OCR araçları hızlıdır; tarama PDF’i birkaç dakikada metne çevirebilir. Ancak dosya yükleme gerekeceğinden hassas evraklarda önerilmez. Online kullanacaksan:
- Mümkünse kişisel/önemsiz dosyalarda kullan.
- OCR sonrası metni mutlaka kontrol et (hata çıkabilir).
Tür: Web tabanlı OCR / PDF araçları
Not: Dosya yükleme gerektirebilir
OCR çıktısı: “Aranabilir PDF” mi, Word mü?
OCR sonrası iki farklı hedef olabilir:
- Aranabilir PDF: Görüntü PDF’in üzerine görünmez metin katmanı ekler. PDF görünümü bozulmaz ama artık Ctrl+F ile arama yapılabilir.
- Word (.docx): Metni düzenlemek istiyorsan Word daha iyi. Ancak tablo ve düzen bozulabilir.
Türkçe OCR için ipuçları (daha doğru sonuç)
- Dil ayarını Türkçe yap (varsa ek olarak İngilizce de seçilebilir).
- PDF taraması çok koyu/çok açık ise kontrastı artır (gölgeyi azalt).
- Eğik sayfaları düzelt (deskew) özelliği varsa kullan.
- Çok küçük yazılarda yüksek DPI tarama daha iyi sonuç verir (150–300 DPI).
En sık sorunlar ve çözümleri
- Türkçe karakterler (ç, ğ, ı, ö, ş, ü) hatalı çıkıyor: Dil ayarının Türkçe olduğundan emin ol. Gerekirse OCR’ı farklı bir araçla tekrar dene.
- Metin kelime kelime bölünüyor: Satır sonu birleştirme ayarı varsa aç. Yoksa Word’de “Bul-Değiştir” ile düzeltme yapılabilir.
- Tablolar bozuluyor: OCR tabloları her zaman doğru çıkaramaz. Sonuç Word ise tablo hizalarını manuel düzeltmek gerekebilir.
- El yazısı okunmuyor: Standart OCR, el yazısında zorlanır. Daha gelişmiş/AI tabanlı OCR gerekebilir.
OCR öncesi dosyayı küçültmek gerekir mi?
Çok büyük tarama PDF’lerde online OCR yükleme sorun çıkarabilir. Böyle durumlarda önce PDF sıkıştırma yapıp sonra OCR denemek mantıklı olabilir. Ancak aşırı sıkıştırma kaliteyi düşürür ve OCR doğruluğunu azaltabilir; bu yüzden “dengeli” ayar kullan.
PDF işlemleri için diğer rehberler
- PDF Düzenleme Programı (En İyi Araçlar)
- Word PDF Çevirme / PDF Word Dönüştürme
- PDF Küçültme (Sıkıştırma) Yöntemleri
Sonuç
PDF OCR, taranmış veya kopyalanamayan PDF dosyalarını düzenlenebilir metne dönüştürmenin en etkili yoludur. En iyi sonuç için net tarama, doğru dil seçimi (Türkçe) ve mümkünse offline yöntemler önerilir. OCR sonrası metni mutlaka kontrol et; özellikle tablolar ve Türkçe karakterlerde küçük düzeltmeler gerekebilir.