Bir Başka OCR Yöntemi Daha

Toplam Okunma 84

Bir önceki yazıda Google Dokümanlar aracılığıyla nasıl OCR yapabileceğimizi, başkaca yöntemleri tekrar paylaşabileceğimi belirtmiştim. Bu yazıda bir OCR yöntemi tanıtacak olsam da bu yöntemin önceki yazıyı bitirirken aklımda olanlarla hiçbir bağlantısı yok. Tamamen tesadüf eseri sayfaların sayfalara, linklerin linklere götürdüğü bir internet gezintisinde, eski deyimle internette sörf yaparken karşılaştığım bir yöntem, bir site.

Öncelikle sitenin adresi şu:

data2data.ru

Site baştan aşağı Rusça. Ancak epey basit bir kullanımı olduğu için çeviri yardımıyla pekâlâ kullanılabiliyor.

Biri hariç bizi çok da ilgilendirmeyen sayfalarını şöyle sıralayabilir, ardından asıl işimize yarar kısma geçebiliriz:

  • Web sitesinde sunulan hizmetlere ilişkin; görme engellilerin hedeflendiği, tamamen ücretsiz ve 10GB’lik yükleme sınırı dışında herhangi bir sınırlandırmanın olmadığını belirten “proje hakkında” sayfası
  • Birazdan detaylandıracağım “görüntüden metne” sayfası
  • Metin dosyalarını eSpeak ya da RhVoice TTS motorlarını kullanarak ses dosyalarına çeviren “metinden konuşmaya” sayfası
  • FB2 e-kitap dosyasını TXT veya HTML’ye çeviren “FB2’den TXT’ye” sayfası
  • Açıkça proje için kullanılmayacağı belirtilen bağışların yapılabileceği, üslubu garip olan “projeyi destekleyin” sayfası
  • Sonu çıkmaz sokak olan, hiçbir yere ulaştırmayan “önerileriniz” sayfası ve
  •  Aralarından biri Raskolnikov’un kardeşiymiş gibi görünen üç kişilik proje ekibini tanıtan “proje ekibi” sayfası

Ayrıca başlık dışında boş olan bir sayfaya yönlendiren “görev listesi” bağlantısı ve kaydolmak veya giriş yapmak için bağlantılar da var. Kaydın şu anlık tek faydası OCR işleminin sonuçlandığı bilgisinin gönderileceği e-posta adresinin doğrudan kutucukta hazır gelmesi.

Tüm bu kısımları bitirdiğimize göre yedi öğeli ana menü listesinin ikinci öğesi olan “görüntüden metne” bağlantısını tıklayarak OCR işlemini başlatacağımız formu içeren sayfaya gidebiliriz.

Sayfa açıldığında birinci seviye başlığa giderek formun başını bulabiliyoruz. Ardından belirlenecek tüm seçeneklere Tab tuşuyla ulaşabiliriz.

En başta OCR sonucunun bize bildirileceği bir e-posta adresi giriyoruz. Kaydolup giriş yaptıysak burası dolu gelecektir.

Devamındaki iki seçenek OCR için kullanılacak birincil ve ikincil dili seçmemizi gerektiriyor. Otomatik algılama seçeneği olmadığı için uygun seçimleri yapıyoruz. Türkçe 103’üncü Sırada, İngilizce ikinci kutucukta varsayılan olarak belirlenmiş durumda ve 5’inci Sırada yer alıyor.

Ardından çıktı biçimini, belge yapısını ve tanıma kalitesini seçmemiz isteniyor. Çıktı olarak iki seçeneğimiz var, PDF ve TXT. Biçimi PDF olarak seçersek OCR işleminden sonra sonucu PDF içerisine metin katmanı olarak gömüyor. TXT seçtiğimizde ise OCR sonucunu veya PDF’teki metin katmanını TXT olarak çıkarıyor.

Tanıma kalitesinde “hızlı” ve “en iyi” olmak üzere iki seçenek var. Her ikisinde de iyi sonuç aldım ve bir fark görmedim doğrusu.

Belge yapısında ise üç seçenek var. Bunların Türkçesi aşağı yukarı şöyle; “orijinal belge yapısını koru”, “paragraf düzeni” ve “tümce düzeni”. Bunlar, metnin nasıl ayrılacağına ilişkinseçenekler. En iyi verimi ikincisinden alabildim ama hâlâ cümlenin ortasında satır başı yapabiliyor.

İlk seçenekte satır başı yapma durumu çok fazla var. Üçüncü seçenek ise noktalama işaretlerine bakarak her cümle bitiminde satır başı yapıyor.

 Bu seçimleri de tamamladıktan sonra görüntü dosyamızı seçmemiz isteniyor. İster tek sayfalı görüntüler ister çok sayfalı PDF’ler ekleyebiliyorsunuz.

PDF seçtikten sonra bir seçim daha yapmamız isteniyor. ABBYY FineReader 14 ve sürümleri kullananların aşina olduğu, metin katmanı, OCR işlemi veya her ikisini birlikte kullanmamızı sağlayan seçenekler mevcut. Buraya ihtiyaç duyuyorsak sıfırdan OCR yapmayı istiyoruzdur çünkü PDF’teki metin katmanına başka uygulamalardan yerel olarak da erişebiliyoruz. Dolayısıyla yalnızca OCR işlemini uygulamayı seçip devam ediyor, Tanı düğmesine basıyoruz.

Tanı düğmesine bastıktan sonra sayfanın üst kısmında, birinci düzey başlığın hemen devamında işlemin yapıldığına dair bir ibare beliriyor. Burada işlem durumunu bize gösteren sayfaya bizi ulaştıracak “git” bağlantısı da var.

Bağlantıya tıkladığımızda açılan sayfada belgenin açılan ve tanınan sayfalarının miktarı ve yüzdesi yazıyor. Bu sayfanın, sitenin ya da tarayıcının açık kalması gerekli değil. Kapatıp işlemin bitmesini, bittiğine dair e-postayla bilgilendirmeyi bekleyebiliriz.

Gelen e-posta beklenebileceği üzere tamamen Rusça. İçerisinde bizi işlemin durumuna götürecek bağlantı yer alıyor. Bağlantıyı açtığımızda çıktı dosyasını indirebileceğimiz bağlantının olduğu sayfa açılıyor. Dosyayı buradan indirebiliriz.

Sitedeki açıklamalara göre yedi gün boyunca dosyalar sunucularda tutuluyor ve bağlantılar yine yedi gün aktif kalıyor. Hizmetler her sayfanın altında isimleri bulunan kuruluşlar tarafından ücretsiz olarak sağlanıyor ve barındırılıyor.

Güvenlik endişeleriniz varsa yalnızca size ait olan ve gizliliğini sağlamak istediğiniz içeriklerle işlem yapmamanızı öneririm. Ancak, örneğin yine internetten bulduğunuz bir kitabın PDF’ini bu sitede işlemenizde bir sakınca olmadığına inanıyorum.

Yaptığım ilk denemelerde OCR işleminin sonucundan oldukça memnun kaldığım bu web sitesinin sizlere faydalı olmasını dilerim.

Sürçülisan ettiysem affola.

Yorumlar

Bu yazı için henüz yorum yok.

Yeni Yorum