Blog ne / nedir | 3513

Optik Karakter Tanıma veya OCR, taranmış kağıt evrakları, PDF dosyaları veya dijital bir kamerayla çekilen resimler gibi değişik belge türlerini düzenlenebilir ve aranabilir verilere dönüştürmenize olanak sağlayan bir teknolojidir. 

Farz edin ki elinizde kağıt bir evrakınız var - örneğin bir dergi makalesi, broşür veya iş ortağınızın size elektronik postayla yolladığı PDF formatında bir sözleşme. Elbette bu bilgileri, mesela, Microsoft Word'de düzenlemek için bir tarayıcı yeterli olmayacaktır.  Bir tarayıcının tüm yapabileceği şey, belgenin resmini oluşturmaktır, ki bu raster görüntüsü olarak bilinen siyah beyaz veya renkli noktalar topluluğundan başka bir şey değildir. Taranmış belgelerden, kamera resimlerinden veya sadece resim içeren PDF dosyalarından verileri çıkartmak ve başka bir amaç için düzenlemek amacıyla resimlerdeki harfleri seçip ayıracak, onlardan kelimeleri ve kelimelerden de cümleleri oluşturup bu sayede orijinal belgenin içeriğine erişmenize ve düzenlemenize olanak tanıyacak bir OCR yazılımına ihtiyacınız vardır.

Menu