Όλα τα θέματα

+
Home > Πόρος > PDF > γνώση της οπτικής αναγνώρισης χαρακτήρων (OCR)

Γνώση της οπτικής αναγνώρισης χαρακτήρων (OCR)

Τι είναι το OCR;

Οπτική αναγνώριση χαρακτήρων, συνήθως με τα αρχικά OCR, είναι η μηχανική ή ηλεκτρονική μετάφραση των σαρωμένων εικόνων του χειρόγραφου, δακτυλογραφημένου ή τυπωμένου κειμένου στο μηχανή-κωδικοποιημένο κείμενο.

Γιατί να χρησιμοποιήσετε OCR;

OCR χρησιμοποιείται ευρέως για να μετατρέψετε διαφορετικούς τύπους εγγράφων, όπως σαρωμένα έγγραφα σε χαρτί, αρχεία PDF ή εικόνες που έχουν ληφθεί από μια ψηφιακή φωτογραφική μηχανή σε επεξεργάσιμο και αναζητήσιμο δεδομένων. Σε ορισμένα επαγγελματικά περιβάλλοντα (όπως οι βιβλιοθήκες, γραφεία), χιλιάδες βιβλία και έγγραφα θα σαρωθούν τακτικά για back-up και αρχείο. Ένα σαρωτή παίρνει απλώς φωτογραφίες των πρωτότυπων εγγράφων χαρτί, με αποτέλεσμα την εικόνα-βασισμένο σαρωμένα έγγραφα σε μορφή PDF. Το μείζον θέμα με τη μεταποίηση και την αποθήκευση τόσο μεγάλους όγκους σαρωμένα έγγραφα είναι η ανικανότητα να αναζητήσετε μια συγκεκριμένη φράση ή όνομα μέσα σε ένα αρχείο. Επίσης κανένα κείμενο μπορεί να τονίζεται, αντιγραφεί, ή να τροποποιηθεί, επειδή το έγγραφο περιέχει μία μεγάλη εικόνα αρχείο, σε αντίθεση με οι μεμονωμένοι χαρακτήρες κειμένου.

OCR Sample

Πριν από την εκτέλεση OCR, ολόκληρη την περιοχή στη σελίδα είναι επιλεγμένη και μαρκαρισμένη και κανένα κείμενο μπορεί να αναζητηθεί και να επεξεργαστεί.

Μετά την εκτέλεση OCR, κείμενο στη σελίδα μπορεί να επιλεχτεί με επιλογή εργαλείο, μπορείτε να αναζητήσετε και να επεξεργαστείτε χαρακτήρα, λέξης και παραγράφους εύκολα.

Πώς Wondershare PDF OCR εργαλεία σας βοηθήσει;

Wondershare PDF OCR εργαλεία μπορεί να σας βοηθήσει να αναγνώριση κειμένου από σαρωμένου PDF γρήγορα και με ακρίβεια και να διατηρήσουν τα αναγνωρισμένα αποτελέσματα με τα πολλαπλάσια σχήματα επεξεργάσιμο.

Wondershare PDF Editor Pro for Mac: με εξαιρετική OCR ακρίβεια και μορφή διατήρηση, σας δίνουν τη δυνατότητα να αναζητηθούν, να διορθώσει και να αντιγράψετε κείμενο σε ένα σαρωμένο ή βάσει ειδώλου PDF απευθείας στο Mac. Επιτρέπει επίσης να εξαγάγετε σαρωμένου PDF σε μορφοποιημένο κείμενο με βάση το Word, Excel, PowerPoint, EPUB, HTML, και να μορφοποιεί το κείμενο.

Wondershare PDF Converter Pro: αναγνώριση κειμένου από σαρωμένου PDF με εξαιρετική ακρίβεια του OCR και να μετατρέψετε πολλαπλές σάρωση PDFs σε κείμενο Word, Excel, PowerPoint, EPUB, HTML και κείμενο έγγραφα που βασίζονται σε Windows.


Wondershare PDF Converter Pro for Mac: αναγνώριση κειμένου από σαρωμένου PDF με εξαιρετική ακρίβεια του OCR και να μετατρέψετε πολλαπλές σάρωση PDFs σε κείμενο Word, Excel, PowerPoint, EPUB, HTML και κείμενο έγγραφα που βασίζονται στο Mac.

Πώς μπορεί να βελτιωθεί η ποιότητα της OCR αναγνώρισης;

OCR αναγνώριση ποιότητας εξαρτάται σε μεγάλο βαθμό την ποιότητα της εικόνας, η οποία σε μεγάλο βαθμό εξαρτάται από τις ρυθμίσεις που χρησιμοποιούνται κατά τη διάρκεια το έγγραφο διαδικασία ανίχνευσης. Προκειμένου να πάρει την καλύτερη ποιότητα της OCR αναγνώρισης για τα σαρωμένα έγγραφα σας, εδώ είναι μερικές συμβουλές για τη σάρωση του εγγράφου:

Γραμματοσειρά είναι πολύ μικρή
Για βέλτιστα αποτελέσματα της αναγνώρισης, σάρωση εγγράφων τυπώνεται σε πολύ μικρές γραμματοσειρές σε υψηλότερη ανάλυση.
Μπορείτε να καθορίσετε την επιθυμητή ανάλυση στην ιδιότητα ψήφισμα του ScanSourceSettings αντικειμένου.


Πηγή εικόνας Συνιστώμενη ανάλυση
Reader 300 dpi για τυπικό κείμενα (τυπωμένο σε γραμματοσειρές μέγεθος 10 pt ή μεγαλύτερο)
Reader 400-600 dpi για κείμενα τυπωμένα σε μικρότερες γραμματοσειρές (9pt ή μικρότερα)

Ρύθμιση φωτεινότητας
Ίσως χρειαστεί να προσαρμόσετε τη ρύθμιση της φωτεινότητας κατά τη σάρωση σε ασπρόμαυρο mode. Μπορείτε να καθορίσετε την επιθυμητή φωτεινότητα στην ιδιότητα φωτεινότητας του αντικειμένου ScanSourceSettings . Μια μέτρια τιμή της τάξης του 50% θα έπρεπε να αρκεί στις περισσότερες περιπτώσεις.
Αν η εικόνα που προκύπτει περιέχει πάρα πολλά "ρήξη" ή "κολλήσει" μαζί γράμματα, αντιμετωπίστε χρησιμοποιώντας τον παρακάτω πίνακα.

Εικόνα σας μοιάζει με αυτό Συστάσεις
Good Quality Αυτή η εικόνα είναι κατάλληλο για την αναγνώριση
Very Light
χαρακτήρες είναι "διχασμένη" ή πολύ ελαφρύ
  • Χαμηλώστε τη φωτεινότητα για να κάνει την εικόνα πιο σκούρα.
  • Σάρωση σε διαβαθμίσεις του γκρι. Φωτεινότητα θα είναι συντονισμένοι αυτόματα.
  • Very Dark
    οι χαρακτήρες είναι πολύ παραμορφωμένη, κολλημένα μαζί, ή συμπλήρωσαν
  • Αυξήσετε τη φωτεινότητα για να κάνει την εικόνα πιο φωτεινή
  • Σάρωση σε διαβαθμίσεις του γκρι. Φωτεινότητα θα είναι συντονισμένοι αυτόματα.
  • Ποιότητα εκτύπωσης
    Ή κακής ποιότητας έγγραφα με "θόρυβο" (δηλαδή τυχαία μαύρες κουκίδες ή στίγματα), θολή και άνιση γράμματα, λοξή γραμμές και τα περιγράμματα του πίνακα μετατοπισμένη μπορεί να απαιτεί συγκεκριμένες ρυθμίσεις σάρωσης. Για παράδειγμα, το φαξ και εφημερίδα:

    Print Quality

    Κακής ποιότητας έγγραφα καλύτερη σάρωση σε διαβαθμίσεις του γκρι. Κατά τη σάρωση σε διαβαθμίσεις του γκρι, το πρόγραμμα θα επιλέξει αυτόματα τη βέλτιστη φωτεινότητα αξία.
    Λειτουργία κλίμακας του γκρι διατηρεί περισσότερες πληροφορίες σχετικά με τα γράμματα στο σαρωμένο κείμενο να επιτευχθούν καλύτερα αποτελέσματα της αναγνώρισης όταν αναγνωρίζοντας έγγραφα του μέσου για την κακή ποιότητα.


    Σχετικά άρθρα

    Ερωτήσεις σχετικές με το προϊόν; Μιλήσετε απευθείας με την ομάδα υποστήριξής μας >>

    Κορυφή