Home » Δίαυλος Επεξεργασίας Εγγράφων: CITE.DocuProc

Δίαυλος Επεξεργασίας Εγγράφων: CITE.DocuProc

πίσω στο CITE.BPMS

Ο Δίαυλος Επεξεργασίας Εγγράφων CITE.DocuProc αναλαμβάνει την εξαγωγή χαρακτηριστικών, μεταδεδομένων και κειμένου από τα έγγραφα τα οποία του παραδίδονται. Πιο συγκεκριμένα, παραλαμβάνει ένα ή περισσότερα έγγραφα τα οποία αποτελούν μέρη ενός μηνύματος μαζί με τα μεταδεδομένα τα οποία τα συνοδεύουν μέχρι τη συγκεκριμένη φάση της επεξεργασίας του από το CITE.BPMS και αφού τα επεξεργαστεί μέσα από μια σειρά από φίλτρα, επιστρέφει ενδεχόμενα πρόσθετα ψηφιακά αρχεία και μεταδεδομένα για το μήνυμα και τα έγγραφα τα οποία παρέλαβε.

Έτσι μέσα από το CITE.DocuProc μπορούν ενδεικτικά να εξαχθούν εναλλακτικοί μορφότυποι ενός αρχείου (πχ MS Office σε PDF), να μετατραπεί μία εικόνα σε εναλλακτικές μορφές συμπίεσης (πχ jpg σε png, tiff σε jpeg κοκ), να εξαχθεί το κείμενο ενός αρχείου (πχ πλήρες κείμενο από ένα έγγραφο MS Office ή PDF), να γίνει οπτική αναγνώριση χαρακτήρων από ένα αρχείο σάρωσης εγγράφου (υποστηρίζεται σε 10άδες γλώσσες), να μετατραπεί ένα αρχείο video (πχ από κάθε μορφότυπο σε mp4 κατάλληλο για διαδικτυακό συρμό), να εξαχθούν δομημένα μεταδεδομένα (πχ πληροφορία θέσης και χρόνου από φωτογραφίες) κοκ Εξειδικευμένες συνιστώσες του CITE.DocuProc μπορούν επιπρόσθετα να επεξεργάζονται τα μεταδεδομένα και το περιεχόμενο ενός εγγράφου σε συνδυασμό με τα δεδομένα της Βάσης Δεδομένων του CITE.BPMS και να δομούν στοιχεία τα οποία βρίσκονται αδόμητα μέσα σε ένα έγγραφο. Παράδειγμα αποτελεί η αυτόματη αναγνώριση στοιχείων τα οποία εμπίπτουν σε πρότυπα, αριθμοί πρωτοκόλλου εγγράφων, φορείς διακίνησης εγγράφων κοκ