Πως να μετατρέψεις PDF σε ebook

Από Αποεμπορευματοποίηση
Μετάβαση σε: πλοήγηση, αναζήτηση

ΕΔΩ ΤΑ ΚΑΛΑ ΠιΔιΕφ!!

πιδιεφ υπαρχουν παντου: στις κορυφες του πνευματος ( http://www.metmuseum.org ) και του πολιτισμου, στα μαγαζια του μοντερνου καπιταλισμου, (αμαζον), σε στοες ( http://eagainst.com/keywords/αναρχικη-βιβλιοθηκη/ ) και καταγωγια ( http://kiatipis.org/Books_Hosted_gr/Various-URLs/list_politiko.kafenio.htm ), σε κρυφες και σε οχι τοσο κρυφες γωνιες (κατω στα τορενταδικα)...

πιδιεφ( http://www.wikihow.com/Work-With-PDF-Files ) ειναι ενα μπραντ φτιαγμενο απο τους αντομπιους για να τυπωνεις σε οποιοδηποτε πισι, με οποιοδηποτε εκτυπωτη και με οποιο λειτουργικο το ιδιο ακριβως κειμενο...αμ δε που ειναι κειμενο!!! εικονα ειναι του κειμενου , κατι σαν σφραγιδα πτυσσομενη, τελος παντων λεπτομερειες εδω για μελετηρα κοριτσια.

Πιδιεφ απ τα χερακια σου, ή εδω ξεκινησε αυτο το γουικι

τον περασμενο σεπτεμβρη ξεθαψα κατι παλιες φωτοκοπιες, ενα βιβλιο που εκανα σε καποιο σεμιναριο, 400 σελιδες φωτοτυπημενες ανα δυο σε ενα Α4, απο τη μια πλευρα, πιασμενες σε σπιραλ, τι πρωτοτυπο!! μια και δυο αναψε ο γλομπος μεσα στο κεφαλι μου και ειπα: τι ωραια θα ηταν να τις διαβασα στο ταμπλετ των 44 ευρων κωτσοβολος, αντι για ολη αυτη τη σκονη και τη μαυριλα που βγαζουν...

πηγα στο συνοικιακο μου φωτοτυπαδικο, περιωπης ειναι, αναλαμβανει δακτυλογραφησεις εργασιων και διατριβων, ποστερ παρουσιασεων και τα παρομοια...τι θελετε η δεσποινις, πιδιεφ απο αυτο παρακαλω, σταθειτε να ρωτησω, μιλαει η διευθυντρια και λεει (διαθετομεν φατσα κυριλε πως να το κανομεν) 40 λεπτα η σελιδα κυριε!!! 80 ευρα λογαριασμος στα αψε σβησε, το αμπεμπουκ κι ο αμαζον μαζι με αραπη να μου το διαβαζει σε υπνοπαιδεια δεν κανουν τοσα λεω γω (μεσα μου καθοτι εχομεν και ενα τακτ) και τσουπ: γουϊκι

υπαρχουν ενα σωρο που εχουν ασχοληθει πριν απο σενα για τα περισσοτερα πραγματα , οπως τα συνεργα του ροβινσωνα τα βρηκε ο ρομπι στο ναυαγιο, ετσι κι εσυ ριχνεις μακροβουτι και σηκωνεις οτι μπορει να φανει χρησιμο: λινκ

1.μπορεις να φωτογραφησεις το κειμενο, οι μερακληδες στηνουν ολοκληρα ατελιε 2.μπορεις να γρησιμοποιησεις το σκανερ σου, κι αν εχεις 3 ενα πολυμηχανημα με ντοκουμεντ φηντερ ειναι η καλυτερη σου: βγαζεις το σπιραλ, χωνεις στον φηντερ οσες σελιδες παιρνει και αρχιζεις τη βασανιστικη κοπια, σκουπιζοντας καλα τον ιδρωτα σου μη σου βρεξει τις σελιδες...

οταν σκαναρεις απ το γυαλι (το πιο συνηθισμενο) μπορεις να κανεις μια ιδιοκατασκευη με χαρτι για να μη σου βγαζει τα ματια η λαμπα, σκεπαζεις δηλαδη με χαρτι το γυαλι που περισσευει εξω απο το βιβλιο κολλας με χαρτοκολλα και βουαλα, προσεχεις εκτος απο τον ιδρωτα και το παρκινσον, και φιρουλι φιρουλι το καραβανι πηρε μπροστα.

Υπαρχουν μικρα κολπακια εδω, οπως το να σκαναρεις με τον driver ενος ocr που σου δινει επιλογες σαρωσης πχ τοσα δευτερολεπτα διακοπη αναμεσα στις σαρωσεις, για μας τις ηλικιωμενες 40 σεκοντια φτανουν για να σηκωσεις το βιβλιο, να γυρισεις σελιδα και να το ξαναβαλεις στη θεση του, δεν πατας κοπυ ολη την ωρα δηλαδη, μονο οταν σου ξεφυγει κατι...καλον ειναι να διαλεξεις μια πραγματικα βαρβατη αναλυση αν σκοπευεις να το πας μεχρι το τελος εννοειται, 300dpi καλα ειναι.

ΞΕΦΥΥΥΥΓΕΙΙΙΙΙ;; γινονται και τετοια; ναι, κατι εβαλες τσαλακωμενο, κατι φωτογραφηθηκε στραβα...τιποτα εσυ εκει σηφης ακλονητος :

τα σκυλια γαβγιζουν, το καραβανι προχωρει...οταν τελειωσεις το βιβλιο, βγαζεις καινουρια πιδιεφ τις ελαττωματικες σελιδες και τις ενσωματωνεις στο ολον μετα. Υπαρχουν μερικα θαυματουργα φρηγουεαρ pdfsam, gimposition που σε βοηθανε ακριβως να βαλεις στη θεση τους τις σελιδες να κανεις δηλαδη αναδιαταξη. Επισης καθως φυσικα θα εχεις βγαλει δυο-δυο τις σελιδες του βιβλιου με αυτα θα τις κοψεις ωστε να ειναι μια μια και να παμε παρακατω.

Τι; δεν πας παρακατω, μια χαρα φωτογραφος εγινες φτανει τοση επιστημη για φετος..καλα, εσυ θα χασεις...εδω παιρνεις το briss, κανεις ενα ξακρισματακι , και βουαλα, ταχυδρομεις το πιδιεφ στον εαυτο σου, και το διαβαζεις σαν πιδιεφ , εμενα μου αρεσει το EbookDroid γι αυτη τη δουλεια που διαβαζει και DjVU και οτι αλλο θελεις...

(DJVU ειναι ενα αλλο φορματ που σου συμπιεζει το πιδιεφ στο ενα δεκατο. Το κανεις ονλαιν ή με το DjVU converter που υπαρχει για γουιντοους αλλα οχι για λινουξ...τρεχει ομως μεσα απ το wine για τα σκληρα αγορια- προκειται για συμπιεση και οχι για μετατροπη, οποτε τα προβληματα του πιδιεφ παραμενουν στη θεση τους)



μα εχουν τα πιδιεφ προβληματα, που με εμπλεξες σκυλα;

λιγα, μικρα και χαριτωμενα χρυσο μου, αν ριξεις ενα καλο ξακρισμα με το μπρις και πληρωσεις για μια μεγαλη ταμπλετα τελειωσες, αν δεν εχεις και μυωπια...ζουμ συριζα στο κειμενο και οτι πηρες-πηρες, διαβαζεται ρε, ξερεις στις φυλακες πως διαβαζαν στο τσιγαροχαρτο καθαρμα;

εισαι ανικανοποιητος εσυ, ψαχνεις το κατι αλλο στον κοσμο της ταμπλετας; γουελκαμ, σουχω αιμα, σπερμα, ιδρωτα και δακρυα ολα σε ενα. Με προσοχη μη μουλιασει το ταμπλετ. Γραμματα χασαπη!!!

το πιδιεφ ειναι ειπαμε εικονα κατα βαθος. Οταν κανεις ζουμ πανω του, μεγαλωνει και το κειμενο και το διαστιχο και οι αποστασεις των γραμματων. Οταν προσπαθεις να διαβασεις πιδιεφ στο κινητο εισαι υποχρεωμενος να μετακινεις συνεχως το κειμενο στο σημειο που διαβαζεις, σιγα και μη διαβασεις το μομπυντικ ετσι ποτε σου αχαιρευτε, ενω οι κομμουνιστες στις φυλακες κλπ, κλπ...παει σκαρτεψε ο κοσμος!!

χρειαζομαστε λοιπον ενα φορματ που θα μπορει κανεις να ζουμαρει το ωφελιμο κομματι, αγνοωντας το επιπλεον τοσο ωστε να παραμενει κομψο το συνολο....και ο θεος εφτιαξε το epub!!

καλα ο θεος εφτιαξε το φορματ, το δικο σου θα το φτιαξεις μονος σου, τι διαβαζεις τοση ωρα;

υπαρχουν λάιτ και χαρντκορ τροποι...οι λάιτ ειναι για τους φλωρους με τα λεφτα και τους “αποτυχημενους καταναλωτες” που ψωνιζουν στα τορενταδικα, ακομη για κατι τσιπηδες που ενω μπορουν να μαθουν το χαρντκορ βολευονται με τα δειγματα δωρεαν του λάιτ!!

αυτοι ολοι θα παρουν τον finereader, θα σκαναρουν απο αυτον, θα αναγνωρισουν απο αυτον θα διορθωσουν και θα επιμεληθουν απο αυτον και θα σωσουν στο τελος ετοιμο το epub απο αυτον.

1. ανιχνευση σελιδας, εδω λες στο προγραμμα τι ειναι κειμενο, τι εικονα, τι πινακας, με ποια σειρα να τα διαβασει σε καθε σελιδα, και με ντραγκ κι ετσι ρυθμιζεις το μεγεθος των box να μη σου κοβει λεξεις. Οσο πιο καλη ανιχνευση τοσο πιο καλη αναγνωση.

2 η αναγνωση μπορει να γινει “μονο με τα ενσωματωμενα προτυπα” με “συνδυασμο ενσωματωμενων και δικων σου” ή μονον με τα δικα σου που ειναι το πιο κουραστικο, αλλα σου δινει και πολυ κοντρολ στη δουλεια. Σε γενικες γραμμες για μοντερνες γραμματοσειρες και μονοτονικο και σκετα τα ενσωματωμενα κανουν τη δουλεια τους μια χαρουλα, για πιο εξεζητημενα λιγη εκπαιδευση δεν βλαπτει, για αλλες πιστες φτιαξε τα δικα σου.

δικα σου πχ χρειαζεσαι στα πολυτονικα κειμενα, οπου πρωτα φτιαχνεις μια γλωσσα με ολους τους χαρακτηρες που θα χρειαστεις, τη βαφτιζεις και την εκπαιδευεις. Ολους θα πει ολους: ελληνικα, αρχαια ελληνικα, συμπληρωμα ελληνικων, λατινικα συμπληρωμα λατινικων, επεκτασεις ελληνικων και λατινικων- χρειαζεσαι κι ενα πολυτονικο πληκτρολογιο, εμενα μου αρεσε το keyman greek, κι εναν διορθωτη, υπαρχει αυτος του κευμαν που ειναι to polytonic.oxt στο λιμπροφφις, αλλα αυτο ηταν μονο για να τρομαξουμε τους λιγοψυχους...αλλωστε πολυτονικα ειναι και τα γαλλικα καληωρα, μονο που εκει το ε με τονο παραμενει ε με τονο, ενω εδω παιρνει ψιλες δασεις περισπωμενες οξειες βαρειες και οτι αλλο σκεφτηκαν οι αναδελφοι για να ειναι κομψοι αν κανεις θελει να μαθει λεπτομερειες καποια αλλη στιγμη και με το μαλακο, οπωσδηποτε καθισμενος αναπαυτικα και μακρια απο αυρα φλαμπουραρη

3.τωρα που εκανες την αναγνωση εφτασε η ωρα της επιμελειας κειμένου: διορθωνεις με τα χερακια σου λεξη λεξη ολο το κειμενο . Ο φρηντερ σου ανοιγει δυο παραθυρακια, ενα για να βλεπεις κι ενα για να δουλευεις, εχει και διορθωτη ορεξη ναχεις. Αν το κανεις καλα ως εδω η πολλη δυλεια εχει τελειωσει, μπορει να σου βγαλει σελιδοποιημενο το epub φτανει να του το παραγγειλεις σωστα, θελει πολλη προσοχη η ταμπ “αποθηκευση” “save” στις” επιλογες” για να μη σου κραταει επικεφαλιδες και υποσελιδα κι εχεις να σβηνεις με το χερι μετα. Αν εισαι τυχερος θα σου σωσει και τις υποσημειωσεις πεταχτουλες πεταχτουλες στο τελος του κειμενου σου, ή τουλαχιστο τις περισσοτερες..

4. Αν οχι ανοιγονται πολλοι δρομοι μπροστα σου

α) λιμπροφφις ριχνεις μεσα ολο το κειμενο, διορθωνεις χτενιζεις φτιαχνεις υποσημειωσεις, βαζεις στυλ heading1, 2 body text και τα παρομοια και με το writer2xhtml εξτενσιον βγαζεις το epub ετοιμο. Εναλλακτικα με το elaix δουλευεις σαν να εφτιαχνες μια σελιδα στο γουεμπ και καταληγεις στο ιδιο αποτελεσμα χρειαζεσαι ορθογραφο ,ισως το pepito cleaner,hommage to ooolon , insert footnote και copypaste τα κειμενα των φουτνοουτ...υπαρχουν εργαλεια και εντολες και γι αυτα, οπως υπαρχουν και επιλογες, ναχεις ενα φουτνοουτ σε δικη του σελιδα ή ολα μαζι σε μια σελιδα στο τελος..μια-μια σου δινει δυνατοτητες αλλα σου τσακιζει το πισι καθε search εχει 600 σελιδες να κυτταξει..μπορεις ομως ναχεις popup σημειωσεις αντι για μπρος-πισω με τα bookmarks. Για links αργοτερα .

β) ανοιγεις το σωσμενο, ή ανοιγεις” νεο epub” και ριχνεις μεσα το κειμενο, με το sigil ( http://web.sigil.googlecode.com/git/files/OEBPS/Text/introduction.html ) που ειναι το βασικο προγραμμα για να φτιαχνεις epub. Ειναι βασικο να εντοπισεις το edit>preferences>preference locations οπου βρισκονται τα dictionaries και να ριξεις εκει μεσα τα ελληνικα λεξικα, που θα παρεις αποσυμπιεζοντας τα oxt (αρχεία επεκτασεων του οπενοφις, λιμπρε κλπ με το 7z βγαζεις τα σχετικα .dic απο μεσα και τα βαζεις στο φακελλο που λεγαμε. Μετα πας στο Εdit>preferences και του λες ποιο λεξικο θα ειναι ενεργο. Τα υπολοιπα ειναι οπως στο λιμπρε και καλυτερα γιατι δεν σε φορτωνει με κωδικα οπως το λιμπρε. Αν ξερεις και κωδικα κανεις παπαδες εδω, αν δεν εχεις ιδεα οπως εγω, αρχιζεις να καταλαβαινεις μερικα, διαβαζεις και οτι καταλαβαινεις απο τα εξαιρετικα μανουαλ κια φορουμ χρηστων , λινκ κι εδω αργοτερα. Εχεις και προβολη βιβλιου και προβολη κωδικα οποτε το παρακολουθεις καθως ψηνεται

γ) ριχνεις το κειμενο σε ενα νεο επαμπ που ανοιγεις με το καλιμπρε ( http://manual.calibre-ebook.com ) ή ανοιγεις καποιο σωσμενο επαμπ εκει, πας στην μετατροπη οπου εχεις την ευκαιρια να φτιαξεις περιεχομενα με το χερι, να διαλεξεις εξωφυλλα κι ενα σωρο καλουδια οπως merge ή split epub κοκο, κοκ...αφου εχεις μετατρεψει, πας στο επεξεργασια, εκει στις επιλογες του βαζεις ορθογραφο (του δειχνεις που να βρει το εξτενσιον του οπενοφισ δηλαδη οχι τιποτε σπουδαιο) οριζεις και ποιο λεξικο θα χρησιμοποιει στο τρεχον βιβλιο...ειναι πολυ πιο χρηστικος κι απ του αμπη κι απ του λιμπρε για μενα. (του σιγκιλ ειναι ατοφιος ο του λιμπρε με δεξι κλικ, εδω εχεις ορθογραφο κανονικο με “διορθωση ολων”)

δ) χρησιμοποιεις κατι σαν αυτο: Aspose.Words.Express. Φρηγουερ ειναι μετατρεπει doc σε epub και μετα δουλευεις οπως με τα αλλα.

ειδικα θεματα:

1.συλλαβισμος στην καρτελλα αναγνωση, και στη καρτελλα αποθηκευση του φρηντερ του λες να μη διατηρει συλλαβισμο, αλλα παρολα αυτα ερχεται η στιγμη που με το find/replace πρεπει να σβησεις μια μια ολες τις παραγραφους

που δεν χρειαζονται..αλλες θα γινουν “space”, αλλες θα εξαφανιστουν για ναχεις κανονικες λεξεις. Αυτο ειναι σκοπιμο για να καλιμπραρεται καλυτερα το epub στην οθονη. Του ξεφευγει και κραταει συλλαβες, υπομονητικοι ανθρωποι το διορθωνουν αυτο στον ορθογραφο του αμπη προκαταβολικα.

2. περιεχομενα: τα φτιαχνω στο σιγκιλ με το κουμπι heading 1, 2 κλπ. Μετα του make table of contents στο tools, ετοιμα. Το καλιμπρε τα βρισκει και τα παιρνει. Ακομη κι αν εχεις φτιαξει με το “μετατροπη” του καλιμπρε και δεν σου αρεσουν πιο ευκολα διορθωνεται στο σιγκιλ παρα στο καλιμπρε (ανοιγεις την τελευταια εκδοχη που βρισκεις μεσα στον φακελλο βιβλιοθηκη καλιμπρε, οχι την original epub, εννοειται).

3.εικονες μπορεις να κανεις add files στο sigil, κι επειτα να τις επεξεργαστεις ως προς το μεγεθος εκτυπωτικο στη σελιδα αλλα και πολυπλοκοτητα -βαθος ωστε να μικρυνει το συνολο. Με κουμπια ή με κωδικα αν ξερεις (εγω δεν ξερω, απλως εντοπισ μερικες εντολες , τις κοπιαρα καπου με το νοτπαντ και τις κοπηπεηστ οταν τις θελω) τοποθετεις την εικονα στη σελιδα.

4.πινακες το ιδιο (εννοειται πως ετσι διορθωνεις κι οτι εχει κακοσκαναριστει ως εδω, το προσθετεις σ αυτη τη φαση η οποια διαρκει αιωνια, εχεις το κειμενο σου και το βελτιωνεις)

5. υποσημειωσεις : πονος και σπαραγμος, ειδικα σε πολυγλωσσα κειμενα, ή σε κειμενα που αλλαζουν γραμματοσειρες, ναι οι εκδοτες με καλλιτεχνικες ανησυχιες μπορει να σε οδηγησουν στο δρομοκαϊτειο χωρις να το πολυκαταλαβεις...

οταν ειναι λιγες οι διορθωσεις μπορεις να το αφησεις για το τελος και να το κανεις μια-μια διορθωνοντας τους αριθμους στα μπουκμαρκ. Αν ειναι πολλες ομως εχει νοημα να μπεις στο λιμπρε απ την αρχη και να τις στρωσεις ...μπορει και να αποφασισεις οτι δεν ειναι στα ενδιαφεροντα σου το σε ποια σελιδα ακριβως ποιανου βιβλιου βρηκε ο συγγραφεας αυτο που σου σημειωνει, οποτε η ζωη γινεται πολυ πιο ευκολη και χαρουμενη!! αν τις θελει κανεις παρα πολυ, καθως βρισκεται σε code view στο σιγιλ ή σε επεξεργασια, και το πανελ κωδικα του καλιμπρε βαζει αυτες τις δυο σειρουλες χωρις να ξεχναει να αλλαζει τον αριθμο μια-μια

 a id="footnote1"></a><a href="#bookmark0">1</a>  

<a id="bookmark0"></a><a href="#footnote1">1</a>

η πρωτη δεικτης στο κειμενο και η δευτερη μπουκμαρκ στην εντνοουτ. Εναλλακτικα ειπαμε make footnote στο λιμπρε.

εγω ο αρχιτεμπελαρος παλι εκει που τις ηθελα οπωσδηποτε, τις εφτιαξα με το χερι μεσα στη ροη του κειμενου, χωρις να μου διασπουν τις παραγραφους, εξαιρετικα τεμπελικος τροπος, ενα απλο κοπηπεηστ της παραγραφου ωστε να την εχεις ολοκληρη πριν τη σημειωση, και μια αλλαγη του αριθμου της σημειωσης αν η μετακινηση του κομματιου της παραγραφου προσθεσε κι αλλες υποσημειωσεις


6. γενικα: απο το σκαναρισμα ακομη μπορεις να αποφυγεις να σκαναρεις πινακα περιεχομενων, βιβλιογραφια και index αν δεν θα τα χρειαστεις, μπορεις να τα αφαιρεσεις οταν επιλεγεις σελιδες του φαινρηντερ στο ocr, μπορεις να τα σβησεις σε οποιο δουλευεις προγραμμα μετα. Επισης αν ξεκινησες με το calibre κι εχεις ενα navigation pan που δεν σου χρειαζεται αφου φτιαχνεις δικα σου περιεχομενα το σβηνεις ανεμελα.



Και η τσοντα νεροβραστε χασαπη;

χα... μπαινοντας εδω ξεχνας καθε ελπιδα...

μακρινα πλανα

πολυ καιρο πριν δεντρα λιβαδι ποταμακι, προβατακια, πεταλουδες, σφηγκα σε παπαρουνα, η χιουλετ πακαρντ ειδε κι αποειδε οτι λεφτα δεν εβγαζε απο το tesseract( https://github.com/tesseract-ocr ) ...το αφησε λοιπον να παρει το δρομο του...., αναλογη πορεια ειχε και το cuneiform, αλλη μια αξιολογη μηχανη...

οπως καθε hardcore αξιο του ονοματος του, γινεται με το πληκτρολογιο, υπαρχουν μανουαλ https://code.google.com/p/tesseract-ocr/ για το πως απο την γραμμη εντολων η τρομερη μηχανη μετατρεπει σε γραμματα συνολα απο πιξελ εικονων..

κι εμεις κυριε που δεν μας αρεσουν τα ασπρα γραμματα σε μαυρο φοντο; χα...nice vice, ετσι προχωραει η ανθρωποτητα....φτιαχτηκαν τα frontend gfaz, gimage reader, document feeder κλπ, κλπ αλλα τρεχουν σε λινουξ, αλλα σε m$, αλλα αλλου. Με τη γραμμη εντολων δεν εχω ιδεα πως δουλευει περα απο το οτι εριξα μια ματια στα λινκ παραπανω.

το gfaz κι αλλα δυο εκτος απο το γκιματζ και το φηντερ που τα δοκιμασα ολα στο opensuse, σε καλης ποιοτητας και μικρου μεγεθους πιδιεφ, κανουν πολυ καλη δουλεια, μιλωντας για αγγλικα ή γαλλικα. Στα ελληνικα υπαρχουν δυο λεξικα για το τεσερακτ, τα αρχαια και τα μοντερνα. Τα μοντερνα ειναι μονοτονικα, κι οταν διαβαζεις ενα καλης ποιοτητας μονοτονικο πιδιεφ, παιρνεις ενα αποδεκτο .txt , το οποιο μετα πρεπει να ριξεις στο λιμπρε, το σιγκιλ ή το καλιμπρε και να πορευτεις οπως στη λαιτ βερσιον, μονο που αφου ξεκινας απο τεξτ, ολη η μορφοποιηση γινεται στο χερι, καθως και ο εντοπισμος των superscript που ποναει γιατι ειναι οι υποσημειωσεις.... το γκιματζ που τρεχω στα γουιντουζ δινει τη δυνατοτητα να οσιαρ σε πολλες γλωσσες μαζι, οποτε δεν σου ξεσκιζει τα ονοματα των συγγραφεων πχ. Αν εχεις κακης ποιοτητας πιδιεφ ή πολυτονικο την εκατσες, εκτος απο καποιες γραμματοσειρες, οπου με τα αρχαια (grc και οχι el_EL traineddata) μπορει να βρεθεις με καλυτερο text απ οτι με τον αμπη... κοντολογης hardcore με την πρωταγωνιστρια να καθεται με κλειστα ματια και τα δακτυλα σταυρωμενα, χαμος... οι δυσκολιες με το ανοικτης πηγης λογισμικο ειναι κατ αρχην η εγκατασταση που εχει πολλα χειροκινητα στοιχεια, κατεβαζεις λεξικα και τα κανεις κοπυπεηστ σε φακελλους, και μετα ψαχνεις με το φροντεντ να τα εντοπισεις και μετα διαλεγεις συνδυασμους γλωσσων για το κειμενο η ανιχνευση, η αναγνωση και η επιμελεια ειναι οπως στο αμπη περιπου, χωρις ομως μορφοποιηση ...στη συνεχεια το οτι παιρνεις απλο αμορφοποιητο κειμενο. Τα υπολοιπα ειναι ακριβως τα ιδια.

Το μεγαλο καλο του ανοικτου λογισμικου εν προκειμενω θα ηταν να εκπαιδευσει https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3 κανεις καλυτερα traineddata, οπως ονομαζονται τα λεξικα του τεσερακτ και να τα κοινοποιησει, οποτε θαχαμε καλυτερα αρχικα αποτελεσματα. Αντιθετα με τον φαινρηντερ ενω εφτιαξα εξαιρετικα καλα προτυπα για πολυτονικα ελληνικα με τη βοηθεια του keyman greek, αυτα δεν ηταν ουσιαστικα portable, κι ενω χακαρα το λεξικο του οπενοφις με το notepad2 και ξεγελασα και τον αμπη να το χρησιμοποιει, hommage to the ghost in the shell, το μονο που πηρα ηταν ενα λεξικο 40 mb που ξετιναζε οποιο πισι κι αν ετρεξα . Που σημαινει οτι πρεπει να κανεις τη δουλεια απ την αρχη σε καθε βιβλιο πρακτικα, εκτος κι αν εχει την ιδια γραμματοσειρα και ποιοτητα, και μιλαμε για τραγικα πολλη δουλεια, πριν ακομη αρχισεις να “γραφεις”, ενω “διαβαζεις” ακομη...ενταξει στα ποιηματα που “εφτιαξα” και που περιλαμβανουν και νοτες, ολοκληρες μπαλλαντες, οταν ολοκληρωθει το εργο μου θα παιζει και midi ανοιγοντας η σελιδα βεβαια χε, χε.. .

Με το cuneiform, https://en.wikipedia.org/wiki/CuneiForm_(software) δεν πολυεψαξα καθως δεν υποστηριζει ελληνικα, αλλα δεν διαφερει πολυ απ το τεσσερακτ, μερικα φροντεντ χρησιμοποιουν και τις δυο μηχανες οποια του πεις κατα περιπτωση.

Μπορεις να ταχυδρομεις τη δουλεια στον εαυτο σου, μπορεις να τρεχεις τον server του calibre ccdemo ή 3 ευρα το full..εγω στο ταμπλετακι μου χρησιμοποιω το aldiko που ειναι φρη και μια χαρα κανει τη δουλεια του 7΄΄ ταβ των 44 ευρ ειπαμε!!