-
1 OCR
(optical character recognition)La reconnaissance optique de caractères (OCR: optical character recognition, même sigle en français et en anglais) est une technologie permettant de convertir en fichier texte un fichier numérisé en mode image. Cette conversion permet d’alléger le poids du fichier, de corriger le texte si utile et d’effectuer des recherches textuelles. En quoi consiste exactement la numérisation d’un livre en utilisant un logiciel OCR? Il consiste à scanner le livre page après page, ce qui donne des fichiers numérisés en mode image, puis à utiliser un logiciel OCR, qui permet de convertir chaque fichier "image" en un fichier texte. Il consiste ensuite à relire le contenu du fichier texte au regard de l’original (image scannée ou livre imprimé) en corrigeant les erreurs (dix erreurs par page en moyenne quand le logiciel OCR est de qualité). Deux logiciels OCR commerciaux sont les logiciels OmniPage et TextBridge de la société Nuance. -
2 numérisation en mode texte
Deux méthodes sont possibles pour numériser un livre en mode texte. On peut saisir le livre de bout en bout sur le clavier de son ordinateur. On peut aussi scanner le livre page après page, ce qui donne des fichiers numérisés en mode image, puis on utilise un logiciel OCR (optical character recognition), qui permet de convertir chaque fichier image en fichier texte. Il est ensuite préférable de relire le contenu du fichier texte au regard de l’original (image scannée ou livre imprimé) en corrigeant les erreurs (dix erreurs par page en moyenne lorsque le logiciel OCR est de qualité). Dans l’un comme l’autre cas (saisie ou scannage + OCR), le texte numérisé apparaît en continu à l’écran, et la présentation de la page originale n’est pas conservée. A cause du temps passé au traitement de chaque livre, la numérisation en mode texte est assez longue. Elle est toutefois très préférable à la numérisation en mode image, puisqu’elle permet l’indexation, la recherche plein texte, l’analyse textuelle, une étude comparative entre plusieurs textes ou plusieurs versions du même texte, etc. C’est la méthode utilisée par exemple par le Projet Gutenberg, la grande bibliothèque mondiale au format texte fondée en 1971. Le format de fichier obtenu est le format TXT, et l’extension du fichier est ".txt".Voir aussi: bibliothèque numérique, indexation, numérisation, numérisation en mode image, OCR, Projet Gutenberg, scanner, TXT. -
3 reconnaissance
reconnaissance [ʀ(ə)kɔnεsɑ̃s]1. feminine nouna. gratitudeb. [d'État, indépendance, droit, diplôme] recognitionc. ( = identification) recognitiond. ( = exploration) reconnaissance2. compounds* * *ʀ(ə)kɔnɛsɑ̃s1) ( gratitude) gratitudeen reconnaissance de — in appreciation of [aide, services]
avoir or éprouver de la reconnaissance pour quelqu'un — to be ou feel grateful to somebody
2) ( action d'identifier) recognition3) ( fait d'admettre) (de torts, d'erreurs) admission, admitting; (de qualités, mérite) recognition, recognizing4) (de droit, d'indépendance, d'un État) recognition5) ( fait d'explorer) Armée reconnaissance, recon USaller or partir en reconnaissance — Armée to go on reconnaissance; fig to go and have a look around, to go and have a recce (colloq)
* * *ʀ(ə)kɔnɛsɑ̃s nf1) [mérite] recognition2) [faute, culpabilité] acknowledgement3) (= gratitude) gratitude4) MILITAIRE reconnaissance, recce* * *1 ( gratitude) gratitude; être plein de reconnaissance to be full of gratitude, to be very grateful; exprimer/témoigner sa reconnaissance à qn to express/to show one's gratitude to sb; ma reconnaissance envers lui n'a pas de bornes I'm infinitely grateful to him; geste de reconnaissance mark of gratitude; en reconnaissance de in appreciation of [aide, services]; avoir or éprouver de la reconnaissance pour qn to be ou feel grateful to sb;2 ( action d'identifier) recognition; reconnaissance des formes/de la parole Ordinat pattern/speech recognition; faire un signe de reconnaissance to give a sign of recognition;3 ( fait d'admettre) (de torts, d'erreurs) admission, admitting; (de qualités, mérite) recognition, recognizing; la reconnaissance de sa propre faiblesse admitting one's own weakness;4 (de droit, d'indépendance, d'un État) recognition; reconnaissance de l'autorité de qn acknowledgement of sb's authority; reconnaissance d'un enfant legal recognition of a child;5 ( fait d'explorer) Mil reconnaissance; mission/patrouille/avion de reconnaissance reconnaissance mission/patrol/plane; après une reconnaissance des lieux Mil after reconnoitring the area; fig after having a look around; aller or partir en reconnaissance Mil to go on reconnaissance; fig to go and have a look around, to go and have a recce○; envoyer qn en reconnaissance Mil to send sb on reconnaissance; fig to send sb to have a look around; faire la reconnaissance du parcours Équit to walk the course.reconnaissance de dette acknowledgement of debt, IOU○; reconnaissance optique de caractères, ROC optical character recognition, OCR; reconnaissance vocale speech recognition.avoir la reconnaissance du ventre hum to love the person who feeds one.[rəkɔnɛsɑ̃s] nom féminin1. [gratitude] gratitudeavoir/éprouver de la reconnaissance envers quelqu'un to be/to feel grateful to ou towards somebodyavec reconnaissance gratefully, with gratitudeen reconnaissance de votre dévouement as a token of my/our etc. gratitude for ou in recognition of your devotion2. [exploration] reconnaissanceelle est partie en reconnaissance ou est allée faire une reconnaissance des lieux (figuré) she went to check the place out3. [identification] recognition4. [aveu] admissionla reconnaissance de ses torts lui a valu l'indulgence du jury his admission of his wrongs won him the leniency of the jury5. POLITIQUE [d'un gouvernement] recognition7. [reçu]reconnaissance de la parole/de formes speech/pattern recognition -
4 i2S
( société)La société i2S est spécialisée dans les techniques de vision industrielle (impression, édition, contrôle qualité, découpe, façonnage, comptage, étiquetage, trajectographie, guidage, gestion électronique de documents). Dans le domaine de la gestion électronique de documents, i2S Digibook conçoit, fabrique et commercialise des systèmes de numérisation d’ouvrages reliés et des logiciels de restauration, notamment des scanners de livres utilisés pour la numérisation à grande échelle des bibliothèques. Les scanners avec tourne-pages automatiques peuvent traiter jusqu’à 3.000 pages par heure (une dizaine de livres), si nécessaire en lumière ambiante pour préserver les documents fragiles. De futurs modèles pourraient inclure la reconnaissance optique de caractères (ou OCR: optical character recognition), qui permettrait une conversion directe des ouvrages en texte pur. En 2006, les machines i2S équipent 300 bibliothèques ou centres d’archives dans le monde, et la société compte une soixantaine de personnes. -
5 photolecture
[fɔtɔlɛktyr] nom féminin -
6 Million Book Project
Lancé en 2000 par cinq professeurs (Jaime Carbonnel, Raj Reddy, Michael Shamos, Gloriana St Clair et Robert Thibadeau) de l’Université Carnegie Mellon (en Pennsylvanie, Etat des Etats-Unis), le Million Book Project a pour but de numériser un million de livres. Cette bibliothèque numérique est hébergée par l’Internet Archive. Les livres sont scannés puis convertis au format texte en utilisant la technologie OCR (Optical Character Recognition). Une présentation complète du projet est donnée dans la FAQ (frequently asked questions). Le Million Book Project a une optique différente du Projet Gutenberg, qui préfère ajouter l’étape de la relecture par des correcteurs, pour avoir un texte parfaitement fiable. Les collections du Million Book Project comprennent 10.500 livres en avril 2005, et sont ensuite intégrées à la section Universal Library de l’Internet Archive. En octobre 2005, l’Internet Archive débute un autre projet de grande envergure avec l’Open Content Alliance (OPA), dont les collections intègrent la section Text Archive.
См. также в других словарях:
OCR-A — Schriftart OCR A Kategorie Grotesk Erstellung … Deutsch Wikipedia
OCR-B — Schriftart OCR B Kategorie Grotesk … Deutsch Wikipedia
OCR-B — Category Sans serif Designer(s) Adrian Frutiger Date released 1968 The OCR B is a set of mono … Wikipedia
OCR-B — OCR B, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Im Unterschied zur OCR A Schrift ist die Linienführung runder, wodurch die Schrift für das menschliche Auge leichter lesbar ist, einem OCR Programm aber… … Universal-Lexikon
OCR-A — OCR A, eine 1968 entworfene Schrift zur maschinellen optischen Zeichenerkennung (OCR). Die Schrift wirkt durch ihre kantige Linienführung sehr technisch, ist aber für OCR Programme leicht zu interpretieren. Man findet sie beispielsweise in der… … Universal-Lexikon
OCR-H — OCR H, eine Schrift zur maschinellen optischen Zeichenerkennung (OCR), die als Vergleichsgrundlage für handgeschriebene Blockschrift eingesetzt wird. Ein OCR Programm vergleicht dabei die eingelesenen Zeichen mit der OCR Schrift und kann so… … Universal-Lexikon
OCR — noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers that have been printed or written by hand on paper: • the scanner s built in OCR software * * * OCR UK US /ˌəʊsiːˈɑːr/ noun [U] IT ► … Financial and business terms
OCR — may refer to: Optical character recognition, conversion of images of text into characters The OCR A font, designed to simplify character recognition The similar OCR B font Transvaginal oocyte retrieval, a technique used in in vitro fertilization… … Wikipedia
.ocr — ocr, von einigen Programmen zum Fax oder Bildschirmdruck erzeugte Dateierweiterung, die anzeigt, dass diese Datei mit einem Zeichenerkennungsprogramm (OCR) bearbeitet werden kann … Universal-Lexikon
OCR — DEFINICIJA krat. inform. postupak kojim računalo prepoznaje slova, znakove i brojke skenirane optičkim čitačem u obliku slike [OCR softver] ETIMOLOGIJA engl. Optical Character Recognition … Hrvatski jezični portal
OCR — sigla ES ingl. Optical Character Recognition, lettura ottica di caratteri … Dizionario italiano