Optical Character Recognition (en) [phrase] Recognition of written or printed language requires that a symbolic representation of the language is derived from its spatial form of graphical marks. For most languages this means recognising and transforming characters. There are two cases of character recognition: recognition of printed images, referred to as Optical Character Recognition (OCR), and recognising handwriting, usually known as Intelligent Character Recognition (ICR). OCR from a single printed font family can achieve a very high degree of accuracy. Problems arise when the font is unknown or very decorative or when the quality of the print is poor. In these difficult cases, and in the case of handwriting, good results can only be achieved by using ICR. This involves word recognition techniques which use language models, such as lexicons or statistical information about word sequences. [see ACCeSS]

optično prepoznavanje znakov (sl) Prepoznavanje pisnega ali tiskanega jezika zahteva, da je simbolična podoba izvedena iz prostorne oblike grafičnih znakov. Za večino jezikov to pomeni prepoznavanje in pretvorbo znakov. Obstajata dve vrsti prepoznavanja: prepoznavanje tiskanih slik, ki se imenuje optično prepoznavanje znakov (OCR) in prepoznavanje rokopisa, znano kot inteligentno prepoznavanje znakov (ICR). OCR lahko doseže visoko stopnjo kvalitete pri uporabi enotne vrste pisave. Problemi se pojavijo, če je pisava neznana ali preveč vijugasta in okrašena, ter pri slabi kvaliteti tiska. V teh težkjih primerih in v primeru rokopisa se dobri rezultati lahko dosežejo le z uporabo ICR-ja. To vključuje tehnike prepoznavanja besedil, ki temeljijo na jezikovnih modelih, kot so leksikoni ali statistični podatki o besednem redu.

optische Zeichenerkennung (de) [Phrase] Die Erkennung von Sprache in geschriebener oder gedruckter Form setzt voraus, daß von der räumlichen Darstellung der Sprache in Form von graphischen Zeichen eine symbolische Darstellung abgeleitet wird. Für die meisten Sprachen bedeutet dies, daß Zeichen erkannt und umgewandelt werden. Es gibt zwei Möglichkeiten der Zeichenerkennung: Erkennung von Druckbildern, bezeichnet als optische Zeichenerkennung (OCR) und die Erkennung von Handschrift, bekannt unter der Bezeichnung Intelligente Zeichenerkennung (ICR). OCR kann nur bei einer Schriftartenfamilie einen hohen Grad an Präzision erzielen. Probleme entstehen dann, wenn die Schriftart unbekannt, verschnörkelt oder von minderwertiger Qualität ist. In solchen schwierigen Fällen, wie auch bei Handschriften, lassen sich gute Ergebnisse nur mit Hilfe von ICR erzielen. Hierfür bedarf es verschiedener Worterkennungsmethoden, deren Sprachmodelle wie z.B. Wörterbücher oder statistische Daten über Wortfolgen zugrunde liegen. [siehe ACCeSS]

(optičko) prepoznavanje pismena (hr) [fraza] Prepoznavanje pisanog ili tiskanog jezika uvjetovano je time da je simbolička reprezentacija teksta izvedena iz prostornog oblika grafičkih oznaka. Za većinu jezika to podrazumijeva prepoznavanje i preoblikovanje pismena. Postoje dvije vrste prepoznavanja pismena: prepoznavanje skeniranih slika koje se naziva optičkim prepoznavanjem pismena, te prepoznavanje rukopisa, koje se obično naziva inteligentnim prepoznavanjem pismena. Optičko prepoznavanje pismena temeljeno na jednom tipu pisma može postići visok stupanj točnosti. Poteškoće se javljaju kada je tip pisma nepoznat ili pretjerano dekorativan ili kada je otisak slabe kvalitete. U takvim složenim slučajevima, kao i kod prepoznavanja rukopisa, dobri se rezultati mogu postići jedino korištenjem inteligentnog prepoznavanja pismena. To uključuje tehnike prepoznavanja riječi pri kojima se koriste jezični modeli, kao što su leksikoni ili statistički podaci o slijedu riječi.

Reconnaissance Optique des Caractères (fr) [locution] La reconnaissance d’un texte manuscrit ou dactylographié nécessite une transposition de la forme spatiale des signes graphiques en une représentation symbolique du langage. Pour la plupart des langues, ce processus se traduit par la reconnaissance et la transformation des caractères. Il existe deux types de reconnaissances des caractères : la reconnaissance d’images imprimées, appelée reconnaissance optique des caractères (OCR), et la reconnaissance de l’écriture manuscrite, appelée reconnaissance intelligente de l’écriture (ICR). L’application du système OCR à une seule famille de polices typographiques peut aboutir à un degré de précision très important. Des problèmes se posent lorsque la police est inconnue ou très stylisée ou lorsque l’impression est de mauvaise qualité. Dans ces situations difficiles et lorsque le texte est manuscrit, seule l’utilisation de l’ICR permet d’obtenir de bons résultats. Ce système nécessite des techniques de reconnaissance des mots utilisant des modèles linguistiq

riconoscimento ottico dei caratteri (it) [locuzione] Il riconoscimento ottico dei caratteri di una lingua scritta o stampata richiede la trasposizione della forma spaziale dei segni grafici in una rappresentazione simbolica della lingua. Perla maggior parte delle lingue, questo significa riconoscere e trasformare caratteri. Il riconoscimento dei caratteri può essere di due tipi: riconoscimento di immagini stampate, detto riconoscimento ottico dei caratteri (OCR) e riconoscimento della scrittura, detto comunemente riconoscimento intelligente dei caratteri (ICR) L'OCR da un tipo preciso di caratteri tipografici può raggiungere nella trasposizione un grado di precisione molto alto. I problemi sorgono quando il tipo di carattere è sconosciuto o molto decorativo o quando la stampa è di bassa qualità. In questi casi difficili, e nel caso di manoscritto, buoni risultati si ottengono soltanto con il riconoscimento intelligente dei caratteri. Questo implica delle tecniche di riconoscimento delle parole che utilizzano modelli linguistici, come lessici o infor

Reconocimiento óptico de caracteres (es) [frase] El Reconocimiento de textos escritos o impresos en una lengua determinada exige obtener una representación simbólica del lenguaje a partir de la forma estacial de sus signos gráficos. En la mayoría de las lenguas, esto significa reconocer y transformar caracteres. Hay dos casos de reconocimiento de caracteres: reconocimiento de imágenes impresas, lo que se denomina como reconocimiento óptico de caracteres (ROC en sus siglas inglesas), y reconocimiento de la escritura, lo que normalmente se denomina Reconocimiento Inteligente de Caracteres (ICR en sus siglas inglesas). El ROC puede lograr a partir de una familia de fuentes de impresión, un alto nivel de precisión. Los problemas vienen cuando la fuente se desconoce o es excesivamente decorativa, o cuando la calidad de la impresión es inferior. En estos casos de dificultad, así como en el caso de la escritura sólo pueden obtenerse buenos resultados empleando el RIC. El RIC consiste en técnicas de reconocimiento de las palabras que emplean modelos l

optinen merkintunnistus (fi) [sanaliitto] Kirjoitetun tai painetun tekstin tunnistus edellyttää että kielen graafisten merkkien muodoista tehdään symbolinen kielen edustuma. Useimmissa kielissä tämä merkitsee merkkien tunnistamista ja muuntamista. Merkintunnistusta on kahdenlaista: painetun tekstin tunnistamista, josta käytetään nimitystä optinen merkintunnistus (OCR), ja käsialan tunnistusta, joka tunnetaan yleensä älykkäänä merkintunnistuksena (ICR). Yhden painetun merkistön optinen merkintunnistus voi olla hyvinkin tarkkaa. Ongelmia syntyy, kun fontti on tuntematon tai koukeroinen tai painojälki on heikko. Vaikeissa tapauksissa ja käsin kirjoitetun tekstin kanssa hyviin tuloksiin päästään vain älykkäällä merkintunnistuksella. Siihen liittyy sanantunnistuksen tekniikoita, joissa käytetään kielen malleja, esimerkiksi sanastoja tai tilastollista tietämystä sanajonoista. [Katso ACCESS]

Optisk Tegngenkendelse (da) Genkendelse af skrevet eller trykt sprog kræver at en symbolsk repræsentation af sproget afledes af dens rumlige form af grafiske mærker. For de fleste sprog medfører dette genkendelse og transformation af tegn. Der er to slags tegngenkendelse: genkendelse af trykte former, kendt som OCR (Optical Character Recognition) og genkendelse af håndskrift, bedst kendt som ICR (Intelligent Character Recognition). OCR af tekster trykt med en enkelt familie af skrifttyper kan opnå en meget høj grad af nøjagtighed. Der opstår problemer hvis skrifttypen er ukendt eller meget dekorativ eller hvis trykkvaliteten er ringe. I disse vanskelige tilfælde, og ved håndskrift, kan gode resultater kun opnås gennem ICR. Dette involverer ordgenkendelsesteknikker som bruger sprogmodeller, såsom ordbøger eller statistisk information om ordsekvenser. [se ACCeSS]



Vir: Večjezični glosar jezikovnih tehnologij - Filozofski fakultet Sveučilišta u Zagrebu in Filozofska fakulteta Univerze v Ljubljani

Komentiraj slovarski sestavek