character recognition (en) Optical Character Recognition of written or printed language requires that a symbolic representation of the language is derived from its spatial form of graphical marks. For most languages this means recognising and transforming characters. There are two cases of character recognition: recognition of printed images, referred to as Optical Character Recognition (OCR), and recognising handwriting, usually known as Intelligent Character Recognition (ICR). OCR from a single printed font family can achieve a very high degree of accuracy. Problems arise when the font is unknown or very decorative or when the quality of the print is poor. In these difficult cases, and in the case of handwriting, good results can only be achieved by using linguistic intelligence. This involves word recognition techniques which use language models, such as lexicons or statistical information about word sequences.

prepoznavanje znakov (sl) (Optično) prepoznavanje znakov v pisanih ali tiskanih besedilih zahteva, da je simbolična predstavitev jezika izpeljana iz prostorske oblike grafičnih znakov. Pri večini jezikov to pomeni prepoznavanje in preoblikovanje znakov. Poznamo dva načina prepoznavanja znakov: prepoznavanje tiskanih slik, kar imenujemo optično prepoznavanje znakov, in prepoznavanje rokopisa, ki je znano kot inteligentno prepoznavanje znakov. Optično prepoznavanje znakov istega tipa pisave lahko doseže zelo visoko stopnjo natančnosti. Težave se pojavijo, ko je tip znakov neznan ali zelo dekorativen ali pa, ko je tisk slabe kakovosti. V takšnih zapletenih primerih, pa tudi pri prepoznavanju rokopisa, lahko dosežemo dobre rezultate le z uporabljanjem jezikovne intelegence. To vključuje metode prepoznavanja besed, ki uporabljajo jezikovne vzorce, kot so leksikoni ali statistični podatki o zaporedju besed.

optische Zeichenerkennung (de) Optische Zeichenerkennung von Sprache in geschriebener oder gedruckter Form setzt voraus, daß von der räumlichen Darstellung der Sprache in Form von graphischen Zeichen eine symbolische Darstellung abgeleitet wird. Für die meisten Sprachen bedeutet dies, daß Zeichen erkannt und umgewandelt werden. Es gibt zwei Möglichkeiten der Zeichenerkennung: die Erkennung von Druckbildern, bezeichnet als optische Zeichenerkennung (OCR), und die Erkennung von Handschrift, bekannt unter der Bezeichnung Intelligente Zeichenerkennung (ICR). OCR kann nur bei einer Schriftartenfamilie einen hohen Grad an Präzision erzielen. Probleme entstehen dann, wenn die Schriftart unbekannt, verschnörkelt oder von minderwertiger Qualität ist. In solchen schwierigen Fällen wie auch bei Handschriften lassen sich gute Ergebnisse nur mit Hilfe linguistischer Intelligenz erzielen. Hierfür bedarf es Worterkennungstechniken, die Sprachmodelle verwenden wie z.B. Lexika oder statistische Informationen zu Wortfolgen.

prepoznavanje pismena (hr) (Optičko) prepoznavanje pismena u pisanim ili tiskanim tekstovima zahtijeva stvaranje simboličke reprezentacije jezika iz njenog prostornog oblika grafičkih oznaka. Kod većine jezika, to znači prepoznavanje i preoblikovanje pismena. Postoje dvije vrste prepoznavanja pismena: prepoznavanje tiskanih slika koje se naziva optičkim prepoznavanjem pismena te prepoznavanje rukopisa, koje se obično naziva inteligentnim prepoznavanjem pismena. Optičko prepoznavanje pismena temeljno na jednom tiskanom tipu pisma može postići visok stupanj točnosti. Poteškoće se javljaju kada je tip pisma nepoznat ili pretjerano dekorativan ili kada je tisak slabe kvalitete. U takvim složenim slučajevima, kao i kod prepoznavanja rukopisa, dobri se rezultati mogu postići jedino korištenjem jezične inteligencije. To uključuje tehnike prepoznavanja riječi pri kojima se koriste jezični modeli, kao što su leksikoni ili statistički podaci o slijedu riječi.

reconnaissance optique des caractères (fr) La reconnaissance optique des caractères ou d' un texte manuscrit ou dactylographié nécessite une transposition de la forme spatiale des signes graphiques en une représentation symbolique du langage. Pour la plupart des langues, ce processus se traduit par la reconnaissance et la transformation des caractères. Il existe deux types de reconnaissance des caractères : reconnaissance d' images imprimées, appelée reconnaissance optique des caractères (OCR) et reconnaissance de l' écriture manuscrite, appelée reconnaissance intelligente de l' écriture (ICR). L' application de l' OCR limitée à une seule famille de polices typographiques peut aboutir à un degré de précision très important. Des problèmes se posent lorsque la police est inconnue ou très stylisée ou lorsque l' impression est de mauvaise qualité. Dans de telles situations difficiles et lorsque le texte est manuscrit, seule l' utilisation de la reconnaissance linguistique permet d' obtenir de bons résultats, ce qui nécessite des techniques de reconna

riconoscimento dei caratteri (it) Il riconoscimento ottico dei caratteri di una lingua scritta o stampata richiede la trasposizione della forma spaziale dei segni grafici in una rappresentazione simbolica della lingua. Perla maggior parte delle lingue, questo significa riconoscere e trasformare caratteri. Il riconoscimento dei caratteri può essere di due tipi: riconoscimento di immagini stampate, detto riconoscimento ottico dei caratteri (OCR) e riconoscimento della scrittura, detto comunemente riconoscimento intelligente dei caratteri (ICR) L'OCR da un tipo preciso di caratteri tipografici può raggiungere nella trasposizione un grado di precisione molto alto. I problemi sorgono quando il tipo di carattere è sconosciuto o molto decorativo o quando la stampa è di bassa qualità. In questi casi difficili, e nel caso di manoscritto, buoni risultati si ottengono soltanto con il riconoscimento intelligente dei caratteri. Questo implica delle tecniche di riconoscimento delle parole che utilizzano modelli linguistici, come lessici o infor

Reconocimiento de caracteres (es) Reconocimiento óptico de caracteres de lenguaje escrito o impreso. Exige obtener una prepresentación simbólica del lenguaje a partir de la forma espacial de sus símbolos gráficos. En la mayoría de las lenguas esto significa reconocer y transformar caracteres. Hay dos tipos de reconocimiento de caracteres: reconocimiento de imágenes impresas, denominado reconocimiento óptico de caracteres (OCR en sus siglas inglesas), y reconocimiento de escritura, frecuentemente designado como reconocimiento inteligente de caracteres (ICR en sus siglas inglesas). El ROC puede lograr a partir de una familia de fuentes de impresión, un elevado nivel de precisión. Los problemas vienen cuando la fuente se desconoce o es escesivamente decorativa, o cuando la calidad de la impresión es inferior. En estos casos de difícultad, así como en el caso de la escritura, sólo pueden obtenerse buenos resultados utilizando el reconocimiento inteligente de caracteres. El RIC consiste en técnicas de reconocimiento de las palabras q

merkintunnistus (fi) Kirjoitetun tai painetun tekstin tunnistus edellyttää että kielen graafisten merkkien muodoista johdetaan symbolinen kielen edustuma. Useimmissa kielissä tämä merkitsee merkkien tunnistamista ja muuntamista. Merkintunnistusta on kahdenlaista: painetun tekstin tunnistamista, josta käytetään nimitystä optinen merkintunnistus (OCR), ja käsialan tunnistusta, joka tunnetaan yleensä älykkäänä merkintunnistuksena (ICR). Yhden painetun merkistön optinen merkintunnistus voi olla hyvinkin tarkkaa. Ongelmia syntyy, kun fontti on tuntematon tai koukeroinen tai painojälki on heikko. Vaikeissa tapauksissa ja käsin kirjoitetun tekstin kanssa hyviin tuloksiin päästään vain älykkäällä merkintunnistuksella. Siihen liittyy sanantunnistuksen tekniikoita, joissa käytetään kielen malleja, esimerkiksi sanastoja tai tilastollista tietämystä sanajonoista.

Tegngenkendelse (da) Optisk tegngenkendelse af skrevet eller trykt sprog kræver at en symbolsk repræsentation af sproget afledes fra dens rumlige form af grafiske mærker. For de fleste sprog medfører dette genkendelse og transformation af tegn. Der er to slags tegngenkendelse: genkendelse af trykte former, kendt som OCR (Optical Character Recognition) og genkendelse af håndskrift, bedst kendt som ICR (Intelligent Character Recognition). OCR af tekster trykt med en enkelt familie af skrifttyper kan opnå en meget høj grad af nøjagtighed. Der opstår problemer hvis skrifttypen er ukendt eller meget dekorativ, eller hvis trykkvaliteten er ringe. I disse vanskelige tilfælde, og ved håndskrift, kan gode resultater kun opnås gennem sproglig forståelse. Dette involverer ordgenkendelsesteknikker som bruger sprogmodeller, såsom leksika eller statistisk information om ordsekvenser.



Vir: Večjezični glosar jezikovnih tehnologij - Filozofski fakultet Sveučilišta u Zagrebu in Filozofska fakulteta Univerze v Ljubljani

Komentiraj slovarski sestavek