speech recognition (en) The sound of speech is received by a computer in analogue wave forms which are analysed to identify the units of sound (phonemes) which make up words. Statistical models of phonemes and words are used to recognise either discrete or continuous speech input. The production of quality statistical models requires extensive training samples (corpora) and vast quantities of speech have been collected and continue to be collected for this purpose. There are a number of significant problems to be overcome if speech is to become a commonly used medium for dealing with a computer. The first of these is the ability to recognise continuous, or spontaneous, speech rather than speech which is deliberately delivered by the speaker as a series of discrete words separated by a pause. The next is to recognise any speaker, avoiding the need to train the system to recognise the speech of a particular individual. There is also the serious problem of the noise which can interfere with recognition, either from the environ

razpoznavanje govora (sl) Računalnik prejme zvok govora v obliki analognih valov, ki jih analizira in razpozna zvokovne enote (foneme), ki sestavljajo besede. Statistični modeli fonemov in besed se uporabljajo za razpoznavanje diskretnega ali zveznega govornega vnosa. Za izdelavo kvalitetnih statističnih modelov potrebujemo obsežne poskusne vzorce (korpuse) in v ta namen so bile zbrane in se še naprej zbirajo velike količine govorjenega materiala. Da bi lahko govor postal običajen medij za sporazumevanje z računalniki, je treba rešiti številne večje težave. Ena od teh je zmožnost razpoznavanja zveznega (spontanega) govora in ne izključno govora, ki ga govorec namerno oblikuje kot niz posameznih besed, ločenih s premorom. Naslednja težava je, da mora računalnik biti sposoben razpoznati kateregakoli govorca, ne da bi bilo potrebno sistem naučiti razpoznavati govor določenega posameznika. Resno težavo predstavljajo tudi različni šumi iz okolja, ki lahko ovirajo razpoznavanje.

Spracherkennung (de) Die Laute der gesprochenen Sprache werden vom Computer in Form von Analogwellen erfa{ -}t; diese werden dann analysiert, um die Lautelemente (die sog. Phoneme) zu erkennen, aus denen die Wvrter bestehen. Eine Eingabe in Form von einzelnen Spracheinheiten oder von kontinuierlich gesprochener Sprache wird anhand von statistischen Phonem- und Wortmodellen erkannt. Zur Erstellung statistischer Modelle hoher Qualitdt werden umfangreiche Testproben (Korpora) benvtigt, und deshalb wurden und werden in erheblichem Umfang Sprachproben zusammengetragen. Wenn Sprache zu einem gemeinhin eingesetzten Medium f|r die Computerarbeit werden soll, sind einige Probelme von erheblichem Ausma{ -} zu bewdltigen. Das erste Problem dieser Art betrifft die Fdhigkeit, kontinuierlich oder spontan gesprochene Sprache zu erkennnen anstelle einer Sprache, die vom Sprecher bewu{ -}t in Form von aneinandergereihten, durch eine Pause getrennten einzelnen Wvrtern gesprochen wird. Ein weiteres Problem ist das Erkennen eines beliebigen Sprechers

prepoznavanje govora (hr) Računalo prima zvuk govora u obliku analognih valova koji se analiziraju kako bi se utvrdile zvukovne jedinice (fonemi) koje sačinjavaju riječi. Statistički modeli fonema i riječi rabe se za prepoznavanje diskretnog ili kontinuiranog govornog ulaza. Izrada kvalitetnih statističkih modela zahtijeva opsežne uzorke za obuku (korpuse) te su za tu svrhu prikupljene i nadalje se prikupljaju velike količine govornog materijala. Postoji niz poteškoća koja valja riješiti kako bi govor postao uobičajeni medij za komunikaciju s računalom. Prva poteškoća je sposobnost računala da prepoznaje kontinuirani, spontani govor, a ne samo govor koji je namjerno izgovoren kao niz diskretnih riječi odvojenih stankama. Druga poteškoća je prepoznavanje bilo kojeg govornika, bez potrebe za obučavanje sustava da prepoznaje govor pojedinih govornika. Postoji i ozbiljan problem buke koja može ometati prepoznavanje, bilo one koja nastaje u okruženju u kojem govornik rabi sustav, bilo one koju uzrokuje medij za transmisiju, npr. te

reconnaissance de la parole (fr) L’ordinateur pergoit la parole sous forme d’ondes analogiques qu’il analyse afin d’identifier les iliments sonores (appelis phonhmes) dont sont constituis les mots. Des modhles statistiques de phonhmes et de mots sont utilisis pour reconnantre les flux continus ou discontinus de parole. La production de modhles statistiques de qualiti nicessite de nombreux ichantillons d’entrannement (corpus) et de grandes quantitis d’archives sonores ont dij` iti collecties et continuent d’jtre recueillies ` cette fin. Pour que la parole devienne un moyen courant d’interaction avec des ordinateurs, il faut encore risoudre certains problhmes majeurs. Au premier rang d’entre eux figure l’aptitude ` reconnantre la parole en continu ou spontaniment pluttt qu’un discours sciemment formuli sous forme d’une sirie discontinue de mots entrecoupis par des pauses. Ces systhmes doivent igalement jtre capables de comprendre tous les locuteurs, ce qui ivitera d’avoir ` les paramitrer avant de reconnantre la voix d’une personne

riconoscimento della voce (it) Il suono della voce h percepito dall’elaboratore elettronico in forma di onde analogiche, che sono analizzate per identificare le unit` di suono (fonemi) che costituiscono le parole. Il riconoscimento del parlato, per singole parole o continuo, avviene sulla base di modelli statistici dei fonemi e delle parole. Per produrre modelli statistici di qualit`, sono stati e continuano ad essere raccolti ampi corpus di esempi di discorsi. Perchi la voce diventi uno strumento di uso corrente nella interazione con l’elaboratore elettronico, restano da risolvere alcuni problemi di rilievo. Il primo di questi h la capacit` di riconoscere il discorso continuo, o spontaneo, contrapposto al discorso pronunciato intenzionalmente come una serie di parole distinte separate da una pausa. Un altro problema h la capacit` di riconoscere qualsiasi locutore, in modo da evitare la necessit` di insegnare al sistema a riconoscere la voce di una determinata persona. Una grossa difficolt` h rappresentata dal rumore che pur i

Reconocimiento del habla (es) El ordenador recibe el sonido de la voz en forma de ondas analsgicas que se analizan para identificar las unidades de sonido (denominadas fonemas) constitutivas de las palabras. Se utilizan modelos estadmsticos de fonemas y de palabras para reconocer la introduccisn de datos de voz discretos o continuos. La produccisn de modelos estadmsticos de calidad requiere disponer de amplias muestras de formacisn (corpus). Con este fin, se han recogido ya y se seguiran recogiendo enormes cantidades der datos de voz. No obstante, deberan superarse muchmsimos problemas para que el habla llegue a utilizarse de manera generalizada como medio para comunicarse con un ordenador. El primero de ellos es la capacidad de reconocer voz continua, o espontanea, en lugar de enunciados emitidos deliberadamente por el orador en forma de palabras independientes separadas por una pausa. El problema siguiente es reconocer a cualquier orador, evitando la necesidad de entrenar el sistema en el reconocimiento de la voz de una per

puheentunnistus (fi) Tietokone ottaa vastaan puheddnen analogisessa aaltomuodossa, jota analysoidaan sanat muodostavien ddnneyksikviden (foneemien) tunnistamiseksi. Foneemien ja sanojen tilastollisia malleja kdytetddn joko irrallisen tai jatkuvan puheen tunnistamiseen. Laadukkaiden tilastollisten mallien tuottaminen edellyttdd laajoja opetusaineistoja (korpuksia) ja huomattavia mddrid puhetta on koottu ja kootaan tdhdn tarkoitukseen. Jotta puheesta tulisi yleisesti kdytetty vdline tietokoneen kanssa kommunikoimisessa, on voitettava joukko merkittdvid ongelmia. Ensimmdinen ndistd on kyky tunnistaa jatkuvaa tai spontaania puhetta, sen sijaan ettd tunnistettaisiin puhetta, jonka puhuja on jo tauottanut selkedsti erillisiksi sanoiksi. Seuraava ongelma on tunnistaa kuka tahansa puhuja ilman ettd jdrjestelmdd tarvitsee opettaa tunnistamaan tietyn yksilvn puhetta. Melu on myvs vakava ongelma, joka sekoittaa tunnistusta; melu voi tulla ympdristvstd, jossa puhuja kdyttdd jdrjestelmdd tai se voi tulla puheen vdlityskanavasta

Talegenkendelse (da) Lyden af tale overfxres til en datamat som analoge bxlger som analyseres for at fastlfgge de lydenheder (fonemer) som danner ord. Der bruges statistiske modeller af fonemer og ord til at genkende enten diskret eller sammenhfngende tale-inddata. Frembringelsen af velfungerende statistiske modeller krfver omfattende samlinger af trfningseksempler (korpora), og store mfngder tale er blevet og bliver stadig optaget til dette formel.En rfkke vigtige krav skal opfyldes, hvis tale skal blive et almindeligt brugt medium til at kommunikere med en datamat pe. Det fxrste er evnen til at genkende sammenhfngende spontan tale, i modsftning til en sekvens ord der bevidst udtales enkeltvis med pause imellem. Det nfste er genkendelsen af enhver talende, se man ikke skal trfne systemet til at genkende enkeltindividers mede at tale pe. Dertil kommer problemet med stxj som kan besvfrliggxre genkendelse, enten fra de omgivelser hvor den talende bruger systemet eller stxj opsteet i transmissionsmediet, f.eks. telefonlinjen. Stxjr



Vir: Večjezični glosar jezikovnih tehnologij - Filozofski fakultet Sveučilišta u Zagrebu in Filozofska fakulteta Univerze v Ljubljani

Komentiraj slovarski sestavek