Q. Wat is continue spraakherkenning en discrete spraakherkenning?
A. Continue spraakherkenning is het proces van continu spreken of dicteren tegen een pc, zonder pauzes tussen individuele woorden, zoals een converstatie, om zo programma- of systeemcodes in te voegen of een teksttranscriptie van heel hoge kwaliteit. Het doel is om het toetsenbord en de muis als interface van de computer volledig te vervangen, om zo het comfort en prestaties te verhogen van de gebruiker. Verschillende studies hebben eigenlijk al bevestigd dat iedereen een tekst kan genereren door het te dicteren aan de computer, die overigens drie keer sneller is dan de beste typist!... In vergelijking, bij discrete spraakherkenning moeten de gebruikers kort pauzeren tussen ieder individueel woord, wat zekere oefening vergt. Continue spraakherkenning vergt meer van de computer en is aangenamer voor de gebruiker. Huidige toepassingen van deze soort zijn spreker-afhankelijk. Ze vergen wat meer basistraining om de unieke stem te herkennen van elke gebruiker, door voorbeeldwoorden uit te spreken. Deze oefening duurt ongeveer 15 tot 20 minuten, maar met software die op Intel Pentium IV en Intel Core Duo werkt, hebben gebruikers van Dragon NaturallySpeaking Professional maar 3 tot 5 minuten nodig!
Q. Wanneer en hoe is deze technologie op de markt verschenen?
A. Continue spraakherkenning is al sinds het begin van de computerindustrie het doel geweest. Hoewel het slechts enkele jaren geleden is, toch eerder dan verwacht, de komst van Pentium III computerklasse en aanzienlijke verbeteringen in geluidsverwerking, akoestische ontwerpen, stemregistratie en taalverwerking kwam, continue spraakherkenning een werkbaar en praktische oplossing werd. In juni 1997, introduceerde Dragon Systems de eerste universele continue spraakherkenningsprogramma voor de computer onder de geregistreerde naam Dragon NaturallySpeaking. Het duurde niet lang vooraleer andere distributeurs van spraakherkenningstoepassingen reageerden. IBM corporation volgde al snel met ViaVoice. En twee anderen, Lernout & Hauspie spraakherkenningsproducten (VoiceXPress) en Philips Electronics (FreeSpeech) betreedden ook deze opkomende markt, maar zijn op vandaag beide niet meer te verkrijgen.
Q. Wie heeft voordeel bij continue spraakherkenning? Is het ook geschikt voor mij?
A. De doelgroep voor deze toepassing omvat:
Sales professionals, telewerkers en mobile professionals
Iedereen die notulen neemt na vergaderingen of actiepuntenlijsten maakt zal ondervinden dat gedachten snel opgevangen kunnen worden door natuurlijk en continu te dicteren tegen een PC, zelfs onderweg.
Kaderleden en anderen niet houden van typen
De meeste kaderleden moeten het nu stellen zonder een toegewijd administratief personeel. Velen van hen hebben niet geleerd hoe ze efficiënt kunnen typen en kunnen zich ietwat onwennig voelen met een toetsenbord. Deze toepassingen laat hen nu toe om teksten sneller te dicteren en met steeds correcte spelling!
Kleine zakenmensen en medewerkers op thuiskantoor (SOHO)
Iedereen zonder een secretaresse zal het gemakkelijker vinden om geschreven werk sneller en gemakkelijker gedaan te krijgen in een diverse waaier van bussiness toepassingen, die tijd sparen en productiviteit doen stijgen.
Juridische en Medische Professionals
Deze professionals moeten gewoonlijk heel wat rapporten, records, notities, brieven en andere documenten opmaken. Daarvoor bieden sommige producenten gespecialiseerde producten aan voor deze professionals, zoals: Dragon NaturallySpeaking Legal Suite en Dragon NaturalSpeaking Medical Suite die elk een brede woordenschat aanbieden met mobiele ondersteuning. Deze reeks zijn op dit moment enkel beschikbaar in Amerikaans Engels en Duits; extra taalondersteuning is in ontwikkeling of wordt aangeboden door derde partijen in andere talen.
Schrijvers en auteurs
Iedereen die heel veel teksten schrijft kan dit gewoon doen door tegen een PC te spreken en zien zo hun woorden op het scherm verschijnen, wat bovendien ook de creativiteit en plezier verhoogt. Blinde, gehandicapten en gebruikers met kans op RSI
Omdat de professionele versie van de meeste programma's over een play back functie beschikken, zullen blinde mensen de tekst die ze gedicteerd hebben horen, omdat het ook herkend wordt door de PC. Daarbij komt ook dat iedereen die heel wat tijd spendeert aan het typen van teksten zal ondervinden dat spraakherkenning het risisco op letsels door het gebruik van toetsenbord en muis verminderd. Trouwens, de Europese Richtlijn 2000/78/CE, van kracht sinds december 2003, zet bedrijven en openbare diensten ertoe "gelijkheid van kansen" te garanderen aan hun werknemers die leiden aan deze beperkingen. Dit door hen te voorzien van om het even welke technologische toepassingen die zij nodig hebben, zoals bijvoorbeeld spraakherkenning.
Q. Is er een continue spraakherkenningssysteem dat ondersteund wordt door MAC OS?
A. Beide Dragon systemen en IBM kondigden de lancering aan van speciale versies van hun programma's, Dragon NaturallySpeaking en ViaVoice, voor de iMac tegen het einde van 1999. Toch is op dit moment enkel ViaVoice beschikbaar voor Mac.
Q. Wat is het beste continue spraakherkenningsprogramma van ze allemaal?
A. Volgens een van de meest bevoegde en uitvoerige beoordelingen ooit gepubliceerd ("Speech Recognition: Finding Its Voice", PC Magazine):
"Of the four, NaturallySpeaking consistently delivered the best accuracy. Voice Xpress makes an impressive debut with tight Microsoft Word-integration and the second-best accuracy. ViaVoice offers unparalleled command-and-control capabilities, but its accuracy was disappointing. Finally, FreeSpeech costs a lot less than the competition, but it also gives you a lot less".
Merk op dat nauwkeurigheid en snelheid niet meer de enige regels van het spel zijn. Met de meest professionele versies van deze programma's, die gelijkaardige prestaties leveren, maakt een gebruikersvriendelijke interface voor correctie en aanpassingen voor de gedicteerde tekst toch een groot verschil.
Q. Wat is de nauwkeurigheid en de snelheid?
A. Onafhankelijke beoordelers en veel gebruikers halen een dictatiesnelheid van tot wel 160 woorden per minuut met een nauwkeurigheid van 95-98%, dat is met ongeveer 2-5% transcriptiefouten, met de professionele versie van deze producten. Bijvoorbeeld: Dragon NaturallySpeaking "haalde tot 99% nauwkeurigheid" bij het testen door derden van PC Magazine ("Speech Recognition: Finding Its Voice"). Hoewel deze resultaten soms een zekere training en aanpassing - ontwikkeling van gespecialiseerde woordenboeken die het herkenningsproces vergemakkelijken en zelfs stemgeactiveerde macro's voor het invoegen van standaardtekst - kan je toch snelheden halen van 150 woorden en meer per minuut met een nauwkeurigheid van 92-94% - na de eerste training van 3 tot 5 minuten - met de professionele versie van deze producten. Zoals het enkele jaren geleden gebeurde met Optical Character Recognition (OCR) software, een lagere snelheid dan dat is niet echt kostenbesparend voor professioneel werk, omdat de gebruiker het merendeel van zijn gespaarde tijd zal gebruiken om transcriptiecorrecties te dicteren tegen de PC. Dit is waarom SpeechWare enkel de beste professionele versies van deze producten anabiedt.
Q. Welke talen zijn op dit moment beschikbaar voor continue spraakherkenning? Zijn er meertalige versies voor polyglots?
A. Dragon NaturallySpeaking is nu beschikbaar in:
Aan de andere kant, meertaligheid wordt volledig ondersteund in de professionele versies van deze producten. Polyglot gebruikers kunnen eenvoudigweg wisselen tussen verschillende taalmodules van dezelfde toepassing, omdat zij verschillende talen gebruiken. Trouwens, sommige meertalige toepassingen, zoals Dragon NaturallySpeaking, omvatten verschillende taalmodellen - zie de "Software" sectie van deze website voor meer informatie. Dit vermindert de totale kost aanzienlijk.
Q. Hoe gemakkelijk is het om tegen een PC te dicteren en uiteindelijk de tekst te importeren in een andere toepassing?
A. Gebruikers kunnen direct dicteren in het scherm van de gestroomlijnde woordenverwerker voorzien door deze programma's of virtueel in iedere Windows toepassing, zoals grote tekstverwerkers - Microsoft Word, WordPerfect en Lotus WordPro - of e-mailtoepassingen. De eerste oplossing is veel efficiënter, zeker voor trage computers, omdat de tekstverwerkers meer geoptimaliseerd zijn voor stemopdrachten, snelheid en prestatie. Als de gebruikers dit doen, kunnen zij de tekst exporteren naar andere toepassingen met de standaard Windows methode van "copy/paste". Bestanden kunnen ook bewaard worden als ASCII, Rich Text Format of Doc, die gemakeklijk te lezen zijn door grote tekstverwerkers. Bovendien, NaturallySpeaking, ViaVoice, en VoiceXpress ondersteunen allemaal "modeless operation", dus de gebruiker kan naadloos wisselen tussen dictatie en andere taken - correcties, aanpassingen, uitvoeren van stemopdrachten, gebruik van het toetsenbord wanneer dan ook, etc. De drie herkennen ook Microsoft Word "natuurlijke" of gewone stemopdrachten tijdens dictatie, dat wil zeggen, zonder de gebruikers eraan te doen herinneren wat de exacte naam is van ieder commando in de toepassing om het te gebruiken.
Q. Kan je dicteren, corrigeren of aanpassen later doen, of moet je de gehele dictatie in één keer doen? Hoe?
A. Alle huidige professionele systemen laten zowel dictatie als correctie of aanpassing gelijktijdig toe en tijdens dezelfde sessie. Bovendien zijn sommige er zelfs van voorzien de gebruiker zijn stem op een later tijdstip terug af te spelen door simpelweg de woorden aan te duiden en het geschikte commando uit te voeren. Deze functie vergemakkelijkt corrigeren, nalezen en aanpassen door een assistent by uw afwezigheid. Met onze Transcription Aid voor Dragon NaturallySpeaking kan uw secretaresse zelfs het gebruikersprofiel updaten - een nodige taak voor het verbeteren van de herkenningsnauwkeurigheid - tijdens het corrigeren, om de nauwkeurigheid van de persoon die het bestand gecreëerd heeft, te verbeteren! Vele kaderleden nemen de stap richting spraakherkenning dankzij dit eerste en indrukwekkend kenmerk!...
Q. Is het mogelijk om met goede resultaten te dictere in een luidruchtige omgeving?
A. Met de recente introductie van Active Noise Cancelling microfonen, die achtergrondlawaai op een efficiënte manier filteren, kan u in praktisch elke omgeving dicteren met goede resultaten: een luidruchtig kantoor, een treinstation, een vliegtuig!...
Q. Worden er meerdere gebruikers ondersteund?
A. Technisch gesproken kunnen meerdere mensen op het kantoor hetzelfde programma gebruiken op verschillende tijdstippen van de dag, als zij het installeren op een enkele PC en ze hun eigen gebruikersprofiel aanmaken, na training of aanpassing aan hun eigen stem van enkele minuten. Hoewel, wettelijk gesproken zou iedere individuele gebruiker een licentie moeten kopen zelfs al delen zij dezelfde applicatie.
Q. Kan je deze toepassingen gebruiken op een netwerk?
A. Sommige professionele systemen, zoals Dragon NaturallySpeaking Professional 9, bieden networking mogelijkheden, die gelijktijdige spraakherkenning bij verschillende gebruikers op het netwerk toestaat. Ieder van hen zal hun eigen gebruikersprofiel moeten behouden op hun computer, terwijl de herkenningsmotor en andere gerelateerde bestanden gedeeld zullen worden. Deze oplossing is ideaal voor grote organisaties, omdat het veel efficiënter is en de aankoopkosten van computersoftware doet dalen.
Q. Ik heb voornamelijk een draagbaar toestel nodig: kan een laptop, notebook, sub-notebook computer of zelfs een manuele recorder gebruikt worden met deze toepassingen?
A. Alle bestaande professionele Continue spraakherkenningsprogramma's kunnen op een efficiënte manier gebruikt worden op een goede laptop, notebook en subnotebook die werken op batterijen. Een groot probleem met deze uitrusting kan zijn dat het niet volledig voldoet aan de vereiste geluidseisen van deze applicaties, omdat zij meer blootgesteld worden aan "intern geluid" dan bureaumachines door het hoge gehalte van fysische integratie met hun componenten. SpeechWare raadt verschillende modellen aan met buitengewoon goede akoestiek die feilloos werken. Als u al over een notebook beschikt met slechte geluidsprestatie, dan kan u een USB microfoon en geluidskaart combo gebruiken dat geoptimaliseerd is voor spraakherkenning.
De voordelen van dit toestel zijn drievoudig:
Inzake manuele digitale recorders, zijn er een aantal op de markt - geproduceerd door Olympus, Sony, Norcom, etc - die gebruikt kunnen worden met de professionele versie van deze programma's zoals u kan zien in de Hand-held digital recorders sectie op deze website. Ze bieden "latere" transcriptie van opgenomen bestanden in praktisch elke PC - ook de trage. Hun nauwkeurigheid is vrij hoog - tot 96% -, vooral wanneer ze gebruikt worden met een professionele microfoon voor spraakherkenning aangesloten in de Mic-In port.
Eindelijk kan je met Transcription Aid voor Dragon NaturallySpeaking dezelfde resultaten bereiken als met een digitale recorder, maar gebruikmakend van vrijwel iedere persoonlijke digitale assistent- Pocket PC, PalmPilot of Clié - en zelfs een Windows smartphone - een 's werelds eerste kenmerk!