Automatická identifikácia telefonických hovorov založená na hlasových charakteristikách

Číslo patentu: E 12819

Dátum: 28.12.2004

Autor: Pascovici Andrei

Je ešte 20 strán.

Pozerať všetko strany alebo stiahnuť PDF súbor.

Text

Pozerať všetko

Automatická identifikácia telefonických hovorov založená na hlasových charakteristikách.0001 Predkladaný vynález sa týka počítačom implementovaného spôsobu a zariadenia na automatickú identifikáciu telefonických hovorov založených na hlasových charakterístikách. Predkladaný vynález sa týka najmä počítačovej techniky rozpoznávania reči pre smerovanie a triedenie prichádzajúcich telefónnych hovorov.0002 V telefónnych komunikačných systémoch sa na smerovanie alebo predbežné triedenie hovorov často používajú call centrá založené na odpovediach volajúceho na automatizované výzvy. Takéto mechanizmy založené na odpovediach na výzvy sú často časovo náročné,pretože volajúci sa musí riadiť veľkým množstvom výziev než je presmerovaný k požadovanému príjemcovi alebo na informačnú databázu. Tieto mechanizmy sa taktiež spoliehajú na to, že volajúci bude správne postupovať podľa príkazov. Ak volajúci nespolupracuje s prñcazmi, hovor nemožno správne presmerovať. Podobne, mechanizmy na triedenie hovorov sa spoliehajú na spoluprácu s volajúcim v tom, že bude pravdivo reagovať na výzvy. Preto je pre volajúceho a prijímateľa ťažké správne a efektívne smerovať a triediť hovory.0003 Preto boli navrhnuté systémy na rozpoznávanie reči ako pomoc v procese presmerovania hovorov. Avšak, systémy rozpoznávania reči sa tiež spoliehalí na mechanizmus výzvy a odpovede, kedy volajúci musí reagovať na vopred stanovené výzvy. Napríklad, systém môže požiadať, aby volajúci udal meno volajúceho a/alebo vopred určené slovo alebo sekvenciu slov predstavujúcich predmet hovoru alebo identitu požadovaného príjemcu. Opäť platí, že tieto systémy sú účinné iba vtedy, ak volajúci odpovedá pravdivo,keď reaguje na vopred určené výzvy. Modely na rozpoznávanie reči, ktoré sa používajú na stanovenie obsahu reči, musia byť tiež schopné presne segmentovať obsah na základe širokého rozsahu charakteristík hlasového vstupu rôznych volajúcich. Takéto systémy môžu byť časovo náročné alebo nepresné a nespolupracujúci volajúci ich môže ľahko obísť.0004 Automatické presmerovanie a triedenie prichádzajúcich telefónnych hovorov na základe hlasových charakteristík preto vyžaduje vylepšené metódy.0005 Rosenberg, Aaron E. et al. Triedenie hlasovej pošty volajúcim pomocou rozpoznávania hovoriaceho nezávisle od textu, Zbomík z medzinárodnej konferencie reči a spracovania jazyka, ICSLP 2000, Vol. 2, str. 474 - 477, sa vzťahuje k triedeniu hlasových správ volajúcim pomocou rozpoznávania hovoriaceho nezávisle od textu. Prejav prichádzajúcej správy je spracovávaný a hodnotený v porovnaní s modelmi volajúcich. Správa, ktorej skóre zhody prekročí prahovú hodnotu, je zaradená do zložky zhodného volajúceho inak je označený ako neznámy volajúci. Telefónny účastník je schopný počúvať neznámu správu a založiť ju do správnej zložky, pokiaľ existuje, alebo vytvoriť novú zložku, ak neexistuje. Takto účastníkom označené správy sa používajú na trénovanie a prispôsobovanie modelov volajúcich.0006 Carex, M. J. et al. Systém na overovanie hovoriaceho pomocou alfa-sietí,Spracovávanie reči 2, VLSI, Medzinárodná konferencia o akustike, reči a spracovaní signálu,ICASSP, IEEE, USA, Vol. 2, Konf. 16, str. 397 - 400, sa vzťahuje k systému na overovaniehovoriaceho pomocou alfa-sietí. V najjednoduchšej forme overovacieho systému sa navrhujú dva celé slovné modely. Jeden model je odvodený od výpovede hovoriaceho, ktorý sa overuje. Druhý model je odvodený od výpovede vzorky populácie vo všeobecnosti. Výstupom verifikačného testu pre každý model je log miera pravdepodobnosti z rámcového synchrónneho Viterbiho hľadania. Potom je vypočítaný rozdiel medzi skóre pre osobný a všeobecný model a porovnaný s prahovou hodnotou. Ak je rozdiel vyšší ako prahová hodnota,osoba je akceptovaná.0007 Leggetter, Woodland Adaptácia hovoriaceho kontinuálnej hustoty HMM pomocou viacnásobnej lineámej regresie, ICSLP 94 1994 Medzinárodná konferencia o spracovaní hovoreného jazyka, Yokohama, Japonsko, september 18-22, 1994 využíva počiatočný súbor osvedčených nezávislých modelov hovoriacich a prispôsobuje modálne parametre novému hovoriacemu transfonnácíou stredných parametrov modelov súborom lineámych transformácii. Transformácie sú nájdené pomocou kritéria maximálnej pravdepodobnosti,ktoré je podobným spôsobom ímplementované na štandardné ML trénovacie algoritmy pre0008 Predmetom tohto vynálezu je zníženie tréningového času pre nový akustický model nového volajúceho.0009 Tento predmet je splnený vynálezom opísaným V nezávislých nárokoch. Výhodné uskutočnenia sú definované závislými nárokmi.0010 Jedno uskutočnenie predkladaného vynálezu je zamerané na spôsob identifikácie volajúceho v hovore volajúceho príjemcovi. Hlasový vstup prichádza od volajúceho a je rozdelený na pododdiely. Charakteristiky každého pododdielu sa aplikujú na pluralitu akustických modelov, ktoré zahŕňajú všeobecný akustický model a akustické modely akýchkoľvek skôr identifikovaných volajúcich, aby sa získala pluralita príslušných akustických skóre, ktoré reprezentujú, nakoľko charakteristiky v každom pododdiele zodpovedajú príslušným akustickým modelom. Pre každý pododdiel je identifíkovaný akustický model s najlepším akustickým skóre. Volajúci je identífikovaný ako jeden zo skôr identifikovaných volajúcich iba v prípade, ak najlepšie akustické skóre pre všetky pododdiely zodpovedajú tomu istému skôr identifikovanému volajúcemu. Inak je volajúci ídentifikovaný ako nový volajúci. Ak je volajúci ídentifikovaný ako nový Volajúci, vygeneruje sa nový akustický model pre nového volajúceho, ktorý je preňho špecifický.001 l Ďalšie uskutočnenie predkladaného vynálezu je zamerané na systém na identifikáciu volajúceho v hovore volajúceho príjemcovi. Systém obsahuje prijímača pre príjem hlasového vstupu od volajúceho a schránku akustického modelu na ukladanie plurality akustických modelov. Pluralita akustického modelu zahŕňa všeobecný akustický model a akustické modely všetkých skôr identifikovaných volajúcich. Systém ďalej obsahuje prostriedok na rozdelenie hlasového vstupu do pododdielov. Okrem toho, systém zahŕňa prostriedok na aplikovanie charakteristík každého pododdielu na pluralitu akustických modelov na získanie plurality príslušných akustických skóre, ktoré vyjadrujú, nakoľko charakteristiky v každom pododdiely vyhovujú príslušným akustickým modelom. Okrem toho zahŕňa systém pre každý pododdiel prostriedky pre identifikáciu akustického modelu, ktorý má najlepšie akustické skóre pre tento pododdiel a prostriedky na identifikáciu volajúceho ako jedného zo skôr identifikovaných volajúcich, iba ak najlepšie akustické skóre pre všetky pododdiely-3 zodpovedajú tomu istému skôr identifikovanému volajúcemu. Navyše, sú tu prostriedky na identifikáciu volajúceho ako nového volajúceho. Ak je volajúci identifikovaný ako nový volajúci, akustické generačné prostriedky generujú nový akustický model pre nového0012 Ďalšie uskutočnenie predkladaného vynálezu je zamerané na počítačovo čitateľné médium obsahujúce počitačovo vykonateľné inštrukcie, ktoré pri vykonávaní počítačom vykonávajú spôsob identifikácie volajúceho hovoru. Tento spôsob zahŕňa prijímanie hlasového vstupu od volajúceho a rozdelenie hlasového vstupu do pododdielov. Charakteristiky každého pododdielu sa aplikujú na pluralitu akustických modelov, ktorá zahŕňa všeobecný akustický model a akustické modely prípadných skôr identifikovaných volajúcich, aby sa získala pluralita príslušných akustických skóre, ktoré predstavujú nakoľko charakteristiky v každom pododdiele zodpovedajú príslušným akustickým modelom. Pre každý pododdiel je identifikovaný akustický model, ktorý má najlepšie akustické skóre pre daný pododdiel. Volajúci je identifikovaný ako jeden zo skôr identifikovaných volajúcich iba v pripade, že najlepšie akustické skóre pre všetky pododdiely zodpovedá rovnakému skôr identifikovanému volajúcemu. Inak je volajúci identifikovaný ako nový volajúci. Ak je volajúci identifikovaný ako nový volajúci, je preňho vygenerovaný nový akustický model,ktorýje špecifický pre nového volajúceho.Prehľad obrázkov na ýkresoch 0013OBR. 1 je schéma príkladného systému na implementáciu vynálezu vo forme konvenčného osobného počítača, podľa jedného uskutočnenia tohto vynálezu.OBR. 2 je podrobnejšia bloková schéma systému modulov na identifikáciu volajúceho, podľa jedného uskutočnenia tohto vynálezu.OBR. 3. je diagram tvaru vlny ilustrujúci akustický vstup WAV získaný od volajúceho ako funkcia času.OBR. 4 je diagram znázorňujúci sadu príznakových vektorov generovaných pre akustický vstup znázomený v OBR. 3OBR. 5 je stavový diagram znázorňujúci základný skrytý Markov model (HMM) pre jednu jednotku reči.OBR. 6 je diagram ilustrujúci príklad zjednodušeného jazykového modelu, ktorý môže byť použitý v jednom uskutočnení vynálezu.OBR. 7 je postupový diagram znázorňujúci počítačom implementovaný proces na identifikáciu volajúceho v telefónnom hovore príjemcovi, podľa jedného uskutočnenia tohto vynálezu.OBR. 8 je postupový diagram znázorňujúci detekciu nového volajúceho alebo skôr identifikovaného volajúceho v rámci procesu znázorneného na OBR. 7, podľa jedného uskutočnenia tohto vynálezu.-4 OBR. 9 je postupový diagram znázorňujúci proces na trénovanie jazykového modelu špecifického pre volajúceho na detekciu volajúceho podľa obsahu hovoru, podľa jedného uskutočnenia tohto vynálezu.0014 OBR. 1 a súvisiaca diskusia majú za cieľ poskytnúť stručný, všeobecný opis vhodného výpočtového prostredia, v ktorom môže byť vynález implementovaný. Aj keď to nie je nutné,vynález bude opísaný aspoň čiastočne, vo všeobecnom kontexte počítačovo vykonateľných inštrukcií, ako sú programové moduly, ktoré sú vykonané pomocou osobného počítača alebo iného zariadenia výpočtovej techniky. Všeobecne platí, že programové moduly zahŕňajú rutinné programy, objekty, komponenty, dátové štruktúry, atď., ktoré vykonávajú konkrétne úlohy alebo implementujú osobitné abstraktné dátové typy. Navyše, odborníci v tomto odbore ocenia, že vynález môže byť používaný s inými konfiguráciami počítačových systémov,vrátane vreckových zariadení, viacprocesorových systémov, mikroprocesorovej alebo programovateľnej spotrebnej elektroniky, sieťových počítačov, minipočítačov, stredískových počítačov, a podobne. Vynález môže byť používané aj v distribuovaných výpočtových prostrediach, kde sú úlohy vykonávané pomocou diaľkových zariadení na spracovanie, ktoré sú prepojené prostredníctvom komunikačnej siete. V distribuovanom výpočtovom prostredí môžu byť programové moduly umiestnené v lokálnych i vzdialených pamäťových0015 S odkazom na OBR. 1, príkladný systém na implementáciu vynálezu obsahuje všeobecne použiteľné výpočtové zariadenie vo forme bežného osobného počítača 20, vrátane procesorovej jednotky (CPU) 21, systémovej pamäte 22, a systémovej zbemice 23, ktorá spája rôzne komponenty systému, vrátane pripojenie systémovej pamäte 22 k procesorovej jednotke 21. Systémová zbemica 23 môže byť niektorým z niekoľkých typov zbemicových štruktúr vrátane pamäťovej zbemice alebo radiča pamäte, perifémej zbemice a lokálnej zbemice s použitím niektorej z rôznych zbemicových štruktúr. Systémová pamäť 22 zahŕňa permanentnú pamäť (ROM) 24 a operačnú pamäť (RAM) 25. Základný vstupno-výstupný systém (I/O, BIOS) 26, obsahujúci základnú rutinu, ktorá pomáha prenosu informácií medzi prvkami v rámci osobného počítača 20, ako napríklad pri štarte, je uložený V pamäti ROM 24. Osobný počítač 20 ďalej obsahuje pevný disk 27 na čítanie z a zápis na pevný disk (nie je zobrazený), magnetickú diskovú jednotku 28 na čítanie z alebo zápis na vymeniteľný magnetický disk 29, a optickú diskovú jednotku 30 na čítanie z alebo zápis na vymeniteľný optický disk 31, ako je napríklad CD-ROM alebo iné optické médium. Jednotka pevného disku 27, magnetická disková jednotka 28, aoptická disková jednotka 30 sú pripojené k systémovej zbemici 23 cez rozhranie pevného disku 32, rozhranie magnetického disku 33,a rozhranie optickej jednotky 34. Jednotky a súvisiace pamäťové médiá umožňujú zálohované ukladanie počítačovo čitateľných inštrukcií, dátových štruktúr, programových modulov a ďalších údajov pre osobný počítač 20.0016 Hoci tu popísané príkladné prostredie využíva pevný disk, vyberateľný magnetický disk 29 a vyberateľný optický disk 31, odborníci v tomto odbore ocenia, že iné typy počítačových pamäťových médií, ktoré môžu ukladať dáta prístupné z počítači, ako sú magnetické kazety, flash pamäťové karty, digitálne video disky, Bemoulliho kazety, pamäte s priamym prístupom (RAM), pamäť len na čítanie (ROM), a podobne, môžu byť taktiež použité v príkladnom operačnom prostredí.0017 Viacero programových modulov môže byť uložených na pevnom disku, magnetickom

MPK / Značky

MPK: G10L 17/00

Značky: hovorov, identifikácia, charakteristikách, telefonických, hlasových, automatická, založená

Odkaz

<a href="http://skpatents.com/28-e12819-automaticka-identifikacia-telefonickych-hovorov-zalozena-na-hlasovych-charakteristikach.html" rel="bookmark" title="Databáza patentov Slovenska">Automatická identifikácia telefonických hovorov založená na hlasových charakteristikách</a>

Podobne patenty