Spôsob a zariadenie na identifikovanie hovoriacej osoby v obrazových a video správach

Číslo patentu: E 15967

Dátum: 15.12.2009

Autori: Runge Fred, Scheerbarth Thomas

Je ešte 22 strany.

Pozerať všetko strany alebo stiahnuť PDF súbor.

Text

Pozerať všetko

SPÓSOB A ZARIADENIE NA IDENTIFIKOVANIE HOVORIACEJ OSOBY v OBRAZOVÝCH A VIDEO SPRÁVACH0001 Tento vynález sa týka spôsobu na riadenie digitálneho systému správ, vktorom je vpamäťovom systéme uložených viacero na osoby viazaných správ. Najmä sa týka systému, vktorom sa zo správ extrahujú obrazové informácie za účelom vytvorenia virtuálnej hovoriacej osoby.0002 Najmä sa tento vynález týka systému video a/alebo obrazových správ a vzťahuje sa najmä na spôsob a usporiadania, s ktorých pomocou sú správy, ktoré sú odovzdávané v rámci systému, napríklad prostrednictvom MailBoxu, príjemcovi ponúkané tak, že obsahujú ďalšiu pridanú 3 D informáciu, ktorá v pôvodnej správe nie je obsiahnutá. Príjemcovi by mali byť správy ponúkané v čo možno najautentickejšej podobe s vylepšeným obsahom informácií o osobách oznamujúcich správu. ktorá u príjemcu vyvolá priestorový dojem, ktorý zo samotnej odoslanej 2 D pôvodnej správy nie je viditeľný.0003 Messaging systémy/systémy správ (mobilbox, voicemail systémy) sú na trhu dostatočne známe (pozri napr. http//wvvw.t-mobiIe.de/mobilbox). Vzávislosti od štruktúry systému sa často hlasové, obrazové a/alebo video správy ukladajú tiež ako prílohy textových správ (e-mailové prílohy) spoločne s informáciami o odosielatelovi (napr. identifikácia odosielateľa (napr. CLI, HLR,adresa odosielateľa a pod. ako kompletné video správy vo video poštových schránkach (video mailbox) na báze videotelefonovania analogicky k už dlhú dobu existujúcim hlasovým poštovým schránkam (voice maiIbox) alebodigitálnym záznamníkom telefonických hovorov atď.0004 Tak je možné za všeobecne známy StdT považovať, že sa vpočítačovo animovaných aplikáciách používajú avatary, ktoré sú vybavené funkcionalitami, ktoré pri použití syntézy hlasu umožňujú prezentovať texty,pričom sa odvodzujú a zobrazujú zodpovedajúce pohyby pier. Za pomoci detekcie tváre a zisťovania výrezov tváre, ktoré sú vyplnené určitými prvkami tváre (napr. pery), je možné kamerou zaznamenané pohyby pier hovoriacej osoby vložiť do oblasti pier nepohybujúcej sa fotografie, ktorá môže prevziať úlohu avatara (pozri http//www. Iogitech.com/index.cfm/ webcamcommunications/webcams/devices/3056 cIde,de,VideoEffects).0005 V dokumente EP 1 648 151 A 1 je opísané, že správy sa uložia za účelom neskoršieho spracovania pre systém na strojový preklad ďalších správ. Ťažisko však pritom leží vo vyhodnotení textových a fonetických informácií,ktoré sú vtýchto uložených správach obsiahnuté. To platí aj pre obrazové správy, ktoré prípadne môžu zahŕňať texty v obraze alebo v metainformáciách. Modifikácie vlastného obsahu obrazu pritom opísaná nie je.Z dokumentu W 0 2006/047347 je známy spôsob, pri ktorom môže užívateľ nejakej správe individuálne prideliť nejaký AVATAR. Toto opatrenie však ani nieje uskutočňované automaticky, ani nie sú menené existujúce obrazové dáta.0006 Zobrazenie obrazov v obrazových správach resp. video správach je realizované dvojrozmerne, pretože postupy zaznamenávania používané v telekomunikačných koncových prístrojoch sú založené na tom, že tieto koncové prístroje sú vybavené kamerou. Ponúka sa dodatočné vybavenie viac ako dvoma kamerami, ktoré vkombinácii s prenosovými postupmi vyžadujú väčšiu šírku pásma, ale u kompaktných prístrojov nie je možné ho odporučiť kvôli ich malému základnému rozmeru v šírke a z toho vyplývajúcej nízkej 3 D kvalite. Tak je 3 D zobrazenie hovoriacej osoby obrazové a/alebo video správy možné len pri veľkom znížení kvality.0007 Tiež rozšírenie 2 D avatarov, ktoré, ako to bolo opísané vyššie, môžubyť generované z fotografií, na 3 D animácie s pomocou vždy dvoch súčasnezaznamenaných vyobrazení je vďaka tomu možné tiež len v obmedzenej miere0008 Pritom spôsoby na trojrozmerné zobrazovanie obrazov a/alebo videí vykazujú čoraz väčší a väčší pokrok (pozri http//www.eIektroniknet.de/id 3200 type 98), takže aj tu vzniká potreba 3 D zobrazovania video-obrazových správ.0009 Známe sú aj 2 D zobrazenia virtuálne vytváraných animovaných avatarov, ktoré sú k dispozícii vo vnútri v systéme ako úplný 3 D model a napr. na systéme, ktorý pozostáva z displeja a reproduktora, interpretujú texty bez toho, aby pritom zároveň bol vytváraný pravý a ľavý obraz (DE 10 2004 0141 89 A 1).0010 Skutočné 3 D zobrazenie objektov alebo obrazov spočíva na(zdanlivo) súčasnom vytvorení dvoch 2 D obrazov, pričom jeden obraz je určenýpre ľavé oko a druhý obraz pre pravé oko.0011 Zaznamenávanie s pomocou kamier, ktoré sú usporiadané od seba vzdialene v horizontálnom smere, za účelom vytvorenia 3 D obrazov je všeobecne známe a nebude tu preto opisované. Rovnako tak existujú metódy,ako z jednotlivých 2 D obrazov generovať umelé 3 D obrazy z modelov, ktoré sú k dispozícii, ktorých základom je úplný 3 D model manuálne anotovaných/analyzovaných 2 D objektov, ktorý je reprezentovaný na základe priestorových súradníc väčšieho počtu bodov na povrchu objektov. Príklady tohto sú opísané v dokumentoch EP 1 412 917 B 1 a EP 0 991 023 B 1.0012 Na pozorovanie 3 D zobrazenia existujú rôzne spôsoby s pomocnými prostriedkami, napr. s pomocou anaglyñckého postupu s šošovkovitým rastrom,polarizačnými okuliarmi atď.0013 Ďalej je tiež možné dva 2 D obrazy určené pre pravé a pre ľavé oko pozorovat bez pomocných prostriedkov technikou prekriženého alebo súbežného pohľadu.toho, že sa separujú rôzne obrazové prvky v popredí a v pozadí a na základe znalosti ich 3 D charakteristík sa z tohto 2 D obrazu vygeneruje vždy jeden pravý a jeden ľavý obraz. V nasledujúcom opise budú na generovanie potrebné vždy dva 2 D obrazy, z ktorých sa potom vygeneruje vždy jeden 2 D pravý obraz a jeden 2 D ľavý obraz pre jeden 3 D obraz, to znamená, že táto opísaná znalost vlastností jednotlivých objektov alebo modelov objektov nie je v nižšie opísanom spôsobe potrebná.0015 Úlohou tohto predkladaného vynálezu je zobrazenie osoby, ktorá zanechala správu, ako virtuálne hovoriacej osoby, na základe vyhladania obrazov zo správ a ich animácie. Riešená je táto úloha podľa tohto vynálezu s pomocou znakov nezávislých patentových nárokov.0016 Najmä sa hovoriace osoby zobrazia v 3 D zobrazení, pričom skutočná hovoriaca osoba pre vnasledujúcom texte opísaný systém je založená na súčasnej alebo zdanlivo súčasnej prezentácii (v časovom intervale niekoľko milisekúnd, ktorý je pre pozorovatela prakticky nezaznamenateľný) dvoch 2 D obrazov osoby poskytujúcej správu, pričom jeden obraz je určený pre ľavé oko a druhý obraz je určený pre pravé oko.0017 Za účelom 3 D zobrazenia hovoriacej osoby sa v systéme poštovej schránky (mailbox system) pri vyhodnotení informácie o odosielateľovi vyhľadajú aktuálne 2 D obrazové správy skorších obrazových a/alebo video správ tej istej hovoriacej osoby, tie sa z obrazov extrahujú a upraví sa ich veľkosť na jednotnú veľkosť zobrazenia hovoriacej osoby. Pritom sa rôzne perspektívy (ľavý a pravý obraz) 2 D jednotlivého záznamu tejto hovoriacej osoby pri upravení rozdielov vjase a/alebo farebnosti spracujú do jedného 3 D vyobrazenia. Pritoma) za účelom 3 D zobrazenia hovoriacej osoby aktuálne 2 D video správy sa z jednotlivých obrazov video správy a/alebo navyše z predchádzajúcich video/obrazových správ tej rovnakej hovoriacej osoby (pri vyhodnotení informácií o odosielateľovi) vyobrazenie hovoriacej osoby extrahuje, prispôsobísa jeho velkost jednotnej veľkosti zobrazenia hovoriacej osoby a rôzne

MPK / Značky

MPK: H04M 3/53

Značky: video, obrazových, osoby, identifikovanie, správach, hovoriacej, zariadenie, spôsob

Odkaz

<a href="http://skpatents.com/36-e15967-sposob-a-zariadenie-na-identifikovanie-hovoriacej-osoby-v-obrazovych-a-video-spravach.html" rel="bookmark" title="Databáza patentov Slovenska">Spôsob a zariadenie na identifikovanie hovoriacej osoby v obrazových a video správach</a>

Podobne patenty