Riconoscimento del parlatore

Per riconoscimento del parlante (dall'inglese speaker recognition) si intende il processo di validazione dell'identità che un utente dichiara, utilizzando le caratteristiche estratte dalla sua voce.

Storia

Il riconoscimento del parlante ha una storia lunga quattro decenni e utilizza le caratteristiche acustiche del parlato che si è scoperto caratterizzare al meglio i diversi individui (cioè che differiscono maggiormente al variare dell'individuo). Queste caratteristiche riflettono sia quelle dell'anatomia (come la dimensione e la forma del collo e della bocca) che quelle comportamentali (come l'altezza della voce o la cadenza del parlato). La speaker verification ha guadagnato il titolo di misurazione biometrica al riconoscimento del parlante. Ente pioniere in Italia per questa disciplina è stato lo CSELT di Torino, che nel 1983 applicò il primo brevetto internazionale in Europa e uno dei primi a livello internazionale[1].

Differenza da termini simili

C'è una differenza fra riconoscimento del parlante (riconoscere chi sta parlando) e riconoscimento vocale (riconoscere cosa viene detto). Questi due concetti (e le corrispondenti locuzioni) sono confusi frequentemente. C'è anche una differenza fra l'atto di autenticare un utente (a cui ci si riferisce spesso col termine "autenticazione del parlante", "verifica del parlante" o, più spesso, con i termini inglesi speaker verification e speaker authentication) e quello di identificare l'utente (a cui ci si riferisce solitamente col termine "identificazione del parlante" o con l'inglese speaker identification). C'è spesso confusione anche con il processo di speaker diarisation (riconoscimento di quando interviene il medesimo parlante).

Verifica/Identificazione

Ci sono due principali applicazione delle tecnologie e delle tecniche di riconoscimento del parlante:

  • Se un parlante afferma di possedere una certa identità e la voce è utilizzata per validare questa affermazione, il processo è detto di verifica o di autenticazione.
  • Viceversa l'identificazione è il processo di determinare l'identità di un parlante sconosciuto.

In altre parole la verifica del parlante è un confronto 1:1, dove la voce di un parlante è confrontata con un'unica impronta vocale (o "modello del parlante"), mentre l'identificazione è un confronto 1:N dove la voce è confrontata con N modelli distinti.

Dal punto di vista della sicurezza, l'identificazione è diversa dalla verifica. Per esempio presentare il passaporto all'imbarco di un aeroporto è un processo di verifica - il personale confronta la faccia dell'individuo con la fotografia nel documento. Viceversa il poliziotto che confronta l'identikit di un malvivente con un database di criminali precedentemente archiviato è un processo di identificazione.

La verifica del parlante può essere impiegata per l'accesso a sistemi sicuri in aggiunta ad altre tecniche di accesso. Questi sistemi generalmente operano con la consapevolezza dell'utente e richiedono la loro cooperazione. I sistemi di identificazione del parlante sono realizzati solitamente senza prevedere la cooperazione del parlante.

Nelle applicazioni forensi è comune effettuare prima il processo di identificazione, per creare una lista di migliori candidati e quindi una serie di processi di verifica per determinare il risultato finale.

Fasi

Ogni sistema di riconoscimento del parlante ha due fasi: una fase di raccolta dati (enrollment) e una fase di verifica.

Durante la fase di raccolta dati la voce del parlante viene registrata e da essa vengono estratte un certo numero di caratteristiche per formare un'impronta vocale, o modello. Nella fase di verifica un campione vocale (utterance) è confrontato con l'impronta vocale precedentemente creata. Per i sistemi di identificazione, i campioni vengono confrontati con varie impronte vocali, per trovare i risultati più simili, mentre nei sistemi di verifica i campioni sono confrontati con una sola impronta vocale. Per questo motivo la verifica è solitamente più veloce dell'identificazione.

Varianti del riconoscimento del parlante

I sistemi di riconoscimento del parlante si suddividono in due categorie: dipendenti dal messaggio (o text-dependent) e indipendenti dal messaggio (text-independent), a seconda che il messaggio pronunciato durante la fase di raccolta dati debba coincidere o meno con quello pronunciato durante la fase di verifica.

Nei sistemi dipendenti dal messaggio il messaggio può essere comune a tutti i parlatori (per esempio una parola d'ordine comune) o univoco. In aggiunta è possibile usare delle informazioni segrete condivise (o shared-secrets, come ad esempio parole d'ordine o PIN) o delle informazioni basate sulla conoscenza, al fine di creare scenari di autenticazione a più fattori.

Nei sistemi di identificazione si utilizzano più spesso sistemi indipendenti dal messaggio, poiché non richiedono la collaborazione del parlante. In questo caso il messaggio pronunciato nella fase di identificazione è diverso da quello utilizzato in fase di raccolta ed entrambe le fasi possono avvenire senza la consapevolezza del parlante, come nel caso di alcune applicazioni forensi.

Poiché le tecnologie indipendenti dal messaggio non possono confrontare direttamente quello che viene detto nelle due fasi di raccolta e verifica, le applicazioni di verifica che ne fanno uso spesso impiegano anche sistemi di riconoscimento vocale per determinare cosa viene detto in fase di autenticazione.

Tecnologie

Le varie tecnologie utilizzate per processare e immagazzinare le impronte vocali includono la stima della frequenza, i modelli di Markov nascosti (HMM), i modelli di misture gaussiane (GMM), gli algoritmi di pattern matching, le reti neurali, le matrici di rappresentazione, la quantizzazione vettoriale, e gli alberi di decisione. Alcuni sistemi utilizzano anche tecniche "anti-parlante", come i cohort model o i modelli ambientali.

Il livello dei rumori d'ambiente può essere tale da impedire la registrazione dei campioni sia nella fase di raccolta che in quella di verifica. Algoritmi di riduzione del rumore possono essere utilizzati per migliorare l'accuratezza, ma l'applicazione scorretta di tali algoritmi può avere l'effetto contrario. La qualità dei risultati è influenzata dalle condizioni di registrazione e generalmente degrada quando le condizioni nella fase di verifica non coincidono con quelle della fase di raccolta. In questo contesto le condizioni includono le condizioni ambientali (rumore, musica in sottofondo, ecc.), il comportamento dell'utente (differente cadenza, stato d'animo, ecc.), ma anche le condizioni del canale trasmissivo (cambio del microfono utilizzato, ecc.). Anche il normale cambiamento della voce dovuto all'età può inficiare il buon funzionamento del sistema, pertanto alcuni sistemi aggiornano i modelli dei parlatori dopo ogni verifica completata con successo. Gli effetti sulla sicurezza imposti dall'adattamento automatico sono ancora oggetto di dibattito.

Le rilevazioni biometriche sono ritenute non invasive: generalmente si utilizzano i microfoni e le tecnologie di trasmissione della voce esistenti (come i normali apparati telefonici di rete fissa o mobile).

L'identificazione del parlante per l'applicazione forense, generalmente fa uso non solo di misure elettroniche, ma anche di specifiche capacità di ascolto di esperti, necessarie affinché l'identificazione possa ritenersi accurata.[2]

Note

  1. ^ Cavazza, Michele, and Alberto Ciaramella. "Device for speaker's verification." U.S. Patent No. 4,752,958. 21 Jun. 1988.
  2. ^ Audio & Video Forensics - Video Production Primeau[collegamento interrotto]

Bibliografia

  • Elisabeth Zetterholm, Voice Imitation. A Phonetic Study of Perceptual Illusions and Acoustic Success. Phd thesis, Lund University. (2003)
  • Federico A., Paoloni A., "Riconoscimento del parlante", in Media Duemila 250 (2007), pp. 47–55.

Voci correlate

Collegamenti esterni

Controllo di autoritàLCCN (ENsh85144234 · J9U (ENHE987007543990405171
  Portale Neuroscienze: accedi alle voci di Wikipedia che trattano di neuroscienze

Read other articles:

American judge Clarence E. CaseActing Governor of New JerseyIn officeJanuary 13, 1920 – January 20, 1920Preceded byWilliam Nelson Runyon (acting)Succeeded byEdward I. Edwards as GovernorChief Justice of the New Jersey Supreme CourtIn office1945–1948Preceded byThomas J. BroganSucceeded byArthur T. VanderbiltMember of the New Jersey SenateIn office1918-1929 Personal detailsBornClarence Edwards Case(1877-09-24)September 24, 1877Jersey City, New JerseyDiedSeptember 3, 1961(1961-09-03...

 

RegionTunapuna–Piarco TPRCRegionRegion of Tunapuna–Piarco Coat of armsMotto: Serving the Burgesses of our Region.Location of Tunapuna–Piarco in TrinidadTunapuna–PiarcoCoordinates: 10°38′00″N 61°23′00″W / 10.6333°N 61.3833°W / 10.6333; -61.3833Country Trinidad and TobagoFormer CountiesSaint George CaroniFormer RegionsTunapuna PiarcoCoastlineCaribbean SeaFounded17 July 1992[1]CapitalTunapunaArea • Total527.23 km2 (20...

 

Election in Texas Main article: 1928 United States presidential election 1928 United States presidential election in Texas ← 1924 November 6, 1928 1932 →   Nominee Herbert Hoover Al Smith Party Republican Democratic Home state California New York Running mate Charles Curtis Joseph T. Robinson Electoral vote 20 0 Popular vote 367,036 341,032 Percentage 51.77% 48.10% County Results Hoover   50–60%   60–70%   70–8...

Russian politician In this name that follows Eastern Slavic naming customs, the patronymic is Zhamalovich and the family name is Bifov. You can help expand this article with text translated from the corresponding article in Russian. (February 2024) Click [show] for important translation instructions. Machine translation, like DeepL or Google Translate, is a useful starting point for translations, but translators must revise errors as necessary and confirm that the translation is accu...

 

イスラームにおける結婚(イスラームにおけるけっこん)とは、二者の間で行われる法的な契約である。新郎新婦は自身の自由な意思で結婚に同意する。口頭または紙面での規則に従った拘束的な契約は、イスラームの結婚で不可欠だと考えられており、新郎と新婦の権利と責任の概要を示している[1]。イスラームにおける離婚は様々な形をとることができ、個�...

 

District and municipality in Bursa, TurkeyİznikDistrict and municipalityLake İznikMap showing İznik District in Bursa ProvinceİznikLocation in TurkeyShow map of Turkeyİznikİznik (Marmara)Show map of MarmaraCoordinates: 40°25′45″N 29°43′16″E / 40.42917°N 29.72111°E / 40.42917; 29.72111CountryTurkeyProvinceBursaGovernment • MayorKağan Mehmet Usta (AKP)Area753 km2 (291 sq mi)Population (2022)[1]44,236 •...

Offensive For the previous offensives, see East Aleppo offensive (2015–16), Ithriyah-Raqqa offensive (June 2016), and East Aleppo offensive (2017). 2017 Southern Raqqa offensivePart of Russian military intervention in Syria and the Syrian Civil WarSituation in central Syria between 13 and 30 June. The Southern Raqqa offensive is shown at the top of the mapDate13–30 June 2017(2 weeks and 3 days)LocationSouthwestern Raqqa Governorate and southern Aleppo Governorate SyriaResult Maj...

 

Ecuadorian physician and politician Ximena BohórquezBohórquez in 2008Member of the Ecuadorian Constituent AssemblyIn officeNovember 30, 2007 – October 25, 2008Member of the National CongressIn officeJanuary 15, 2003 – January 2007ConstituencyPichincha ProvinceFirst Lady of EcuadorIn roleJanuary 15, 2003 – April 20, 2005Preceded byMaría Isabel BaquerizoSucceeded byMaría Beatriz Paret Personal detailsBornXimena Bohórquez Romero (1956-11-12) November 12, 195...

 

Election in Rhode Island Main article: 1844 United States presidential election 1844 United States presidential election in Rhode Island ← 1840 November 1 - December 4, 1844 1848 →   Nominee Henry Clay James K. Polk Party Whig Democratic Home state Kentucky Tennessee Running mate Theodore Frelinghuysen George M. Dallas Electoral vote 4 0 Popular vote 7,322 4,867 Percentage 59.55% 39.58% President before election John Tyler Independent Elected Pre...

German Nazi politician Josef TerbovenTerboven in February 1942, during the Akershus Government Act ceremony.Reichskommissar for the Occupied Norwegian TerritoriesIn office24 April 1940 – 7 May 1945Appointed byAdolf HitlerPreceded byPosition createdSucceeded byFranz Böhme (acting)Gauleiter of Gau EssenIn office1 August 1930 – 8 May 1945Appointed byAdolf HitlerPreceded byPosition createdSucceeded byPosition abolishedOberpräsident of Rhine ProvinceIn office5 February 1935...

 

  提示:此条目页的主题不是中華人民共和國最高領導人。 中华人民共和国 中华人民共和国政府与政治系列条目 执政党 中国共产党 党章、党旗党徽 主要负责人、领导核心 领导集体、民主集中制 意识形态、组织 以习近平同志为核心的党中央 两个维护、两个确立 全国代表大会 (二十大) 中央委员会 (二十届) 总书记:习近平 中央政治局 常务委员会 中央书记处 �...

 

Samsung Galaxy S III miniSamsung Galaxy S III mini VEsmartphone ProduttoreSamsung Electronics SerieGalaxy S Presentazioneottobre 2012 Inizio venditaS III mini: novembre 2012S III mini VE: marzo 2014 PredecessoreSamsung Galaxy Mini 2 SuccessoreSamsung Galaxy S4 Mini ComunicazioneReti2G: GSM 850 / 900 / 1800 / 19003G: HSDPA 900 / 1900 / 2100 ConnettivitàHSPA, Bluetooth 4.0+LE, Wi-Fi, Wi-Fi Hotspot, DLNA, Kies Air, USB 2.0 High-Speed SoftwareSistema operativoAndroid Jelly Bean MultimediaMP3, AA...

Kazakh telecommunications company JSC KazakhtelecomCompany typePublic (KASE: KZTK)IndustryTelecommunicationsFounded1994HeadquartersAstana, KazakhstanKey peopleKuanyshbek Yessekeev, CEO (2010)Revenue 142.236 billion tenge (2008)Operating income 10.581 billion tenge (2008)Net income 22.826 billion tenge (2008)Websitewww.telecom.kz Kazakhtelecom JSC (Kazakh: Қазақтелеком, romanized: Qazaqtelekom; Russian: Казахтелеком) is the largest telecommunication company in...

 

Claude Guillermet de BérigardDubitationes in dialogum Galilaei Galilaei, 1632BiographieNaissance 15 août 1578Moulins, Royaume de FranceDécès 23 avril 1663 (à 84 ans)Padoue,  République de VeniseActivité Philosophemodifier - modifier le code - modifier Wikidata Claude Guillermet de Bérigard, Claude Guillermet de Beauregard ou Claudius Berigardus en latin (15 août 1578 à Moulins – 23 avril 1663 à Padoue) est un philosophe français du XVIIe siècle. Biographie «...

 

Chronicle of the Mongol conquest of Persia Frontispiece of Tarikh-i Jahangushay, depicting Ata-Malik Juvayni sitting and writing in front of Arghun Aqa, dated 1290. Located in the Bibliothèque Nationale de France (Suppl. Pers. 205).[1][2] This is one of the first Persian miniatures. The sky design with volutes is known as Chinese cloud.[3] Tārīkh-i Jahāngushāy (Persian: تاریخ جهانگشای The History of The World Conqueror) or Tārīkh-i Jahāngushāy-i J...

Skirmish at MatamorosPart of the Mexican–American WarPlan of Matamoras, and vicinity (November 30, 1847)DateNovember 23, 1847LocationIzúcar de Matamoros, PueblaResult American victoryBelligerents  United States  MexicoCommanders and leaders Gen. Joseph Lane Colonel PiedrasStrength 135 mounted riflemen and dragoons, 25 artillerymen and 1 gun 400–600 menCasualties and losses 3 soldiers killed, 1 American citizen killed5 wounded 60–80 killed or wounded 21 U.S. Soldiers freed, la...

 

চৰ্দাৰ বল্লভভাই পেটেলউপ-প্ৰধানমন্ত্ৰীকাৰ্যকাল১৫ আগষ্ট ১৯৪৭ – ১৫ ডিচেম্বৰ ১৯৫০প্ৰধানমন্ত্ৰী জৱাহৰলাল নেহৰুপূৰ্বসূৰী Position establishedউত্তৰসূৰী মোৰাৰজী দেশাইভাৰতৰ গৃহমন্ত্ৰণালয়কাৰ্যকাল...

 

مدينة الملك عبد الله الرياضيةمعلومات عامةأسماء سابقة إستاد الملك عبد الله الرياضيلقب ملعب بريدةالمنطقة الإدارية بريدة البلد  السعودية التشييد والافتتاحكلفة التشييد 390,000,000 ريالالاستعمالالمستضيف الرائد والتعاونالمالك الهيئة العامة للرياضةالإدارة الهيئة العامة للري...

Pays autorisant les peines de prison à vie Pays autorisant les peines de prison à vie pour les hommes uniquement Pays n'autorisant pas les peines de prison à vie Situation inconnue L'emprisonnement à perpétuité – aussi appelé plus communément prison à vie – est une sanction pénale pour les crimes les plus graves, qui consiste théoriquement en l'incarcération définitive d'un criminel. Dans la pratique, tous les pays au monde admettent des libérations conditionnelles, mais la...

 

يعتمد الري في مصر على نهر النيل، وتنظم هذه العمليات وزارة الموارد المائية والري. الرى السطحي يعرف الري السطحي[1] أو الري بالغمر كمجموعة من تقنيات تطبيق مياه الري وتوزيعها فوق سطح التربة بفعل الجاذبية. وعادة ما تصل نسبة الري السطحي بمصر حاليا إلى حوالي 90 ٪ من الأراضي المر...