Диференційна приватність — це формальна теорія забезпечення конфіденційності персональних даних при публікації статистичних аналізів або моделей машинного навчання, обчислених на базі персональних даних. Диференційна приватність гарантує те, що персональні дані неможливо точно відновити з результатів обчислень за рахунок контрольованого додавання випадкових значень в процес обчислень.
Мотивація
Нехай існує довірена сторона, яка володіє масивом чутливих персональних даних (наприклад медичні записи, відомості щодо перегляду кіно або використання електронної пошти) і бажає надавати узагальнену статистичну інформацію про ці дані. Така система називається статистичною базою даних. Однак надання узагальненої статистичної інформації про дані може розкрити деяку інформацію щодо осіб. Дійсно, різноманітні ad-hoc підходи до анонімізації опублікованих записів були подолані, коли дослідники поєднували вміст двох або більше окремих баз даних. Диференційна приватність — це підхід для формалізації приватності у статистичних базах даних, запропонований для захисту від подібних методів деанонімізації.
Приз Netflix
Наприклад, у жовтні 2006 Netflix запропонував приз у 1 мільйон доларів США за покращення власної системи формування рекомендацій на 10 %. Netflix також випустив тренувальний масив даних для змагання розробників. При випуску цього масиву даних Netflix зазначив, що для захисту приватності користувачів уся персональна інформація, що ідентифікує користувачів, та усі ідентифікатори користувачів замінені на випадкові ідентифікатори.
Netflix — не єдиний портал оцінювання кінофільмів у мережі, існують і інші, зокрема IMDb. На IMDb користувачі можуть реєструватись і оцінювати фільми без анонімізації. Arvind Narayanan та Vitaly Shmatikov, дослідники у University of Texas at Austin, поєднали анонімізований масив даних Netflix з базою даних IMDb (використовуючи дату оцінювання) і частково деанонімізували масив даних Netflix, скомпрометувавши ідентичність деяких користувачів[1].
База даних медичних випадків Комісії з групового страхування штату Массачусетс
Latanya Sweeney з Carnegie Mellon University поєднала анонімізовану базу даних (у якій зберігалися дата народження, стать та поштовий індекс кожного пацієнта) з записами виборців, і змогла визначити медичний запис губернатора штату Массачусетс[2].
Метадані та бази даних мобільних операторів
De Montjoye та інші з MIT ввели поняття унікальності і показали, що 4 просторово-часових відмітки з приблизними моментами часу і просторовими координатами достатньо, щоб ідентифікувати 95 % з 1,5 млн людей з бази даних мобільних операторів[3]. Подальше дослідження показує, що ці обмеження мають місце навіть тоді, коли роздільна здатність набору даних є низькою, що означає, що навіть грубий або розмитий набір даних мобільних операторів та метадані забезпечують малу анонімність.
Огляд
У 2006, Cynthia Dwork визначила галузь диференційної приватності з використанням результатів роботи, початої у 2003. У цій роботі показано неможливість досягти семантичних цілей безпеки, що відносяться до роботи Tore Dalenius з 1970-х, і визначено нові методи для обмеження зростаючого ризику для персональних даних від їх включення до статистичної бази даних. Це дозволяє у багатьох випадках надати дуже точну статистику на підставі бази даних із забезпеченням високого рівня приватності.[4][5]
Принцип та ілюстрація
Диференційна приватність — це процес, який вносить випадковість у дані.
Простим прикладом, розробленим у соціальних науках,[6] є опитування осіб «Ви володієте атрибутом A?», за наступною процедурою:
Якщо випав герб — підкинути монетку ще раз і відповісти «Так», якщо випав аверс, або «Ні», якщо випав герб.
Приватність забезпечується через забезпечення відмовності щодо індивідуальних відповідей.
Хоча ці дані з багатьма відповідями є значимими, позитивні відповіді дали чверть осіб, які не мали атрибута A і три чверті осіб, які володіють атрибутом A.
Якщо p справжня частка осіб з A, тоді буде отримано (1/4)(1-p) + (3/4)p = (1/4) + p/2 позитивних відповідей. Звідси можна обчислити p.
PS: зокрема, якщо володіння атрибутом A є синонімом незаконних дій, відповідь «Так» не є зізнанням у злочині, оскільки існує ненульова імовірність хибнопозитивної відповіді «Так».
Формальне визначення та приклад застосування
Нехай позитивне дійсне число і є увипадковленим алгоритмом, який приймає набір даних на вході, що представляє дії довіреної сторони, яка розпоряджається даними.
Нехай є образом відображення. Алгоритм є -диференційно приватним, якщо для всіх наборів даних
та , які відрізняються у єдиному елементі (даних щодо однієї особи), для всіх підмножин з ,
де імовірність отримана з випадковості, яку використовує алгоритм.[6]
У відповідності до цього визначення диференційна приватність є умовою роботи механізму публікації (довіреної сторони, яка публікує інформацію щодо набору даних), а не самого набору даних. Інтуітивно це означає, що для двох довільних схожих наборів даних диференційно приватний алгоритм буде праціювати схоже для обох наборів даних. Визначення гарантує, що присутність або відсутність особи не значно вплине на фінальний результат.
Наприклад представимо, що ми маємо базу баних медичних записів де кожен запис є парою (Ім'я, X), де є булевою змінною, яка позначає наявність діабету у особи. Наприклад:
Ім'я
Наявність діабету (X)
Рос
1
Моніка
1
Джої
0
Фібі
0
Чендлер
1
Тепер припустимо, що зловимсний користувач (порушник) бажає визначити наявність діабету у Чендлера. Також припустимо, що порушник також знає у якому рядку бази даних розміщено запис Чендлера. Тепер припустимо, що порушнику дозволено використовуати тільки часткову форму запиту , яка повертає часткову суму перших рядків ствопчика у базі даних. Зазвичай, щоб визначити наявність діабету у Чендлера порушник виконує запити та , потім обчислює їх різницю. У цьому прикладі , а , тому різниця дорівнює 1. Це означає, що у полі рядка Чендлера знаходиться 1. Це приклад показує, як може бути скомпрометована інформація про особу навіть без точного запиту щодо особи.
Продовжуючи цей приклад, якщо ми сконструюємо базу даних заміною (Чендлер, 1) на (Чендлер, 0), то порушник матиме можливість відрізнити від обчисленням для кожного набору даних. Якщо порушнику знадобиться отримати значення використовуючи -диференційно приватний алгоритм, для достатньо малого , то він не зможе розрізнити два набори даних.
Чутливість
Нехай є позитивним цілим, є колекцією наборів даних, і є функцією. Чутливість[7] функції, позначена , визначається як
де максимум по усім парам наборів даних та у , які відрізняються щонайменш у одному елементі і позначається нормою.
У прикладі медичної бази даних вище, якщо ми приймемо є функцією , тоді чутливість функції дорівнює одиниці, оскільки зміна одного запису у базі даних призводить до зміни значення функції на нуль або одиницю.
Існують методи (описані нижче), використання яких дозволяє створювати диференційно приватний алгоритм для функцій з низькою чутливістю.
Компроміс між корисністю та приватністю
Компроміс між точністю статистики, отриманої із дотриманням приватності, і приватністю описується параметром ε.[8][9][10][11]
Інші нотації диференційної приватності
Для деяких застосувань властивість диференційної приватності є занадто суворою, тому запропоновані слабші версії властивостей приватності. Вони включають (ε, δ)-диференційну приватність,[12] рандомізовану диференційну приватність,[13] і приватність з метрикою.[14]
Диференційно приватні механізми
Оскільки диференційна приватність є імовірнісною концепцією, будь-який диференційно приватний механізм обов'язково є рандомізованим. Деякі з них, як механізм Лапласа, описаний нижче, покладаються на додавання контрольованого шуму до функції, яку потрібно обчислити.
Інші, як еспоненційний механізм[en][15] використовують післявибірку[16] замість залежних від галузі використання розподілів.
Механізм Лапласа
Багато диференційно приватних методів додають контрольований шум до функцій з низькою чутливістю.[7] Механізм Лапласа додає шум Лапласа (шум з розподілом Лапласа), який може бути виражений функцією щільності імовірності , яка має математичне сподівання, що дорівнює нулю, і стандартне відхилення). У нашому випадку визначено вихідну функцію від як функцію з дійсними значеннями як де and є оригінальною функцією з дійсними значеннями, яку планувалося виконати над базою даних. Звідси може бути представлена як неперервну випадкову змінну, де
де щонайменше . Можна представити як фактор приватності . Таким чином відповідає визначенню диференційно приватного механізму. Якщо застосувати цю концепцію до нашого прикладу з хворими на діабет, тоді це слідує з факту, що як -диференційно приватний алгоритм повинен мати . Хоча було використано шум Лапласа, можуть бути використані шуми з іншим розподілом (наприклад нормальним розподілом), але для цього потрібне деяке послаблення визначення диференційної приватності.[2]
Поєднуваність
Послідовне поєднання
Якщо запитати ε-диверенційно приватний механізм разів, і рандомізація механізму є незалежною для кожного запиту, тоді результат буде -диференційно приватним. У загальному випадку, якщо наявні незалежних механізмів: , чиї гарантії приватності є диференційно приватними, відповідно, тоді будь-яка функція від: є -диференційно приватною.[17]
Паралельне поєднання
Більш того, якщо попередні механізми обчислені над підмножинами, що не перетинаються, приватної бази даних, тоді функція є -диференційно приватною.[17]
Групова приватність
У загальному випадку ε-диверенційна приватність створена для захисту приватності між базами даних, які відрізняються лише у одному рядку. Це означає, що жоден порушник із довільною допоміжною інформацією не може знати, чи один конкретний учасник надав свою інформацію. Тим не менше це також може бути поширене для потреби захисту баз даних, які відрізняються у рядках, де порушник із довільною допоміжною інформацією має можливість знати, що часткових учасників надали інформацію. Це може бути досягнуто тому що у випадку коли значень змінюються, ймовірність розширення обмежена замість ,[2] тобто для D1 та D2, які відрізняються у значеннях:
Таким чином встановлення ε замість досягає бажаного результату (захисту значень). Іншими словами, замість ε-диференційно приватного захисту кожного значення, тепер група з значень є захищеною з параметром ε-диференційної приватності (і кожне значення є захищеним з параметром -диференційної приватності).
Стабільні перетворення
Перетворення є -стабільним, якщо відстань Геммінга між та є не більше -разів відстані Геммінга між та для двох довільних баз даних . Теорема 2 у[17] стверджує, що якщо існує механізм такий, що є -диверенційно приватним, тоді складений механізм є -диференційно приватним.
Це може бути узагальнене для групової приватності, оскільки розмір групи може бути розглянуте як відстань Геммінга між
та (де містить групу та не містить). У цьому випадку є -диференційно приватним.
Google, для поширення історичної статистики трафіку,[20]
13 червня 2016 Apple оголосила про намір використовувати диференційну приватність у iOS 10 щоб покращити власну технологію персонального помічника,[21]
Виконані деякі початкові дослідження щодо практичної реалізації диференційної приватності у моделях дата-майнингу.[22]
↑Dwork, Cynthia (25 квітня 2008). Differential Privacy: A Survey of Results. У Agrawal, Manindra; Du, Dingzhu; Duan, Zhenhua; Li, Angsheng (ред.). Theory and Applications of Models of Computation. Lecture Notes in Computer Science (англ.). Springer Berlin Heidelberg. с. 1—19. doi:10.1007/978-3-540-79228-4_1. ISBN9783540792277. Архів оригіналу за 27 лютого 2021. Процитовано 4 листопада 2017.
↑
A. Ghosh, T. Roughgarden, and M. Sundararajan. Universally utility-maximizing privacy mechanisms. In Proceedings of the 41st annual ACM Symposium on Theory of Computing, pages 351–360. ACM New York, NY, USA, 2009.
↑
H. Brenner and K. Nissim. Impossibility of Differentially Private Universally Optimal Mechanisms. In Proceedings of the 51st Annual IEEE Symposium on Foundations of Computer Science (FOCS), 2010.
↑
R. Chen, N. Mohammed, B. C. M. Fung, B. C. Desai, and L. Xiong. Publishing set-valued data via differential privacy. The Proceedings of the VLDB Endowment (PVLDB), 4(11):1087-1098, August 2011. VLDB Endowment.
↑
N. Mohammed, R. Chen, B. C. M. Fung, and P. S. Yu. Differentially private data release for data mining. In Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD), pages 493-501, San Diego, CA: ACM Press, August 2011.
↑
Dwork, Cynthia, Krishnaram Kenthapadi, Frank McSherry, Ilya Mironov, and Moni Naor. "Our data, ourselves: Privacy via distributed noise generation." In Advances in Cryptology-EUROCRYPT 2006, pp. 486-503. Springer Berlin Heidelberg, 2006.
↑
Hall, Rob, Alessandro Rinaldo, and Larry Wasserman. "Random differential privacy." arXiv preprint arXiv:1112.2680 (2011).
↑
Chatzikokolakis, Konstantinos, Miguel E. Andrés, Nicolás Emilio Bordenabe, and Catuscia Palamidessi. "Broadening the scope of Differential Privacy using metrics." In Privacy Enhancing Technologies, pp. 82-102. Springer Berlin Heidelberg, 2013.
↑
Ashwin Machanavajjhala, Daniel Kifer, John M. Abowd, Johannes Gehrke, and Lars Vilhuber. "Privacy: Theory meets Practice on the Map". In Proceedings of the 24th International Conference on Data Engineering,
(ICDE) 2008.
Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Maret 2023. Bhoot ChaturdashiSutradaraShabbir MallickProduserSVF EntertainmentSkenarioAritra Sengupta, Anwoy Mukherjee, Arindra Rai ChaudhuriCeritaMainak BhaumikPemeranAryann BhowmikEna SahaSohini SarkarDeepsheta MitraPenata musikNabarun BoseSinematograferMano...
Antireligious campaign in China Rep. Ileana Ros-Lehtinen, who co-sponsored a Congressional resolution condemning organ harvesting from Falun Gong adherents, speaks at a rally in Washington, D.C. Freedom of religion Concepts Laicism Religious discrimination Religious censorship Religious liberty Religious pluralism Secularism Separation of church and state Anti-clericalism School prayer Catholic priests in public office Confessionalism Theocracy State religion Secular state Confessional state ...
Gereja Katolik di IndonesiaUmat Katolik merayakan Misa di Katedral Jakarta, Keuskupan Agung JakartaJenisKebijakan nasionalPenggolonganGereja Katolik RomaOrientasiLatinKitab suciAlkitabTeologiTeologi KatolikBadanpemerintahanKonferensi Waligereja IndonesiaPausPaus FransiskusKardinalIgnatius Suharyo HardjoatmodjoNunsius ApostolikPiero PioppoWilayah IndonesiaBahasaIndonesia, Latin, dan ratusan bahasa daerah lainnyaKantor pusatJakartaDidirikan1534[1] Kepulauan Maluku, Maluku PortugisS...
French bicycle racer This biography of a living person needs additional citations for verification. Please help by adding reliable sources. Contentious material about living persons that is unsourced or poorly sourced must be removed immediately from the article and its talk page, especially if potentially libelous.Find sources: Pauline Ferrand-Prévot – news · newspapers · books · scholar · JSTOR (September 2015) (Learn how and when to remove this tem...
Ordine di Karl MarxKarl-Marx-OrdenRepubblica Democratica TedescaTipologiaOrdine cavalleresco statale Statusnon attivo Istituzione5 maggio 1953 Cessazione1990 PrecedenzaOrdine più altoOrdine di Blücher per il Coraggio Ordine più bassoOrdine di Scharnhorst Modifica dati su Wikidata · Manuale L'Ordine di Karl Marx era un'onorificenza tra le più importanti della Repubblica Democratica Tedesca. Il premio consisteva in una medaglia e in un premio in denaro pari a 20.000 marchi. Il Consigl...
Japanese manga magazine Not to be confused with Bessatsu Shōnen Magazine. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Monthly Shōnen Magazine – news · newspapers · books · scholar · JSTOR (August 2016) (Learn how and when to remove this template message) Monthly Shonen MagazineCategoriesShōnen manga...
Geographical region in south-eastern Romania Dobruja within the historical regions of Romania Northern Dobruja (Romanian: Dobrogea de Nord or simply Dobrogea; Bulgarian: Северна Добруджа, Severna Dobrudzha) is the part of Dobruja within the borders of Romania. It lies between the lower Danube River and the Black Sea, bordered in the south by Southern Dobruja, which is a part of Bulgaria. History Further information: Dobruja § History Protected archaeological and natural a...
Medieval East European state Principality of Chernigov1024–1402 Symbol of Mstislav of Chernigov Principality of Chernigov (1132)StatusPrincipality within Kievan Rus' (1024–1240)Vassal of the Golden Horde (1245–1362)Principality within the Grand Duchy of Lithuania (1362–1402)CapitalChernigovCommon languagesOld East Slavic (official)Religion Eastern Orthodoxy (official)GovernmentMonarchyOlgovichi dynastyPrince • 1024–1036 Mstislav (first) History •&...
Maremagnum Shopping & dinning at the marina Vista general desde el funicularLocalizaciónPaís España EspañaComunidad Cataluña CataluñaLocalidad BarcelonaDirección Moll d'Espanya, 5Datos generalesApertura 7 de mayo de 1995Propietario Corio Real Estate España, SLArquitecto Helio Piñón, Albert Viaplana y Rafael CollSuperficie 22 000 m² (SBA)Plazas de parking 840 plazasPlantas 3Sitio web oficial[editar datos en Wikidata] Maremagnum es un centro com...
Pour l’article homonyme, voir Boson II. Boson II d'ArlesTitres de noblesseComte d'ArlesComte d'Avignon (d)Comte de ProvenceBiographieNaissance Vers 910 ou 915Décès 968Activité FeudataireFamille BosonidesPère Rotbald Ier de Provence (d)Mère NN d'Aquitaine (d)Fratrie Guillaume d'Avignon (d)Conjoint ConstanceEnfants Rotboald Ier de ProvenceGuillaume Ier de Provencemodifier - modifier le code - modifier Wikidata Boson II (né vers 910 et mort en 968), comte d...
Il mulino delle donne di pietraUna scena del filmLingua originaleitaliano Paese di produzioneItalia, Francia Anno1960 Durata96 min Genereorrore, fantascienza, fantastico RegiaGiorgio Ferroni SoggettoRemigio Del Grosso, Ugo Liberatore, Giorgio Stegani, Giorgio Ferroni Casa di produzioneWanguard Film Distribuzione in italianoCino Del Duca FotografiaPier Ludovico Pavoni MontaggioAntonietta Zita MusicheCarlo Innocenzi ScenografiaArrigo Equini Interpreti e personaggi Pierre Brice: Hans...
American baseball player (born 1999) Baseball player Grayson RodriguezRodriguez with the Bowie Baysox in 2021Baltimore Orioles – No. 30PitcherBorn: (1999-11-16) November 16, 1999 (age 24)Houston, Texas, U.S.Bats: LeftThrows: RightMLB debutApril 5, 2023, for the Baltimore OriolesMLB statistics (through April 23, 2024)Win–loss record10–5Earned run average4.37Strikeouts163 Teams Baltimore Orioles (2023–present) Grayson Greer Rodriguez (born November 16, 1999) is an Am...
NGC 6193 الكوكبة المجمرة[1] رمز الفهرس NGC 6193 (الفهرس العام الجديد)OCl 975 (Catalogue of Star Clusters and Associations)C 1637-486 (فهرس كالدويل) المكتشف جيمس دنلوب تاريخ الاكتشاف 1826 شاهد أيضًا: مجرة، قائمة المجرات تعديل مصدري - تعديل إن جي سي 6193 (NGC 6193) هو عنقود مفتوح ايحتوي على 27...
State park in South Carolina, United States Givhans Ferry State ParkEdisto River in Givhans Ferry State ParkNearest cityRidgeville, SCCoordinates33°01′56″N 80°22′38″W / 33.032125°N 80.377228°W / 33.032125; -80.377228Area988 acres (4 km2)Created1934Camp sitestent and RV sites, primitive group camping area, cabinsHiking trails1.5 mile long River Bluff Nature Trail Givhans Ferry State Park is a state park located near the town of Ridgeville in Dorche...
Governors of the state of Tripura, India Governor of TripuraRaj Bhavan AgartalaIncumbentNallu Indrasena Reddysince 26 October 2023StyleHis ExcellencyResidenceRaj Bhavan; AgartalaAppointerPresident of IndiaTerm length5 YearsFormationrajbhavan.tripura.gov.in The state of Tripura is surrounded by eastern Bangladesh. This is a list of the governors of Tripura, a state in northeast India, since its inception as a state on 21 January 1972.[1] Powers and functions See also: Powers and f...
American writer (born 1935) This article is about the writer. For the entrepreneur, see Lewis Henry Lapham. Lewis H. LaphamLewis Lapham at an American Library Association conferenceBornLewis Henry Lapham (1935-01-08) January 8, 1935 (age 89)San Francisco, California, U.S.Alma materYale UniversityMagdalene College, CambridgeOccupationWriterKnown forFormer editor of Harper's MagazineSpouse Joan Brooke Reeves (m. 1972)Children3Parent(s)Lewis A. Lapha...
This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Princes Quay – news · newspapers · books · scholar · JSTOR (February 2012) (Learn how and when to remove this message) Shopping mall in East Riding of Yorkshire, EnglandPrinces QuayPrinces Quay Shopping Centre, Princes QuayLocationKingston upon Hull, East Ridi...
För andra betydelser, se Rrëshen (olika betydelser). Den här artikeln behöver källhänvisningar för att kunna verifieras. (2015-08) Åtgärda genom att lägga till pålitliga källor (gärna som fotnoter). Uppgifter utan källhänvisning kan ifrågasättas och tas bort utan att det behöver diskuteras på diskussionssidan. Rrëshen. Rrëshen (även Rrësheni) är en stad i norra Albanien, huvudort i Mirditëdistriktet, med 9 240 invånare (2001). Den här artikeln anses behöva fak...
Polish tennis player (born 1996) Jan ZielińskiZieliński at the 2023 Monte-Carlo MastersCountry (sports) PolandResidenceWarsaw, PolandBorn (1996-11-16) 16 November 1996 (age 27)Warsaw, PolandHeight1.80 m (5 ft 11 in)PlaysRight-handed (two-handed backhand)CollegeUniversity of GeorgiaCoachMariusz FyrstenbergPrize money$1,011,752SinglesCareer record0–2Career titles0Highest rankingNo. 769 (20 September 2021)DoublesCareer record73–49Career...