elektrik port üyelik servisleri elektrik port üyelik servisleri

Diferansiyel Gizlilik Nedir? Nerede Kullanılır?

Verilerimizin günümüzde pazarlama, öneri sistemleri geliştirme ve tahminleme gibi alanlarda sıklıkla kullanılması bu verilerin mahremiyetinin sağlanmasının ne kadar önemli olduğunu bir kez daha gözler önüne seriyor. Peki hem veri mahremiyeti sağlayıp hem de öneri sistemleri geliştirmek mümkün mü? Detaylar yazımızın devamında.



A- A+
07.03.2022 tarihli yazı 3110 kez okunmuştur.
Bir veritabanı yönettiğimizi düşünelim. Bu verilerden elde ettiğimiz istatistikleri paylaşmak istediğimizde kötü niyetli bir kişinin tersine mühendislik ile bu verileri ele geçirmesini veya ifşa etmesini istemeyiz. Diferansiyel gizlilik, hassas veriler, verilerden elde edilen istatistikleri yayınlaması gereken küratörler ve hassas verileri ele geçirmek isteyen kötü niyetli kullanıcılar arasında oluşabilecek sorunları çözmek için kullanılabilecek önemli bir kavramdır.

Şekil 1: Hassas Veri, Veri Küratörleri, Kötü Niyetli Kullanıcılar

►İlginizi Çekebilir: Açık Kaynak Veri Tabanları Nedir?
 

Veri gizliliğini sağlamak neden bu kadar zor? Verileri anonimleştirmek yeterince iyi bir çözüm olabilir mi?

Diferansiyel gizlilik verilerin gürültülü ve belirsiz hale gelmesi için rastgele gürültü eklenmesine dayanır ve bu nedenle mahremiyeti ihlal etmek çok daha zor hale gelir. Diferansiyel gizliliğin ne olduğundan bahsettiğimize göre biraz da diferansiyel gizliliğin temelindeki matematiğe göz atalım. Bir algoritma ancak aşağıdaki şartı sağlıyorsa diferansiyel gizli bir algoritma olarak kabul edilebilir.
 
Pr[A(D) = x] ≤ e^ϵ * Pr[A(D’) = x]

Tüm x verileri ve bu veri çitflerinden oluşan tüm D veri kümeleri için, D’ herhangi bir kişinin verilerinin D kümesinden çıkarılmasıyla oluşacak yeni kümeyi ifade eder.

ε (Epsilon): Gizlilik kaybı parametresi, eklenecek gürültü miktarını belirler. Epsilon, veri özniteliklerinden birinin veri kümesinden çıkarılması durumunda hesaplamada ne kadar sapma olduğunu belirleyen Laplace Dağılımı olarak bilinen olasılık dağılımından türetilir. Epsilon ne kadar küçükse kullanıcıların verilerinin veri kümesinden çıkarılacağı hesaplamalardaki sapma da o kadar küçük olur. Daha yüksek Epsilon değerleri daha doğru, daha az özel sonuçlar gösterir ve daha düşük Epsilon, saldırganların verisetine dair çok fazla bilgi edinmesini engelleyecek yüksek randomize sonuçlar sağlar. Bu nedenle, Epsilon'un küçük değeri için hesaplama sonuçları gerçek sonuçtan daha uzak olsa da daha güçlü veri koruması sağlar. Bununla birlikte, gerekli veri koruma ve doğruluk düzeyini sağlayacak en uygun Epsilon değeri henüz belirlenmemiştir. Kullanıcıların oluşturması gereken gizlilik ve doğruluk arasındaki ilişkiye bağlı olarak farklı epsilon değerleri belirlenir. 
Şekil 2: Diferansiyel Gizlilik Diyagramı

►İlginizi Çekebilir: Veri Madenciliği | Apriori Algoritması 1.Bölüm

Diferansiyel Gizliliğin Günümüzde Kullanım Alanları Nelerdir?

Günümüzde teknolojinin gelişimi ile kurum, kuruluş ve hükümetlerin veriye ve veri gizliliğine bakış açısını gözden geçirmelerini gerektirecek pek çok veri ihlali ve siber tehdit ile karşı karşıyayız. Bununla birlikte büyük miktarda eğitim verisi gerektiren makine öğrenmesi teknikleri neredeyse bütün alanlarda karşımıza çıkmaya devam ediyor. Makine öğrenmesi kullanılan araştırmalarda sıklıkla kurumlar ve bireyler hakkında hassas veya gizli bilgiler içeren veriler kullanılıyor. Bu tür verilerin uygunsuz şekilde ifşa edilmesi, ilgili kişiler ve kurumlar için olumsuz sonuçlar doğurabiliyor hatta hukuki süreçlerin gelişmesine yol açabiliyor. Bu noktada diferansiyel gizlilik kurumların ve araştırmacıların gizlilik ihlalleri olmadan araştırma yapması için hassas verilere erişmesini sağlıyor.
 

Araştırma kurumları, bulut paylaşım toplulukları içindeki gizlilik süreçlerini otomatikleştirmek için farklı gizlilik teknolojileri geliştirerek kullanıcıların gizliliğini koruyabiliyor ve veri paylaşımı sorununu çözebiliyor. Diferansiyel gizlilik, veri kümesine titizlikle gürültü ilave edilerek verileri anonim hale getiriyor. Veri analistlerinin, herhangi bir kişisel bilgiyi tanımlamadan tüm yararlı analizleri yürütmesine olanak sağlıyor. Öneri sistemleri ve sosyal ağlardan konum tabanlı hizmetlere kadar pek çok farklı alanda diferansiyel gizlilik uygulanabilir. 


Şekil 3: Kişisel Veri Örnekleri
 
► Apple, iPhone, iPad ve Mac gibi cihazlardan anonim kullanım bilgileri toplamak için diferansiyel gizlilik kullanır.

► Amazon, kullanıcının kişiselleştirilmiş alışveriş tercihlerine erişmek için diferansiyel gizlilik kullanır ve geçmiş satın alımlarıyla ilgili hassas bilgileri analiz eder.

► Facebook, herhangi bir ülkenin gizlilik politikalarına aykırı bir hamlede bulunmadan hedef reklam kampanyaları için kişisel veriler toplayabilmek amacıyla diferansiyel gizlilik kullanır.

► Makine öğrenmesinde, oyun teorisinde, iktisadi mekanizma tasarımında ve istatistiksel tahminlemede diferansiyel gizlilik kullanılır.

Bir veri kümesinin ortalama, medyan, mod vb. özellikleri yalnızca bu algoritmanın çıktısı incelenecek şekilde analiz edildiğinde, analiz eden kişi herhangi bir bireyin verilerinin gerçek veri kümesine dahil edilip edilmediğini belirtemeyeceği için diferansiyel gizli bir algoritma olarak kabul edilebilir. En basit haliyle diferansiyel gizliilik, bir bireye ait veriler veri kümesine dahil edildiğinde ya da veri kümesinden çıkarıldığında veri kümesinde hiç bir davranış değişikliği olmayacağını garanti eder.

 

Diferansiyel Gizlilik Neyi Garanti Eder?

Diferansiyel gizlilik, matematiksel olarak diferansiyel bir analizin sonucunu gözlemleyen bir kişinin, herhangi bir bireyin özel bilgilerinin analiz için girdide bulunup bulunmadığına bakılmaksızın, o analiz sonucunda muhtemelen aynı çıkarımı üreteceğini garanti eder. Ayrıca, bağlantı saldırıları (linkage attacks) gibi çok çeşitli saldıralara karşı gizliliğin korunmasını sağlar.

 

Diferansiyel Gizliliğin Özellikleri

► Diferansiyel gizlilik, hassas kişisel bilgileri değerlendirmek ve gizliliği korumak için onu zengin bir çerçeve haline getiren bazı değerli özelliklere sahiptir.

► Diferansiyel gizlilik mekanizması ve algoritmaları altında, farklı teknikler arasında karşılaştırmalar aracılığıyla gizlilik kaybı ölçülebilir. Bununla birlikte gizlilik kaybı kontrol edilebilir.

► Gizlilik kaybının ölçülebilmesi birden fazla hesaplamada gizlilik kayıplarının kontrolü ve analizine ek olarak kompozisyon altında diferansiyel gizlilik temelli mekanizmaların davranışının anlaşılmasını kolaylaştırır.

► Diferansiyel gizlilik, gruplar (aileler, kurumlar gibi) arasında gelişen gizlilik kaybının kontrolüne ve analizine olanak sağlar.

► Bir veri analisti, özel bir veritabanı hakkında ek bilgiye sahip olmadan diferansiyel gizlilik algoritmasının çıktısının gerçekleştirebileceği işlevleri gerçekleştiremez.
 

Diferansiyel Gizliliğin Avantajları

Diferansiyel gizlilik, geleneksel gizlilik tekniklerine göre çeşitli avantajlara sahiptir. Mevcut tüm verilerin tanımlanmış bilgiler olduğunu varsayarsak, diferansiyel gizlilik, verilerin tüm öğelerini tanımlarken karşılaşılabilecek zorlukları ortadan kaldırır. Diferansiyel gizlilik, yardımcı bilgiler ile oluşabilecek gizlilik saldırılarına karşı dirençlidir ayrıca muhtemel bağlantı saldırılarını etkili bir şekilde engelleyebilir.
 

Diferansiyel Gizlilik Nasıl Çalışır?

Diferansiyel gizlilik, veri analizini gerçekleştirirken veri kümesine rastgele bir miktar gürültü ekleyerek bireyin verilerinin gizliliğini korur. Basitçe, bir analizin sonucuna dayanarak gürültü eklendiğinde bireysel verileri tanımak mümkün olmayacaktır. Bununla birlikte, gürültü eklendikten sonra analizin çıktısı, yalnızca gerçek veri kümesi üzerinde gerçekleştirilirse elde edilecek kesin (doğru) sonuç değil, yaklaşık bir sonuca dönüşür. Ek olarak, diferansiyel gizlilik temelli analizler birden çok kez gerçekleştirilirse, veri kümelerinde gürültülerin rastgeleliği ortaya çıktıkça her seferinde farklı sonuçlar vermesi de son derece mümkündür.

Bir veri analisti, kişisel olarak tanımlanabilir bilgileri korurken verilerin nasıl analiz edileceği konusunda iyi kararlar vermelidir. Bileşimsellik aynı verilerden birden fazla analiz sonucu sunarken anlamlı gizlilik garantilerinin oluşturulmasını sağlar.

Diferansiyel gizlilik, rastgele gürültüyü, sonucu değiştirmeden tek tek girdilerin kaydedilmesi ile oluşan kümülatif bir sorguyu toplayarak elde edilebilir.

Diferansiyel gizlilik, mahremiyetle ilgili pratik sorunları ölçmek ve çözmek için oldukça güçlü bir yöntem. Sahip olduğumuz en değerli şeylerden birinin verilerimiz olduğunu göz önüne bulundurursak gizlilikten ödün vermeden bu verilerden faydalı bilgiler elde etmek için diferansiyel gizlilik gibi yöntemlerin büyük bir potansiyel taşıdığını fark edebiliriz.



Kaynak:

► towardsdatascience.com
► medium.com
► analyticssteps.com
► infoq.com
 

Aktif etkinlik bulunmamaktadır.
ANKET
Endüstri 4.0 için En Hazır Sektör Hangisidir

Sonuçlar