Yönetmen Steven Spielberg , 2002 yapımı Azınlık Raporu filminde ( Philip K. Dick’in kısa öyküsünden uyarlanmıştır ), üç medyumun cinayetleri gerçekleşmeden önce “görebildiği” bir gelecek hayal etmişti. Basiretleri, Tom Cruise ve “Suç Öncesi” polis gücünün neredeyse tüm potansiyel cinayetleri önlemesine olanak tanır.
Yirmi yıl sonra, gerçek dünyada, bilim adamları ve kolluk kuvvetleri bu medyumları taklit etmek için veri madenciliği ve makine öğrenimini kullanıyor. Bu tür ” öngörülü polislik ” olarak adlandırılan şey, birçok suçun – ve suçlunun – tespit edilebilir modellere sahip olduğu gerçeğine dayanmaktadır .
Tahmine dayalı polislik bazı başarılar elde etti. ABD’deki bir vaka incelemesinde , bir polis departmanı, tipik olarak silahların bol olduğu Yılbaşı Gecesi’nde silahlı olayları %47 oranında azaltmayı başardı. Birleşik Krallık’taki Manchester polisi , tahmine dayalı önlemleri uygulamaya koymasının ilk 10 haftasında benzer şekilde soygunları, hırsızlıkları ve motorlu araçlardan yapılan hırsızlıkları çift haneli rakamlarla tahmin edip azaltabildi.
Tahmine dayalı polislik hızla gelişti. Geçmişte , insanlar suç raporlarını manuel olarak incelemek veya ulusal suç veritabanlarını filtrelemek zorundaydı. Şimdi, büyük veri, veri madenciliği ve güçlü bilgisayarlar çağında , bu süreç otomatikleştirilebilir.
Ancak sadece bilgi bulmak suçu caydırmak için yeterli değildir. Altta yatan kalıpları ve ilişkileri tespit etmek için verilerin analiz edilmesi gerekir. Bilim adamları, mevcut verilerden yararlı bilgiler ve içgörüler çıkarmak için, insanların öğrenme şeklini taklit eden makine öğrenimi gibi algoritmalar ve matematiksel modeller kullanır.
Son zamanlarda, yaklaşımımızı iyileştirmek için 18. yüzyılda tasarlanmış bir matematiksel yönteme yöneldik . Bu yöntemi temel alan mevcut bir algoritmayı değiştirerek, suç tahmin oranlarını önemli ölçüde iyileştirdik.
Bu bulgu, Güney Afrika gibi yetersiz kaynaklara sahip bağlamlarda öngörücü polisliğin uygulanması için umut vaat ediyor. Bu, bazıları dünyadaki en yüksek ve yükselen suç seviyelerinin düşürülmesine yardımcı olabilir . Bu, ülkenin polis gücünün dizginlemek için yeterli donanıma sahip olmadığı bir durum.
İki farklı yaklaşımı birleştirmek
Thomas Bayes bir İngiliz matematikçiydi. Ünlü Bayes teoremi , esas olarak, bir olayın meydana gelme olasılığını, o olayla ilgili olabilecek bazı ön bilgilere dayanarak açıklar. Bugün Bayes analizi, yapay zeka, astrofizik, finans, kumar ve hava tahmini gibi çok çeşitli alanlarda olağan hale geldi. Naïve Bayes algoritmasına ince ayar yaptık ve onu bir suç tahmincisi olarak test ettik.
Bayes analizi, istatistiksel modellerin bilinmeyen parametreleri hakkındaki araştırma sorularını yanıtlamak için olasılık ifadelerini kullanabilir. Örneğin, bir suçla itham edilen bir zanlının suçlu olma olasılığı nedir? Ancak, poker kartlarının nasıl açılacağını veya insanların (özellikle suç işleme niyeti olan insanların) nasıl davranacağını hesaplamak gibi daha derine inmek, giderek daha karmaşık teknolojiler ve algoritmalar gerektirir.
Araştırmamız , suç tahmini için popüler bir denetimli makine öğrenimi algoritması olan Naïve Bayes algoritması veya sınıflandırıcısı üzerine kuruludur .
Naïve Bayes, özelliklerin – girdi görevi gören değişkenlerin – koşullu olarak bağımsız olduğu, yani bir özelliğin varlığının diğerlerini etkilemediği öncülüyle başlar.
Naïve Bayes algoritmasını Özyinelemeli Özellik Eleme olarak bilinen başka bir algoritmayla birleştirerek ince ayar yaptık . Bu araç, sonuçları iyileştirmek amacıyla bir veri kümesindeki daha önemli özelliklerin seçilmesine ve daha zayıf olanların kaldırılmasına yardımcı olur.
Daha sonra incelikli algoritmamızı , o Amerikan şehrinde suçu tahmin etmek ve azaltmak için kullanılan Chicago Polis Departmanının CLEAR (Citizen Law Enforcement Analysis and Reporting) sisteminden çıkarılan popüler bir deneysel veri setine uyguladık . Bu veri seti, içerdiği zengin veriler nedeniyle küresel olarak uygulandı: olay düzeyinde suç verileri, kayıtlı suçlular, topluluk endişeleri ve şehirdeki polis karakollarının konumlarını sağlar.
Geliştirilmiş Naïve Bayes’imizin sonuçlarını, orijinal Naïve Bayes’in sonuçlarıyla ve ayrıca Rastgele Ormanlar ve Son Derece Rastgeleleştirilmiş Ağaçlar ( suç tahmini için üzerinde çalıştığımız algoritmalar) gibi diğer tahmine dayalı algoritmalarla karşılaştırdık . Naïve Bayes’in tahminlerini yaklaşık %30 iyileştirebileceğimizi ve diğer algoritmaların tahminlerini eşleştirebileceğimizi veya iyileştirebileceğimizi bulduk.
Veri ve önyargı
Modelimiz umut verici olsa da, onu Güney Afrika bağlamlarına uygularken kesinlikle eksik olan bir unsur var: veriler. Chicago CLEAR sisteminin gösterdiği gibi, tahmine dayalı modeller, üzerinde çalışacak çok sayıda ilgili veriye sahip olduğunuzda en iyi şekilde çalışır. Ancak Güney Afrika polis teşkilatı, belki de gizlilik sorunlarından dolayı, tarihsel olarak verileri konusunda çok cimri olmuştur. Suç dizilerini tespit etme ve haritalama üzerine yaptığım doktora araştırmamda bu sorunla karşılaştım .
Bu yavaş yavaş değişiyor. Şu anda, tahmine dayalı polislik için Güney Afrika Polis Teşkilatı verilerini kullanarak, Cape Town’un merkezi iş bölgesine ve üniversitemizin bulunduğu bölgeye yaklaşık 20 km uzaklıktaki bir banliyö olan Bellville’de küçük bir vaka çalışması yürütüyoruz .
Bunların hiçbiri, tahmine dayalı polisliğin tek başına Güney Afrika’nın suç sorununu çözeceğini önermez. Tahmine dayalı algoritmalar ve polislik kusursuz değildir. Azınlık Raporu’ndaki medyumların bile hatasız olmadığı ortaya çıktı. Örneğin, bu algoritmaların basitçe ırksal önyargıları güçlendirebileceğine dair korkular hem Güney Afrika’da hem de başka yerlerde gündeme geldi .
Ancak, sürekli teknolojik gelişmeyle, tahmine dayalı polisliğin polisin tepki verme yeteneğini güçlendirmede önemli bir rol oynayabileceğine ve halkın polise olan güvenini artırmaya yönelik küçük bir adım olabileceğine inanıyoruz.