Captcha nedir?
Captcha(Completely Automated Public Turing test to tell Computers and Humans Apart) Carnegie Mellon School of Computer Science tarafından geliştirilen bir projedir. Projenin amacı bilgisayar ile insanların davranışlarının ayırt edilmesidir ve daha çok bu ayrımı yapmanın en zor olduğu web ortamında kullanılmaktadır.
Captcha projesinin bazı uygulamalarına çoğu web sayfalarında rastlamak mümkündür. Üyelik formlarında rastgele resim gösterilerek formu dolduran kişiden bu resmin üzerinde yazan sözcüğü girmesi istenir. Buradaki basit mantık o resimde insan tarafından okunabilecek ancak bilgisayar programları tarafından okunması zor olan bir sözcük oluşturmaktır. Eğer forma girilen sözcük resimdeki ile aynı değilse ya formu dolduran kişi yanlış yapmıştır ya da formu dolduran bir programdır denebilir.
Captcha ile bilgi girişlerinin kötü niyetli kişilerin yazdığı programlar tarafından otomatik olarak yapılmasının önüne geçilmesi amaçlanır.[kaynak]
Ancak tüm captcha'lar görsel modellere dayanmaz. Aksi takdirde, görme bozukluğu olan herhangi bir Web kullanıcısının haklarından mahrum etme riski taşır. Görsel bir teste alternatif, sesli captcha`da mevcuttur. Sesli bir captcha genellikle kullanıcıya bir dizi sesli harf veya rakam sunar.
reCAPTCHA nedir?
Bu projede yapılan
sadece rastgele harfleri kullanıcıya girmek değil kitapların
sayısallaştırılmasına yardım etmek. Peki kitapların sayısallaşması ne
demek? Kütüphanelerde duran çok eski kitapların taratılmasından elde
edilen resimler OCR (Optical Character Recognition) ile kelimelere
dökülüyor. Eğer resim halinde bırakılsalardı hem çok boyut kaplarlardı,
küçük cihazlarda saklanamazdı, indirmek çok maliyetli
olurdu, hem de arama yapılamazdı. Resimleri text haline OCR ile
getirilebiliyor. Ama OCR ne yazık ki mükemmel değil, %100 başarılı
olamıyor, okuyamadığı kelimeler oluyor. Dünyada günde 200milyon
captcha’nın çözüldüğünü varsayarsak, bilgisayar tarafından okunamayan
kelimeleri captcha olarak kullanıyoruz. Peki ya bilgisayarın okuyamadığı
kelimeyi insanların doğru yazıp yazmadığına nasıl karar veriyoruz?
reCAPTCHA iki tane kelime gösteriyor. Bir tanesi zaten
sayısallaştırılabilmiş kelime. Diğeri ise henüz sayısallaştırılmamış
kelime. Kullanıcı bilinen kelimeyi doğru girerse, diğer kelimeyi
girdiğinde doğru olarak kabul ediliyor. Bilgisayarın bilmediği kelime
belli sayıda kullanıcının aynı değeri girmesi durumunda doğru olarak
kabul ediliyor. Luis von Ahn TEDx konuşmasında konuyu detaylıca anlatıyor.[kaynak]
Captcha ve Turing testi
Captcha teknolojisi, Turing Test adlı bir deneyde temelini attı.[kaynak]
Turing testi, ilk olarak 1950 yılında Mind adlı felsefe dergisinde ünlü İngiliz matematikçi ve bilgisayar bilimcisi Alan Turing'in Computing Machinery and Intelligence başlıklı ünlü makalesinde sözü edilen kavram.
Turing testinin amacı, bir makinenin düşünebildiğini söyleyebilmenin mantıksal olarak mümkün olup olmadığıdır. Turing testine göre makine, gönüllü bir insanla birlikte, sorgulayıcının görüş alanının dışında bir yere saklanır. Sorgulayıcı yalnız soru sormak suretiyle hangisinin insan hangisinin bilgisayar olduğunu saptamaya çalışır. Sorgulayıcının soruları ve daha önemlisi aldığı yanıtlar, tamamen ses gizlenerek, yani ya bir klavye sisteminde yazılarak veya bir ekranda gösterilerek verilir. Sorgulayıcıya bu soru-cevap oturumunda elde edilen bilgiler dışında her iki taraf hakkında hiçbir bilgi verilmez. Dizi halinde tekrarlanan testler sonucunda sorgulayıcı, tutarlı bir şekilde insanı saptayamadığı takdirde makine Turing testini geçmiş sayılır.[kaynak]
Captcha ve Turing testi
Captcha teknolojisi, Turing Test adlı bir deneyde temelini attı.[kaynak]
Turing testi, ilk olarak 1950 yılında Mind adlı felsefe dergisinde ünlü İngiliz matematikçi ve bilgisayar bilimcisi Alan Turing'in Computing Machinery and Intelligence başlıklı ünlü makalesinde sözü edilen kavram.
Turing testinin amacı, bir makinenin düşünebildiğini söyleyebilmenin mantıksal olarak mümkün olup olmadığıdır. Turing testine göre makine, gönüllü bir insanla birlikte, sorgulayıcının görüş alanının dışında bir yere saklanır. Sorgulayıcı yalnız soru sormak suretiyle hangisinin insan hangisinin bilgisayar olduğunu saptamaya çalışır. Sorgulayıcının soruları ve daha önemlisi aldığı yanıtlar, tamamen ses gizlenerek, yani ya bir klavye sisteminde yazılarak veya bir ekranda gösterilerek verilir. Sorgulayıcıya bu soru-cevap oturumunda elde edilen bilgiler dışında her iki taraf hakkında hiçbir bilgi verilmez. Dizi halinde tekrarlanan testler sonucunda sorgulayıcı, tutarlı bir şekilde insanı saptayamadığı takdirde makine Turing testini geçmiş sayılır.[kaynak]
Peki sistem robotu nasıl tanıyor?
Google sistem hakkında güvenlik nedeniyle detaylı bilgi vermekten kaçınıyor.Ancak kullanılan yöntemler büyük ölçüde biliniyor.
Google Captcha takımı ürün müdürü Vinay Shet, Wired'a
yaptığı açıklamada yeni sistemin birçok ipucundan faydalandığını
söylüyor. Bunlar arasında kullanıcının IP adresi, fare hareketleri,
çerezler ve fazlası gibi bilgiler var.[kaynak]
Ayriyetten eklenen favorileriniz,Lokal ayarlar,sistem verileri ve web sitelerinde kalma süreside muhtemel veriler arasında bulunuyor.[kaynak]
Dailymail deki habere göre,İnternette kişisel verilerin gizliliğini korumak üzere çalışmalar yapan
Princeton Üniversitesinin, İnternet Şeffaflık ve Hesap Verebilirlik
Projesi kapsamında yürütülen çalışmada, 400'den fazla popüler internet
sitesinin kullanıcıların sitede yaptıkları tıklamalar, fare hareketleri
ve sayfaları kaydırma davranışlarına kadar çevrimiçi hareketlerini takip
edebildiği öne sürüldü.[kaynak]
Google Captcha olarak Street View resimlerinide kullanıyor
ReCaptcha'larda Google Sokak Görünümü'nden çekilen ev numaralarına benzeyen ve şüpheli görünen görüntüleri görmeye mi başladınız? Google,kullanıcıların cadde adları ve işletme adresleri gibi şeyleri tanımlamasını sağlayarak, Google Haritalar'daki verileri iyileştirmek için recaptcha spamla mücadele sistemini kullanmayı içeren bir deneme çalıştığını doğruladı.[kaynak]
Captcha Robot"Ben Robot Değilim"Tıklayamaz Mı?Elbette tıklayabilir.Ancak muhtemelen sistemde yine robot olarak tanınır.
reCaptcha modülü, tıklatmadan hemen önceki fare hareketleri ve sayfaları kaydırma davranışlarına kadar çevrimiçi hareketlerini algılar ve aynı zamanda bir kullanıcıyı belirlemek için kullanıcının IP adresini belirli veritabanlarıyla ve diğer özellikleri ile eşleştirir.
Yani kancalama anındaki "ben robot değilim"belirleyici olmuyor.Kancalamaya giden süreçteki IP ve fare hareketleri ve sayfaları kaydırma davranışları belirleyici etken.
Bu arada her sistemin bir açığı var.Bunu başarabilen bir robotumuzda oldu tabiki.Yazılımı kandırmanın ironik bir yolunu bulan bu youtuberi tebrik ederiz.[kaynak]
Kaynaklar,
1.http://static.usenix.org/event/sec10/tech/full_papers/Motoyama.pdf
2.https://en.wikipedia.org/wiki/CAPTCHA
3.Tedx Talks-https://www.youtube.com/watch?v=-Ht4qiDRZE8
4.https://www.wired.com/2014/12/google-one-click-recaptcha/
5.https://www.dieerfolgsbringer.de/so-funktioniert-das-google-captcha/
6.https://www.dailymail.co.uk/sciencetech/article-5103119/Secret-code-built-websites-tracks-move.html
7.https://techcrunch.com/2012/03/29/google-now-using-recaptcha-to-decode-street-view-addresses/
8.Video-Zuck that-https://www.youtube.com/watch?v=jCr6rNaZ9EU
9.https://en.wikipedia.org/wiki/Turing_test
10.https://computer.howstuffworks.com/captcha1.htm