.
Günümüzde hiç kimse ChatGPT’nin tutarlı ve doğal bir dilde metin oluşturma yeteneklerinden şüphe duymuyor. Öyle ki, ilk başta ulaşılamaz bir hedef olan (insan metni oluşturmak) bir meydan okuma haline geldi: ChatGPT tarafından üretilen bir dili bir insan tarafından oluşturulandan ayırt etmek mümkün mü?
Şimdiye kadar yayınlanan araçlardan bazıları, örneğin, insan tarafından oluşturulan metnin daha kaotik olacağını varsayarak, metin rastgeleliğini analiz etmeye dayanmaktadır. ChatGPT’yi (OpenAI) oluşturan kuruluştan bile, dil modeli tarafından oluşturulan metni tanımak için yollar geliştirilmektedir.
Ek olarak, metinlerle eğitildikten sonra, metinlerde bulunan basmakalıplar model tarafından benimsenecek ve dillerini oluştururken önyargılar ortaya çıkacaktır. Bu nedenle, eşitlik üzerinde çalışmak gerekir (adalet): Adil bir model öğrenmek için bu önyargıları tespit edecek algoritmalar geliştirin.
Eğitiminiz
ChatGPT, aralarında Wikipedia makaleleri, haberler, kitaplar bulabileceğimiz, İnternetten milyonlarca metinle eğitilmiştir…
Eğitimi için yaklaşık 300 milyar kelimenin kullanıldığı tahmin edilmektedir. Bir dil modeli olarak işleyişi, verilen bir kelimeden sonra gelen olası kelimelerin hesaplanmasına ve olasılığı en yüksek olanın döndürülmesine dayanmaktadır. Bu, modele daha sonra hangi kelimelerin geleceğinin öğretildiği, önceden denetlenen bir doğrulama süreci aracılığıyla yapılır. Bir cümle girilir ve modelin yanlış cevap vermesi durumunda geçerli cevap verilir. Böylece ne söyleyeceğini öğrenir.
Ve eğer metinler taraflıysa?
Bu tür metinlerle eğitilmiş olması, ister istemez şu soruyu akla getiriyor: Metinler taraflı olursa ne olur? Toplumda mevcut olan fikirler veya klişeler eğitim verilerinde aktarılabilir ve aslında öyledir, çünkü metinlerde mevcut olan buydu. Herhangi bir yapay zeka modelinde olduğu gibi, eğitim setindeki önyargılar, model eğitildikten sonra modelin davranışına iletilecektir.
Böylesine güçlü bir aracın yalnızca yapay zeka uzmanlarına yönelik olması beklenebilir. Ancak entegre olduğu platform üzerinden internet bağlantısı olan herkes kullanabilir.
Başka bir yapay zekayı tespit etmek için bir yapay zeka
Bunun gibi modellerin ortaya çıkardığı en büyük zorluklardan biri, kullanımlarındaki sahtekarlıktır.
ChatGPT tarafından yazılmış bir metni algılamak mümkün müdür? Şu anda, bir metnin bir dil modeli tarafından yazılıp yazılmadığını tespit etmek için araçlar zaten geliştirilmiştir. Her zaman haklı olmadıkları da doğru olsa da. Şu anda kullanılan yollardan biri, metinde mevcut olan karışıklığın veya aynı şey olan rastgeleliğin analizidir. Bu ölçü, bir metindeki düzensizlik derecesini gösterir. Yüksek bir şaşkınlık, metnin gerçek bir kişi tarafından oluşturulma olasılığının daha yüksek olduğunu gösterir. Bu nedenle, metnin uzunluğu ne kadar uzun olursa tespit aracının güvenilirliği de o kadar yüksek olur (uzunluğun artması düzensizliğin derecesi hakkında daha fazla bilgi sağlar).
Son zamanlarda Stanford Üniversitesi’ndeki araştırmacılar tarafından yayınlanan bir makalede yayınlanan bir başka yöntem, olasılık eğriliği istatistiksel yöntemine dayanmaktadır. Makalede belirtildiği gibi, bir yapay zeka tarafından üretilen metnin log-olabilirlik fonksiyonunda negatif bir eğrilik vardır. Bu, pozitif eğriliğe sahip olan insan yapımı metnin tersidir.
Yani, birçok durumda dolandırıcılık tespit araçları, başka bir yapay zekayı tespit etmek için bir yapay zekadır.
ChatGPT’yi oluşturan kuruluş OpenAI, oluşturulan metinlerde filigranların geliştirilmesi üzerinde çalışıyor: insan için algılanamaz işaretler, ancak metnin yazarının bir insan mı yoksa bir yapay zeka mı olduğunu gösteren bilgisayar araçları aracılığıyla tespit edilebilir.
Hesap makinelerini yasaklamak istediğimizde
Mevcut tartışma, hesap makinelerinin kullanımıyla ilgili olana biraz benziyor. Onları yasaklamak yerine, onları öğrenmeye entegre etmek ve bunlardan en iyi şekilde yararlanmak için nasıl kullanılacağını öğretmek mümkündü. ChatGPT’deki durum benzerdir, buradaki zorluk, bu teknolojiyi öğretime entegre etmek ve sahip olduğu büyük potansiyelin farkında olarak yeteneklerinden yararlanabilmektir. Bunu yapmak için, bunun gibi araçları kullanan öğrenmeyi değerlendirmenin yollarını bulmanız gerekecek.
Model, temel olarak intihal ve önyargı yoluyla akademik dolandırıcılıktan oluşan bazı tehlikeler sunar. Diğer yapay zeka modellerinde olduğu gibi, ChatGPT eğitimi için bazı veriler (bu durumda yazılı metin) alır. Sonuç olarak, sergiledikleri davranış, bu metinlerle öğrendikleri tarafından belirlenir. Örneğin, adli hükümlerle ilgili tüm eğitim metinlerinin bir kişinin ırkına bağlı olarak suçlu olup olmadığını belirttiği varsayımsal durumda, model bu kuralı öğrenecektir. Ve bir kişinin suçlu olup olmadığını nasıl belirleyeceğiniz sorulsaydı, buna ırkına göre cevap verirdiniz.
Verilerdeki önyargı
Tüm bu nedenlerden dolayı, çalışmalar artık mevcut önyargıları dikkate alarak ve dengeyi bu hakkaniyet lehine dengeleyerek verilerden nasıl öğrenileceğine odaklanmaktadır. adalet).
Navarra Üniversitesi Veri Bilimi ve Yapay Zeka Enstitüsü DATAI’den şu konularda araştırma çalışmaları yürütülüyor: adalet bir algoritma tarafından verilen kararlarda. Sıklıkla sapma, algoritmada olduğundan daha fazla veridedir ve bu nedenle amaç, verilerdeki bu sapmayı tespit etmek ve otomatik olarak onarmaktır. Ayrıca, doğal dil işlemeyi kullanarak bir metinden kişilik modeli çıkarmaya olanak tanıyan bir yapay zeka motorunun geliştirilmesi üzerinde çalışan bir grup araştırmacı da var.
İçerebileceği risklere rağmen, ChatGPT bilimsel alanda büyük bir ilerlemeyi temsil eder. Sorun, yeteneklerini bilmek, onlardan yararlanmak ve ima ettiği tehlikelerle mücadele etmektir. Bu şekilde, büyük potansiyele sahip bir yardımcı olmak için bir tehdit olmaktan çıkacaktır.
.