OpenAI, GPT-4 Modelini Eğitmek İçin Bir Milyon Saatten Fazla YouTube Video Kullanmış!

Son zamanlarda The New York Times’ın ortaya attığı iddialara göre yapay zekâ geliştiricisi OpenAI, GPT-4 adlı dil modelini eğitmek için telif haklarına konu olabilecek bir milyondan fazla YouTube videosunu kullanmış olabilir. Bu durum, yapay zekâ modellerinin eğitiminde kullanılan veri kaynaklarının etik ve yasal sorunlarını gündeme getiriyor.

Rapora göre OpenAI’nin bu büyük veri havuzunu oluşturmak için Whisper adlı bir ses tanıma aracı kullanarak YouTube videolarını metin haline dönüştürdüğü belirtiliyor. Elde edilen metinler daha sonra GPT-4’ü eğitmek için kullanıldı. Ancak, bu verilerin izinsiz kullanımı telif haklarının ihlali anlamına gelebilir.

OpenAI yetkilileri, veri toplama sürecinde bu konuların farkında olduklarını ve yasal sorunlar yaratmayacağını düşündüklerini belirtiyorlar. Ancak, Google tarafından sağlanan YouTube verilerinin bu şekilde kullanımının Google’ın izin politikalarıyla uyumlu olup olmadığı da belirsizliğini koruyor.

Google ise konuya ilişkin “doğrulanmamış raporları” doğruladı ve izinsiz veri kullanımının yasak olduğunu vurguladı. Ayrıca Google’ın kendi iç modellerini eğitmek için YouTube içeriklerini kullandığı da ortaya çıktı. Bu durumda Google’ın da OpenAI’ın aksine harekete geçmemesi dikkat çekici bir ayrıntı olarak değerlendiriliyor.

Yapay zekâ teknolojilerinin gelişimiyle birlikte bu tür veri kullanımı ve telif hakları ihlalleri gibi konular önem kazanıyor. OpenAI gibi büyük teknoloji şirketleri ve platformlarının, veri kullanımı konusunda daha şeffaf ve izinli bir yaklaşım benimsemeleri gerekebilir. Bu tür gelişmeler, yapay zekânın karşılaştığı etik ve yasal zorlukları da gün yüzüne çıkarıyor. Konuyla ilgili gelişmeleri yakından takip edeceğiz.

Share.
Leave A Reply

Exit mobile version