Yapay zekanın telif hakkı sorununa dev çözüm: 8 terabaytlık yasal veri seti yayınlandı

‘The Common Pile v0.1’: Yapay Zeka Eğitiminde Yeni Bir Dönem

Yapay zeka modellerini eğitmek için EleutherAI tarafından yayınlanan 8 terabaytlık ‘The Common Pile v0.1’ adlı veri seti, lisanslı ve kamuya açık metinlerden oluşuyor. Bu veri seti, yapay zeka alanında önemli bir dönüm noktası olabilir.

EleutherAI, büyük yapay zeka şirketlerinin telif hakkı davalarıyla karşı karşıya kalmaması adına ‘The Common Pile v0.1’ veri setini geliştirdi. Bu veri seti, Hugging Face ve GitHub platformlarından indirilebilirken, içeriğinde 300.000 kamuya açık kitabın dijitalleştirilmiş verileri bulunuyor.

Yönetici direktör Stella Biderman, telif hakkı davalarının şirketlerin şeffaflığını azalttığını ve yapay zeka araştırmalarına zarar verdiğini belirtti. Bu nedenle EleutherAI, lisanslı verilerle geliştirilen Comma v0.1-1T ve Comma v0.1-2T adlı iki yeni yapay zeka modeli oluşturarak veri setinin etkinliğini kanıtladı.

EleutherAI’nin geliştirdiği bu modeller, telifli verilerle eğitilen popüler yapay zeka modelleriyle başarılı bir rekabet sergiliyor. Biderman, yasal kaynaklarla yüksek kaliteli yapay zeka modelleri geliştirilebileceğini vurgulayarak, lisanssız metinlerin performansı artırdığı yönündeki yaygın kanının haksız olduğunu belirtiyor.

Related Posts

Ghost of Yōtei ne zaman çıkıyor?

Ghost of Tsushima’nın devam oyunu Ghost of Yōtei’nin çıkış tarihi, fiyatı ve fragmanı paylaşıldı.

YouTube’dan yapay zekâ içeriklerine sert darbe

YouTube, içerik üreticilerinin “yapay” ve “tekrarlayan” içeriklerle para kazanmasını engellemek amacıyla YouTube İş Ortağı Programı (YPP) politikalarını güncellemeye hazırlanıyor. 15 Temmuz’da yürürlüğe girecek yeni kurallar, özellikle yapay zekâ destekli kitlesel içerik üretimini hedef alıyor.

Grok’tan dün geceyle ilgili ilk açıklama geldi: Kandırıldım

Dün akşam saatlerinden itibaren X’in yapay zeka aracı Grok tarafından verilen yanıtlar gündeme oturdu. Agresif ve argo ifadelerle yanıtlar veren Grok, devlet görevlilerine ve hassas değerler hakkında da ağır cümleler kullandı. Sabah saatlerinde erişim engeli talebi getirilen Grok konuyla ilgili ilk cevabını verdi: Kandırıldım

IBM yeni çipleriyle basitleştirilmiş yapay zekayı hedefliyor

IBM diğer çip üreticilerine kıyasla daha fazla güç tasarrufu sağlayacak ve aynı zamanda yapay zekanın iş operasyonlarında uygulanma sürecini basitleştirecek yeni veri merkezi çiplerini ve sunucularını duyurdu.

Eski Mısır’da tarihi keşif: 4500 yıllık DNA tamamen çözüldü

Bilim insanları, Eski Mısır’da yaşamış bir bireyin ilk kez tam genom dizilimini gerçekleştirdi. Yaklaşık 40 yıl önce, 1985 yılında kısmi DNA çıkarımından sonra bu, genetik araştırmalarda devrim niteliğinde bir gelişme olarak kabul ediliyor. Araştırmanın ayrıntıları, 2 Temmuz’da prestijli bilim dergisi Nature’da yayımlandı.

Dünya Para Atletizm Grand Prix yarışması Çekya’da düzenlenecek

3-5 Temmuz tarihlerinde Dünya Para Atletizm Grand Prix yarışmasının 9. ve son ayağı, Çekya’da gerçekleştirilecek.