OpenAI ve Google çifte standartla oynuyor: büyük modelleri diğer kişilerin verileriyle eğitiyor, ancak asla kendi verilerinin dışarı akmasına izin vermiyor
Üretken yapay zekanın yeni çağında, büyük teknoloji şirketleri çevrimiçi içerik tüketirken "söylediğimi yap, yaptığımı yapma" stratejisi izliyor. Bu stratejinin bir dereceye kadar çifte standart ve söz hakkının kötüye kullanılması olduğu söylenebilir.
Aynı zamanda, büyük dil modeli (LLM) yapay zeka gelişiminin ana akım trendi haline geldiğinden, hem büyük hem de yeni kurulan şirketler kendi büyük modellerini geliştirmek için hiçbir çabadan kaçınmıyorlar. Bunların arasında eğitim verileri, büyük modelin kalitesi için önemli bir ön koşuldur.
Son zamanlarda, Insider raporlarına göre, Microsoft destekli OpenAI, Google ve onu destekleyen Anthropic, üretken yapay zeka modellerini eğitmek için yıllardır diğer web sitelerinden veya şirketlerden gelen çevrimiçi içeriği kullanıyor. Tüm bunlar, özel bir izin alınmadan yapıldı ve web'in geleceğini ve bu yeni çağda telif hakkı yasasının nasıl uygulanacağını belirleyecek olan, gelişmekte olan bir yasal savaşın parçasını oluşturacak.
Bu büyük teknoloji şirketleri adil kullanım olduğunu iddia edebilir, ancak durumun gerçekten böyle olup olmadığı tartışmalıdır. Ancak içeriklerinin diğer AI modellerini eğitmek için kullanılmasına izin vermezler. Öyleyse, bu büyük teknoloji şirketleri, büyük modellerini eğitirken neden diğer şirketlerin çevrimiçi içeriğini kullanabiliyorlar?
Bu şirketler akıllı ama aynı zamanda çok ikiyüzlü
Büyük teknoloji şirketlerinin başkalarının çevrimiçi içeriğini kullanıp kullanmadığı, ancak başkalarının kendi somut kanıtlarını kullanmasına izin verip vermediği, hizmet şartlarında ve bazı ürünlerinin kullanımında görülebilir.
Önce Anthropic tarafından başlatılan ChatGPT'ye benzer bir yapay zeka asistanı olan Claude'a bakalım. Sistem, özetleme, arama, yardımlı oluşturma, soru yanıtlama ve kodlama gibi görevleri tamamlayabilir. Bir süre önce tekrar yükseltildi ve bağlam belirteci 100k'ye genişletildi ve işlem hızı büyük ölçüde hızlandırıldı.
Claude'un hizmet şartları aşağıdaki gibidir. Hizmete aşağıdaki şekilde erişemez veya kullanamazsınız (bazıları burada listelenmiştir) ve bu kısıtlamalardan herhangi birinin Kabul Edilebilir Kullanım Politikası ile tutarsız veya açık olmaması durumunda, ikincisi geçerli olacaktır:
herhangi bir AI veya makine öğrenimi algoritması veya modeli geliştirmek veya eğitmek dahil olmak üzere hizmetlerimizle rekabet eden herhangi bir ürün veya hizmet geliştirmek
Hizmetlerimizden Şartlar tarafından izin verilmeyen verileri veya bilgileri kazımak, kazımak veya başka bir şekilde elde etmek
Claude Hizmet Şartları adresi:
Aynı şekilde, Google'ın Üretken Yapay Zeka Kullanım Şartları'nda da "Hizmeti, makine öğrenimi modelleri veya ilgili teknikler geliştirmek için kullanamazsınız."
Google Generative AI kullanım şartları adresi:
OpenAI'nin kullanım koşulları ne olacak? Google'a benzer şekilde, "Bu hizmetin çıktısını OpenAI ile rekabet eden modeller geliştirmek için kullanamazsınız."
OpenAI kullanım koşulları adresi:
Bu şirketler, yüksek kaliteli içeriğin yeni AI modellerini eğitmek için kritik öneme sahip olduğunu bilecek kadar akıllıdır, bu nedenle başkalarının çıktılarını bu şekilde kullanmasına izin vermemek mantıklıdır. Ancak kendi modellerini eğitmek için diğer insanların verilerini pervasızca kullanmalarını nasıl açıklıyorlar?
OpenAI, Google ve Anthropic, Insider'ın yorum talebini reddetti ve yanıt vermedi.
Reddit, Twitter ve diğerleri: Yeter artık
Aslında diğer şirketler ne olduğunu anladıklarında mutlu olmadılar. Yıllardır AI modellerini eğitmek için kullanılan Reddit, Nisan ayında verilerine erişim için ücretlendirmeye başlamayı planlıyor.
Reddit CEO'su Steve Huffman, "Reddit'in veri topluluğu o kadar değerli ki, bu değeri dünyanın en büyük şirketlerine ücretsiz olarak veremeyiz" dedi.
Yine bu yılın nisan ayında Musk, OpenAI'nin ana destekçisi Microsoft'u AI modellerini eğitmek için Twitter verilerini yasa dışı bir şekilde kullanmakla suçladı. "Dava zamanı" diye tweet attı.
Ancak Insider'ın yorumlarına yanıt olarak Microsoft, "önerme o kadar yanlış ki nereden başlayacağımı bile bilmiyorum" dedi.
OpenAI CEO'su Sam Altman, telif hakkına saygı duyan yeni yapay zeka modellerini keşfederek bu soruyu bir adım öteye taşımaya çalışıyor. Axios tarafından bildirildiği üzere, "Yapay zeka sistemi içeriğinizi kullanırsa veya stilinizi kullanırsa bunun için size ödeme yapılan bir model geliştirmeye çalışıyoruz" dedi.
Yayıncılar (İçerdekiler dahil) kazanılmış bir menfaate sahip olacaktır. Buna ek olarak, News Corporation of the United States dahil olmak üzere bazı yayıncılar, teknoloji şirketlerini içeriklerini AI modellerini eğitmek için kullanmaları için ödemeye zorluyor.
Mevcut yapay zeka modeli eğitim yöntemi ağı "keser"
Bazı eski Microsoft yöneticileri bir sorun olması gerektiğini söylediler. Microsoft kıdemli ve tanınmış yazılım geliştiricisi Steven Sinofsky, AI modellerini eğitmenin mevcut yolunun ağı "kırdığına" inanıyor.
Twitter'da şöyle yazdı: "Geçmişte, tıklama oranları karşılığında tarama verileri kullanılıyordu. Ancak şimdi yalnızca bir modeli eğitmek için kullanılıyor ve yaratıcılara ve telif hakkı sahiplerine herhangi bir değer getirmiyor."
Belki de daha fazla şirket uyandıkça, üretici yapay zeka çağındaki bu eşit olmayan veri kullanımı yakında değişecektir.
Orijinal Bağlantı:
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
OpenAI ve Google çifte standartla oynuyor: büyük modelleri diğer kişilerin verileriyle eğitiyor, ancak asla kendi verilerinin dışarı akmasına izin vermiyor
Editörler: Du Wei, Zi Wen
Üretken yapay zekanın yeni çağında, büyük teknoloji şirketleri çevrimiçi içerik tüketirken "söylediğimi yap, yaptığımı yapma" stratejisi izliyor. Bu stratejinin bir dereceye kadar çifte standart ve söz hakkının kötüye kullanılması olduğu söylenebilir.
Aynı zamanda, büyük dil modeli (LLM) yapay zeka gelişiminin ana akım trendi haline geldiğinden, hem büyük hem de yeni kurulan şirketler kendi büyük modellerini geliştirmek için hiçbir çabadan kaçınmıyorlar. Bunların arasında eğitim verileri, büyük modelin kalitesi için önemli bir ön koşuldur.
Son zamanlarda, Insider raporlarına göre, Microsoft destekli OpenAI, Google ve onu destekleyen Anthropic, üretken yapay zeka modellerini eğitmek için yıllardır diğer web sitelerinden veya şirketlerden gelen çevrimiçi içeriği kullanıyor. Tüm bunlar, özel bir izin alınmadan yapıldı ve web'in geleceğini ve bu yeni çağda telif hakkı yasasının nasıl uygulanacağını belirleyecek olan, gelişmekte olan bir yasal savaşın parçasını oluşturacak.
Bu şirketler akıllı ama aynı zamanda çok ikiyüzlü
Büyük teknoloji şirketlerinin başkalarının çevrimiçi içeriğini kullanıp kullanmadığı, ancak başkalarının kendi somut kanıtlarını kullanmasına izin verip vermediği, hizmet şartlarında ve bazı ürünlerinin kullanımında görülebilir.
Önce Anthropic tarafından başlatılan ChatGPT'ye benzer bir yapay zeka asistanı olan Claude'a bakalım. Sistem, özetleme, arama, yardımlı oluşturma, soru yanıtlama ve kodlama gibi görevleri tamamlayabilir. Bir süre önce tekrar yükseltildi ve bağlam belirteci 100k'ye genişletildi ve işlem hızı büyük ölçüde hızlandırıldı.
Claude'un hizmet şartları aşağıdaki gibidir. Hizmete aşağıdaki şekilde erişemez veya kullanamazsınız (bazıları burada listelenmiştir) ve bu kısıtlamalardan herhangi birinin Kabul Edilebilir Kullanım Politikası ile tutarsız veya açık olmaması durumunda, ikincisi geçerli olacaktır:
Claude Hizmet Şartları adresi:
Aynı şekilde, Google'ın Üretken Yapay Zeka Kullanım Şartları'nda da "Hizmeti, makine öğrenimi modelleri veya ilgili teknikler geliştirmek için kullanamazsınız."
OpenAI'nin kullanım koşulları ne olacak? Google'a benzer şekilde, "Bu hizmetin çıktısını OpenAI ile rekabet eden modeller geliştirmek için kullanamazsınız."
Bu şirketler, yüksek kaliteli içeriğin yeni AI modellerini eğitmek için kritik öneme sahip olduğunu bilecek kadar akıllıdır, bu nedenle başkalarının çıktılarını bu şekilde kullanmasına izin vermemek mantıklıdır. Ancak kendi modellerini eğitmek için diğer insanların verilerini pervasızca kullanmalarını nasıl açıklıyorlar?
OpenAI, Google ve Anthropic, Insider'ın yorum talebini reddetti ve yanıt vermedi.
Reddit, Twitter ve diğerleri: Yeter artık
Aslında diğer şirketler ne olduğunu anladıklarında mutlu olmadılar. Yıllardır AI modellerini eğitmek için kullanılan Reddit, Nisan ayında verilerine erişim için ücretlendirmeye başlamayı planlıyor.
Reddit CEO'su Steve Huffman, "Reddit'in veri topluluğu o kadar değerli ki, bu değeri dünyanın en büyük şirketlerine ücretsiz olarak veremeyiz" dedi.
Yine bu yılın nisan ayında Musk, OpenAI'nin ana destekçisi Microsoft'u AI modellerini eğitmek için Twitter verilerini yasa dışı bir şekilde kullanmakla suçladı. "Dava zamanı" diye tweet attı.
OpenAI CEO'su Sam Altman, telif hakkına saygı duyan yeni yapay zeka modellerini keşfederek bu soruyu bir adım öteye taşımaya çalışıyor. Axios tarafından bildirildiği üzere, "Yapay zeka sistemi içeriğinizi kullanırsa veya stilinizi kullanırsa bunun için size ödeme yapılan bir model geliştirmeye çalışıyoruz" dedi.
Yayıncılar (İçerdekiler dahil) kazanılmış bir menfaate sahip olacaktır. Buna ek olarak, News Corporation of the United States dahil olmak üzere bazı yayıncılar, teknoloji şirketlerini içeriklerini AI modellerini eğitmek için kullanmaları için ödemeye zorluyor.
Mevcut yapay zeka modeli eğitim yöntemi ağı "keser"
Bazı eski Microsoft yöneticileri bir sorun olması gerektiğini söylediler. Microsoft kıdemli ve tanınmış yazılım geliştiricisi Steven Sinofsky, AI modellerini eğitmenin mevcut yolunun ağı "kırdığına" inanıyor.
Twitter'da şöyle yazdı: "Geçmişte, tıklama oranları karşılığında tarama verileri kullanılıyordu. Ancak şimdi yalnızca bir modeli eğitmek için kullanılıyor ve yaratıcılara ve telif hakkı sahiplerine herhangi bir değer getirmiyor."
Belki de daha fazla şirket uyandıkça, üretici yapay zeka çağındaki bu eşit olmayan veri kullanımı yakında değişecektir.
Orijinal Bağlantı: