Silinen Sam Altman konuşma dakikaları: Açık AI ayrıca GPU'dan yoksundur, birincil hedef maliyet azaltmadır

2023-06-07 03:30:16

Yazar | Lingzi İlçesi

Editör | Wei Shijie

Kaynak丨Geek Park

Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur

SamAltman'ın Avrupa turu hala devam ediyor. Kısa bir süre önce, Londra'da yapay zeka şirketi HumanLooop'un CEO'su ile kapalı kapılar ardında bir görüşme yaptı. HumanLoop, geliştiricilerin büyük dil modellerinde uygulama oluşturmasına yardımcı olan bir şirkettir.

HumanLoop CEO'su Raza Habib, görüşmenin önemli anlarını kaydetti ve şirketin web sitesinde kamuoyuna açıkladı. Ancak daha sonra OpenAI'nin talebi üzerine tutanaklar geri çekildi. Bu da dış dünyanın sohbete olan merakını artırdı. Bazıları, OpenAI'nin bazı düşüncelerinin bu değişikliğe dahil olduğunu düşünüyor.

Geek Park, konuşmanın silinen dakikalarına göz attıktan sonra, Sam'in gözünde bunun OpenAI'nin kısa vadeli planlamasını içerdiğini, ayrıca Microsoft'un bulut bilişim kaynaklarından güçlü destek aldıktan sonra OpenAI üzerindeki baskıyı da gizlediğini gördü. Ne de olsa, model ince ayarı ve akıl yürütme hala çok fazla bilgi işlem kaynağı tüketiyor. The Information'a göre Open AI modeli, Microsoft Azure'a 1,2 milyar dolara mal oldu, bilgi işlem kaynaklarını OpenAI'yi desteklemeye odakladı ve diğer Microsoft departmanlarının kullanabileceği sunucuları sınırladı.

Bu bağlamda Sam, şu anda maliyet düşürmenin birincil hedef olduğunu söyledi.

Buna ek olarak Sam, şu anda daha uzun bağlam pencereleri açma ve API'lere ince ayar sağlama gibi hizmetlerin GPU kaynaklarıyla sınırlı olduğunu da açıkladı;

Bu sohbette Sam Altman, rekabet ve ticarileştirme gibi pek çok dış kaygıya yanıt verdi:

Birinci sınıf bir ürün yöneticisi olan Peter Deng'i işe almasına rağmen, OpenAI daha fazla ürün piyasaya sürmeyi düşünmeyecek;

Gelecekteki uygulama eğilimi, ChatGPT'de daha fazla eklenti geliştirmek yerine büyük modelin işlevlerini daha fazla APP'ye yerleştirmektir, çünkü gerçekte çoğu eklenti PMF (Ürün / Pazar Uyumu, yani ürün-pazar uyumu) göstermez. );

Geçtiğimiz birkaç yıl içinde OpenAI, model boyutunu milyonlarca kat genişletti, ancak bu hız sürdürülebilir değil. Ardından OpenAI, model performansını iyileştirmek için model boyutunu 1 ila 3 kat artırmaya devam edecek.

Konuşmanın tutanakları 29 Mayıs'ta kamuoyuna açıklandı ve netizenlerin kayıtlarına göre 3 Haziran civarında silindi. Yedekleme ile şunları elde edersiniz:

01, OpenAI şu anda GPU tarafından ciddi şekilde sınırlandırılmıştır

Konuşmalar ölçeklendikçe gerekli bilgi işlem kaynakları katlanarak artar

OpenAI şu anda çok sınırlı GPU'lara sahip ve bu da kısa vadeli planlarının çoğunu erteledi. Müşterilerden gelen en büyük şikayet, API'nin güvenilirliği ve hızıdır. Sam, sorunların çoğunun GPU eksikliğinden kaynaklandığını açıklayarak endişelerini kabul etti.

Daha uzun 32k içerik henüz daha fazla kişiye sunulamıyor. OpenAI, O(n^2) dikkat ölçeklendirmesinin üstesinden gelemedi ve bu nedenle, makul görünse de, yakında (bu yıl) 100 bin - 1 milyon belirteç bağlam penceresine sahip olacaklardı, daha büyük bir şey bir araştırma atılımı gerektirecekti.

Daha uzun 32K bağlamlar daha fazla kişi tarafından kullanılamaz. OpenAI, yakında (bu yıl) 100k-1M Jetonluk bir bağlam penceresine sahip olacak gibi görünse de, dikkat mekanizmasının O(n^2) ölçeklendirme sorununun üstesinden gelemedi. Daha büyük herhangi bir pencere, araştırma atılımları gerektirecektir.

*Not: O (n^2), dizinin uzunluğu arttıkça Dikkat hesaplamalarını gerçekleştirmek için gereken bilgi işlem kaynaklarının katlanarak arttığı anlamına gelir. O, algoritmanın zaman veya uzay karmaşıklığının büyüme oranının üst sınırını veya en kötü durumunu tanımlamak için kullanılır; (n^2), karmaşıklığın girdi boyutunun karesiyle orantılı olduğu anlamına gelir. *

İnce ayar API'si de şu anda GPU kullanılabilirliği ile sınırlıdır. Adaptörler veya LoRa gibi verimli ince ayar yöntemleri kullanmadılar, bu nedenle (modeli) ince ayar yoluyla çalıştırmak ve yönetmek, hesaplama açısından çok yoğun. İnce ayar için daha iyi destek gelecekte sağlanacaktır. Model katkıları için topluluk tabanlı bir pazara bile ev sahipliği yapabilirler.

Ayrılmış kapasite sağlama, GPU kullanılabilirliği ile sınırlıdır. OpenAI, müşterilere modelin özel bir kopyasını sağlayarak özel kapasite sunar. Müşterilerin hizmeti almak için önden 100.000 ABD Doları ödemeyi taahhüt etmeye istekli olmaları gerekir.

02, OpenAI'nin son yol haritası

2023, akıllı maliyet azaltma; 2024, çok modluluğun sınırlı gösterimi

Sam ayrıca, OpenAI API için kısa vadeli bir yol haritası olarak gördüğü şeyi de paylaştı.

2023:

Daha ucuz ve daha hızlı GPT-4 — bu onların en büyük önceliği. Genel olarak, OpenAI'nin amacı "zeka maliyetini" mümkün olduğunca azaltmaktır, böylece zaman içinde API'nin maliyetini düşürmeye devam etmek için çok çalışacaklardır.

Daha uzun bağlam penceresi — yakın gelecekte, bağlam penceresi 1 milyon jetona kadar çıkabilir.

İnce Ayar API'sı — İnce ayar API'si en yeni modelleri kapsayacak şekilde genişletilecek, ancak tam biçim, geliştiricilerin gerçekten ne istediklerini söylediklerine bağlı olacaktır.

Durum bilgisi olan bir API - Bugün sohbet API'sini çağırırken, aynı oturum geçmişini tekrar tekrar gözden geçirmeniz ve aynı belirteçleri tekrar tekrar ödemeniz gerekir. API'nin gelecekte oturum geçmişini hatırlayan bir sürümü olacaktır.

2024:

Multimodal - Bu, GPT-4 sürümünün bir parçası olarak gösterilmektedir, ancak daha fazla GPU çevrimiçi olana kadar herkese ölçeklenmeyecektir.

03. Ticari tahmin ve düşünme: "PMF'siz" eklentiler yakında API'de görünmeyebilir

Pek çok geliştirici, ChatGPT eklentilerini API aracılığıyla erişilebilir kılmakla ilgileniyor, ancak Sam bunların yakın zamanda piyasaya sürüleceğini düşünmediğini söyledi. Brosing eklentisine ek olarak, diğer eklentilerin kullanılması, PMF'nin (Ürün/Pazar Uyumu) olmadığını gösterir. Pek çok kişinin, uygulamalarının ChatGPT içinde olmasını istediğini düşündüğünü, ancak asıl istediklerinin, uygulamanın içinde ChatGPT olduğunu belirtti.

04. ChatGPT dışında, OpenAI müşterileriyle rekabet etmekten kaçınacak

Büyük şirketlerin öldürücü bir uygulaması var

Pek çok geliştirici, OpenAI API ile geliştirme konusunda gergin olduklarını çünkü OpenAI sonunda kendileriyle rekabet edebilecek ürünleri piyasaya sürebileceğini söyledi. Sam, OpenAI'nin ChatGPT dışında daha fazla ürün yayınlamayacağını söyledi. Tarihsel olarak, büyük platform şirketlerinin öldürücü bir uygulaması olduğunu söyledi. ChatGPT, geliştiricilerin API'yi iyileştirmek için kendi ürünlerinin müşterisi olmalarına olanak tanıyacak. ChatGPT'nin vizyonu, süper zeki bir çalışma asistanı olmaktır, ancak OpenAI'nin dahil olmayacağı başka birçok GPT kullanım durumu vardır.

05. Düzenlemeye ihtiyaç var, ancak şimdi değil

"Kaç kişinin ve şirketin büyük modelleri elinde tutabileceği konusunda şüpheliyim"

Sam, gelecekteki modellerin düzenlenmesi çağrısında bulunurken, mevcut modellerin tehlikeli olduğunu ve bunları düzenlemenin veya yasaklamanın büyük bir hata olacağını düşünmüyor. Açık kaynağın önemini yineledi ve OpenAI'nin GPT-3'ü açık kaynak yapmayı düşündüğünü söyledi. Kısmen, kaç kişinin ve şirketin büyük dil modellerini (LLM'ler) tutma ve sunma yeteneğine sahip olduğu konusunda şüpheci olduğu için henüz açık kaynaklı değiller.

06. Ölçek yasaları hala geçerli

Birkaç yılda milyonlarca kez genişleme hızı sonsuza kadar devam edemez.

Son zamanlarda "dev AI modelleri çağının bittiğini" iddia eden birçok makale var. Bu doğru değil. (Not: Nisan ayında MIT'de düzenlenen bir etkinlikte Sam Altman şöyle demişti: Artık devasa modeller çağının sonuna yaklaşıyoruz.)

OpenAI'nin dahili verileri, model performansının ölçeklendirme yasalarının hala geçerli olduğunu ve artan model boyutunun performansı iyileştirmeye devam edeceğini gösteriyor.

OpenAI, modelleri sadece birkaç yılda milyonlarca kez büyüttüğü için, bu ölçeklendirme hızı sürdürülemez. Bu, OpenAI'nin modelleri büyütmeye devam etmeyeceği anlamına gelmez, ancak bu, boyutlarının birçok büyüklük sırasına göre değil, her yıl iki veya üç kat artacağı anlamına gelir.

Ölçek yasalarının yürürlükte olduğu gerçeğinin, AGI geliştirme zaman çizelgesi için önemli etkileri vardır. Ölçek yasasının varsayımı, muhtemelen AGI oluşturmak için gereken bileşenlerin çoğuna zaten sahip olduğumuz ve işin geri kalanının esas olarak mevcut yöntemleri daha büyük modellere ve daha büyük veri kümelerine ölçeklendirmek olduğudur. Ölçek çağı sona ererse, AGI'den daha da uzaklaşmış olabiliriz. Boyut yasalarının güçlü bir şekilde uygulanmaya devam etmesi, daha kısa bir zaman çizelgesi anlamına gelir.

View Original

The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
#BTC#
239130 posts
#PI#
238039 posts
#ETH#
153559 posts
4#GateioInto11#
79792 posts
5#ContentStar#
66449 posts
6#GT#
64858 posts
7#BOME#
60580 posts
8#DOGE#
59073 posts
9#MAGA#
52061 posts
10#SLERF#
50456 posts

sitemap