Sam Altman: LLM’lerin boyutu ilerlemek kadar önemli olmayacak

OpenAI’nin kurucu ortağı ve CEO’su Sam Altman bugünlerde konuşurken dinlemek mantıklı geliyor. En son girişimi, piyasaya çıktığından beri herkesin ağzında. GPT-4 ve bugüne kadar oluşturulmuş en gelişmiş büyük dil modeli tabanlı arabirimlerden biri olan ChatGPT. Ancak Altman kasıtlı ve alçakgönüllü bir yaklaşım benimsiyor ve büyük dil modelleri söz konusu olduğunda, daha büyük olanın her zaman daha iyi olacağına inanmıyor.

Zoom üzerinden röportaj yapılan Altman, Eylemde Hayal Gücü Dün MIT’deki etkinlik, büyüklük uğruna LLM boyutunun sınırlarına yaklaştığımıza inanıyor. Altman, “Bence bu dev modellerin olacağı çağın sonundayız ve onları başka şekillerde daha iyi hale getireceğiz,” dedi.

Boyutu, model kalitesinin yanlış bir ölçüsü olarak görüyor ve bunu eskiden gördüğümüz çip hızı yarışlarıyla karşılaştırıyor. “Parametre sayısına çok fazla odaklanıldığını düşünüyorum, belki parametre sayısı kesinlikle artacaktır. Ancak bu bana, herkesin büyük bir sayıyı işaret etmeye çalıştığı 1990’lar ve 2000’lerdeki gigahertz yarışını hatırlatıyor” dedi.

İşaret ettiği gibi, bugün iPhone’larımızı çalıştıran çok daha güçlü çiplere sahibiz, ancak ne kadar hızlı oldukları hakkında çoğunlukla hiçbir fikrimiz yok, sadece işini iyi yaptıklarına dair bir fikrimiz yok. “Odak noktamızın hızla artan yetenek olması önemli olduğunu düşünüyorum. Ve parametre sayısının zamanla azalmasının bir nedeni varsa veya birlikte çalışan, her biri daha küçük olan birden fazla modelimiz olması gerekiyorsa, bunu yaparız. Dünyaya ulaştırmak istediğimiz şey, en yetenekli, kullanışlı ve güvenli modellerdir. Parametre sayımı konusunda kendimizi kandırmak için burada değiliz” dedi.

Altman kısmen büyük bahisler yaptığı ve ardından bilinçli olarak hareket ettiği ve şirketleri ve ürettikleri ürünler hakkında derinlemesine düşündüğü için bu kadar başarılı bir teknoloji uzmanı oldu ve OpenAI de farklı değil.

“Üzerinde çok uzun süredir çalışıyoruz, ancak gerçekten işe yarayacağına olan güvenimiz giderek artıyor. Biz olduk [building] şirket yedi yıldır. Bu işler çok uzun zaman alıyor. Başkaları işe yaramadığında neden işe yaradığına dair genel olarak şunu söyleyebilirim: Bunun nedeni, uzun süredir her ayrıntıyı terletmek için uğraşmamız. Ve çoğu insan bunu yapmaya istekli değil” dedi.

hakkında sorulduğunda mektup OpenAI’nin altı ay ara vermesini talep eden mektubun bazı kısımlarına katılarak şirketinin yaklaşımını savundu.

“İtme parçaları var [of the letter] buna gerçekten katılıyorum. Yayınlamadan önce GPT-4 eğitimini bitirdikten sonra altı aydan fazla zaman harcadık. Bu nedenle, güvenlik modelini gerçekten incelemek, dış denetimler almak için zaman ayırmak, dış kırmızı takım görevlileri gerçekten neler olup bittiğini anlamaya çalışmak ve elinizden geldiğince hafifletmek için zaman ayırmak, bu önemli” dedi.

Ancak mektubun hedefi kaçırdığı önemli yollar olduğuna inanıyor.

“Yetenekler giderek daha ciddi hale geldikçe güvenlik çubuğunun da artması gerektiğine katılıyorum. Ancak ne yazık ki, mektubun nerede durmamız gerektiğine dair en teknik nüansı kaçırdığını düşünüyorum – mektubun daha önceki bir versiyonu, GPT-5’i eğittiğimizi iddia ediyordu. Değiliz ve bir süre daha olmayacağız, bu yüzden bu anlamda biraz aptalcaydı – ancak GPT-4’ün yanı sıra ele alınması gereken her türlü güvenlik sorununa sahip olduğunu düşündüğüm başka şeyler yapıyoruz. ve mektubun tamamen dışında bırakıldı. Bu yüzden dikkatli hareket etmenin ve güvenlik sorunları için artan titizliğin gerçekten önemli olduğunu düşünüyorum. sanmıyorum [suggestions in the] mektup, onu ele almanın nihai yoludur” dedi.

Altman, yapılacak doğru şeyin bu olduğuna inandığı için mevcut modelin güvenlik sorunları ve sınırlamaları konusunda açık olduğunu söylüyor. Bazen kendisinin ve diğer şirket temsilcilerinin yanlış olduğu ortaya çıkan “aptalca şeyler” söylediğini kabul ediyor, ancak bu teknoloji hakkında diyalog kurmak önemli olduğu için bu riski almaya istekli.

“OpenAI’deki hedefimizin büyük bir kısmı, dünyanın bizimle etkileşime geçmesini ve [this technology]ve hepimizin istediği geleceğin ne olduğunu anlayabilmek için kademeli olarak yeni kurumları güncelleyip inşa edin veya mevcut kurumlarımızı uyarlayın. İşte bu yüzden buradayız.”

kim kimdir ne zaman nasıl nelerdir nedir ne işe yarar tüm bilgiler
dünyadan ilginç ve değişik haberler en garip haberler burada

Yorum yapın