Özel çipler ve bir süper bilgisayar ile AI üzerinde büyük meta bahisleri

Bu sabah sanal bir etkinlikte Meta, şu türden üretken yapay zeka da dahil olmak üzere yapay zeka iş yükleri için kurum içi altyapı geliştirme çabalarının perdesini kaldırdı. yakın zamanda kullanıma sunulan reklam tasarımı ve oluşturma araçlarının temelini oluşturur.

Bu, geçmişte yapay zeka dostu donanım sistemlerini benimsemekte yavaş davranan ve Google ve Microsoft gibi rakiplerine ayak uydurma becerisini engelleyen Meta’nın gücünü yansıtma girişimiydi.

Kendimizi inşa etmek [hardware] Meta’da Altyapıdan Sorumlu Başkan Yardımcısı Alexis Bjorlin, TechCrunch’a verdiği demeçte, yetenekler veri merkezi tasarımından eğitim çerçevelerine kadar yığının her katmanında bize kontrol sağlıyor. “Yapay zeka araştırmasının sınırlarını geniş ölçekte zorlamak için bu düzeyde bir dikey entegrasyon gerekiyor.”

Son on yılda Meta, en iyi veri bilimcileri işe almak ve yeni yapay zeka türleri oluşturmak için milyarlarca dolar harcadı. Ama şirket var mücadele etti özellikle üretken yapay zeka cephesinde, daha iddialı yapay zeka araştırma yeniliklerinin çoğunu ürünlere dönüştürmek.

2022 yılına kadar Meta, yapay zeka iş yüklerini büyük ölçüde, bu tür görevler için genellikle GPU’lardan daha az verimli olan CPU’lar ve yapay zeka algoritmalarını hızlandırmak için tasarlanmış özel bir çip kullanarak çalıştırıyordu. Meta, 2022 için planlanan özel çipin büyük ölçekli bir piyasaya sürülmesinin fişini çekti ve bunun yerine, veri merkezlerinin birçoğunun büyük ölçüde yeniden tasarlanmasını gerektiren milyarlarca dolar değerinde Nvidia GPU siparişleri verdi.

İşleri tersine çevirme çabasıyla Meta, 2025’te piyasaya sürülecek olan, hem yapay zeka modellerini eğitme hem de çalıştırma yeteneğine sahip daha iddialı bir şirket içi çip geliştirmeye başlama planları yaptı. Bugünkü sunumun ana konusu da buydu.

Meta, yeni çipi Meta Eğitim ve Çıkarım Hızlandırıcısı veya kısaca MTIA olarak adlandırıyor ve onu yapay zeka eğitimini hızlandırmak ve iş yüklerini çıkarım yapmak için kullanılan bir çip “ailesinin” bir parçası olarak tanımlıyor. (“Çıkarma”, eğitilmiş bir model çalıştırmayı ifade eder.) MTIA, farklı devreleri tek kartta birleştiren ve bir veya daha fazla görevi paralel olarak yürütmek üzere programlanmasına izin veren bir tür çip olan bir ASIC’dir.

Meta AI hızlandırıcı çip

Yapay zeka iş yükleri için özel olarak tasarlanmış bir yapay zeka çipi Meta.

Bjorlin, “Önemli iş yüklerimizde daha iyi verimlilik ve performans seviyeleri elde etmek için model, yazılım yığını ve sistem donanımıyla birlikte tasarlanmış özel bir çözüme ihtiyacımız vardı” diye devam etti. “Bu, çeşitli hizmetlerde kullanıcılarımız için daha iyi bir deneyim sağlıyor

Özel AI çipleri, Big Tech oyuncuları arasında giderek daha fazla oyunun adı haline geliyor. Google, aşağıdakiler gibi büyük üretken AI sistemlerini eğitmek için TPU (“tensör işleme birimi”nin kısaltması) adlı bir işlemci oluşturdu: PALM-2 Ve resim. Amazon, AWS müşterilerine hem eğitim için hem de (trenyum) ve çıkarım (çıkarım). ve Microsoft, bildirildiğine göreAthena adlı şirket içi bir yapay zeka çipi geliştirmek için AMD ile birlikte çalışıyor.

Meta, 2020’de 7 nanometrelik bir süreç üzerine inşa edilen MTIA’nın ilk neslini – MTIA v1 – yarattığını söylüyor. 128 MB’lık dahili belleğinin ötesinde 128 GB’a kadar ölçeklenebilir ve Meta tarafından tasarlanmış bir kıyaslama testinde – ki bu elbette şüpheyle karşılanmalıdır – Meta, MTIA’nın “düşük karmaşıklığı” ele aldığını iddia ediyor ve “Orta karmaşıklıkta” yapay zeka, bir GPU’dan daha verimli modeller.

Meta, yapay zeka modellerinin boyutu büyüdükçe darboğazlar oluşturan ve iş yüklerinin birkaç yonga arasında bölünmesini gerektiren, çipin bellek ve ağ oluşturma alanlarında yapılması gereken işlerin kaldığını söylüyor. (Tesadüfen değil, yakın zamanda Meta Edinilen İngiliz çip tek boynuzlu atı Graphcore’da yapay zeka ağ teknolojisi oluşturan Oslo merkezli bir ekip.) Ve şimdilik, MTIA’nın odak noktası, Meta’nın uygulama ailesindeki “tavsiye iş yükleri” için eğitime değil, kesinlikle çıkarıma odaklanıyor.

Ancak Meta, iyileştirmeye devam ettiği MTIA’nın, tavsiye iş yüklerini çalıştırırken Watt başına performans açısından şirketin verimliliğini “büyük ölçüde” artırdığını ve Meta’nın “daha gelişmiş” ve “son teknoloji” (görünüşte) çalışmasına izin verdiğini vurguladı. AI iş yükleri.

AI için bir süper bilgisayar

Belki bir gün Meta, AI iş yüklerinin çoğunu MTIA bankalarına havale edecektir. Ancak şimdilik sosyal ağ, araştırma odaklı süper bilgisayarı Research SuperCluster’da (RSC) GPU’lara güveniyor.

İlk olarak Ocak 2022’de tanıtılan ve Penguin Computing, Nvidia ve Pure Storage ortaklığıyla bir araya getirilen RSC, ikinci aşama kurulumunu tamamladı. Meta, şu anda 16.000 Nvidia A100 GPU’ya sahip toplam 2.000 Nvidia DGX A100 sistemi içerdiğini söylüyor.

Öyleyse neden şirket içi bir süper bilgisayar inşa edesiniz? Birincisi, akran baskısı var. Birkaç yıl önce Microsoft, yerleşik yapay zeka süper bilgisayarı hakkında yapılacak büyük bir iş yaptı. ortaklık OpenAI ile ve daha yakın zamanda yeni bir AI oluşturmak için Nvidia ile birlikte çalışacağını söyledi. Süper bilgisayar Azure bulutunda. Başka yerlerde, Google kendi AI odaklı Süper bilgisayar26.000 Nvidia H100 GPU’ya sahip olan , onu Meta’nın önüne koyuyor.

Meta süper bilgisayar

Yapay zeka araştırması için Meta’nın süper bilgisayarı.

Ancak Meta, Jones’lara ayak uydurmanın ötesinde, RSC’nin araştırmacılarına Meta’nın üretim sistemlerinden gerçek dünya örneklerini kullanarak modelleri eğitmelerine izin verme avantajı sağladığını söylüyor. Bu, yalnızca açık kaynaklı ve halka açık veri kümelerinden yararlanan şirketin önceki AI altyapısından farklı.

Bir Meta sözcüsü, “RSC yapay zeka süper bilgisayarı, üretken yapay zeka da dahil olmak üzere birçok alanda yapay zeka araştırmasının sınırlarını zorlamak için kullanılıyor” dedi. “Bu gerçekten yapay zeka araştırma üretkenliği ile ilgili. Yapay zeka araştırmacılarına modeller geliştirebilmeleri ve yapay zekayı ilerletmeleri için bir eğitim platformuyla onları güçlendirebilmeleri için son teknoloji altyapı sağlamak istedik.”

Zirvede, RSC, şirketin onu dünyanın en hızlıları arasında yaptığını iddia ettiği yaklaşık 5 exaflop bilgi işlem gücüne ulaşabilir. (Bu etkilemesin diye, buna değer not etmek bazı uzmanlar, exaflops performans metriğini bir tutam tuzla ve RSC’nin uzak olduğunu düşünüyor silahsız dünyanın en hızlı süper bilgisayarlarının birçoğu tarafından.)

Meta, RSC’yi “Large Language Model Meta AI” ın eziyetli bir kısaltması olan LLaMA’yı eğitmek için kullandığını söylüyor – şirketin yılın başlarında araştırmacılara “geçitli sürüm” olarak paylaştığı (ve daha sonra çeşitli internet topluluklarında sızdırılmıştır). Meta, en büyük LLaMA modelinin 21 gün süren 2.048 A100 GPU’da eğitildiğini söylüyor.

“Kendi süper bilgi işlem yeteneklerimizi oluşturmak bize yığının her katmanında kontrol sağlıyor; veri merkezi tasarımından eğitim çerçevelerine kadar,” diye ekledi sözcü. “RSC, Meta’nın yapay zeka araştırmacılarının trilyonlarca örnekten öğrenebilecekleri yeni ve daha iyi yapay zeka modelleri geliştirmelerine yardımcı olacak; yüzlerce farklı dilde çalışın; metni, görüntüleri ve videoyu birlikte sorunsuz bir şekilde analiz edin; yeni artırılmış gerçeklik araçları geliştirmek; ve daha fazlası.”

Video kod çözücü

Meta, MTIA’ya ek olarak, şirketin bugünkü etkinlikte belirli bilgi işlem iş yüklerini işlemek için başka bir çip geliştirdiğini açıkladı. Meta Ölçeklendirilebilir Video İşlemcisi veya MSVP olarak adlandırılan Meta, talep üzerine video ve canlı akışın işleme ihtiyaçları için tasarlanmış, şirket içinde geliştirilmiş ilk ASIC çözümü olduğunu söylüyor.

meta başladı düşünmek Okuyucular, yıllar önce özel sunucu tarafı video yongaları, 2019’da video kod çevrimi ve çıkarım çalışması için bir ASIC duyurusu yaptığını hatırlayabilirler. video özellikle.

Meta teknik baş müdürleri Harikrishna Reddy ve Yunqing Chen, bu sabah yayınlanan ortak yazarlı bir blog yazısında, “Yalnızca Facebook’ta, insanlar uygulamada zamanlarının %50’sini video izleyerek geçiriyorlar,” diye yazdı. “Dünyanın her yerindeki çok çeşitli cihazlara (mobil cihazlar, dizüstü bilgisayarlar, TV’ler vb.) hizmet vermek için, örneğin Facebook veya Instagram’a yüklenen videolar, farklı kodlama formatları, çözünürlükleri ve kaliteleriyle birden çok bit akışına dönüştürülür… MSVP programlanabilir ve ölçeklenebilir ve hem VOD için gereken yüksek kaliteli kod çevrimini hem de canlı akışın gerektirdiği düşük gecikme ve daha hızlı işlem sürelerini verimli bir şekilde destekleyecek şekilde yapılandırılabilir.”

Meta video çipi

Akış ve kod çevrimi gibi video iş yüklerini hızlandırmak için tasarlanmış Meta’nın özel çipi.

Meta, planının sonunda “sabit ve olgun” video işleme iş yüklerinin çoğunu MSVP’ye boşaltmak ve yazılım video kodlamasını yalnızca belirli özelleştirme ve “önemli ölçüde” daha yüksek kalite gerektiren iş yükleri için kullanmak olduğunu söylüyor. Meta, akıllı gürültü giderme ve görüntü iyileştirme gibi ön işleme yöntemlerinin yanı sıra yapaylık giderme ve süper çözünürlük gibi son işleme yöntemleri kullanılarak MSVP ile video kalitesini iyileştirme çalışmalarının devam ettiğini söylüyor.

Reddy ve Chen, “Gelecekte MSVP, kısa biçimli videolar da dahil olmak üzere Meta’nın en önemli kullanım durumlarını ve ihtiyaçlarını daha da fazla desteklememize olanak tanıyacak ve üretken AI, AR/VR ve diğer metaverse içeriğinin verimli bir şekilde sunulmasını sağlayacak” dedi.

yapay zeka odağı

Bugünün donanım duyurularında ortak bir nokta varsa, o da Meta’nın yapay zekayı, özellikle üretken yapay zekayı ilgilendirdiği yerde umutsuzca hız kazanmaya çalıştığıdır.

Daha önce telgraf çekildiği kadar. Şubat ayında, Meta’nın yapay zeka için bilgi işlem kapasitesini en üst öncelik haline getirdiği bildirilen CEO Mark Zuckerberg, ilan edildi şirketin Ar-Ge’sini kendi deyimiyle “turboşarj edecek” yeni bir üst düzey üretken yapay zeka ekibi. CTO Andrew Bosworth da aynı şekilde geçenlerde dedi bu üretken yapay zeka, kendisinin ve Zuckerberg’in en çok zaman geçirdikleri alandı. Ve baş bilim adamı Yann LeCun, söz konusu Meta’nın sanal gerçeklikte öğeler oluşturmak için üretici yapay zeka araçlarını kullanmayı planladığını,

Zuckerberg, Meta’nın Nisan ayındaki 1. Çeyrek kazanç çağrısı sırasında, “WhatsApp ve Messenger’daki sohbet deneyimlerini, Facebook ve Instagram’daki gönderiler ve reklamlar için görsel oluşturma araçlarını ve zaman içinde video ve çok modlu deneyimleri de keşfediyoruz” dedi. “Bu araçların sıradan insanlardan yaratıcılara ve işletmelere kadar herkes için değerli olmasını bekliyorum. Örneğin, bu deneyimi tamamladığımızda iş mesajlaşması ve müşteri desteği için yapay zeka temsilcilerine büyük ilgi gösterilmesini bekliyorum. Zamanla bu, insanların avatarları, nesneleri, dünyaları ve hepsini birbirine bağlamak için kodları çok daha kolay oluşturabilecekleri metaverse üzerindeki çalışmalarımıza da uzanacak.”

Kısmen, Meta’nın yatırımcılardan artan baskı hissetmesi, şirketin üretken AI için (potansiyel olarak büyük) pazarını yakalamak için yeterince hızlı hareket etmediğinden endişe ediyor. Bard, Bing Chat veya ChatGPT gibi sohbet robotlarına henüz bir yanıtı yok. Patlayıcı büyüme görülen bir başka önemli segment olan görüntü oluşturma konusunda da fazla ilerleme kaydetmedi.

Tahminler doğruysa, üretken yapay zeka yazılımı için toplam adreslenebilir pazar abilir 150 milyar dolar olsun. Goldman Sachs, GSYİH’yı %7 artıracağını tahmin ediyor.

Bunun küçük bir dilimi bile Meta’nın artırılmış gerçeklik kulaklıkları, toplantı yazılımları ve Horizon Worlds gibi VR oyun alanları gibi “metaverse” teknolojilerine yaptığı yatırımlarda kaybettiği milyarlarca parayı silebilir. Meta’nın artırılmış gerçeklik teknolojisinden sorumlu bölümü Reality Labs, geçen çeyrekte 4 milyar dolarlık net zarar bildirdi ve şirket ilk çeyrek çağrısı sırasında “2023’te faaliyet zararlarının yıldan yıla artmasını” beklediğini söyledi.

kim kimdir ne zaman nasıl nelerdir nedir ne işe yarar tüm bilgiler
dünyadan ilginç ve değişik haberler en garip haberler burada

Yorum yapın