Google, yeni nesil büyük dil modeli PaLM 2’yi piyasaya sürdü

Google bugün I/O geliştirici konferansında en yeni büyük dil modeli (LLM) olan PaLM 2’nin lansmanını duyurdu. PaLM 2, şirketin OpenAI’nin ChatGPT’sine rakibi olan Google’ın güncellenmiş Bard sohbet aracını güçlendirecek ve şirketin bugün duyurduğu yeni AI özelliklerinin çoğu için temel model işlevi görecek. PaLM 2 artık Google’ın PaLM API’si, Firebase ve üzerinde geliştiriciler tarafından kullanılabilir Colab.

OpenAI’ye benzer şekilde Google, parametre sayıları da dahil olmak üzere bu yeni nesil modeli nasıl eğittiğine ilişkin pek çok teknik ayrıntı sağlamadı (PaLM 2, değeri ne olursa olsun 540 milyar parametreli bir modeldir). Google’ın burada sağladığı tek teknik ayrıntı, PaLM 2’nin Google’ın en son JAX Ve TPU v4 altyapı.

Görsel Kaynakları: Google

Deepmind Başkan Yardımcısı Zoubin Ghahramani, bugünkü duyurudan önce düzenlediği basın toplantısında, “Çalışmamızda bulduğumuz şey, bunun gerçekten bir tür model boyutu olmadığı – daha büyük olanın her zaman daha iyi olmadığıdır” dedi. “Bu nedenle, farklı boyutlarda bir model ailesi sağladık. Aslında parametre sayımının, modellerin yetenekleri hakkında düşünmenin gerçekten yararlı bir yolu olmadığını ve yeteneklerin gerçekten modelleri kullanan kişiler tarafından değerlendirilmesi ve bu modellerle başarmaya çalıştıkları testlerde yararlı olup olmadıklarını öğrenmeleri gerektiğini düşünüyoruz. ”

Bunun yerine şirket yeteneklerine odaklanmaya karar verdi. Google, yeni modelin sağduyu, matematik ve mantıkta daha iyi olduğunu söylüyor. Gerçekten de, Deepmind’den Ghahramani’nin de belirttiği gibi, şirket modeli çok sayıda matematik ve bilim metninin yanı sıra matematiksel ifadeler üzerinde eğitti. Dile odaklanan büyük dil modellerinin, üçüncü taraf eklentilere başvurmadan matematik sorularını ele almakta zorlandığı bir sır değil. Ancak Google, PaLM 2’nin matematik bulmacalarını kolayca çözebileceğini, problemler üzerinden akıl yürütebileceğini ve hatta diyagramlar sağlayabileceğini savunuyor.

PaLM 2 ayrıca artık kod yazmak ve hata ayıklamak için geliştirilmiş desteğe sahiptir. Model, JavaScript ve Python gibi popüler dillerin yanı sıra Prolog, Verilog ve Fortran gibi 20 programlama dilinde eğitildi. PaLM 2, Google’ın diğer şeylerin yanı sıra kod tamamlama ve oluşturma hizmetinin bir parçası olarak bugün de piyasaya sürdüğü, kodlama ve hata ayıklamaya yönelik özel modeli Codey’nin temelini oluşturuyor.

Google bugün ayrıca, PaLM 2’nin 100’den fazla dil içeren bir yapı üzerinde eğitildiğinin altını çizerek, Google’ın deyimiyle, önceki modellere göre daha incelikli ifadeler de dahil olmak üzere “çok dilli görevlerde mükemmel” hale getirdi.

Google, PaLM’den Codey’nin beğenilerini ve aynı zamanda şirketin tıbbi bilgiye odaklanan modeli Med-PaLM 2’yi içeren bir model ailesi olarak bahsediyor. Ayrıca, güvenlik kullanım durumlarına odaklanan bir sürüm ve akıllı telefonlarda çalışabilen daha küçük bir PaLM 2 modeli olan Sec-PaLM de var; bunun için. Google, bu modelin saniyede 20 jetonu işleyebileceğini söylüyor, bu çok hızlı değil, ancak bazı kullanım durumları için kabul edilebilir (yine de Google, bunu hangi telefonda test ettiğini söylemez).

Google’ın bu yapay zeka özelliklerini kullanıma sunma konusunda çok bilinçli bir yaklaşım benimsediği bir sır değil – şirket bunu kabul ediyor. Ancak aynı zamanda, Google temsilcilerinin bu konudaki standart sözü, şirketin bu araçları sorumlu bir şekilde ve güvenliği göz önünde bulundurarak oluşturmak istediği yönündedir. Elbette şirketin PaLM hakkında söylediği de bu. Bugünün duyurusundan önce test edemediğimizden, ne kadar iyi performans gösterdiğini ve uç durumlarla nasıl başa çıktığını açıkça bilmiyoruz.

TechCrunch'ta Google I/O 2023 hakkında daha fazlasını okuyun

kim kimdir ne zaman nasıl nelerdir nedir ne işe yarar tüm bilgiler
dünyadan ilginç ve değişik haberler en garip haberler burada

Yorum yapın