Çin’in arama motoru öncüsü, açık kaynaklı büyük dil modelini açıkladı

Şubat ayında, Sogou’nun kurucusu Wang Xiaochuan söz konusu Weibo’da “Çin’in kendi OpenAI’sine ihtiyacı var.” Çinli girişimci, yeni kurulan şirketi Baichuan Intelligence’ın yeni nesil büyük dil modelini piyasaya sürmesiyle şimdi rüyasına adım adım yaklaşıyor. Baichuan-13B Bugün.

Baichuan, kurucusunun Tsinghua Üniversitesi’nden bir bilgisayar bilimi dahisi olarak geçmişi ve arama motoru sağlayıcısı Sogou’yu kurması sayesinde, Çin’in en umut verici LLM geliştiricilerinden biri olarak lanse ediliyor. daha sonra Tencent tarafından satın alındı.

Wang, 2021’in sonlarında Sogou’dan ayrıldı. ChatGPT dünyayı kasıp kavururken, girişimci Baichuan’ı başlattı Nisan içinde ve bir grup melek yatırımcıdan hızla 50 milyon dolarlık finansman sağladı.

Çin’in diğer yerli LLM’leri gibi, Transformer mimarisine (GPT’yi de destekleyen) dayalı 13 milyar parametreli bir model olan Baichuan, Çince ve İngilizce verilerle eğitilmiştir. (Parametreler, modelin metin oluşturmak ve analiz etmek için kullandığı değişkenlere atıfta bulunur.) GitHub sayfasına göre model açık kaynaklıdır ve ticari uygulama için optimize edilmiştir.

Baichuan-13, 1,4 trilyon jeton üzerinde eğitildi. Karşılaştırıldığında, Meta’nın LLaMa 13 milyar parametreli modelinde 1 trilyon jeton kullanıyor. Wang daha önce bir röportaj girişiminin, bu yılın sonuna kadar OpenAI’nin GPT-3.5’i ile karşılaştırılabilir büyük ölçekli bir modeli piyasaya sürme yolunda olduğunu söyledi.

Sadece üç ay önce başlayan Baichuan, kayda değer bir gelişme hızına ulaştı. Nisan ayı sonundaekip 50 kişiye ulaştı ve Haziran ayında ilk LLM’sini, 7 milyar parametreye sahip ön eğitim modeli Baichuan-7B’yi piyasaya sürdü.

Şimdi, temel model Baichuan-13B, onu ticari amaçlarla kullanmak için resmi onay almış akademisyenler ve geliştiricilere ücretsiz olarak sunuluyor. Önemli olan, yaşlarında ABD’nin Çin’e AI çip yaptırımlarımodel, Nvidia’nın 3090 grafik kartları da dahil olmak üzere tüketici sınıfı donanımlarda çalışabilen varyasyonlar sunar.

Büyük dil modellerine büyük yatırım yapan diğer Çinli firmalar arasında arama motoru devi Baidu; Profesör tarafından yönetilen Tsinghua Üniversitesi’nin bir yan ürünü olan Zhipu.ai tan jie; yanı sıra araştırma enstitüsü IDEA Microsoft Research Asia’nın kurucularından Harry Shum tarafından yönetiliyor.

Ülke, dünyanın en katı AI düzenlemelerinden bazılarını uygulamaya hazırlanırken, Çin’in büyük dil modelleri hızla ortaya çıkıyor. Financial Times tarafından bildirildiği üzereÇin’in üretken yapay zeka için özellikle içeriğe odaklanan düzenlemeler hazırlaması bekleniyor ve bu da kurallardan daha fazla kontrolün olduğunu gösteriyor. Nisan ayında tanıtıldı. Şirketlerin ayrıca, Çin’in gelişmekte olan sektörde ABD ile rekabet etme çabalarını yavaşlatabilecek büyük dil modellerini piyasaya sürmeden önce bir lisans alması gerekebilir.

kim kimdir ne zaman nasıl nelerdir nedir ne işe yarar tüm bilgiler
dünyadan ilginç ve değişik haberler en garip haberler burada

Yorum yapın