Kurumsal liderlerin yeni olasılıkların kilidini açmak için büyük dil modellerini kullanabileceği 5 yol

           Çiçekli Duvar Kağıdı            Yenigün Çay

VB Transform 2023 oturumlarını görüntülemek için isteğe bağlı kitaplığımıza gidin. Buradan Kaydolun


Üretken yapay zekayı ve özellikle ChatGPT gibi büyük dil modellerini (LLM’ler) çevreleyen vızıltıları kaçırmanız pek olası değildir. Son aylarda bunlar, sosyal medyadan haberlere ve günlük konuşmalara kadar her yerde gündemde olan konular oldu ve ne olduğunu daha yeni öğrenmeye başladık. üretici yapay zeka yeteneğine sahip olabilir.

Genel olarak konuşursak, gen AI, insan yapımı içeriğe çok benzeyen görüntüler, müzik ve metin gibi içerikler oluşturabilen bir makine öğrenimi (ML) teknikleri kategorisini ifade eder. Öte yandan LLM’ler, insan benzeri bir dili anlamalarını, işlemelerini ve üretmelerini sağlayan, çok miktarda metin verisi üzerinde eğitilmiş milyarlarca parametreye sahip sinir ağlarıdır.

Bu teknolojiler birlikte, çeşitli endüstrileri yeniden şekillendirme ve insanlar ile makineler arasındaki etkileşimlerin kalitesini artırma potansiyeline sahip çok çeşitli uygulamalar sunar. İşletme sahipleri ve kurumsal karar alıcılar, bu uygulamaları keşfederek değerli ilhamlar alabilir, büyümeyi hızlandırabilir ve hızlı prototip oluşturma yoluyla somut olarak iyileştirilmiş sonuçlar elde edebilir. eklenen gen AI’nın avantajı Bu uygulamaların çoğunun minimum uzmanlık gerektirmesi ve daha fazla model eğitimi gerektirmemesidir.

Hızlı sorumluluk reddi: İnsanlar genellikle gen yapay zekayı yalnızca ChatGPT ile ilişkilendirme eğilimindedir, ancak Google’ın T5’i, Meta’nın Llama’sı, TII’nin Falcon’u ve Anthropic’in Claude’u gibi diğer sağlayıcıların sunduğu çok sayıda model vardır. Bu makalede tartışılan uygulamaların çoğu OpenAI’nin ChatGPTözel bilgi işlem bütçeniz, gecikme süreniz (tamamlamaları oluşturmak için modelinizin ne kadar hızlı olması gerektiği — daha küçük modeller daha hızlı yüklemeye izin verir ve çıkarım gecikmesini azaltır) ve sonraki görevle uyumlu hale getirmek için temel LLM’yi kolayca uyarlayabilir ve değiştirebilirsiniz.

Etkinlik

VB Transform 2023 İsteğe Bağlı

VB Transform 2023’ten bir oturumu kaçırdınız mı? Öne çıkan tüm oturumlarımız için isteğe bağlı kitaplığa erişmek için kaydolun.

Şimdi üye Ol

1. LLM’leri harici verilere bağlayın

LLM’ler, başlangıçta özelleştirme gerektirmeden çeviri ve özetleme gibi birçok görevde etkileyici yetenekler gösterir. Bu genel görevlerde bu kadar iyi olmalarının nedeni, temel alınan temel modelin büyük ancak genel veri kümeleri üzerinde eğitilmiş olmasıdır. Bununla birlikte, bu yeterlilik, örneğin şirketinizin yıllık raporu hakkında yanıtlar sağlamak da dahil olmak üzere, alana özgü görevlere sorunsuz bir şekilde genişletilmeyebilir. burası Alma Artırılmış Nesil (RAG) resme giriyor.

RAG, harici veri kaynaklarından yararlanan LLM destekli sistemler oluşturmaya yönelik bir çerçevedir. RAG, bir LLM’ye ön eğitim sırasında görmeyeceği verilere erişim sağlar, ancak bu, ilgili ve doğru yanıtları doğru bir şekilde sağlamak için gereklidir. RAG, ChatGPT gibi dil modellerinin, doğal dil işleme (NLP) yeteneklerini harici bilgilerle birleştirerek, yanlış bilgi veya “halüsinasyonlar” oluşturma durumlarını hafifleterek alana özgü sorulara daha iyi yanıtlar vermesini sağlar. Bunu şu şekilde yapar:

  • Büyük ölçekli belge koleksiyonları, veritabanları veya internet gibi dış bilgi kaynaklarından ilgili bilgileri almak. Alaka düzeyi, kullanıcının sorusuyla anlamsal benzerliğe (örneğin, kosinüs benzerliği kullanılarak ölçülür) dayanır.
  • Alınan bilgileri bilgi isteminde orijinal soruya eklemek (soruyu yanıtlamak için yararlı bir bağlam sağlamak için) ve daha bilgili, bağlamsal olarak alakalı ve doğru bir yanıt üretebilmesi için LLM’ye iletmek.

Bu yaklaşım yapar LLM’ler daha çok yönlü ve kullanışlı gerçek zamanlı verilere erişim ile soru yanıtlama, içerik oluşturma ve etkileşimli konuşma dahil olmak üzere çeşitli alanlarda ve uygulamalarda. Bir podcast uygulaması olan Podurama, yapay zeka destekli tavsiye sohbet robotlarını oluşturmak için benzer tekniklerden yararlandı. Bu botlar, kullanıcı sorgularına dayalı olarak ilgili şovları ustalıkla önerir ve önerilerini iyileştirmek için podcast transkriptlerinden içgörüler çıkarır.

Bu yaklaşım kriz yönetiminde de değerlidir. Çağrı GöreviBir SaaS olay müdahale platformu olan LLM’leri, başlık, önem derecesi veya diğer faktörler gibi temel verileri kullanarak olayların özetlerini oluşturmak ve bunu yanıtlayanların ayrıntıları tartıştığı ve özetlerin kalitesini iyileştirmek için sorun giderme güncellemelerini paylaştığı dahili Slack verileriyle zenginleştirerek LLM’leri kullanır.

RAG karmaşık görünse de LangChain kitaplığı, geliştiricilere RAG’yi uygulamak ve gelişmiş soru yanıtlama sistemleri oluşturmak için gerekli araçları sunar. (Çoğu durumda, başlamak için yalnızca tek bir kod satırına ihtiyacınız vardır). LangChain, harici veri kaynaklarına erişim sağlayarak veya diğer uygulamaların mevcut API’lerine bağlanarak çalışma zamanında LLM’nin performansını artırabilen ve geliştirebilen güçlü bir kitaplıktır.

ile birleştirildiğinde açık kaynaklı LLM’ler (Llama 2 veya BLOOM gibi), RAG, gizli belgeleri işlemek için son derece güçlü bir mimari olarak ortaya çıkıyor. Özellikle ilginç olan, LangChain’in yapılandırılmış veriler (SQL), yapılandırılmamış içerik (PDF’ler), kod parçacıkları ve hatta YouTube videoları ile sorunsuz işlevsellik sağlayan (yazım sırasında) 120’den fazla entegrasyona sahip olmasıdır.

2. LLM’leri harici uygulamalara bağlayın

Dış veri kaynaklarını kullanmak gibi, LLM’ler de belirli görevlere göre uyarlanmış dış uygulamalarla bağlantılar kurabilir. Bu, bir model zaman zaman güncel olmayan bilgiler nedeniyle yanlışlıklar ürettiğinde özellikle değerlidir. Örneğin, Birleşik Krallık’ın şu anki Başbakanı sorgulanırken, 2022’nin sonlarında görevden ayrılmasına rağmen ChatGPT, Boris Johnson’a atıfta bulunmaya devam edebilir. Bu sınırlama, modelin bilgisinin eğitim öncesi dönemde sabitlenmesi ve sonrası kapsamaması nedeniyle ortaya çıkar. – Rishi Sunak’ın randevusu gibi eğitim etkinlikleri.

Bu tür zorlukların üstesinden gelmek için, LLM’ler aracılar aracılığıyla dış dünyayla entegre edilerek geliştirilebilir. Bu aracılar, LLM’lerin doğasında bulunan internet erişimi eksikliğini hafifletmeye hizmet ederek, bir hava durumu API’si (gerçek zamanlı hava durumu verileri için) veya SerpAPI (web aramaları için) gibi araçlarla etkileşim kurmalarına olanak tanır. Dikkate değer bir örnek, Expedia’nın, kullanıcılara otelleri keşfetme ve rezervasyon yapma, konaklamayla ilgili soruları yanıtlama ve kişiselleştirilmiş seyahat önerileri sunma konusunda rehberlik eden chatbot’udur.

Bir başka büyüleyici uygulama, tweet’lerin duygu, saldırganlık ve dil gibi belirli niteliklerle gerçek zamanlı olarak otomatik olarak etiketlenmesini içerir. bir Pazarlama ve Reklamcılık bakış açısından, e-ticaret araçlarına bağlanan bir aracı, LLM’nin kullanıcı ilgi alanlarına ve içeriğine göre ürün veya paket önermesine yardımcı olabilir.

3. Zincirleme LLM’ler

LLM’ler çoğu uygulama için genellikle tek başına kullanılır. Bununla birlikte, son zamanlarda LLM zincirleme, karmaşık uygulamalar için ilgi kazanmıştır. Daha karmaşık görevleri gerçekleştirmek için birden fazla LLM’yi sırayla bağlamayı içerir. Her LLM belirli bir konuda uzmanlaşmıştır ve kapsamlı ve rafine çıktılar oluşturmak için işbirliği yaparlar.

Bu yaklaşım, LLM’lerin art arda metni bir dilden diğerine dönüştürmek için kullanıldığı dil çevirisinde uygulanmıştır. Microsoft gibi şirketlerin sahip olduğu önerilen LLM zincirlemesi düşük kaynaklı dillerde çeviri hizmetleri için, nadir kelimelerin daha doğru ve bağlama duyarlı çevirilerini mümkün kılar.

Bu yaklaşım, diğer alanlarda da birkaç değerli kullanım durumu sunabilir. Tüketiciyle yüz yüze olan şirketler için LLM zincirleme, müşteri etkileşimlerini, hizmet kalitesini ve operasyonel verimliliği geliştirebilen dinamik bir müşteri desteği deneyimi yaratabilir.

Örneğin, ilk LLM, müşteri sorgularını önceliklendirebilir ve kategorilere ayırabilir, daha doğru yanıtlar için özel LLM’lere iletebilir. Üretimde LLM zincirlemesi, talep tahmini, envanter yönetimi, tedarikçi seçimi ve risk değerlendirmesi için özel LLM’leri zincirleyerek uçtan uca tedarik zinciri süreçlerini optimize etmek için kullanılabilir.

Öncesinde LLM’lerin ortaya çıkışı, varlık çıkarma, veri toplama, etiketleme ve karmaşık model eğitimini içeren emek yoğun makine öğrenimi yaklaşımlarına dayanıyordu. Bu süreç zahmetli ve kaynak gerektiriyordu. Bununla birlikte, LLM’lerle paradigma değişti. Artık varlık ayıklama, kullanıcıların metinden varlıkları ayıklamak için modeli zahmetsizce sorgulayabilecekleri basit bir bilgi istemine indirgenmiştir. Daha da ilginci, PDF’ler gibi yapılandırılmamış metinlerden varlıkları ayıklarken, bilgi isteminde bir şema ve ilgilenilen öznitelikleri bile tanımlayabilirsiniz.

Potansiyel örnekler, zamanında ve doğru piyasa analizine olanak tanıyan, haber makalelerinden şirket adları, şerit sembolleri ve finansal rakamlar gibi önemli finansal varlıkları çıkarmak için LLM’leri kullanabilen finansal kuruluşları içerir. Benzer şekilde, tarafından kullanılabilir Reklam pazarlama reklam metinlerini, aktörleri, konumları ve tarihleri ​​kategorize etmek için LLM güdümlü varlık çıkarımı kullanarak dijital varlıklarını yönetmeye yönelik ajanslar, verimli içerik indeksleme ve varlık yeniden kullanımını kolaylaştırıyor.

5. ReAct bilgi istemleriyle LLM’lerin şeffaflığını artırma

LLM’lerden doğrudan yanıt almak kuşkusuz değerli olsa da, kara kutu yaklaşımının opaklığı genellikle kullanıcılar arasında tereddütlere yol açar. Ek olarak, karmaşık bir sorgu için yanlış bir yanıtla karşılaşıldığında, başarısızlığın tam adımını saptamak zorlaşır. Sürecin sistematik bir dökümü, hata ayıklama sürecine büyük ölçüde yardımcı olabilir. İşte tam da bu noktada Reason and Act (ReAct) çerçevesi devreye girerek bu zorluklara bir çözüm sunuyor.

ReAct, LLM’nin bir insan gibi çözümler üretmesini sağlamak için adım adım akıl yürütmeyi vurgular. Amaç, modelin insanlar gibi görevler aracılığıyla düşünmesini sağlamak ve mantığını dili kullanarak açıklamaktır. ReAct istemleri oluşturmak, yürüttükleri karşılık gelen eylemlerin yanı sıra düşüncelerini doğal dilde ifade eden insan annotatorları içeren basit bir görev olduğundan, bu yaklaşım kolayca operasyonel hale getirilebilir. Bu tür yalnızca bir avuç örnekle, model yeni görevler için iyi genelleme yapmayı öğrenir.

Bu çerçeveden ilham alan birçok eğitim teknolojisi şirketi, öğrencilere ders ve ödev konusunda kişiselleştirilmiş yardım ve eğitmenlere yapay zeka destekli ders planları sunmak için pilot araçlar kullanıyor. Bu amaçla, Khan Akademisi öğrencilere matematik problemlerinde ve kodlama alıştırmalarında rehberlik etmek için tasarlanmış bir sohbet robotu olan Khanmigo’yu geliştirdi. Khanmigo, yalnızca istek üzerine yanıtlar vermek yerine, öğrencileri akıl yürütme sürecinden geçirerek düşünceli problem çözmeyi teşvik eder. Bu yaklaşım sadece intihalin önlenmesine yardımcı olmakla kalmaz, aynı zamanda öğrencilerin kavramları bağımsız olarak kavramalarını sağlar.

Çözüm

Yapay zekanın rollerinde insanların yerini alma potansiyeli veya teknolojik tekilliğin nihai başarısı hakkında tartışmalar devam ediyor olsa da (yapay zekanın vaftiz babası Geoffrey Hinton tarafından tahmin edildiği gibi), kesin olan bir şey var: LLM’ler şüphesiz çok önemli bir rol oynayacaktır. çeşitli etki alanlarında çeşitli görevleri hızlandırmak. Karmaşık görevleri basitleştirirken verimliliği artırma, yaratıcılığı geliştirme ve karar alma süreçlerini iyileştirme gücüne sahiptirler.

Veri bilimcileri, yazılım geliştiricileri ve ürün sahipleri gibi çeşitli teknoloji rollerindeki profesyoneller için LLM’ler iş akışlarını düzene sokmak, içgörü toplamak ve yeni olasılıkların kilidini açmak için değerli araçlar sunabilir.

Varshita Sher, kendini işine adamış bir veri bilimcisidir. blogcu ve podcast küratörVe Haleon’da NLP ve üretken AI ekibine liderlik ediyor.

DataDecisionMakers

VentureBeat topluluğuna hoş geldiniz!

DataDecisionMakers, veri işini yapan teknik kişiler de dahil olmak üzere uzmanların verilerle ilgili içgörüleri ve yenilikleri paylaşabileceği yerdir.

En yeni fikirler ve güncel bilgiler, en iyi uygulamalar ile veri ve veri teknolojisinin geleceği hakkında okumak istiyorsanız DataDecisionMakers’ta bize katılın.

düşünebilirsin bile makale katkıda bulunmak senin!

DataDecisionMakers’dan Daha Fazlasını Okuyun

kim kimdir ne zaman nasıl nelerdir nedir ne işe yarar tüm bilgiler
dünyadan ilginç ve değişik haberler en garip haberler burada

Yorum yapın