Temel Model (Foundation Model)
Temel model, büyük ölçekli ve genel amaçlı olarak eğitilen, ince ayar ile pek çok farklı göreve uyarlanabilen yapay zeka modelidir.
Duz Turkce Aciklama
Temel model kavramı, Stanford HAI araştırmacılarının 2021'de ortaya attığı bir terimdir. GPT-4, Claude veya Gemini gibi modeller milyarlarca parametreyle devasa veri üzerinde eğitilir ve bu sayede tek bir model çeviri, özetleme, kod yazma, analiz gibi onlarca farklı görevi gerçekleştirebilir. Şirketler bu modeller üzerine ince ayar yaparak kendi uygulamalarını geliştirir. Temel modeller, spesifik görev modellerine kıyasla çok daha fazla esneklik sunar.
Nerede Kullanilir?
Yapay zeka araştırmaları, ürün geliştirme ve iş dünyası tartışmalarında yaygın kullanım alanı olan bir terimdir. Açık kaynak temel modeller (Llama, Mistral) ile tescilli modeller (GPT, Claude) arasındaki karşılaştırmalarda sıkça geçer.
Ornek
Bir sağlık teknolojisi firması, Llama temel modelini kendi hasta kayıtları üzerinde ince ayar yaparak klinik not özetleme sistemine dönüştürdü.