Measuring LLMs with Jodie Burchell

.NET Rocks!3 Apr

Measuring LLMs with Jodie Burchell

How do you measure the quality of a large language model? Carl and Richard talk to Dr. Jodie Burchell about her work measuring large language models for accuracy, reliability, and consistency. Jodie talks about the variety of benchmarks that exist for LLMs and the problems they have. A broader conversation about quality digs into the idea that LLMs should be targeted to the particular topic area they are being used for - often, smaller is better! Building a good test suite for your LLM is challenging but can increase your confidence that the tool will work as expected.

Upptäck Premium

Prova 14 dagar kostnadsfritt

Allt en och samma app

Lyssna på dina favoritpoddar och ljudböcker på ett och samma ställe.

Noga utvalt innehåll

Njut av handplockade tips som passar din smak – utan ändlöst scrollande.

Fortsätt när du vill

Fortsätt lyssna där du slutade – även offline.

Premium

99 kr/mån

Tillgång till alla Premium-poddar
Lyssna utan reklam
Avsluta när du vill

Prova 14 dagar gratis

Premium

129 kr/mån

Tillgång till alla Premium-poddar
Lyssna utan reklam
Avsluta när du vill
Ett extra konto

Prova 14 dagar gratis

Populärt inom Teknik

uppgang-och-fall

skogsforum-podcast

har-vi-akt-till-mars-an

natets-morka-sida

bli-saker-podden

rss-uppgang-och-fall

rss-elektrikerpodden

developers-mer-an-bara-kod

rss-technokratin

bilar-med-sladd

solcellskollens-podcast

gubbar-som-tjotar-om-bilar

ai-sweden-podcast

bosse-bildoktorn-och-hasse-p

Berättelserna och rösterna du älskar att lyssna på

Obegränsad lyssning på alla dina favoritpoddar och ljudböcker

Upptäck Premium