Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson
Kodsnack28 Nov 2023

Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson

Fredrik får besök av Daniel Mauno Pettersson och de diskuterar vad och hur man kan bygga på språkmodeller. Gränssnittstester, till exempel, som Daniel och hans företag ägnar sig åt.

Vi är i generativ AI:s absoluta barndom, det finns långt mycket fler saker vi inte vet om vad som kommer att hända än vad vi vet kan hända eller faktiskt har hänt.

Varför vill man kombinera AI och testning? Eller omvänt: varför har inte mer hänt kring testning? Varför skriver vi tester på ungefär samma sätt, och ofta från grunden för varje projekt trots att så mycket egentligen är lika? Testning av gränssnitt är också ett sammanhang där man faktiskt kan göra det till en styrka att generativ AI inte ger exakt samma resultat varje gång - istället får du över tid en variation på testerna som kan upptäcka nya saker. (Givetvis med utförlig loggning av vad som gjorts, hur och när.)

Ska man skriva något som är helt deterministiskt och alltid ger samma resultat så finns det redan bra verktyg.

Hur vidareutvecklar man något som inte är deterministiskt? Hur vet man att ens justeringar faktiskt gör saker bättre? Här finns utrymme för väldigt många bättre verktyg!

Man behöver ha kontroll på båda sidor av språkmodellen - man måste ju kunna analysera och försöka justera efter resultaten.

Ett stort tack till Cloudnet som sponsrar vår VPS!

Har du kommentarer, frågor eller tips? Vi är @kodsnack, @thieta, @krig, och @bjoreman på Mastodon, har en sida på Facebook och epostas på info@kodsnack.se om du vill skriva längre. Vi läser allt som skickas.

Gillar du Kodsnack får du hemskt gärna recensera oss i iTunes! Du kan också stödja podden genom att ge oss en kaffe (eller två!) på Ko-fi, eller handla något i vår butik.

Länkar Titlar
  • AI-baserad testning
  • Hela vägen upp i trappan
  • Den som råkar kunna lite programmering
  • Vår tids stora skifte
  • Generera tester
  • En helt ny typ av testning
  • Börja testa allt
  • Allt som är normalflöden
  • Deterministiskt tänk på något som inte är deterministiskt
  • En kedja av prompts
  • Kontroll på båda sidor av språkmodellen
  • Man vet ingenting om väldigt många saker

Det här avsnittet är hämtat från ett öppet RSS-flöde och publiceras inte av Podme. Det kan innehålla reklam.

Avsnitt(721)

Kodsnack 707 - Det finns ett värde i friktion, med Benny Andrén och Jakob Wolman

Kodsnack 707 - Det finns ett värde i friktion, med Benny Andrén och Jakob Wolman

Fredrik snackar hastighet och kognitiv skuld med Benny Andrén och Jakob Wolman. Allt handlar inte om hastighet. Eller åtminstone inte om hastighet i de steg som språkmodeller kan göra snabbare. Vi dis...

16 Juni 48min

Kodsnack 706 - Kotlin på många olika sätt, med Johan Blomgren och Emil Kantis

Kodsnack 706 - Kotlin på många olika sätt, med Johan Blomgren och Emil Kantis

Fredrik snackar Kotlinconf 2026 och språket Kotlin i allmänhet med Johan Blomgren och Emil Kantis. Hur var konferensen? Hur fungerar utvecklingen av Kotlin, och vad är på gång i språket? Det blir tips...

9 Juni 1h 6min

Kodsnack 705 - Matte på många oväntade ställen, med Martin Nordgren

Kodsnack 705 - Matte på många oväntade ställen, med Martin Nordgren

Fredrik snackar med Martin Nordgren om hans nya ljudanalysapp Spectralscan. Appen är ett sidoprojekt byggt på ett par veckor (påskhelgen hjälpte!) på webbteknik och förpackad för både Android och Ios....

2 Juni 55min

Kodsnack 704 - Från bilen och ut, med Johan Thelin

Kodsnack 704 - Från bilen och ut, med Johan Thelin

Fredrik och Johan Thelin snackar mjukvara i bilar. Varför är det ens svårt? Varför har begreppet software defined vehicle ens blivit en grej? Conways lag gäller även här, och när man fått ordning på e...

26 Maj 57min

Kodsnack 703 - The subset needs to fit you, with Harald Achitz

Kodsnack 703 - The subset needs to fit you, with Harald Achitz

Fredrik chats to Harald Achitz about freelancing, C++ 26, and ten years of running the Swedencpp meetup. Harald discusses the various oddities of the Swedish consultant and software market, both befor...

19 Maj 1h 28min

Kodsnack 702 - Spelrelaterade CPU-optimerar-snubbar

Kodsnack 702 - Spelrelaterade CPU-optimerar-snubbar

Fredrik och Tobias snackar om Eurollvm 2026, och lite om kaffe. Tobias åkte till Dublin på LLVM-konferens, och råkade hålla i en presentation, en paneldiskussion, och två rundabordssamtal. Det gick hy...

12 Maj 43min

Kodsnack 701 - The chicken would explode, with Holly Cummins

Kodsnack 701 - The chicken would explode, with Holly Cummins

Fredrik chats to Holly Cummins about using Minecraft for observability, other amazing Quarkus tricks, and the value of joy at work. Recorded during Øredev 2025. Thank you Cloudnet for sponsoring our V...

5 Maj 38min

Kodsnack 700 - Varför har vi så bråttom?, med Benny Andrén och Markus Borg

Kodsnack 700 - Varför har vi så bråttom?, med Benny Andrén och Markus Borg

Fredrik snackar med Benny Andrén och Markus Borg om AI-drivet återupptäckande av sunda arbetssätt. Benny har börjat fundera över vilka problem AI egentligen löser, och om våra försök att tämja modelle...

26 Apr 42min

Populärt inom Utbildning

historiepodden-se
rss-bara-en-till-om-missbruk-medberoende-2
det-skaver
nu-blir-det-historia
harrisons-dramatiska-historia
not-fanny-anymore
roda-vita-rosen
sektledare
johannes-hansen-podcast
allt-du-velat-veta
rss-viktmedicinpodden
i-vantan-pa-katastrofen
sa-in-i-sjalen
rikatillsammans-om-privatekonomi-rikedom-i-livet
rss-foraldramotet-bring-lagercrantz
rss-om-vi-ska-vara-arliga
rss-sjalsligt-avkladd
rss-relationsrevolutionen
sex-pa-riktigt-med-marika-smith
rss-traningsklubben