Julekalender luke 3: AI for kontinuerlig læring

Julekalender luke 3: AI for kontinuerlig læring

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.

Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605

Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html

Populært innen Fakta

dine-penger-pengeradet
fastlegen
hanna-de-heldige
relasjonspodden-med-dora-thorhallsdottir-kjersti-idem
rss-hva-velger-du
foreldreradet
treningspodden
dypdykk
fryktlos
jakt-og-fiskepodden
rss-sunn-okonomi
mikkels-paskenotter
rss-kunsten-a-leve
sinnsyn
dopet
sovnlos
hverdagspsyken
sondagsquiz-med-hasse-tophe
bedragere
rss-strid-de-norske-borgerkrigene