Categories
- DATA SCIENCE / AI
- AFIR / ERM / RISK
- ASTIN / NON-LIFE
- BANKING / FINANCE
- DIVERSITY & INCLUSION
- EDUCATION
- HEALTH
- IACA / CONSULTING
- LIFE
- PENSIONS
- PROFESSIONALISM
- THOUGHT LEADERSHIP
- MISC
ICA LIVE: Workshop "Diversity of Thought #14
Italian National Actuarial Congress 2023 - Plenary Session with Frank Schiller
Italian National Actuarial Congress 2023 - Parallel Session on "Science in the Knowledge"
Italian National Actuarial Congress 2023 - Parallel Session with Lutz Wilhelmy, Daniela Martini and International Panelists
Italian National Actuarial Congress 2023 - Parallel Session with Kartina Thompson, Paola Scarabotto and International Panelists
47 views
0 comments
0 likes
0 favorites
DAVDGVFMGermany
Die Leistungsfähigkeit großer Sprachmodelle lässt sich mit bestehenden Benchmarks nur unzureichend für aktuarielles Arbeiten beurteilen, da diese fachliche Anforderungen kaum abbilden. Mit actubench wird ein domänenspezifisches Benchmarking vorgestellt, das auf einem mehrstufigen agentischen Workflow basiert: Ein Mehragentensystem aus spezialisierten LLM-Agenten generiert, verifiziert und klassifiziert automatisiert anspruchsvolle Prüfungsaufgaben aus dem IAA-Syllabus, von der Schlüsselwortextraktion über die Wissensbasis bis zur unabhängigen Qualitätsprüfung. Die so erzeugten Aufgaben dienen anschließend als Benchmark, anhand dessen verschiedene LLMs hinsichtlich fachlicher Kompetenz, Modellversionen und Kostenstrukturen verglichen werden. Die Ergebnisse zeigen, dass kein Modellanbieter durchgängig überlegen ist und kleine Modelle überraschend gut abschneiden können. Der Vortrag gibt praktische Empfehlungen für den gezielten Einsatz von LLMs, sowohl als Werkzeug als auch als autonome Agenten, in der Versicherungsmathematik und in Versicherungsunternehmen.
0 Comments
There are no comments yet. Add a comment.