Blog Met Machine Learning je WKR op orde

Met Machine Learning je WKR op orde

Wat is het fiscale verschil tussen een voorgeschoten zakelijke lunch, een maaltijd bij overwerk en een lunch in de kantine? Iemand? Het antwoord: binnen de werkkostenregeling (WKR) geldt de voorgeschoten zakelijke lunch als ‘intermediaire kosten’, de maaltijd bij overwerk is ‘gericht vrijgesteld’ en voor een lunch in de kantine geldt een ‘normbedrag’. Gaan we door naar de volgende vraag: het fiscale verschil tussen losse treinkaartjes en een OV-abonnement. Leuke quiz? Zeker niet! Laten we eerlijk zijn, de werkkostenregeling is één grote, ingewikkelde, tot op het bot genuanceerde ellende. Hoe krijg je dat in hemelsnaam op orde? Antwoord: met Machine Learning. Lees snel verder...

Wat is de werkkostenregeling (WKR)?

Jaarlijks mogen werkgevers op basis van de werkkostenregeling (WKR) een deel van de totale fiscale loonsom besteden aan onbelaste vergoedingen en verstrekkingen aan werknemers (in 2022 is dit maximaal 1,7% van de fiscale loonsom tot en met € 400.000, daarboven is het 1,18%). Die percentages vormen de zogenaamde ‘vrije ruimte’. Kom je daar als werkgever boven, dan moet je een eindheffing van 80% betalen. Belangrijk is dat niet alle vergoedingen en verstrekkingen ten koste gaan van de vrije ruimte. Binnen de WKR worden daarvoor verschillende categorieën gehanteerd. Lees hier meer over hoe de WKR op hoofdlijnen werkt.

Wat maakt de werkkostenregeling (WKR) zo ingewikkeld?

Wat de WKR erg ingewikkeld maakt is het bepalen welke vergoedingen en verstrekkingen vallen onder welke categorie. Dat ligt vaak verdraaid genuanceerd. Weet je het nog? In de inleiding hierboven gaven we al een paar voorbeelden. Lunch in de kantine gaat (via een normbedrag) wel ten koste van je vrije ruimte, maar een voorgeschoten zakelijke lunch niet. Een laptop moet voor minimaal 90% zakelijk gebruikt worden om niet ten koste van de vrije ruimte te gaan, een smartphone voor minimaal 10%. Bedrijfskleding met logo gaat niet ten koste van de vrije ruimte, bedrijfskleding zonder logo wel. Weten hoe het fiscaal gezien allemaal zit is één ding, maar het op een correcte manier administreren is een extra complicerende factor. Was het een ‘zakelijke lunch’, maar administreer je ‘lunch’, dan kan dat tot problemen leiden.

Hoe kan Machine Learning helpen bij het op orde krijgen van de WKR?

Omdat de WKR een regeling is waar details de doorslag kunnen geven of een boeking wel of niet in de juiste WKR-categorie terecht is gekomen, is het ondoenlijk om een analyse te bouwen die werkt op basis van business rules. Daarvoor moet je namelijk alle mogelijke varianten vooraf heel strak definiëren. Bij de WKR gaat dat niet. Een jas is (mits voorzien van logo) bedrijfskleding, een broek kan dat ook zijn, een shirt, en ga zo maar door. Er zijn wel 100 manieren om bedrijfskleding in een boekingstekst te omschrijven. Daarom hebben we – samen met de universiteiten van Leiden, Groningen, Wageningen, Hogeschool Inholland en de fiscalisten van Caraad een Machine Learning model ontwikkeld (lees hier meer over het maken van een Machine Learning model). Door, in overleg met alle betrokkenen, het model te ‘voeden’ met grote hoeveelheden boekingen en de door de betrokken partners toegekende WKR-classificaties, ontstond er een model dat op basis van de boekingstekst kan beoordelen binnen welke WKR-categorie de kosten vallen. Door verschillende datasets te combineren en door fiscalisten te laten meekijken met de uitkomsten, konden we voorkomen dat foute beoordelingen in de datasets het model verkeerde dingen aan zouden leren. Verder worden door het model boekingsteksten die onvoldoende duidelijk zijn op een aparte lijst gezet, zodat die boekingsteksten in het vervolg duidelijker omschreven kunnen worden. Zoals uit alleen "lunch" bijvoorbeeld niet kan worden opgemaakt of de lunch zakelijk was of niet.

Hoe betrouwbaar zijn de resultaten?

Modellen zijn leuk, maar uiteindelijk gaat het om de resultaten. Als laatste stap in de ontwikkeling van het model heeft een fiscaal expert van een van onze klanten daarom de uitkomsten van het model handmatig gecontroleerd. Kortgezegd worden er door het model lijsten gemaakt van die boekingen waarbij het model een andere WKR-categorie waarschijnlijk acht, dan de inschatting van de klant. Het model was het in 216 gevallen niet eens met de classificatie die de klant had toegekend. Daarvan bleek – na nadere bestudering van de fiscaal expert - in 198 gevallen (92%) het model gelijk te hebben. In 17 gevallen had de klant gelijk en het model niet. In 1 geval hadden zowel het model als de klant het fout.

En dat is iets waar we oprecht trots op zijn!