Over Wetzoek

Missie

Wetzoek is een project om het Nederlands recht toegankelijker te maken. Wij maken het gemakkelijker voor mensen zonder juridische achtergrond om de context voor hun juridische vragen te vinden. Daarnaast geven wij advocaten en andere mensen die met het Nederlands recht werken een hulpmiddel om relevante wetgeving en rechtspraak te vinden.

Kunstmatige Intelligentie

Het vakgebied "Natural Language Processing" richt zich binnen de kunstmatige intelligentie op het verwerken van natuurlijke taal. Hier vindt men de middelen om kunstmatige intelligentie toe te passen op het Nederlands recht. Er bestaat een geweldig gamma aan technieken om met natuurlijke taal te werken, die vaak ook al op het recht zijn toegepast. Hierbij kunt u denken aan het automatisch opstellen van contracten, het analyseren van contracten om de belangrijkste clausules te identificeren, of het gebruik van taalanalyses om tot een (voorlopig) vonnis te komen.

Neural Search

Ook zoekmachines maken steeds meer gebruik van kunstmatige intelligentie. Traditionele zoekmachines zoeken op trefwoorden, door middel van zogenaamd "symbolic search". Dat betekent dat ze simpelweg door documenten heen bladeren en er een notitie van maken als één of meerdere trefwoorden voorkomen. Hierbij was vaak geen ruimte voor nuance: als u zocht naar uitspraken met de tekst "ontslag op staande voet", dan werd de tekst "hij werd stante pede ontslagen" niet opgepakt door de zoekmachine.

De meeste moderne zoekmachines zijn er meestal wel op uitgerust om ook verbuigingen en synoniemen van trefwoorden te herkennen. Dit vereist vaak dat de zoekmachines een aantal regels wordt uitgelegd: bijvoorbeeld dat "stante pede" een synoniem is voor "op staande voet". U voelt de bui waarschijnlijk al hangen: dit is tijdrovend werk met veel ruimte voor fouten. De ontwikkelaar hoeft maar vergeten een synoniem in te voeren en de zoekmachine werkt niet naar behoren.


Het allernieuwste op het raakvlak van zoekmachilsnes en kunstmatige intelligentie is de zogenaamde neural search. Hierbij worden modellen op enorme hoeveelheden tekst getraind om overeenkomsten, parallelen, en patronen te herkennen. Een zoekmachine op basis van neural search gebruikt deze modellen om zoektermen of vragen in hun bredere context te kunnen plaatsen, om zo tot een beter antwoord te komen. Wetzoek gebruikt de neural search technieken van open-source bedrijven als DeepSet en Jina.

Multi-label classification

Een andere toepassing van kunstmatige intelligentie is de zogeheten "multi-label classification". Hierbij wordt een model getraind op gelabelde teksten, zodat het via patroonherkenning een label kan geven aan nieuw ingevoerde tekst. Bijvoorbeeld: u voert de machine samenvattingen van "Soldaat van Oranje", "Spetters", "Turks Fruit", en nog honderd andere films. Deze samenvattingen heeft u allemaal al categoriseerd: "Oorlogsfilm", "Drama", en "Drama". Als het goed is, zal het model dan een samenvatting van de film "Pastorale 1943" categoriseren als "Oorlogsfilm". Het is bij het gebruik van deze techniek overigens geen vereiste dat Rutger Hauer een rol heeft in de film.

Wetzoek gebruikt multi-label classification om teksten in te delen naar rechtsgebieden. Voor de rechtsgebieden gebruiken we de gangbare definities van de Nederlandse rechtpsraak, van Arbeidsrecht tot Vreemdelingenrecht. Met behulp van grafentheorie verfijnen we de resultaten nog verder. Meer informatie over hoe we grafentheorie gebruiken staat in dit Engelstalige artikel, Using Graphs and Neo4j to build a search tool for Dutch law.

Databronnen

Wetzoek was niet mogelijk geweest zonder de uitstekende Open Data van de Nederlandse overheid. Zowel de uitspraken van rechtspraak.nl als van wetten.nl zijn beschikbaar gemaakt en zij vormen de basis van Wetzoek.

SIDN Fonds

Voor Wetzoek hebben wij steun ontvangen als Pioniersproject van het SIDN fonds. Het SIDN fonds draagt bij aan een sterk internet voor iedereen en Wetzoek past daarbinnen doordat wij mensen zonder juridische achtergrond wegwijs willen maken.