Tijdens de laatste schaakwereldkampioenschapsmatch tussen Carlsen en Caruana eindigden alle reguliere partijen in remise. Behalve het hoge remise percentage viel het op dat zwart de meeste kansen had gehad om te winnen. Later tijdens het Tata steel chess toernooi leek dit bevestigd te worden. In de eerste drie ronden won zwart 6 keer en wit slechts 1 keer. Wit scoorde dus maar 38%! Opvallend, maar uiteindelijk won wit 20 keer en zwart 17 keer. Wit scoorde dus 52%, vrij normaal.

Toch lijkt het aannemelijk dat de resultaten historisch gezien veranderen. Ik heb een herdruk van Howard Stauntan’s (die van de schaakstukken!) “The Chess-Player’s Handbook” uit 1847. Schaken was een heel ander spelletje toen. De eerste 10% van het boek legt wat algemene regels uit. Daarna volgt ongeveer 55% van het boek over de open spelen (1. e4 e5). Daarna nog 5% (!) over andere openingen. De rest van het boek gaat over eindspelen. De meeste partijen zijn absurd tactisch.

Een ander leuk klein boekje is “Nieuwe ideeën in het schaakspel” van Richard Réti uit 1922. De titel is vrij vertaald uit mijn Franse vertaling van een Engelse vertaling van het Duitse origineel. Het verteld de verandering van het tactische spel van Morphy tot het positionele spel van Capablanca. Het eindigt met de “hyper-moderne” stijl, waarbij 1. d4 niet per sé met 1. … d5 beantwoord hoeft te worden.

 

 

De vraag is nu of deze veranderingen terug gezien kunnen worden in de resultaten. Tot mijn beschikking staat nog steeds de database van Fritz 13. Deze database kwalificeert zich niet als big data, maar het is toch een aardige selectie van partijen. De eerste grafiek laat de score van wit zien tussen 1950 en 2010:

Score van 1950 to 2010

Tot 1980 schommelt de grafiek behoorlijk. Dit is waarschijnlijk een teken dat het aantal partijen te klein is voor een goede statistiek. Van 1980 tot 2010 zou je misschien een iets dalende trend kunnen zien. Het lijkt erop dat de resultaten behoorlijk stabiel zijn. De volgende grafiek laat het aantal remises zien tussen 1950 en 2010:

 Remises van 1950 tot 2010

Het aantal remises is behoorlijk constant. Tot 1980 eindigt ongeveer 40% van de partijen in remise. Daarna word een scherpe daling ingezet. Dit weerspreekt het algemene gevoel dat er meer remise gespeelt word. Maar we weten niet zo goed hoe de partijen geselecteerd worden. Een eerste indicatie is het aantal partijen in de database van 1950 tot 2010:

Aantal partijen van 1950 tot 2010

Vanaf 1980 gaat het aantal partijen scherp omhoog. Dit verklaard waarom de twee vorige grafieken zoveel varieerden tot 1980. Het vermoeden is nu dat de recentere partijen in de database ook partijen van minder getalenteerde schakers bevat. Zou de afname van het aantal remise partijen verklaard kunnen worden door spelers met een lagere rating in de database?

Invloed van rating

Om dit te bepalen kijk ik alleen naar partijen uit 2010. Hierbij splits ik de partijen op naar rating. De eerste groep zijn partijen waar spelers met een rating tussen 1800 en 1900 tegen elkaar spelen. Telkens verhoog ik de rating met 100 ELO punten tot 2700-2800. De wit score ziet er als volgt uit:

Score in 2010 naar rating

De variatie is vrij klein, maar spelers met een hogere rating lijken iets beter te scoren met wit. Een grotere verschuiving zien we als we naar het aantal remise partijen kijken:

Remise percentage in 2010 naar rating

De 2700 spelers spelen 2 keer zo vaak remise tegen elkaar als de 2000 spelers. Merk ook op dat in deze grafieken geen statistieken verwerkt zijn waarbij een sterkere speler tegen een zwakkere speler speelt. Waarschijnlijk daalt het remise percentage dan nog verder. Dit kun je ook terug zien in het aantal partijen wat in totaal duidelijk onder de 150000 blijft:

Aantal partijen in 2010 naar rating

 

Corrigeren naar rating

De aanname is nu dat de oudere partijen tussen goede spelers zijn, terwijl er in recentere tijden ook mindere spelers in de database zitten. Het lijkt dus eenvoudig om te filteren op ELO rating, maar er is zoiets als rating inflatie. Persoonlijk heb ik hier nooit wat van gemerkt, maar betere spelers hebben een steeds hogere rating. Bij gebrek aan beter heb ik de rating zo afgekapt dat het aantal partijen min of meer constant blijft. De volgende grafiek laat zien waar de ELO limiet voor een jaar op lag:

ELO limiet per jaar

En nu het aantal partijen tussen 1980 en 2010:

Aantal partijen van 1980 tot 2010

Het is niet helemaal gelukt om het aantal partijen constant op 5000 per jaar te krijgen. Toch hebben we nu voor ieder jaar de beste partijen geselecteerd.  Voor 1980 hebben we nu 5.000 van de 9.000 partijen geselecteerd. Voor 2010 ongeveer 3.000 van de 150.000. De wit score is weer ongeveer constant gebleven:

Wit score van 1980 tot 2010

Het percentage remises lijkt nu juist wel toe te nemen:

Remise percentage van 1980 tot 2010

 

Conclusie

Het is natuurlijk super lastig om deze data goed te interpreteren. Maar het lijkt toch aannemelijk dat bij goed spel het percentage remises omhoog gaat. Dit zie je ook terug in computer matches, veel remises en af en toe wint wit.

 

 

Comments powered by CComment