Kenmerken – epistemische bouwstenen

zijn kenmerken epistemisch gezond, stabiel en informatief?

Support – hoe vaak een kenmerk voorkomt binnen een observatieperiode

Doel

Meet hoe vaak een kenmerk voorkomt binnen een observatieperiode.

Definitie

Support beschrijft het aantal waarnemingen van een kenmerk binnen de geselecteerde observatieperiode.

Formule

support =

aantal(kenmerk_voorkomens)

Bereik

[1, +∞)

Interpretatie

Laag

Weinig observaties beschikbaar. Kwaliteitsindicatoren die op dit kenmerk worden berekend zijn mogelijk minder betrouwbaar.

Middel

Voldoende observaties beschikbaar voor een representatieve analyse van het kenmerk.

Hoog

Sterke vertegenwoordiging binnen de observatieperiode. Resultaten zijn doorgaans stabieler en betrouwbaarder.

Belang

Support vormt de basis voor vrijwel alle andere kwaliteitsindicatoren. Een lage Support kan leiden tot instabiele, ruisgevoelige of statistisch onvoldoende onderbouwde kwaliteitsmetingen.

Faalmodi

Geen waarnemingen beschikbaar.

Te weinig waarnemingen voor een betrouwbare analyse.

Sterke dominantie van een zeer beperkte observatieperiode.

Sterke dominantie van een klein aantal instrumenten of contexten.

Coverage – hoeveel van de beschikbare bucketruimte daadwerkelijk wordt gebruikt

Doel

Meet hoeveel van de beschikbare bucketruimte daadwerkelijk wordt gebruikt.

Definitie

Coverage beschrijft het aandeel gebruikte buckets binnen de totale beschikbare bucketruimte.

Formule

coverage =
gebruikte_buckets
/
beschikbare_buckets

Bereik

[0, 1]

Interpretatie

Laag

Een groot deel van de beschikbare bucketruimte blijft ongebruikt. Het kenmerk benut slechts een beperkt deel van de mogelijke representatieruimte.

Middel

Een redelijk deel van de bucketruimte wordt benut. Het kenmerk vertoont voldoende spreiding voor een representatieve analyse.

Hoog

De beschikbare bucketruimte wordt grotendeels of volledig benut. Het kenmerk maakt effectief gebruik van de gedefinieerde bucketstructuur.

Belang

Coverage meet hoe goed een kenmerk gebruikmaakt van de beschikbare bucketruimte. Een lage Coverage kan wijzen op informatieverlies, een ongeschikte bucketdefinitie of een gebrek aan variatie binnen het kenmerk. Een hoge Coverage vergroot de kans dat relevante verschillen binnen de data zichtbaar worden.

Faalmodi

Geen bucketruimte beschikbaar.

beschikbare_buckets = 0

Ongeldige of onvolledige bucketdefinitie.

Alle waarnemingen vallen in een zeer beperkt aantal buckets.

Sterke concentratie van waarnemingen waardoor grote delen van de bucketruimte ongebruikt blijven.

Entropy – spreiding van observaties over de bucketruimte

Doel

Meet de spreiding van waarnemingen over de beschikbare bucketruimte.

Definitie

Entropie beschrijft hoe gelijkmatig waarnemingen zijn verdeeld over de beschikbare buckets. De indicator is gebaseerd op de Shannon-entropie van de bucketverdeling.

Formule

entropie =
− Σ p(i) × log₂(p(i))

waarbij:

p(i) =
aandeel waarnemingen in bucket i

Bereik

[0, log₂(aantal_buckets)]

Interpretatie

Laag

Waarnemingen concentreren zich in een beperkt aantal buckets. Het kenmerk vertoont weinig variatie en onderscheidend vermogen.

Middel

Waarnemingen zijn redelijk verdeeld over de bucketruimte. Het kenmerk bevat een bruikbare mate van variatie.

Hoog

Waarnemingen zijn breed verspreid over de beschikbare bucketruimte. Het kenmerk benut zijn representatieruimte effectief en bevat veel variatie.

Belang

Entropie meet de informatiedichtheid van een kenmerk. Een hogere entropie wijst doorgaans op een grotere diversiteit aan waarnemingen en een rijkere representatie van mogelijke toestanden. Een zeer lage entropie kan erop wijzen dat een kenmerk onvoldoende onderscheid maakt tussen verschillende situaties.

Faalmodi

Lege bucketverdeling.

Geen waarnemingen beschikbaar.

Ongeldige kansverdeling.

Alle waarnemingen bevinden zich structureel in één enkele bucket.

Information Gain – onderscheidend vermogen van een kenmerk

Doel

Meet het onderscheidend vermogen van een kenmerk.

Definitie

Information Gain beschrijft in welke mate een kenmerk betekenisvolle verschillen tussen waarnemingen zichtbaar maakt. De indicator is afgeleid van de entropie van de bucketverdeling.

Formule

information_gain =
1 − genormaliseerde_entropie

Bereik

[0, 1]

Interpretatie

Laag

Het kenmerk maakt weinig onderscheid tussen verschillende situaties. De informatie-inhoud is beperkt.

Middel

Het kenmerk bezit een redelijke mate van onderscheidend vermogen en draagt bij aan het herkennen van relevante verschillen.

Hoog

Het kenmerk maakt duidelijke onderscheidingen tussen verschillende situaties en bevat veel bruikbare informatie.

Belang

Information Gain meet hoeveel informatie een kenmerk toevoegt boven een volledig uniforme verdeling. Een hoge waarde wijst op een sterk onderscheidend kenmerk. Een lage waarde kan erop wijzen dat het kenmerk weinig nieuwe informatie toevoegt en beperkt bruikbaar is voor verdere analyse.

Faalmodi

Ongeldige entropiewaarde.

Ontbrekende bucketverdeling.

Onvoldoende waarnemingen voor een betrouwbare berekening.

Ongeldige normalisatie van de entropie.

Stability – gedraagt een kenmerk zich vergelijkbaar tussen opeenvolgende observatieperiodes

Doel

Meet of een kenmerk zich vergelijkbaar gedraagt tussen opeenvolgende observatieperiodes.

Definitie

Stability beschrijft de mate waarin de bucketverdeling van een kenmerk doorheen de tijd gelijk blijft. De indicator meet of de betekenisstructuur van het kenmerk stabiel blijft tussen opeenvolgende observatieperiodes.

Formule

stability =
similariteit(
bucketverdeling(t),
bucketverdeling(t−1)
)

De exacte similariteitsmaat wordt architecturaal vastgelegd.

Bereik

[0, 1]

Interpretatie

Laag

De bucketverdeling verandert sterk tussen observatieperiodes. Het kenmerk vertoont een instabiele betekenisstructuur.

Middel

De bucketverdeling blijft gedeeltelijk behouden. Het kenmerk vertoont een redelijke mate van temporele stabiliteit.

Hoog

De bucketverdeling blijft grotendeels gelijk tussen observatieperiodes. Het kenmerk bezit een consistente betekenisstructuur doorheen de tijd.

Belang

Stability meet de reproduceerbaarheid van een kenmerk doorheen de tijd. Een hoge Stability vergroot de betrouwbaarheid van analyses en maakt resultaten beter vergelijkbaar tussen observatieperiodes. Een lage Stability kan wijzen op veranderingen in marktdynamiek of op een kenmerk waarvan de betekenis onvoldoende stabiel is.

Faalmodi

Geen vorige observatieperiode beschikbaar.

Ontbrekende bucketverdeling.

Onvoldoende waarnemingen voor een betrouwbare vergelijking.

Ongeldige of niet-vergelijkbare bucketverdelingen.

Consistency – gedraagt een kenmerk zich vergelijkbaar binnen verschillende observatieruimten

Doel

Meet of een kenmerk zich vergelijkbaar gedraagt binnen verschillende observatieruimten.

Definitie

Consistency beschrijft de mate waarin de bucketverdeling van een kenmerk vergelijkbaar blijft over verschillende instrumenten, contexten en resoluties binnen dezelfde observatieperiode.

Formule

consistency =
similariteit(
bucketverdelingen
)

De exacte aggregatiemethode wordt architecturaal vastgelegd.

Bereik

[0, 1]

Interpretatie

Laag

De bucketverdelingen verschillen sterk tussen observatieruimten. Het kenmerk is sterk afhankelijk van specifieke instrumenten, contexten of resoluties.

Middel

De bucketverdelingen vertonen gedeeltelijke overeenkomsten tussen observatieruimten. Het kenmerk bezit een redelijke mate van consistentie.

Hoog

De bucketverdelingen zijn grotendeels vergelijkbaar tussen observatieruimten. Het kenmerk gedraagt zich breed toepasbaar en voorspelbaar.

Belang

Consistency meet in welke mate een kenmerk zijn betekenis behoudt binnen verschillende observatieruimten. Een hoge Consistency vergroot de kans dat een kenmerk bruikbaar blijft over meerdere instrumenten, contexten en resoluties. Een lage Consistency kan erop wijzen dat het kenmerk sterk afhankelijk is van specifieke omstandigheden.

Faalmodi

Onvoldoende observatieruimten beschikbaar.

Ontbrekende bucketverdelingen.

Onvoldoende waarnemingen binnen één of meerdere observatieruimten.

Ongeldige of niet-vergelijkbare bucketverdelingen.

Drift – hoeveel de betekenisstructuur verandert tussen opeenvolgende observatieperiodes

Doel

Meet hoeveel de betekenisstructuur verandert tussen opeenvolgende observatieperiodes.

Definitie

Drift beschrijft de afstand tussen de bucketverdelingen van opeenvolgende observatieperiodes. De indicator meet in welke mate de betekenisstructuur van een kenmerk verschuift doorheen de tijd.

Formule

drift =
afstand(
bucketverdeling(t),
bucketverdeling(t−1)
)

De exacte afstandsmaat wordt architecturaal vastgelegd.

Bereik

[0, +∞)

of

[0, 1]

afhankelijk van de gekozen afstandsmaat.

Interpretatie

Laag

De bucketverdeling blijft grotendeels gelijk tussen observatieperiodes. Het kenmerk vertoont weinig verandering in betekenisstructuur.

Middel

De bucketverdeling verschuift merkbaar tussen observatieperiodes. Het kenmerk ondergaat een beperkte verandering in betekenisstructuur.

Hoog

De bucketverdeling verandert sterk tussen observatieperiodes. Het kenmerk vertoont een aanzienlijke verschuiving in betekenisstructuur.

Belang

Drift meet de mate waarin de betekenisstructuur van een kenmerk verandert doorheen de tijd. Een lage Drift wijst op een stabiele betekenisstructuur, terwijl een hoge Drift kan wijzen op veranderende marktdynamiek, regimeveranderingen of een verschuivende relatie tussen het kenmerk en de waargenomen werkelijkheid.

Faalmodi

Geen vorige observatieperiode beschikbaar.

Ontbrekende bucketverdeling.

Onvoldoende waarnemingen voor een betrouwbare vergelijking.

Ongeldige of niet-vergelijkbare bucketverdelingen.

Ongeldige afstandsmaat of afstandsberekening.

Redundancy – overlap met andere kenmerken

Doel

Meet de mate van overlap met andere kenmerken.

Definitie

Redundancy beschrijft in welke mate een kenmerk dezelfde informatie bevat als andere kenmerken binnen dezelfde observatieruimte. De indicator wordt bepaald door de hoogste absolute correlatie tussen dit kenmerk en alle andere kenmerken.

Formule

redundancy =
max(
absolute_correlatie
)

Bereik

[0, 1]

Interpretatie

Laag

Het kenmerk vertoont weinig overlap met andere kenmerken en draagt grotendeels unieke informatie bij.

Middel

Het kenmerk deelt een deel van zijn informatie met andere kenmerken, maar behoudt voldoende eigen onderscheidend vermogen.

Hoog

Het kenmerk vertoont sterke overlap met één of meerdere andere kenmerken. De toegevoegde informatie is beperkt.

Belang

Redundancy meet hoeveel unieke informatie een kenmerk toevoegt ten opzichte van andere kenmerken. Een hoge Redundancy kan wijzen op duplicatie van informatie, terwijl een lage Redundancy suggereert dat het kenmerk een eigen bijdrage levert aan de beschrijving van de observatieruimte.

Faalmodi

Onvoldoende vergelijkingsdata beschikbaar.

Onvoldoende waarnemingen voor een betrouwbare correlatieberekening.

Geen vergelijkbare kenmerken beschikbaar binnen de observatieruimte.

Ongeldige of niet-berekenbare correlatiewaarden.

Sterke dominantie van ontbrekende of constante waarden.

Reactieprofielen – structurele gedragsprojecties

zijn structurele marktresponses stabiel en bruikbaar?

Intenties – epistemische contractdefinities

zijn interpretatiekaders coherent, stabiel en consistent?

Agents – contractuele interpretatie

interpreteren agents proportioneel, consistent en conflictvrij?

Ensemble – spanningsorganisatie

bewaart het ensemble epistemische spanningen correct en stabiel?

Regie – normatieve begrenzing

begrenst regie gedrag consistent, proportioneel en reproduceerbaar?

Kapitaal – exposurebeheer

blijft exposure veilig, begrensd en reproduceerbaar?

Executie – marktuitvoering

blijft uitvoering correct, reproduceerbaar en contractconform?