Kenmerken – epistemische bouwstenen
zijn kenmerken epistemisch gezond, stabiel en informatief?
Support – hoe vaak een kenmerk voorkomt binnen een observatieperiode
Doel
Meet hoe vaak een kenmerk voorkomt binnen een observatieperiode.
Definitie
Support beschrijft het aantal waarnemingen van een kenmerk binnen de geselecteerde observatieperiode.
Formule
support =
aantal(kenmerk_voorkomens)
Bereik
[1, +∞)
Interpretatie
Laag
Weinig observaties beschikbaar. Kwaliteitsindicatoren die op dit kenmerk worden berekend zijn mogelijk minder betrouwbaar.
Middel
Voldoende observaties beschikbaar voor een representatieve analyse van het kenmerk.
Hoog
Sterke vertegenwoordiging binnen de observatieperiode. Resultaten zijn doorgaans stabieler en betrouwbaarder.
Belang
Support vormt de basis voor vrijwel alle andere kwaliteitsindicatoren. Een lage Support kan leiden tot instabiele, ruisgevoelige of statistisch onvoldoende onderbouwde kwaliteitsmetingen.
Faalmodi
Geen waarnemingen beschikbaar.
Te weinig waarnemingen voor een betrouwbare analyse.
Sterke dominantie van een zeer beperkte observatieperiode.
Sterke dominantie van een klein aantal instrumenten of contexten.
Coverage – hoeveel van de beschikbare bucketruimte daadwerkelijk wordt gebruikt
Doel
Meet hoeveel van de beschikbare bucketruimte daadwerkelijk wordt gebruikt.
Definitie
Coverage beschrijft het aandeel gebruikte buckets binnen de totale beschikbare bucketruimte.
Formule
coverage =
gebruikte_buckets
/
beschikbare_buckets
Bereik
[0, 1]
Interpretatie
Laag
Een groot deel van de beschikbare bucketruimte blijft ongebruikt. Het kenmerk benut slechts een beperkt deel van de mogelijke representatieruimte.
Middel
Een redelijk deel van de bucketruimte wordt benut. Het kenmerk vertoont voldoende spreiding voor een representatieve analyse.
Hoog
De beschikbare bucketruimte wordt grotendeels of volledig benut. Het kenmerk maakt effectief gebruik van de gedefinieerde bucketstructuur.
Belang
Coverage meet hoe goed een kenmerk gebruikmaakt van de beschikbare bucketruimte. Een lage Coverage kan wijzen op informatieverlies, een ongeschikte bucketdefinitie of een gebrek aan variatie binnen het kenmerk. Een hoge Coverage vergroot de kans dat relevante verschillen binnen de data zichtbaar worden.
Faalmodi
Geen bucketruimte beschikbaar.
beschikbare_buckets = 0
Ongeldige of onvolledige bucketdefinitie.
Alle waarnemingen vallen in een zeer beperkt aantal buckets.
Sterke concentratie van waarnemingen waardoor grote delen van de bucketruimte ongebruikt blijven.
Entropy – spreiding van observaties over de bucketruimte
Doel
Meet de spreiding van waarnemingen over de beschikbare bucketruimte.
Definitie
Entropie beschrijft hoe gelijkmatig waarnemingen zijn verdeeld over de beschikbare buckets. De indicator is gebaseerd op de Shannon-entropie van de bucketverdeling.
Formule
entropie =
− Σ p(i) × log₂(p(i))
waarbij:
p(i) =
aandeel waarnemingen in bucket i
Bereik
[0, log₂(aantal_buckets)]
Interpretatie
Laag
Waarnemingen concentreren zich in een beperkt aantal buckets. Het kenmerk vertoont weinig variatie en onderscheidend vermogen.
Middel
Waarnemingen zijn redelijk verdeeld over de bucketruimte. Het kenmerk bevat een bruikbare mate van variatie.
Hoog
Waarnemingen zijn breed verspreid over de beschikbare bucketruimte. Het kenmerk benut zijn representatieruimte effectief en bevat veel variatie.
Belang
Entropie meet de informatiedichtheid van een kenmerk. Een hogere entropie wijst doorgaans op een grotere diversiteit aan waarnemingen en een rijkere representatie van mogelijke toestanden. Een zeer lage entropie kan erop wijzen dat een kenmerk onvoldoende onderscheid maakt tussen verschillende situaties.
Faalmodi
Lege bucketverdeling.
Geen waarnemingen beschikbaar.
Ongeldige kansverdeling.
Alle waarnemingen bevinden zich structureel in één enkele bucket.
Information Gain – onderscheidend vermogen van een kenmerk
Doel
Meet het onderscheidend vermogen van een kenmerk.
Definitie
Information Gain beschrijft in welke mate een kenmerk betekenisvolle verschillen tussen waarnemingen zichtbaar maakt. De indicator is afgeleid van de entropie van de bucketverdeling.
Formule
information_gain =
1 − genormaliseerde_entropie
Bereik
[0, 1]
Interpretatie
Laag
Het kenmerk maakt weinig onderscheid tussen verschillende situaties. De informatie-inhoud is beperkt.
Middel
Het kenmerk bezit een redelijke mate van onderscheidend vermogen en draagt bij aan het herkennen van relevante verschillen.
Hoog
Het kenmerk maakt duidelijke onderscheidingen tussen verschillende situaties en bevat veel bruikbare informatie.
Belang
Information Gain meet hoeveel informatie een kenmerk toevoegt boven een volledig uniforme verdeling. Een hoge waarde wijst op een sterk onderscheidend kenmerk. Een lage waarde kan erop wijzen dat het kenmerk weinig nieuwe informatie toevoegt en beperkt bruikbaar is voor verdere analyse.
Faalmodi
Ongeldige entropiewaarde.
Ontbrekende bucketverdeling.
Onvoldoende waarnemingen voor een betrouwbare berekening.
Ongeldige normalisatie van de entropie.
Stability – gedraagt een kenmerk zich vergelijkbaar tussen opeenvolgende observatieperiodes
Doel
Meet of een kenmerk zich vergelijkbaar gedraagt tussen opeenvolgende observatieperiodes.
Definitie
Stability beschrijft de mate waarin de bucketverdeling van een kenmerk doorheen de tijd gelijk blijft. De indicator meet of de betekenisstructuur van het kenmerk stabiel blijft tussen opeenvolgende observatieperiodes.
Formule
stability =
similariteit(
bucketverdeling(t),
bucketverdeling(t−1)
)
De exacte similariteitsmaat wordt architecturaal vastgelegd.
Bereik
[0, 1]
Interpretatie
Laag
De bucketverdeling verandert sterk tussen observatieperiodes. Het kenmerk vertoont een instabiele betekenisstructuur.
Middel
De bucketverdeling blijft gedeeltelijk behouden. Het kenmerk vertoont een redelijke mate van temporele stabiliteit.
Hoog
De bucketverdeling blijft grotendeels gelijk tussen observatieperiodes. Het kenmerk bezit een consistente betekenisstructuur doorheen de tijd.
Belang
Stability meet de reproduceerbaarheid van een kenmerk doorheen de tijd. Een hoge Stability vergroot de betrouwbaarheid van analyses en maakt resultaten beter vergelijkbaar tussen observatieperiodes. Een lage Stability kan wijzen op veranderingen in marktdynamiek of op een kenmerk waarvan de betekenis onvoldoende stabiel is.
Faalmodi
Geen vorige observatieperiode beschikbaar.
Ontbrekende bucketverdeling.
Onvoldoende waarnemingen voor een betrouwbare vergelijking.
Ongeldige of niet-vergelijkbare bucketverdelingen.
Consistency – gedraagt een kenmerk zich vergelijkbaar binnen verschillende observatieruimten
Doel
Meet of een kenmerk zich vergelijkbaar gedraagt binnen verschillende observatieruimten.
Definitie
Consistency beschrijft de mate waarin de bucketverdeling van een kenmerk vergelijkbaar blijft over verschillende instrumenten, contexten en resoluties binnen dezelfde observatieperiode.
Formule
consistency =
similariteit(
bucketverdelingen
)
De exacte aggregatiemethode wordt architecturaal vastgelegd.
Bereik
[0, 1]
Interpretatie
Laag
De bucketverdelingen verschillen sterk tussen observatieruimten. Het kenmerk is sterk afhankelijk van specifieke instrumenten, contexten of resoluties.
Middel
De bucketverdelingen vertonen gedeeltelijke overeenkomsten tussen observatieruimten. Het kenmerk bezit een redelijke mate van consistentie.
Hoog
De bucketverdelingen zijn grotendeels vergelijkbaar tussen observatieruimten. Het kenmerk gedraagt zich breed toepasbaar en voorspelbaar.
Belang
Consistency meet in welke mate een kenmerk zijn betekenis behoudt binnen verschillende observatieruimten. Een hoge Consistency vergroot de kans dat een kenmerk bruikbaar blijft over meerdere instrumenten, contexten en resoluties. Een lage Consistency kan erop wijzen dat het kenmerk sterk afhankelijk is van specifieke omstandigheden.
Faalmodi
Onvoldoende observatieruimten beschikbaar.
Ontbrekende bucketverdelingen.
Onvoldoende waarnemingen binnen één of meerdere observatieruimten.
Ongeldige of niet-vergelijkbare bucketverdelingen.
Drift – hoeveel de betekenisstructuur verandert tussen opeenvolgende observatieperiodes
Doel
Meet hoeveel de betekenisstructuur verandert tussen opeenvolgende observatieperiodes.
Definitie
Drift beschrijft de afstand tussen de bucketverdelingen van opeenvolgende observatieperiodes. De indicator meet in welke mate de betekenisstructuur van een kenmerk verschuift doorheen de tijd.
Formule
drift =
afstand(
bucketverdeling(t),
bucketverdeling(t−1)
)
De exacte afstandsmaat wordt architecturaal vastgelegd.
Bereik
[0, +∞)
of
[0, 1]
afhankelijk van de gekozen afstandsmaat.
Interpretatie
Laag
De bucketverdeling blijft grotendeels gelijk tussen observatieperiodes. Het kenmerk vertoont weinig verandering in betekenisstructuur.
Middel
De bucketverdeling verschuift merkbaar tussen observatieperiodes. Het kenmerk ondergaat een beperkte verandering in betekenisstructuur.
Hoog
De bucketverdeling verandert sterk tussen observatieperiodes. Het kenmerk vertoont een aanzienlijke verschuiving in betekenisstructuur.
Belang
Drift meet de mate waarin de betekenisstructuur van een kenmerk verandert doorheen de tijd. Een lage Drift wijst op een stabiele betekenisstructuur, terwijl een hoge Drift kan wijzen op veranderende marktdynamiek, regimeveranderingen of een verschuivende relatie tussen het kenmerk en de waargenomen werkelijkheid.
Faalmodi
Geen vorige observatieperiode beschikbaar.
Ontbrekende bucketverdeling.
Onvoldoende waarnemingen voor een betrouwbare vergelijking.
Ongeldige of niet-vergelijkbare bucketverdelingen.
Ongeldige afstandsmaat of afstandsberekening.
Redundancy – overlap met andere kenmerken
Doel
Meet de mate van overlap met andere kenmerken.
Definitie
Redundancy beschrijft in welke mate een kenmerk dezelfde informatie bevat als andere kenmerken binnen dezelfde observatieruimte. De indicator wordt bepaald door de hoogste absolute correlatie tussen dit kenmerk en alle andere kenmerken.
Formule
redundancy =
max(
absolute_correlatie
)
Bereik
[0, 1]
Interpretatie
Laag
Het kenmerk vertoont weinig overlap met andere kenmerken en draagt grotendeels unieke informatie bij.
Middel
Het kenmerk deelt een deel van zijn informatie met andere kenmerken, maar behoudt voldoende eigen onderscheidend vermogen.
Hoog
Het kenmerk vertoont sterke overlap met één of meerdere andere kenmerken. De toegevoegde informatie is beperkt.
Belang
Redundancy meet hoeveel unieke informatie een kenmerk toevoegt ten opzichte van andere kenmerken. Een hoge Redundancy kan wijzen op duplicatie van informatie, terwijl een lage Redundancy suggereert dat het kenmerk een eigen bijdrage levert aan de beschrijving van de observatieruimte.
Faalmodi
Onvoldoende vergelijkingsdata beschikbaar.
Onvoldoende waarnemingen voor een betrouwbare correlatieberekening.
Geen vergelijkbare kenmerken beschikbaar binnen de observatieruimte.
Ongeldige of niet-berekenbare correlatiewaarden.
Sterke dominantie van ontbrekende of constante waarden.
Reactieprofielen – structurele gedragsprojecties
zijn structurele marktresponses stabiel en bruikbaar?
Intenties – epistemische contractdefinities
zijn interpretatiekaders coherent, stabiel en consistent?
Agents – contractuele interpretatie
interpreteren agents proportioneel, consistent en conflictvrij?
Ensemble – spanningsorganisatie
bewaart het ensemble epistemische spanningen correct en stabiel?
Regie – normatieve begrenzing
begrenst regie gedrag consistent, proportioneel en reproduceerbaar?
Kapitaal – exposurebeheer
blijft exposure veilig, begrensd en reproduceerbaar?
Executie – marktuitvoering
blijft uitvoering correct, reproduceerbaar en contractconform?