NIR-spectroscopie: neem de validatieprocedure eens onder de loep

Nabij-infrarood (NIR) spectroscopie maakt snelle samenstellings- en kwaliteitsbepalingen van voedingsproducten mogelijk. De praktische implementatie ervan vereist evenwel dat men een kalibratievergelijking opstelt en de juistheid ervan valideert. De selectie van de juiste validatiestrategie is hierbij cruciaal.

NIR spectroscope toepassen: een kwestie van een kalibratiemodel bouwen?  

Als snelle en goedkope methode voor kwaliteits- en samenstellingsbepaling van producten wordt NIR spectroscopie veelvuldig gebruikt voor kwaliteitscontrole en- bewaking in de voedingsindustrie.  Bij NIR spectroscopie wordt er gemeten hoeveel nabij-infrarood straling (van een bepaalde intensiteit) geabsorbeerd wordt door een staal en dit per golflengte (resolutie rond 1 nm).  De mate waarin straling van een bepaalde golflengte geabsorbeerd wordt is afhankelijk van de aard van de componenten (bv. vet, eiwit, suikers,…) en hun hoeveelheid aanwezig in het staal (zie ook artikel 02/04/2009).  Indien de golflengte waarbij een bepaalde component absorbeert gekend is, kan aan de hand van de hoeveelheid geabsorbeerde straling de concentratie berekend worden. 

Voor complex samengestelde producten (zoals voedingsproducten) is dit echter niet zo eenvoudig, alleen al omdat absorptiegolflengtes van verschillende componenten overlappen.   Mits gebruik van regressie analyse (een statistische techniek) kan men toch een relatie leggen tussen de opgenomen spectra en de concentratie van een component.  In de praktijk komt dit neer op het bouwen van een kalibratiemodel met een set van steekproefstalen, en dit voor elke component (bv. vet, eiwit, suikers,…) die men wenst te bepalen.  Dit kan bijvoorbeeld via het toepassen van ‘partial least square regression’ (PLSR), waarvoor commerciële software pakketten voorhanden zijn. 

NIR spectroscope toepassen: een kwestie van het kalibratiemodel valideren!  

Na het bouwen van een kalibratiemodel dient de juistheid ervan te worden gevalideerd door toevoeging van metingen op nieuwe, onafhankelijke stalen.  Immers, multivariate kalibratietechnieken zoals PLSR zijn zo efficiënt in het correleren van variaties (zowel afhankelijke als latente niet-afhankelijke) dat over-optimistische resultaten bekomen kunnen worden bij het bouwen van een kalibratiemodel.  

Voor validatie staan er verschillende strategieën ter beschikking:

  • Random subset validation (RS)  - Hierbij wordt typisch 2/3 van de waarnemingen random uitgekozen voor de kalibratieset en de overige 1/3 als onafhankelijke validatieset. 
  • 10-voudige cross-validatie (10-fold CV) – Hierbij worden de stalen random verdeeld in 10 subsets, waarvan negen fungeren als kalibratieset en één als validatieset.  Via een doorschuifsysteem wordt dit proces herhaald waardoor elk van de tien subsets eens fungeert als validatieset. 
  • Groepsgewijze cross-validatie – Hierbij worden de stalen volgens vooraf gedefinieerde criteria in subsets (groepen) verdeeld.  Hierdoor wordt voorkomen dat deze criteria mee worden opgenomen in het model  Een criterium kan bijvoorbeeld ‘meetdag’ zijn.  Eén subset (met dus metingen van één bepaalde dag) fungeert dan als validatieset en de subsets van de andere dagen fungeren als kalibratieset.  Via een doorschuifsysteem wordt dit proces herhaald, waardoor elk van de subsets eens fungeert als validatieset. 

Het belang van het kiezen van een validatiestrategie  

In een studie van Kemps et al. (2010) werden verschillende validatie strategieën getest voor NIR-spectroscopische bepaling van ei-eiwit versheid.  In het bijzonder werd getracht om 1/[H+] (of 10pH) van ei-eiwit te bepalen aan de hand van NIR spectra die opgenomen werden op verschillende dagen tijdens de bewaring van eieren gedurende 22 dagen. 

PLSR modellen werden gebouwd en gevalideerd door middel van RS, 10-fold CV en cross-validatie over meetdagen (MD).  Dit laatste is een groepsgewijze – cross validatie waarbij ‘meetdag’ gebruikt werd als criterium om de verdeling in subsets te maken.  De accuraatheid van de bekomen modellen werd afgeleid van specifieke parameters (zie Tabel 1).  De ‘ratio of performance to deviation’ (RPD) waarde bekomen met 10-fold CV en RS gaf (met waarden >2) aan dat ei-eiwit versheid kon afgeleid worden van NIR spectra.


Tabel 1: PLSR resultaten voor het voorspellen van ei-eiwit versheid (1/[H+], of ook 10pH) gebaseerd op ei-eiwit NIR spectra.  Vergelijking van drie validatiestrategieën: 10-voudige cross-validatie (10-fold CV), random subsets (RS) en cross-validatie over meetdagen (MD).  [Bron: Kemps et al., 2010]. 

De RPD waarde bekomen met de MD validatie (zijnde <1) gaf echter aan dat ei-eiwit versheid niet voorspeld kan worden vanuit spectrale metingen.  De tegenspraak tussen MD enerzijds en 10-fold CV en RS kan verklaard worden doordat deze laatste twee validatiestrategieën aspecifieke variaties ten gevolge van inter-dag verschillen (artefacten) opnemen in hun correlaties.  Doordat bij MD de subsets ingedeeld werden volgens de meetdagen, werd vermeden dat het effect van meetdag mee opgenomen werd in het model.  Verdere analyse toonde aan dat meetdag inderdaad gecorreleerd was aan 1/[H+] (Figuur 1). 


Figuur 1: ei-eiwit versheid (1/[H+], of ook 10pH) is gecorreleerd aan de ouderdom van de eieren (en dus aan meetdagen).  [Bron: Kemps et al., 2010]. 

Met groepsgewijze cross-validatie kan men nog een stapje verder gaan dan wat aangetoond wordt in het artikel van Kemps et al. (2010).  Stel bijvoorbeeld dat je verwacht dat er ook een effect is van herkomst (bv. kippenbedrijf, gebruikte voeding, ...) op de pH van de eieren en ook op de opgemeten spectra. Je wil natuurlijk een kalibratiemodel bouwen dat robuust is en dat werkt voor meer dan één specifiek bedrijf, je wil dus geen herkomst-effecten opnemen in je model. Dit kan je doen door tijdens de cross-validatie onder te verdelen in groepen gebaseerd op herkomst. 

Deze studie toont aan dat selectie van de juiste validatie strategie en kritische interpretatie van de resultaten voor een bepaalde toepassing cruciaal is om tot betrouwbare en dus in praktijk bruikbare kalibratiemodellen te komen. 

Nuttige links

Bronnen

  • Kemps BJ, Saeys W, Mertens K, Darius P, De Baerdemaeker JG, De Ketelaere B. The importance of choosing the right validation strategy in inverse modelling.  J. Near Infrared Spectrosc.  18, 231-237 (2010).