validatie van een hplc methode voor di...

74
UNIVERSITEIT GENT FACULTEIT FARMACEUTISCHE WETENSCHAPPEN Vakgroep Farmaceutische Analyse Laboratorium voor Analytische Chemie Academiejaar 2010-2011 Manon BUYL Eerste Master in de Farmaceutische Zorg Promotor Prof. Dr. L. Thienpont Commissarissen Dr. K. Van Uytfanghe Prof. Dr. W. Lambert VALIDATIE VAN EEN HPLC METHODE VOOR DIPROPYLFTALAAT EN LITERATUURONDERZOEK OVER STATISTISCHE ASPECTEN BIJ DE INTERPRETATIE VAN DE DETECTIELIMIET

Upload: ngohuong

Post on 16-Feb-2018

216 views

Category:

Documents


1 download

TRANSCRIPT

UNIVERSITEIT GENT

FACULTEIT FARMACEUTISCHE WETENSCHAPPEN

Vakgroep Farmaceutische Analyse

Laboratorium voor Analytische Chemie

Academiejaar 2010-2011

Manon BUYL

Eerste Master in de Farmaceutische Zorg

Promotor

Prof. Dr. L. Thienpont

Commissarissen

Dr. K. Van Uytfanghe

Prof. Dr. W. Lambert

VALIDATIE VAN EEN HPLC METHODE VOOR

DIPROPYLFTALAAT EN LITERATUURONDERZOEK

OVER STATISTISCHE ASPECTEN BIJ DE

INTERPRETATIE VAN DE DETECTIELIMIET

UNIVERSITEIT GENT

FACULTEIT FARMACEUTISCHE WETENSCHAPPEN

Vakgroep Farmaceutische Analyse

Laboratorium voor Analytische Chemie

Academiejaar 2010-2011

Manon BUYL

Eerste Master in de Farmaceutische Zorg

Promotor

Prof. Dr. L. Thienpont

Commissarissen

Dr. K. Van Uytfanghe

Prof. Dr. W. Lambert

VALIDATIE VAN EEN HPLC METHODE VOOR

DIPROPYLFTALAAT EN LITERATUURONDERZOEK

OVER STATISTISCHE ASPECTEN BIJ DE

INTERPRETATIE VAN DE DETECTIELIMIET

AUTEURSRECHT

“De auteur en de promotor geven de toelating deze masterproef voor consultatie beschikbaar

te stellen en delen ervan te kopiëren voor persoonlijk gebruik. Elk ander gebruik valt onder de

beperkingen van het auteursrecht, in het bijzonder met betrekking tot de verplichting

uitdrukkelijk de bron te vermelden bij het aanhalen van de resultaten uit deze masterproef.”

6 juni 2011

Promotor

Prof. Dr. L. Thienpont

Auteur

Manon Buyl

DANKWOORD

Woorden schrijven is niet zo moeilijk, de kunst is echter er een thesis van te maken. Eén van

mijn allereerste gesprekken met Dr. Stöckl gingen over kunst, muziek en schoonheid. Bij deze

wil ik ook graag mijn thesis in schoonheid beginnen met dit dankwoord.

Wetenschap is eigenlijk net zoals muziek maken: iedereen draait mee in een orkest en heeft

zijn rol in het geheel, naar muzikaliteit en karakter. Als masterstudente ben ik opgenomen

geweest in een goed orkest met prima mensen en een leuke melodie. Dit orkest staat onder

leiding van Professor Thienpont, een dirigente met een visie en enorme vakkennis die met

haar orkest de top wil bereiken. Ik bedank haar voor de kansen die ik gekregen heb te leren

en ontdekken hoe het orkest functioneert. Evenals dank ik haar voor de finale orkestratie en

ondersteuning van dit werk.

Graag wil ik ook Dr. Stöckl bedanken die als ervaren percussionist ons leerde luisteren naar

de maat en het ritme en mij geleerd heeft kritisch na te denken. Hij was ook diegene die ons

leerde hoe we de muziek moeten beschouwen en die klaarstond met wijze raad en daad.

Mijn dank gaat ook uit naar Katleen, de eerste viool, die mij binnen het orkest wegwijs heeft

gemaakt en de diverse secties heeft laten ontdekken. Ze is als een concertmeester die de

melodie speelde. Ik wil ook mijn dank betuigen aan Tania en Hilde, de celli die een dragende

en ondersteunende functie vertolken binnen het orkest. Graag wil ik ook de dames aan het

koper bedanken, met name Hedwig en Sofie. Ook al speelden jullie een andere melodie,

desalniettemin speelt iedere toon een belangrijke rol in het orkest.

Mijn dank gaat ook uit naar Sara en Linde, bij de houtblazers, waarbij Sara een hele

muzikale invulling gegeven heeft als haar rol als fluitiste.

Ook wil ik Arno bedanken met wie ik samen in dit orkest gestapt ben en met wie ik vele leuke

en muzikale momenten beleefd heb.

Tot slot wil ik ook het publiek bedanken, mijn familie en vrienden die mij gesteund hebben en

soms valse noten of onbegrijpelijk zware symfonieën hebben moeten aanhoren. Graag wil ik

ook Bernard bedanken voor de steun en het vertrouwen in een goede afloop. Een speciaal

woord wil ik richten tot mijn mama die me gesteund heeft in mijn passie voor muziek en die

me heeft geleerd om door te zetten, ook al waren er soms harde noten te kraken.

INHOUDSOPGAVE

DANKWOORD

LIJST MET GEBRUIKTE AFKORTINGEN

DEFINITIES

METROLOGISCHE TERMEN IN HET NEDERLANDS

1. INLEIDING ............................................................................................................................................ 1

1.1. METHODEVALIDATIE ................................................................................................................. 1

1.2. FTALATEN..................................................................................................................................... 3

1.2.1. Chemische en fysische eigenschappen ...................................................................................... 3

1.2.2. Gebruik ................................................................................................................................... 3

1.2.3. Gezondheid .............................................................................................................................. 4

2. OBJECTIEVEN ..................................................................................................................................... 5

3. MATERIALEN EN METHODEN ......................................................................................................... 6

3.1. MATERIALEN ............................................................................................................................... 6

3.2. STANDAARDEN EN STALEN ....................................................................................................... 6

3.3. APPARATUUR ............................................................................................................................... 8

3.3.1. HPLC toestel ........................................................................................................................... 8

3.3.2. Randapparatuur ...................................................................................................................... 9

3.4. METHODEN ................................................................................................................................... 9

3.4.1. Systeemcontrole ....................................................................................................................... 9

3.4.2. Validatie ................................................................................................................................ 12

3.5. STATISTIEK ................................................................................................................................. 19

3.6. LITERATUURONDERZOEK ....................................................................................................... 19

4. RESULTATEN ..................................................................................................................................... 20

4.1. SYSTEEM ..................................................................................................................................... 20

4.1.1. Systeemfunctiecontrole ........................................................................................................... 20

4.1.2. Systeemgeschiktheidscontrole................................................................................................. 20

4.2. VALIDATIE .................................................................................................................................. 21

4.2.1. Lineariteit .............................................................................................................................. 21

4.2.2. Kalibratie .............................................................................................................................. 23

4.2.3. Imprecisie .............................................................................................................................. 24

4.2.4. Detectielimiet ........................................................................................................................ 26

4.2.6. Methodenvergelijking ............................................................................................................ 28

4.2.7. Samenvatting validatie experimenten...................................................................................... 32

4.3. LITERATUURONDERZOEK ....................................................................................................... 33

4.3.1. VERSCHILLENDE BEPALINGEN VAN DE DETECTIELIMIET ............................................ 33

4.3.2. BENADERING BESCHREVEN VOLGENS CURRIE .............................................................. 38

4.3.3. BENADERING VOLGENS LINNET ....................................................................................... 43

4.3.4. Vergelijken principe van Linnet en Currie .............................................................................. 46

5. CONCLUSIE ........................................................................................................................................ 47

6. BIBLIOGRAFIE .................................................................................................................................. 49

ADDENDUM

LIJST MET GEBRUIKTE AFKORTINGEN

°C Graden Celsius

Å Ångström

ANOVA “Analysis of Variance” (Variantie Analyse)

AOAC “Association of Analytical Communities”

B “Standard Deviation of the Dialy Means” (Standaarddeviatie van het Daggemiddelde)

CI “Confidence Interval” (Betrouwbaarheidsinterval)

CL “Confidence Limits” (Betrouwbaarheidslimieten)

CLSI “Clinical and Laboratory Standards Institute”

CV “Coefficient of Variation” (Variatiecoëfficiënt)

D2 Deuterium

DBP “Dibutyl Phthalate” (Dibutylftalaat)

DEP “Diethyl Phthalate” (Diethylftalaat)

DMP “Dimethyl Phthalate” (Dimethylftalaat)

DPP “Dipropyl Phthalate” (Dipropylftalaat)

EP “Evaluation Protocol” (Evaluatieprotocol)

FDA “Food and Drug Agency”

HN-IQC “High-Normal Internal Quality Control” (Hoog-Normale Interne Kwaliteitscontrole)

HPLC “High Pressure Liquid Chromatography”

ICH “International Conference on Harmonisation”

ISO “International Standard Organisation”

IUPAC “International Union of Pure and Applied Chemistry”

LC “Liquid Chromatography” (Vloeistofchromatografie)

L-IQC “Lower Internal Quality Control” (Laag Intern Kwaliteitscontrole)

LLoQ “Lower Limit of Quantification” (Lage Kwantificatielimiet)

LoD “Limit of Detection” (Detectielimiet)

LoQ “Limit of Quantification” (Kwantificatielimiet)

min minuten

mV Millivolt

ODS “Octadecyl Silane”

OLR “Ordinary Lineair Regression” (Gewone Lineaire Regressie)

PI “Prediction Interval” (Voorspellingsinterval)

PVC “Polyvinyl Chloride”

S/N “Signal/Noise” (Signaal/Ruis)

SD “Standard Deviation” (Standaarddeviatie)

sdd “Between-day Standard Deviation” (Binnen-dag Standaarddeviatie)

SE “Systemic Error” (Systemische Fout)

SFSTP “Societe Francaise des Sciences et Techniques Pharmaceutiques”

sT “Total Standard Deviation” (Totale Standaarddeviatie)

swr “Within-run Standard Deviation” (Binnen-analyse Standaarddeviatie)

TE “Total Error” (Totale Fout)

UL “Upper Limit” (Bovenste Limiet)

ULoQ “Upper Limit of Quantification” (Hoge Kwantificatielimiet)

US-FDA “United States Food and Drug Administration”

UV Ultraviolet

VIS “Visible” (zichtbaar)

WLR “Weighted Linear Regression” (Gewogen Lineaire Regressie)

DEFINITIES

Measurand [1]

Quantity intended to be measured.

Quantity [1]

Property of a phenomenon, body, or substance, to which a number can be assigned with

respect to a reference.

Measurement [1]

Process of experimentally obtaining one or more quantity values that can reasonably be

attributed to a quantity.

Measurement unit [1]

Scalar quantity, defined and adopted by convention, with which any other quantity of the

same kind can be compared to express the ratio of the two quantities as a number.

Value of a quantity [1]

Number and reference together expressing magnitude of a quantity.

Measurement standard [1]

Realization of the definition of a given quantity, with stated quantity value and measurement

uncertainty, used as a reference.

Error [1]

Difference of measured quantity value and reference quantity value.

Systematic error [1]

Component of measurement error that in replicate measurements remains constant or varies in

a predictable manner.

Bias [1]

Systematic measurement error or its estimate, with respect to a reference quantity value.

Random error [1]

Component of measurement error that in replicate measurements varies in an unpredictable

manner.

Trueness [1]

Closeness of agreement between the average of an infinite number of replicate measured

quantity values and a reference quantity value.

Accuracy [1]

Closeness of agreement between a measured quantity value and a true quantity value of the

measurand.

Precision [1]

Closeness of agreement between indications obtained by replicate measurements on the same

or similar objects under specified conditions.

Uncertainty [1]

Parameter characterizing the dispersion of the quantity values being attributed to a

measurand.

Selectivity [1]

Capability of a measuring system, using a specified measurement procedure, to provide

measurement results, for one or more measurands, that do not depend on each other nor on

any other quantity in the system undergoing measurement.

Specific (in analysis)

A term which expresses qualitatively the extent to which other substances interfere with the

determination of a substance according to a given procedure. Specific is considered to be the

ultimate of selective, meaning that no interferences are supposed to occur

(http://goldbook.iupac.org).

Calibration [1]

Operation that, under specified conditions, in a first step establishes a relation between the

quantity values with measurement uncertainties provided by measurement standards and

corresponding indications with associated measurement uncertainties and, in a second step,

uses this information to establish a relation for obtaining a measurement result from an

indication.

Sensitivity [1]

Quotient of the change in the indication and the corresponding change in the value of the

quantity being measured.

Linear range

Concentration range over which the intensity of the signal obtained is directly proportional to

the concentration of the species producing the signal (http://goldbook.iupac.org).

Linearity (generic)

Ability of an analytical procedure to produce test results which are proportional to the

concentration (amount) of an analyte, either directly or by means of a well-defined

mathematical transformation.

Working interval [1]

Set of values of the quantities of the same kind that can be measured by a given measuring

instrument or measuring system with specified instrumental uncertainty, under defined

conditions.

Limit of detection (in analysis)

The limit of detection, expressed as the concentration, cL, or the quantity, qL, is derived from

the smallest measure, xL, that can be detected with reasonable certainty for a given analytical

procedure. The value of xL is given by the equation xL = xbi + k • sbi, where xbi is the mean

of the blank measures, sbi is the standard deviation of the blank measures, and k is a

numerical factor chosen according to the confidence level desired (http://goldbook.iupac.org).

Limit of detection [1]

Measured quantity value, obtained by a given measurement procedure, for which the

probability of falsely claiming the absence of a component in a material is β, given a

probability α of falsely claiming its presence.

Ruggedness (USP)

Degree of reproducibility of the results obtained under a variety of conditions, expressed as

%RSD. These conditions include different laboratories, analysts, instruments, reagents, days,

etc.

Robustness (ICH Q2A 1995)

The robustness of an analytical procedure is a measure of its capacity to remain unaffected by

small, but deliberate variations in method parameters and provides an indication of its

reliability during normal usage.

Referentie:

[1] BIPM, IEC, IFCC, ISO, IUPAC, IUPAP, OIML,.2007.

Metrologische termen in het Nederlands

Accuracy Nauwkeurigheid

Trueness Juistheid

Precision Precisie

Repeatability Herhaalbaarheid

Reproducibility Reproduceerbaarheid

Limit of detection Aantoonbaarheidsgrens

Limit of quantification Bepaalbaarheidsgrens

Referentie:

Maas C, Bravenboer J, van der Putten A, Salm M. Validatie van methoden. De Ware

Chemicus 1993;23:90-106.

Belgisch Instituut voor Normalisatie (BIN). Algemene criteria voor de werking van

beproevingslaboratoria (NBN – EN 45001). Brussel: BIN, 1990:7.

Nederlands Meetinstituut. Metrologische termen. www.nmi.nl

Thomas Linsinger. Vergelijking van een meetresultaat met de gecertificeerde waarde.

Application Note 1. Europese Gemeenschappen, 2005.

1

1. INLEIDING

1.1. METHODEVALIDATIE

Deze thesis handelt over de validatie van een HPLC-UV methode voor de bepaling van

dipropylftalaat (Dipropyl Phthalate, DPP). Validatie wordt volgens de ISO 9000-richtlijnen

gedefinieerd als: “confirmation, through the provision of objective evidence, that the

requirements, for a specific intended use or application have been fulfilled” (International

Standard ISO 9000, 2005). Algemeen wordt er dus nagegaan of een bepaalde analysemethode

geschikt is voor een bepaalde toepassing.

Noteer dat er een onderscheid dient gemaakt te worden tussen evaluatie- en validatie van

een methode. Hierbij is evaluatie een schatting van de prestatie van de toepassing en validatie

een toets van de schatting ten opzichte van aanvaardbaarheidscriteria voor de gespecificeerde

toepassing. Het is belangrijk om dit onderscheid te maken, om uit te maken welk type van

aanvaardbaarheidscriteria er dienen gebruikt te worden. Bij evaluatie van een methode kan dat

met behulp van zowel statistische- als analytische specificaties. Voor validatie van een

methode worden toepassingsgedreven specificaties gebruikt (Stöckl, 2007).

Om een succesvolle validatie uit te voeren, moet er eerst een validatieplan worden

uitgestippeld. Hierin wordt de toepassing, het toepassingsgebied en het doel van de methode

gedefinieerd. De te valideren prestatiekarakteristieken met bijhorende

aanvaardbaarheidscriteria of specificaties worden er ook in vastgelegd. Voor ieder experiment

dient er een validatieprotocol te worden gezocht of opgesteld. Er moet gebruik gemaakt

worden van gekwalificeerde materialen (zie 3.1.). Vervolgens kan gestart worden met het

uitvoeren van de validatie-experimenten. De resultaten van deze experimenten moeten

zorgvuldig worden gedocumenteerd. Deze worden ten slotte op een statistische manier

verwerkt en geïnterpreteerd (Stöckl, 2007).

De geschiktheid van een analysemethode wordt nagegaan aan de hand van verschillende

experimenten, deze zijn afhankelijk van de prestatiekarakteristieken die men wenst te

valideren. De experimenten die uitgevoerd worden gedurende de methodevalidatie zijn

gebaseerd op experimentele protocollen zoals deze van de Clinical and Laboratory Standards

Institute (CLSI) (Stöckl, 2007). De prestatiekarakteristieken die onderzocht zullen worden zijn

weergegeven in Tabel 1.1.

2

Tabel 1.1 Overzicht prestatiekarakteristieken die worden onderzocht tijdens de

methodevalidatie.

Wanneer de resultaten verzameld zijn, moet er beslist worden of deze voldoen aan de

vooropgestelde specificaties of niet. Dit kan op twee manieren: (i) bij de „oude‟ interpretatie

werd een beslissing genomen zonder een betrouwbaarheidsinterval (Confidence Interval, CI)

in acht te nemen. Hierbij werden de „naakte‟ waarden vergeleken met de specificaties en ging

er informatie verloren over het aantal metingen dat werd uitgevoerd en over de imprecisie van

de methode, (ii) de „moderne‟ interpretatie daarentegen vereist wel het gebruik van CI en

statistische significantietesten. In deze thesis zullen de gegevens volgens deze laatstgenoemde

manier geïnterpreteerd worden (Stöckl, 2007).

Wanneer er een -op statistiek gebaseerde- beoordeling wordt gemaakt hangt deze af van

het type aanvaardbaarheidscriteria dat gebruikt wordt, zoals reeds hierboven vermeld. Voor

statistische specificaties wordt de statistische test vergeleken met de nulhypothese. Bij

analytische specificaties wordt de statistische test vergeleken met de geschatte waarde bij een

stabiel proces. Voor de toepassingsgedreven specificatie wordt de statistische test vergeleken

met de validatielimiet. De statistische test kan bv. een F-test of een t-test zijn. Alternatief kan

er ook een 95% CI opgesteld worden (Stöckl, 2007).

Prestatiekarakteristieken

Lineariteit

Kalibratie

Imprecisie

Detectielimiet

Juistheid

Methodevergelijking

3

1.2. FTALATEN

1.2.1. Chemische en fysische eigenschappen

Ftalaten zijn esters van ortho-ftalaatzuur (C6H4(CO2H)2). Dit is een aromaat met twee

carbonzure groepen in ortho-configuratie. De algemene structuur van een ftalaat is

weergegeven in Figuur 1.1.

Figuur 1.1 Algemene structuur ftalaat (APEC)

De ftalaten onderscheiden zich in hun zijketen (R en R‟). De meest voorkomende

ftalaten zijn diethylftalaat (Diethyl Phthalate, DEP) (C6H4(COOC2H5)2) waarbij R en R‟ een

ethylfunctie zijn, dibutylftalaat (Dibutyl Phthalate, DBP) (C6H4[COO(CH2)3CH3]2) met een

butylgroep als R en R‟. Dit onderzoek spitst zich toe op DPP (C6H4[COO(CH2)2CH3]2)

waarbij beide R-groepen een propylfunctie zijn (ECPI, 2010).

DPP is stabiel bij normale temperatuur en druk. Het bevindt zich bij kamertemperatuur

in vloeibare toestand en is kleurloos. Het kookpunt bedraagt 317.5°C, de densiteit is

1.078 g/mL bij 25 °C. Het moleculair gewicht is 250.29 g/mol (Chemcas, 2011).

1.2.2. Gebruik

Ftalaten worden hoofdzakelijk gebruikt als weekmaker in polyvinyl chloride (PVC)

om deze zacht en flexibel te maken. PVC wordt aangewend voor verschillende doeleinden,

van vloerbekleding over speelgoed tot kabelomhulsel, zelfs als bestanddeel van medisch

materiaal en voedingsverpakking. Net door het gebruik van een weekmaker is er een

uitgebreid gebruik van PVC mogelijk in verschillende disciplines (ECPI, 2010).

4

Ftalaten worden niet enkel aangewend in PVC. Bepaalde ftalaten worden ook gebruikt

in cosmetica, als oplosmiddel en geurverspreider. Ze kennen ook een toepassing in lijmen,

verven en inkten (ECPI, 2010).

1.2.3. Gezondheid

Ondanks het feit dat ftalaten al meer dan 50 jaar gebruikt worden, bestaat er veel

controverse over het al dan niet schadelijk zijn van deze stoffen. De ftalaten gebruikt als

weekmaker zijn niet chemisch gebonden aan PVC. Ze kunnen lekken en migreren in voeding

en andere materialen. Producten die ftalaten bevatten en door consumenten gebruikt worden

kunnen dus resulteren in humane blootstelling door direct contact bij gebruik. Indirecte

blootstelling gebeurt door het lekken in andere producten of algemeen vervuiling van het

milieu. Mensen worden blootgesteld aan ftalaten door inslikken, inademen en dermaal contact

(Heudorf, et al., 2007). De primaire blootstelling aan ftalaten gebeurt bij het innemen van

voeding, voornamelijk voeding met hoog vetgehalte. Ftalaten met een laag moleculair

gewicht (DEP, DBP) worden voornamelijk dermaal geabsorbeerd. Hoe vluchtiger het ftalaat,

hoe makkelijker geabsorbeerd via inhalatie (ATSDR, 1995).

Een andere mogelijke bron voor blootstelling aan ftalaten is medicatie. De nood voor

plaats-specifieke dosering van medicatie heeft geleid tot het gebruik van enterische coatings.

Coating bestaat algemeen uit verschillende polymeren die weekmakers bevatten, inclusief

ftalaten zoals DEP en DBP (Hauser, et al., 2004). Ook medische apparatuur bevat ftalaten en

vormt daardoor een bron voor significante blootstelling van vatbare patiëntengroepen zoals

deze op intensieve zorgen (Schettler, 2006).

Blootstelling aan ftalaten resulteert in het algemeen in lage toxiciteit. Bij volwassen dieren

zijn de effecten van ftalaten op de reproductiviteit goed gekarakteriseerd. Zo treed er schade

op aan de gonaden na blootstelling aan hoge dosissen. Resultaten van recente studies geven

aan dat het voortplantingstelsel van ontwikkelende dieren zeer gevoelig is aan bepaalde

ftalaten. De fenotypische veranderingen die geobserveerd worden in mannelijke

nakomelingen van ratten, die gedurende de perinatale periode zijn blootgesteld, vertonen

opvallende kenmerken met menselijke voortplantingsstoornissen zoals cryptorchisme,

hypospadie en een laag aantal zaadcellen (Martino-Andrade, et al., 2010).

5

2. OBJECTIEVEN

De objectieven voor deze thesis bestaan uit twee delen. Het eerste deel handelt over een

validatie van een HPLC-UV methode voor de bepaling van DPP. In het tweede deel wordt

een literatuuronderzoek uitgevoerd over de statistische aspecten bij het interpreteren van de

detectielimiet.

Dagelijks, voordat de experimenten van start gaan, wordt het HPLC-UV toestel

gecontroleerd door het uitvoeren van een systeemgeschikheids- en systeemfunctiecontroletest.

Voor de validatie van DPP worden verschillende prestatiekenmerken onderzocht. De

experimenten die hieromtrent worden uitgevoerd zijn lineariteit, kalibratie, imprecisie,

juistheid en de detectielimiet. Voordat de validatie-experimenten van start gaan, worden

voorbereidende experimenten uitgevoerd voor het bepalen van een gepast regressiemodel. Er

wordt ook een methodevergelijking uitgevoerd aan de hand van gesimuleerde data.

Het is de bedoeling dat de experimenten zelfstandig gepland en uitgevoerd worden. Er

dient dan ook enige tijd uitgetrokken te worden om technieken zoals pipetteren en

oplossingen maken onder de knie te krijgen en om met het HPLC toestel te leren werken en

eventuele veranderingen toe te passen zoals een kolom vervangen. Alsook dient specifieke

software aangeleerd te worden om zelfstandig te kunnen werken.

Het literatuuronderzoek handelt over de detectielimiet en de verschillende statistische

theorieën die hieromtrent zijn ontstaan. De belangrijkste theorieën worden verder uitgediept.

Voor het literatuuronderzoek dient informatie verzamelt te worden uit verschillende

bronnen. Hiervoor moet de informatie op een kritische manier geëvalueerd kunnen worden.

6

3. MATERIALEN EN METHODEN

3.1. MATERIALEN

Er wordt 1 liter oplosmiddel gemaakt bestaande uit 77% methanol (gradiënt kwaliteit,

Romil Ltd,Cambridge, VK) en 23% water (super purity solvent, Romil Ltd). Dit wordt

bewaard bij 4°C. Het wordt gebruikt om glaswerk voor te spoelen en om stockoplossing,

standaarden en testmix aan te maken. De zuiverheid wordt onderzocht door een aantal keer

het oplosmiddel te injecteren en het bekomen chromatogram te controleren op interferenties

of onstabiele basislijn rond het retentievenster [3.0-5.0] minuten van DPP. De mobiele fase

wordt dagelijks opnieuw gemaakt en heeft dezelfde samenstelling als het oplosmiddel.

Er worden stockoplossingen gemaakt van dimethylftalaat (Dimethyl Phthalate, DMP)

(PESTANAL®, analytische standaard, Fluka - Sigma-Aldrich NV / MO, St. Louis, VS), DEP

(≥ 99.5% - Aldrich - Sigma-Aldrich NV), DPP (purum - ≥ 98.5% (HPLC) – Fluka - Sigma-

Aldrich NV) en uracil ( ≥ 99.0% - Sigma - Sigma-Aldrich NV). De stockoplossingen worden

bewaard bij 4°C. Er wordt van elk product 10 ml stockoplossing gemaakt op gravimetrische

wijze. Deze oplossingen worden gebruikt voor de aanmaak van stalen en standaarden.

De testmix wordt gebruikt voor de systeemgeschiktheidscontrole (zie 3.4.1.2.) en

bestaat uit gelijke concentraties van 3.12 µg/g van uracil, DMP, DEP en DPP. Uracil wordt

gebruikt om de dode tijd te bepalen. Er wordt 10 ml testmix gemaakt op gravimetrische wijze.

Dit wordt bewaard bij 4°C.

3.2. STANDAARDEN EN STALEN

De stalen voor de validatie van lineariteit en kalibratie worden gedefinieerd als

„standaarden‟. Er worden 5 standaarden gemaakt uitgaande van de stockoplossing van DPP

volgens het alternatieve mengprotocol beschreven in het CLSI-EP6 protocol. Tabel 3.1

beschrijft dit mengprotocol (CLSI, 2003).

7

Tabel 3. 1 Alternatief mengprotocol CLSI-EP6

Voor het bepalen van het concentratiebereik moeten er voorbereidende experimenten

uitgevoerd worden. De detectielimiet (Limit of Detection, LoD) van DPP wordt dan bepaald.

De LoD is de concentratie waarbij de signaal/ruis (Signal/Noise, S/N) gelijk is aan drie. Voor

het bepalen van de Lage Kwantificatielimiet (Lower Limit of Quantification, LLoQ) wordt de

concentratie voor LoD vermenigvuldigd met drie. Dit is eveneens de theoretische concentratie

van standaard 1. Voor Hoge Kwalificatielimiet (Upper Limit of Quantification, ULoQ) wordt

de concentratie van LLoQ vermenigvuldigd met vijftig. Dit geeft de theoretische concentratie

van standaard 5. De concentraties van LLoQ en ULoQ definiëren het werkbereik. De

bereiding van standaard 1 en 5 gebeurt gravimetrisch in maatkolven van 100 mL uitgaande

van de stockoplossing van DPP. De gravimetrisch bepaalde concentratie van standaard 1 en 5

bedragen respectievelijk 0.108 µg/g en 6.14 µg/g. De standaarden worden bewaard bij 4°C.

Zoals hierboven beschreven is de doelconcentratie voor het LoD-staal in de

voorbereidende experimenten bepaald. De stalen voor LoD worden dagelijks opnieuw

gemaakt. Standaard 1 wordt één op drie keer met oplosmiddel verdund. De concentratie wordt

gravimetrisch bepaald.

Voor de validatie van de imprecisie wordt het CLSI-EP5 protocol gevolgd. Dit schrijft

voor dat twee stalen gemaakt moeten worden. Het Lage Interne Kwaliteitscontrole staal (Low

Internal Quality Control (L-IQC) heeft een concentratie die in de buurt komt van de

concentratie van standaard 2. Het Hoog-Normale Interne Kwaliteitscontrole staal (High-

Normal Internal Quality Control, HN-IQC) benadert de concentratie van standaard 4. De

stalen worden bereid door de stockoplossing van DPP te verdunnen met oplosmiddel. Dit

gebeurt op gravimetrische wijze (CLSI, 2004).

Standaarden Benaming volgens concentratie Mengprotocol

Standaard 1 Laag Uit stockoplossing

Standaard 2 Medium laag Laag en medium (1:1)

Standaard 3 Medium Laag en hoog (1:1)

Standaard 4 Medium hoog Medium en hoog (1:1)

Standaard 5 Hoog Uit stockoplossing

8

Voor de validatie van de juistheid worden zes stalen gebruikt: drie stalen worden door

het labo afgeleverd, twee stalen zijn dezelfde als deze gebruikt voor de imprecisie-

experimenten en één staal wordt aangemaakt. De concentratie van alle stalen moet binnen het

werkbereik liggen. In Tabel 3.2 zijn alle stalen weergegeven met hun bijhorende

concentraties.

Tabel 3.2 Stalen en standaarden met bijhorende concentratie

Prestatiekenmerken Concentratie (µg/g)

Stockoplossing 1291

Standaard 1 0.108

Standaard 2 1.62

Standaard 3 3.11

Standaard 4 4.62

Standaard 5 6.14

L-IQC 2.68

HN-IQC 3.90

Juistheid staal 3.12

Juistheid onbekende 1 1.23

Juistheid onbekende 2 0.509

Juistheid onbekende 3 2.09

3.3. APPARATUUR

3.3.1. HPLC toestel

Het systeem bestaat uit een ontgasser DGU-20A5 (Shimadzu Corporation, Kyoto,

Japan), een UV-VIS detector SPD-20A „Prominence series‟ (Shimadzu Corporation) en een

pomp LC-20AT „Prominence series‟ (Shimadzu Corporation). Data wordt geregistreerd en

verwerkt met het programma LC solution versie 1.21 SP1 (Shimadzu Corporation).

Als injector wordt een manuele Rheodyne® 7725i injector gebruikt (Rheodyne®, CA,

VS) met een injectieloop van 5µL.

9

Er wordt gebruik gemaakt van een ODS hypersil kolom (Thermo Fisher Scientific

Inc., MA, VS). Dit is een C18 kolom die “end-capped” is met een partikel grootte van 5 µm

en een poriëngrootte van 120 Å. De dimensies van de kolom zijn 150 x 4.6 mm.

3.3.2. Randapparatuur

De stalen worden geïnjecteerd met een naald van 100 µL, model 710 van de 700

Series MICROLITER ® Syringes met een nauwkeurigheid tot op 1µL (Hamilton, Bonaduz,

Zwitserland).

Bij de bereiding van het oplosmiddel en de mobiele fase wordt voor de filtratie

gebruik gemaakt van een solvent filtratie apparaat (Alltech®, Deerfield, IL, VS) van 1L

aangesloten op een vacuumpomp. Hierbij worden filters gebruikt van Millipore type HVLP

0.45µm (Millipore, Billerica, MA, VS). Om eluens en mobiele fase te ontgassen wordt een

ultrasoon bad (Branson 1210, Bransonic®, Danbury, CT, VS) gebruikt.

Om de concentraties gravimetrisch te bepalen wordt gebruik gemaakt van een

analytische balans (Mettler AT261 DeltaRange ®, Mettler-Toledo GmbH, Laboratory &

Weighing Technologies, Greifensse, Zwitserland).

Om volumina te pipetteren worden er macropipetten (0.2 -2 ml; 1-10ml Calibras®

digital 832, Socorex Isba S.A., Ecublens, Zwitserland) en micropipetten (10-100µl, 20-200µl,

100-1000 µl Calibra® digital 822, Socorex Isba S.A.) gebruikt. Hierbij worden bijpassende

pipetpunten (ROLL s.a.s., Piove di Sacco, Italië) gebruikt. Het bepalen van de dichtheid

gebeurt met een draagbare dichtheidsmeter (DMA 35N, Anton Paar GmbH, Graz,

Oostenrijk).

3.4. METHODEN

3.4.1. Systeemcontrole

3.4.1.1. Systeemfunctiecontrole

Dagelijks wordt bij het opstarten van het HPLC-toestel gecontroleerd of het naar

behoren functioneert. Hiervoor worden een aantal operationele parameters gecontroleerd van

10

de pomp en de detector (zie Tabel 3.2). Indien aan de specificaties voor deze parameters

voldaan is kan overgegaan worden tot de systeemgeschiktheidscontrole (zie 3.4.1.2.).

Tabel 3.2 Parameters systeemfunctiecontrole voor HPLC

Parameters pomp

Totaal geleverde volume pomp < 180 L

Accuraatheid van het debiet ± 5 %

Parameters detector

Levensduur D2 lamp Maximum 2000 uur

Staal energie bij 220 nm > 800 mV

Referentie energie bij 220 nm > 800 mV

Ruis Maximum 0.006 mV

Basislijn stabiliteit over 5 minuten Maximum 0.01 mV

3.4.1.2. Systeemgeschiktheidscontrole

Deze controle wordt dagelijks uitgevoerd na de systeemfunctiecontrole (zie 3.4.1.1.).

Dit gebeurt om de algemene geschiktheid van het analytisch systeem voor de beoogde

toepassing te controleren voor de metingen van start gaan. De controle wordt uitgevoerd door

de testmix te injecteren en specifieke parameters te controleren voor DPP. Deze worden

vergeleken met opgelegde limietwaarden (zie Tabel 3.3). De parameters die gecontroleerd

worden zijn hieronder weergegeven, de formules zijn afkomstig uit de United States

Pharmacopeia (USP).

Retentietijd:

Retentietijd of afstand van de basislijn van het punt van injectie tot het loodrechte

snijpunt met de basislijn van het maximum van de piek dat overeenstemt met de component.

Oppervlakte en hoogte:

De piekoppervlakte is de oppervlakte onder de piek. De piekhoogte is de afstand

tussen het maximale punt van de piek loodrecht op de basislijn. Beide parameters zijn een

maat voor de hoeveelheid analyt.

11

Theoretisch plaatgetal:

(3.1)

N: Theoretisch plaatgetal

tR: Retentietijd (min)

W: Piekbreedte (min)

Het theoretisch plaatgetal, is een maat voor de kolomkwaliteit. Het theoretische

plaatgetal varieert met de component als ook met de kolom.

Symmetriefactor:

(3.2)

Tf: Symmetriefactor

W0.05: Breedte van de piek op vijf procent van de maximumhoogte (min)

: Piekbreedte van de eerste helft van de piek op 5% van de piekhoogte

(min)

Een waarde van één wijst op volledige symmetrie. Een waarde groter dan één wijst op

tailing. Een waarde kleiner dan één wijst op leading.

Resolutie:

(3.3)

Rs: Resolutie

tR en tpp: Retentietijd waarbij de tpp groter moet zijn dan tR.(min)

W en Wp: Piekbreedte halverwege de piekhoogte.(min)

Tabel 3. 3 Aanvaardbaarheidslimieten voor de parameters die gecontroleerd worden bij de

systeemgeschiktheidscontrole voor dipropylftalaat.

Parameters Aanvaardbaarheidslimiet voor DPP

Retentietijd (min) 3.99 ± 0.2

Oppervlakte 6600 ± 50%

Hoogte (mV) 900 ± 50%

Theoretisch plaatgetal Minimum 2000

Symmetriefactor Maximum 2

Resolutie Minimum 2

12

3.4.1.3. Analyse

Gedurende de validatie experimenten voor DPP wordt er gebruik gemaakt van een

isocratisch HPLC systeem. Dit wil zeggen dat de samenstelling van de mobiele fase constant

blijft gedurende de run. De mobiele fase heeft een samenstelling van 77% methanol en 23%

water. De pomp heeft een debiet van 1 mL/min. De UV-detector wordt ingesteld bij een

golflengte van 256 nm. Er wordt telkens ongeveer 30 µL analyt in de injector gebracht

(overvultechniek), hiervan gaat slechts 5µL over de kolom, omdat er gebruik wordt gemaakt

van een 5µL loop. Het injectievolume is hierdoor goed te reproduceren. De totale runtijd

bedraagt 5 minuten. Dagelijks wordt er een kalibratiecurve opgesteld om uit de

piekoppervlakte de overeenkomstige concentratie van het staal te bepalen. De kalibratie wordt

verder besproken bij de validatie (zie 3.4.2.). In Figuur 3.1 wordt een chromatogram

weergegeven van standaard 4 voor DPP met een concentratie van 4.62µg/g.

Figuur 3. 1 Chromatogram van standaard 4 gemeten op 31 maart 2011 met een concentratie

voor dipropyl ftalaat van 4.62 µg/g

3.4.2. Validatie

3.4.2.1. Lineariteit

Bij het bepalen van de lineariteit wordt het CLSI-EP6 protocol gevolgd. Dit schrijft

voor stalen te gebruikten die met elkaar gerelateerd zijn, zoals eerder beschreven bij de

standaarden en stalen (zie 3.2.). De vijf stalen worden in quadruplicaat gemeten en het

experiment wordt drie maal herhaald. Grafisch worden de waarden weergegeven in een

residuendiagram. Hieruit kan men vermoeden of er eventuele uitschieters aanwezig zijn. Dit

13

vermoeden wordt vervolgens al dan niet bevestigd met behulp van de Grubbs‟ test, hierbij

wordt getest op het 95% significantieniveau. Dit significantieniveau geldt voor alle verder

uitgevoerde Grubbs‟ testen. Indien er een uitschieter aanwezig is wordt deze uitgesloten voor

de verdere statistische verwerking. Uit het residuendiagram kan eveneens informatie gehaald

worden over de lineariteit. Zijn de punten in het diagram willekeurig verdeeld, dan wijst dit

op het bestaan van een verband. Bij de statistische verwerking wordt de “lack of fit”-test en de

tweedegraadspolynomiale test uitgevoerd. Deze zijn respectievelijk gebaseerd op de

ANOVA-test en lineaire regessie.

De lack of fit-test wordt gebruikt in het oudere CLSI-EP6 protocol. Dit is een soort

ANOVA test. Er wordt gebruik gemaakt van een éénzijdige F-test waarbij wordt nagegaan of

de variatie binnen de groepen verschillend is van de afstand van het gemiddelde tot de lijn.

Indien de verkregen p-waarde groter is dan vijf procent, is het verschil niet significant en kan

de nulhypothese aanvaard worden, en bestaat er dus een lineair verband. Deze test is sterk

afhankelijk van de variatie binnen de groepen. De test is minder gevoelig als een

tweedegraadspolynomiale test.

Bij de tweedegraadspolynomiale test –gebruikt in het nieuwe CLSI-EP6 protocol-

wordt een tweedegraadsfunctie opgesteld. De coëfficiënt van de hoogste exponent wordt met

behulp van een tweezijdige student‟s t-test getoetst op het 95% significantieniveau voor

significant verschil met nul. Indien de verkregen p-waarde groter is dan vijf procent, wordt de

tweedegraadsfunctie verworpen en is er een lineair verband. Indien de p-waarde kleiner is dan

vijf procent wijst dit erop dat de hoogste exponent verschillend is van nul. Indien het verband

niet lineair is, wordt het verschil tussen de resultaten bekomen via de vergelijking van

eerstegraads- en tweedegraadsfunctie getest tegen de specificatie van vijf procent. Wanneer

dit verschil groter is dan de specificatie van vijf procent is de fout te groot om toch een

eerstegraadsvergelijking toe te passen; is daarentegen het verschil kleiner dan vijf procent,

wordt toch de eerstegraadsfunctie gebruikt omdat de gemaakte fout nog aanvaardbaar geacht

wordt. Ondanks het feit dat het verband effectief tweedegraads is wordt er toch via een

eerstegraadsfunctie gewerkt.

14

3.4.2.2. Kalibratie

Om te onderzoeken wat het meest geschikte kalibratiemodel is worden dezelfde stalen

gebruikt als voor de lineariteit-experimenten (zie 3.2.). De stalen voor kalibratie worden

gedurende de methodevalidatie twee maal per dag gemeten, in stijgende en dalende

concentratie respectievelijk voor en na de experimenten. Het bepalen van het beste type

kalibratiecurve gebeurt door het vergelijken van vier typen kalibratiecurves, door middel van

vier verschillende regressiemodellen. Deze modellen zijn: ordinaire lineaire regressie

(Ordinary Linear Regression, OLR), OLR geforceerd door nul, OLR met nul als punt

inbegrepen en gewogen lineaire regressie (Weighted Linear Regression, WLR).

Het best passende regressiemodel wordt gekozen met behulp van de stalen die

gebruikt worden voor imprecisie (L-IQC- en HN-IQC staal). Van deze stalen wordt de

concentratie met de vier verschillende regressiemodellen berekend gedurende vijf dagen. De

variatie op de berekende concentratie met behulp van de variatiecoëfficiënt (Coefficient of

Variation, CV) en procentuele afwijking van de doelconcentratie wordt eveneens bepaald. De

methode met de laagste CV en procentuele afwijking kan beschouwd worden als het best

passende regressiemodel. Er kan ook getest worden of het intercept voor OLR significant

verschillend is van nul door een tweezijdig 95% CI op te stellen voor het intercept.

3.4.2.3. Imprecisie

Voor de validatie van de imprecisie wordt het CLSI-EP5 protocol gevolgd. Dit geeft

richtlijnen voor het uitvoeren van experimenten om de imprecisie te karakteriseren voor

chemische toepassingen. Het protocol stelt voorop dat er gedurende twintig dagen metingen

dienen uitgevoerd te worden. Hierbij worden dagelijks twee verschillende stalen gemeten in

duplicaat (zie 3.2.) (Kennedy, 2004).

Grafisch wordt in een puntendiagram de gemiddelde dagconcentratie uitgezet voor elk

staal. Er wordt eveneens een puntendiagram opgesteld voor het verschil van de

dagconcentraties. Hier kan gekeken worden of er mogelijks een uitschieter aanwezig is. De

aanwezigheid van een uitschieter kan onderzocht worden met behulp van de Grubbs‟ test.

Indien er uitschieters aanwezig zijn worden deze uitgesloten voor de verdere berekeningen.

15

Het protocol stelt specifieke berekeningen voor om statistisch de imprecisie te

bepalen. De volgende kenmerken worden berekend: binnen-analyse standaarddeviatie

(Within-run Standard Deviation, swr), standaarddeviatie van het daggemiddelde (Standard

Deviation of the Dialy Means, B), binnen-dag standaarddeviatie (Between-day Standard

Deviation, sdd) en de totale standaarddeviatie (Total Standard Deviation, sT). Hierbij worden

de bijpassende binnen-analyse CV (Within-run CV, CVwr) en totale analyse CV (Total CV,

CVT) berekend. De specificaties voor de CVwr en CVT bedragen respectievelijk 2% en 5%. Er

is aan de specificaties voldaan wanneer de experimentele CV‟s kleiner zijn dan de

vooropgestelde specificaties. Indien dit niet het geval is wordt door middel van de Chi²-test

nagegaan of de berekende experimentele Chi² waarde kleiner is dan de kritische Chi² waarde.

Een andere manier om statistisch de imprecisie te bepalen is met behulp van de single

factor ANOVA. Via het uitvoeren van deze test worden de swr, sdd en sT berekend. Hieruit kan

vervolgens de CVwr en CVT berekend worden (Stöckl, 2007).

3.4.2.4. Detectielimiet

Voor het bepalen van de LoD worden het staal gedurende dertien dagen gemeten in

enkelvoud (generisch protocol). Hiervan wordt de S/N ratio bepaald (zie Figuur 3.1). De ruis

wordt bepaald over een range van vijf maal de piekbreedte op vijftig procent van de

piekhoogte. Dit komt ongeveer overeen met vijftig meetpunten. Het signaal komt overeen met

de hoogte van de piek gemeten van het maximale punt tot de gemiddelde basislijn.

Figuur 3. 1 Illustratie van de bepaling van S/N verhouding (Dolan J.W., 2010)

16

De S/N-waarden worden grafisch weergegeven in een puntendiagram. Er kan gekeken

worden of er mogelijks uitschieters aanwezig zijn. Het al dan niet aanwezig zijn van

uitschieters kan berekend worden met behulp van de Grubbs‟ test. Indien er uitschieters

aanwezig zijn worden deze uitgesloten voor de verdere berekeningen.

Bij het berekenen van de S/N, wordt het gemiddelde van alle S/N waarden berekend.

Voor deze waarde wordt het CI bepaald. Er worden geen specificaties opgelegd voor de LoD

waarde.

3.4.2.5. Juistheid

De stalen voor juistheid (zie 3.2.) worden gedurende vijf dagen in singlicaat gemeten.

Grafisch worden de resultaten uitgezet ten opzichte van hun gemiddelde in een

verschildiagram. Dit diagram laat toe visueel na te gaan of er mogelijke uitschieters zijn. Voor

het statistisch testen op de aanwezigheid van uitschieters kan de Grubbs‟ test gebruikt

worden. Indien er uitschieters aanwezig zijn worden deze uitgesloten voor de verdere

berekeningen.

Het CI van het gemiddelde wordt eenzijdig berekend met behulp van volgende

formule:

(3.4)

CI: betrouwbaarheidsinterval

tα;v: students t-waarde voor significantieniveau α en “v”-vrijheidsgraden

SD: Standaarddeviatie

n: aantal metingen

Deze gegevens worden uitgezet in een procentueel verhoudingsdiagram waarbij

nagegaan wordt of de vooropgestelde specificatie van vijf procent overschreden wordt.

3.4.2.6. Methodevergelijking

Bij deze experimenten worden twee verschillende methoden met elkaar vergeleken.

Er wordt een gesimuleerde dataset ter beschikking gesteld, met specificaties zoals beschreven

17

in Tabel 3.3. Deze zijn geïnspireerd op eigen data bekomen uit de methodevalidatie

experimenten. De dataset geeft data voor een referentie- en routinemethode weer. Zij dienen

geïnterpreteerd te worden volgens de Bland & Altman (B&A)-benadering en volgens een

lineair regressiemodel.

Tabel 3. 4 Specificaties van de dataset gebruikt voor de methodevergelijking.

Gegevens Specificaties

Standaarddeviatie 0.1 µg/g

Werkbereik 0.1 – 6.1 µg/g

Gemiddelde 3.4 µg/g

Aantal resultaten 80

Een eerste evaluatie kan gebeuren op basis van een spreidingsdiagram. Hierin

worden de resultaten van beide methoden weergegeven. Bij gelijkwaardigheid van de twee

methoden heeft de trendlijn een richtingscoëfficiënt (rico) van één en een intercept van nul.

Afhankelijk van het concentratiebereik en de spreiding van de data rond de trendlijn kan het

echter moeilijk worden de verschillen tussen de methoden waar te nemen. Daarom wordt een

B&A-diagram gebruikt. Hiervan wordt zowel een procentueel als een absoluut

verschildiagram gemaakt. In beide gevallen worden de verschillen tussen de resultaten

bekomen met de testmethode ten opzichte van deze van de referentiemethode uitgezet.

Een maat voor de spreiding (1.96 SD) van de verschillen (d) wordt weergegeven als

„d ± 1.96 SD‟. Er wordt een CI opgesteld voor het gemiddeld verschil (Formule (3.4)) en voor

de „1.96 SD‟ (Formule (3.5)). Zowel d als 1.96 SD worden vergeleken met de vooropgestelde

specificaties voor systematische- en totale fout (systematic error, SE - Total error, TE).

Hierbij dient „d ± CI‟ binnen de limieten voor SE te liggen. De waarde voor „1.96 SD ± CI‟

dient binnen de limieten voor TE te liggen om te stellen dat beide methoden evenwaardig zijn.

(3.5)

CI (1.96 SD percentiel): confidentie-interval van 1.96 SD

tα;v: students t-waarde met α het significantieniveau en “v” de vrijheidsgraden

SD: Standaarddeviatie van het verschil tussen de individuele resultaten van de

methoden (µg/g)

n: aantal metingen

18

Het nadeel van de B&A-benadering is dat ze niet in staat is concentratie gebonden

fouten te detecteren. Daarom wordt er eveneens een regressieonderzoek, gebruikmakend van

OLR, uitgevoerd. Hierbij wordt nagegaan of er een lineair verband is tussen de twee

methoden. Grafisch wordt een spreidingsdiagram opgesteld aan de hand van de resultaten van

beide methoden. In het spreidingsdiagram wordt door deze resultaten een trendlijn

geconstrueerd. Deze geeft informatie over de proportionele en constante systematische fout

aan de hand van respectievelijk de rico en het intercept. Voor de minimale en maximale x-

waarde wordt de voorspelde y‟-waarde berekend. Voor y‟ (uitgedrukt als procentueel

verschil) wordt het CI opgesteld en dit wordt vergeleken met de vooropgestelde specificaties

voor de systematische fout. Voor y‟ wordt eveneens het voorspellingsinterval (Predictie

Interval, PI) opgesteld en dit wordt vergeleken met de vooropgestelde specificaties voor de

totale fout. Het CI drukt de onzekerheid van de trendlijn op de metingen uit terwijl het PI met

een bepaalde zekerheid de volgende meetresultaten bevat.

3.4.2.7. Specificaties

In Tabel 3.2 worden de specificaties weergegeven gebruikt tijdens de

methodevalidatie. Hierbij zijn de specificaties voor imprecisie doelwaarden voor een stabiel

proces. De overige specificaties daarentegen zijn limietstellingen.

Tabel 3. 5 Overzicht van de gebruikte specificaties voor de verschillende prestatiekenmerken

van de methodevalidatie

Prestatiekenmerken Specificaties

Imprecisie – CVwr 2 %1

Imprecisie – CVT 5 %1

Lineariteit 5 %2

Juistheid 5 %2

Methodevergelijking – totale fout 15 %2

Methodevergelijking – systemische fout 5 %2

1: Doelwaarde,

2: Limietstelling

19

3.5. STATISTIEK

Voor de statistische verwerking van de gegevens wordt gebruik gemaakt van CBstat

(Kristian Linnet, Charlottenlund, Denemarken) en Microsoft Excel 2007 (Microsoft

Corporation, Redmond, WA, VS). Voor de verwerking van de statistische gegevens van de

validatie wordt het Excel templaat Methval (STT-consulting, Horebeke, België) gebruikt.

3.6. LITERATUURONDERZOEK

Voor het literatuuronderzoek wordt informatie gezocht in verband met de detectielimiet.

Hiervoor worden eerst algemene zoekmachines gebruikt zoals “google” om algemene

informatie te verzamelen over het onderwerp. Vervolgens worden wetenschappelijke

zoekmachines gebruikt zoals “google scholar”, “pubmed” en “web of science” om de

zoekopdrachten te verfijnen. Er kan ook kennis gebaseerd gezocht worden in werken zoals de

“Europese Farmacopee”.

20

4. RESULTATEN

4.1. SYSTEEM

4.1.1. Systeemfunctiecontrole

De systeemfunctiecontrole wordt dagelijks uitgevoerd. Hierbij wordt aan alle

parameters voldaan die voorgeschreven zijn. Vooraleer de metingen van start gaan wordt

gewacht tot het systeem gestabiliseerd is. De ruis is dan kleiner dan 0.003 mV en de drift over

een periode van vijf minuten niet groter dan 0.01 mV. De druk van het gestabiliseerde

systeem wordt steeds genoteerd bij de desbetreffende mobiele fase en kolom. Deze druk

bedraagt gemiddeld (±SD) 68 ± 1.5 bar.

4.1.2. Systeemgeschiktheidscontrole

De systeemgeschiktheidscontrole wordt dagelijks uitgevoerd door de testmix te

injecteren. De parameters voor DPP worden gecontroleerd zoals beschreven bij de methoden

(zie 3.4.1.2.). Alle parameters voldeden aan de vooropgestelde specificaties. Het systeem

wordt hierdoor geschikt bevonden voor het uitvoeren van de validatie-experimenten voor

DPP. In Tabel 4.1 worden de gemeten parameters en de bijhorende aanvaardbaarheidslimieten

voor de systeemgeschiktheidscontrole weergegeven. In Figuur 4.1 is een chromatogram

weergegeven van een testmix.

Tabel 4. 1 Gemiddelde en standaarddeviatie van de parameters die gecontroleerd worden bij de

systeemgeschiktheidstest voor dipropylftalaat met bijhorende aanvaardbaarheidslimieten.

Parameters Gemiddelde ± SD Limieten

Retentietijd (min) 3.993 0.067 [3.79;4.19]

Oppervlakte 6672 89 [3300;9900]

Hoogte (mV) 917 19 [450;1350]

Theoretisch plaatgetal 6171 97 Minimum 2000

Tailing factor 1.148 0.009 Maximum 2

Resolutie 6.978 0.190 Minimum 2

21

Figuur 4. 1 Chromatrogram van de testmix met concentratie 3.12μg/g gebruikt voor

systeemgeschiktheidscontrole op 4 april 2011.

4.2. VALIDATIE

4.2.1. Lineariteit

Voor de lineariteitsvalidatie worden vijf stalen in quadruplicaat gemeten. Het

experiment wordt drie maal herhaald. In Figuur 4.2 zijn de diagrammen weergegeven van het

lineariteitsexperiment van 16 maart 2011. In Figuur 4.2 A is het residuendiagram

weergegeven. Er is geen duidelijke trend waar te nemen, waaruit men dus kan vermoeden dat

de waarden lineair zijn. Er kan ook worden nagegaan of er uitschieters aanwezig zijn met

behulp van de Grubbs‟ test. Dit blijkt niet het geval te zijn. In Figuur 4.2 B is het

spreidingsdiagram weergegeven. De correlatiecoëfficiënt geeft een goede correlatie weer.

DM

P

DE

P

DP

P

Ura

cil

22

Figuur 4. 2 Diagrammen van het lineariteitsexperiment van 16 maart 2011. A:

Residuendiagram. B: Spreidingsdiagram.

Voor de statistische verwerking van de gegevens wordt gebruik gemaakt van de lack

of fit-test en de tweedegraadspolynomiale test. In Tabel 4.2 zijn de p-waarden weergegeven

voor beide testen. Voor de lack of fit-test zijn voor de drie experimenten de waarden kleiner

dan 0.05, wat wijst op een „niet lineair‟ verband. De waarden voor de

tweedegraadspolynomiale test zijn groter dan 0.05, wat wijst op een lineair verband. Dit

verschil is te verklaren doordat de lack of fit-test geen echte regressie-analyse uitvoert maar

eerder een ANOVA zoals reeds beschreven bij methoden (zie 3.4.). De lack of fit-test zal de

variatie binnen de groepen vergelijken met de afstand van het gemiddelde tot de regressielijn.

Zoals te zien is in Figuur 4.2 A zal het vierde punt gezien worden als een uitschieter waardoor

de lineariteit wordt verworpen. Dit is in tegenstelling tot de tweedegraadspolynomiale functie

die een echte regressie-analyse uitvoerd. De functie voor de regressielijn wordt opgesteld en

voor de hoogste exponent van de tweedegraadsvergelijking wordt getoetst of deze al dan niet

significant verschillend is van nul. Hieruit blijkt dat er geen significant verschil is met nul en

dus de waarden een lineair verband hebben.

Tabel 4. 2 p-waarden voor lack of fit- en tweedegraadspolynomiale test voor de drie meetdagen

van het lineariteit experiment.

p-waarde lack of fit-test p-waarde tweedegraadspolynomiale test

16 maart 2011 0.0241 0.3991

17 maart 2011 0.0195 0.4143

21 maart 2011 0.0398 0.2663

-400.0

-300.0

-200.0

-100.0

0.0

100.0

200.0

300.0

0 2 4 6 8

Res

iduen

Concentratie (µg/g)

y = 2048.3x - 13.95

R² = 0.9997

0.0

2000.0

4000.0

6000.0

8000.0

10000.0

12000.0

14000.0

0 2 4 6 8

Opper

vla

kte

Concentratie (µg/g)A B

23

4.2.2. Kalibratie

Voor de keuze van de meest geschikte kalibratiecurve worden vier verschillende

regressiemodellen getest: OLR, OLR geforceerd door nul, OLR met nul ingesloten en WLR.

Voor het L-IQC en HN-IQC staal worden via de vier regressiemodellen gedurende vijf

meetdagen de concentratie berekend. Voor elk van de vier regressiemodellen wordt

vervolgens de CV op de resultaten en de afwijking van de doelwaarde bepaald. De resultaten

zijn weergegeven in onderstaande Tabel 4.3. Uit de resultaten kan afgeleid worden dat voor

het HN-IQC staal er nauwelijks een verschil is tussen OLR, OLR geforceerd door nul en het

regressiemodel met nul ingesloten. Voor het L-IQC staal is de procentuele afwijking het

laagst bij OLR geforceerd door nul wat wijst op een goede terugvinding. Ondanks het feit dat

de CV bij OLR geforceerd door nul het grootst is wordt besloten toch met OLR geforceerd

door nul verder te gaan. Dit na het opstellen van een 95% CI om na te gaan of het intercept

bekomen via OLR significant verschillend is van nul. Er wordt geen significant verschil

gevonden, waardoor kan gesteld worden dat er tussen OLR en OLR geforceerd door nul geen

significant verschil is. Dagelijks wordt de kalibratiecurve opgesteld met behulp van het

regressiemodel OLR geforceerd door nul (zie Figuur 4.3).

Tabel 4. 3 Procentuele afwijking en CV voor de concentratie van het L-IQC en HN-IQC staal

berekend voor de vier onderzochte regressiemodellen.

OLR OLR GEFORCEERD DOOR 0 0 INGESLOTEN WLR

LIQC AFWIJKING (%) 2.5 2.2 2.4 2.6

CV (%) 1.5 1.7 1.5 1.4

HIQC AFWIJKING (%) 2.8 2.8 2.8 3.1

CV (%) 1.1 1.1 1.1 1.4

24

Figuur 4. 3 Kalibratiecurve gemeten op 1 april 2011.

4.2.3. Imprecisie

Voor de validatie van imprecisie zijn de stalen van L-IQC en HN-IQC in duplicaat

gemeten gedurende veertien dagen. In werkelijkheid werd gebruik gemaakt van een

gereduceerd CLSI-EP5 protocol. In Figuur 4.4 zijn de puntendiagrammen weergegeven voor

het L-IQC staal. In het linkse puntendiagram A is de gemiddelde dagconcentratie

weergegeven. Uit het puntendiagram kan vermoed worden dat de binnen-dag gemiddelden

homogeen verdeeld zijn. De Grubbs‟ test bewijst dat er geen uitschieters aanwezig zijn. In

Figuur 4.4 B wordt het verschil van de dagconcentraties weergegeven. Dit is een maat voor de

binnen-analyse variatie. Aan de hand van het puntendiagram kan vermoed worden dat er een

uitschieter aanwezig is. Bij het uitvoeren van de Grubbs‟ test wordt echter het tegendeel

bewezen, er zijn dus geen uitschieters aanwezig.

Voor het HN-IQC staal zijn soortgelijke puntendiagrammen opgesteld. Voor de

gemiddelde dagconcentratie lijken de waarden homogeen verdeeld. De Grubbs‟ test bevestigt

dat er geen uitschieters aanwezig zijn. Bij het verschil in dagconcentraties lijken er twee

waarden toch verder te liggen dan de andere. Bij het uitvoeren van de Grubbs‟ test blijkt het

toch niet om uitschieters te gaan.

y = 2029.3x

R² = 0.9999

0

2000

4000

6000

8000

10000

12000

14000

0 1 2 3 4 5 6 7

Gem

iddel

de

opper

vla

kte

Concentratie (µg/g)

25

Op de resultaten van het L-IQC- en HN-IQC staal werd een “single factor” ANOVA

test uitgevoerd. Hieruit kan swr, sdd, sT, CVwr en CVT berekend worden. De CVT en CVwr

waarden kunnen vergeleken worden met de vooropgestelde specificaties zoals weergegeven

in Tabel 4.4. Hierin is te zien dat zowel het L-IQC- en HN-IQC staal aan de specificaties

voldoen.

Er wordt ook getest met een Chi²-test, of de experimentele waarden kleiner zijn dan de

kritische Chi²-waarden. Deze test is eenzijdig en wordt uitgevoerd op een 0.05

significantieniveau. Bij Chi² van de totale analyse (CVT) zijn de specificaties verschillend. Dit

is te wijten aan de berekeningen van de vrijheidsgraden voor de totale analyse. De resultaten

zijn terug te vinden in onderstaande Tabel 4.4. Ze bevestigen nogmaals dat aan de

specificaties voldaan is.

2.65

2.70

2.75

2.80

2.85

2.90

Gemiddelde

L-IQC

-0.08

-0.06

-0.04

-0.02

0.00

0.02

0.04

0.06

D (2-1)

L-IQC

Figuur 4. 4 Puntendiagram L-IQC staal. A: gemiddelde dagconcentratie van de verschillende

meetdagen. B: verschil van de dagconcentraties.

A B

26

Tabel 4. 4 Weergave van resultaten van het lage- en hoge IQC staal vergeleken met de

vooropgestelde specificties voor CV van binnen-analyse en totale CV.

4.2.4. Detectielimiet

Het LoD staal wordt gedurende dertien dagen gemeten en dagelijks wordt de

concentratie berekend. Deze bedraagt gemiddeld (±SD) 0.0365 ± 0.0028 µg/g. Omgerekend

en rekening houdend met de dichtheid van het oplosmiddel (0.8988 g/ml) en het volume van

de loop (5µL) geeft dit een massa (± SD) van 164.3 ± 12.5 pg DPP die op de kolom

geïnjecteerd wordt. De S/N waarde van elke meting wordt bepaald (Figuur 4.5) en uitgezet in

een puntendiagram (Figuur 4.6).

Figuur 4.5 Illustratie over hoe S/N waarde wordt berekend met chromatogram van 4 april 2011

met 163.9 pg DPP op de kolom.

De spreiding van de waarden lijkt homogeen en er zijn geen uitschieters merkbaar. De

Grubbs‟ test bevestigt dit ook. De gemiddelde S/N waarde wordt berekend, deze bedraagt 5.1

± 0.8. Voor de LoD zijn geen specificaties opgesteld.

Specificaties L-IQC HN-IQC

CVwr 2.0% 0.6% 1.8%

CVT 5.0% 1.4% 2.0%

Chi²wr 23.7 1.425 11.533

Chi²T (L-IQC) 26.3 1.2 -

Chi²T (HN-IQC) 37.7 - 4.1

27

Figuur 4. 6 Het puntendiagram van de S/N waarden voor de verschillende metingen van het LoD

staal.

4.2.5. Juistheid

Voor de terugvindingsexperimenten worden de zes stalen gedurende vijf dagen in

singlicaat gemeten. Het verschil van de gemeten concentratie met hun gemeten gemiddelde

concentratie wordt weergegeven in een verschildiagram (zie Figuur 4.7). Hieruit kan visueel

vermoed worden dat er geen uitschieters aanwezig zijn. Dit wordt getest met de Grubbs‟ test.

Deze bevestigt dat er geen uitschieters aanwezig zijn.

Figuur 4. 7 Verschildiagram dat het verschil tussen gemeten en gemiddelde concentratie

weergeeft voor de juistheidstalen. Van links naar rechts: Onbekende 2, Onbekende 1,

Onbekende 3, L-IQC, Juistheidstaal, HN-IQC.

In een procentueel verhoudingsdiagram (zie Figuur 4.8) wordt ook het CI

weergegeven. Merk op dat in het diagram de stalen gerangschikt zijn van laagste naar hoogste

3.0

4.0

5.0

6.0

7.0

8.0

9.0

S/N-waarde

-0.15

-0.10

-0.05

0.00

0.05

0.10

0.15

0 1 2 3 4 5

Ver

sch

il m

et g

emid

del

de

Concentratie (µg/g)

28

concentratie. Hieruit kan afgeleid worden dat de stalen homoscedastisch zijn, daar er geen

trend aanwezig is in de varianties. De specificaties schrijven een maximum afwijking voor

van vijf procent, waarbij de bovenste grens (Upper Limit; UL) 105% bedraagt. Voor

onbekende 2 en L-IQC overschrijdt de bovengrens van het CI deze van UL. Voor onbekende

2 wordt ook de ondergrens van het CI overschreden.. Van deze stalen kan niet met 95%

zekerheid gezegd worden dat ze aan de specificaties voldoen. Meer metingen zouden in dit

geval het CI voldoende kunnen verkleinen en uitsluitsel kunnen brengen of aan de

specificaties voldaan wordt. Hoeveel extra metingen nodig zijn kan via een power berekening

voorspeld worden.

Figuur 4. 8 Procentueel verhoudingsdiagram van de zes stalen met hun CI.

4.2.6. Methodenvergelijking

De gegevens worden weergegeven in een B&A-diagram (zie Figuur 4.9). Het CI van

het gemiddeld verschil overschrijdt de SE-limiet van vijf procent niet. Bij het controleren van

de TE-limiet wordt opgemerkt dat het CI van „d + 1.96 SD‟ de limietwaarde van vijftien

procent overschrijdt. Bij de onderste TE-limiet wordt de limietwaarde niet overschreden door

het CI.

On

bek

end

e 2

On

bek

end

e 1

On

bek

end

e 3 L

-IQ

C

Ju

isth

eid

staal

HN

-IQ

C

90

92

94

96

98

100

102

104

106

108

110

0 1 2 3 4 5 6

Pro

centu

ele

ver

ho

udin

g (

%)

Staalnummer

29

Figuur 4. 9 Bland & Altman diagram van de gesimuleerde data

In plaats van een procentueel verschildiagram op te stellen zoals het B&A-diagram in

Figuur 4.9, kan ook een absoluut verschildiagram worden opgesteld (zie Figuur 4.10). Omdat

de SD van de methode niet noodzakelijk constant is, kan gekozen worden om tot een bepaalde

concentratie met een absolute TE-limiet te werken. In dit geval wordt hiervoor als buigpunt

van de limiet de waarde één gekozen (op educatieve basis). Normaal is het buigpunt het punt

waarbij de SD van een constante naar stijgende waarde overgaat. Tot de waarde één is de

limiet constant, deze waarde is 15% van de concentratie van het buigpunt. Vanaf de waarde

één is er een constante stijging met rico 0.15. Alle waarden liggen binnen de vooropgestelde

specificaties.

-30

-25

-20

-15

-10

-5

0

5

10

15

20

25

30

0 1 2 3 4 5 6 7

Routi

ne-

Ref

ere

nti

e (%

)

Referentie concentratie (µg/g)

Gem.

verschil (%).

±1,96 SD

gem.

verschil(%)

±95% CI

SE limiet

TE limiet

30

Figuur 4. 10 Absoluut verschildiagram van de gesimuleerde data.

Het nadeel van de B&A-benadering is dat het geen concentratiegebonden fouten kan

detecteren. Daarom wordt er nog een lineair regressieonderzoek uitgevoerd. De resultaten van

het lineair regressieonderzoek zijn weergegeven in Figuur 4.11. Hierbij kan afgeleid worden

dat de correlatiecoëfficiënt 0.9968 bedraagt. Het interpreteren van de data met behulp van de

correlatiecoëfficiënt is echter misleidend. Deze is geen maat voor de overeenkomst tussen

twee methoden maar eerder een maat voor de sterkte van de relatie tussen twee variabelen.

Zolang de waarden rond eender welke rechte liggen, zal derhalve de correlatiecoëfficiënt goed

zijn. De correlatiecoëfficiënt is bovendien ook sterk afhankelijk van het werkbereik.

Aangezien bij deze methodevergelijking een groot werkbereik wordt gebruikt zal de

correlatiecoëfficiënt ook hoog zijn (Bland, et al., 1986). Daarom wordt de overeenkomst

tussen de referentie en routine methode statistisch geïnterpreteerd met behulp van OLR. In

Figuur 4.11 kan gezien worden dat de regressielijn niet op de rode referentierechte (y = x)

ligt. Dit komt door de afwijking van het intercept van nul, het 95% CI is [0.00577; 0.101]. Dit

wijst op een constante systematische fout. De richtingscoëfficiënt wijkt nagenoeg niet af van

de waarde één, het 95% CI is [0.990; 1.01], de laagste waarden zijn moeilijker te beoordelen.

-0.9

-0.7

-0.5

-0.3

-0.1

0.1

0.3

0.5

0.7

0.9

0 1 2 3 4 5 6 7

Rou

tine

-R

efer

nti

e (µ

g/g

)

Concentratie (µg/g)

TE limitTE-limiet

31

Figuur 4. 11 Spreidingsdiagram

In Tabel 4.5 wordt het CI en PI vergeleken met de specificaties voor respectievelijk SE

en TE ter hoogte van de minimale en maximale waarde concentratie. Voor de minimale

waarde wordt de limiet van zowel SE als TE overschreden. Bij de maximale waarden is

voldaan aan zowel de SE- als TE-limiet.

Tabel 4. 5 CI en PI in vergelijking met respectievelijke systemische- en totale fout voor de

laagste en hoogste concentratie.

CI (∆%) vergeleken met SE PI (∆%) vergeleken met TE

Minimale waarde (0.13µg/g) [10.77;69.18] [-89.99;169.95]

Maximale waarde (6.09µg/g) [0.51;1.65] [-1.77;3.93]

y = 1.0021x + 0.0534

R² = 0.9968

0

2

4

6

8

10

0 2 4 6 8 10

Ro

uti

ne

(µg/g

)

Referentie (µg/g)

Lijn Y=X

TE-limiet

Lineair

(Regressielijn)

32

4.2.7. Samenvatting validatie experimenten

Table 4.6 Samenvatende tabel van de resultaten van de verschillende prestatiekenmerken.

Prestatiekenmerken Specificatie Voldaan/ niet voldaan

Imprecisie – CVWR 2% Voldaan

Imprecisie – CVT 5% Voldaan

Lineariteit 5% Voldaan

Juistheid 5% Niet voldaan, meer metingen nodig

Methodevergelijking – TE 15% Voldaan voor hoge concentratie

Methodevergelijking – SE 5% Voldaan voor hoge concentratie

33

4.3. LITERATUURONDERZOEK

De LoD is al lange tijd en is nog steeds een van de meest controversiële concepten in de

analytische chemie. De vele verschillende definities en methoden hebben geleid tot een

situatie van misverstanden en verwarring (Boqué, et al., 2009). Verschillende oproepen tot

harmonisatie waren het gevolg. Eén van de pogingen tot harmonisatie werd ondernomen in

2004 door het “Environmental Protection Agency” (EPA), die een document publiceerden

met als titel “Revised Assessment of Detection and Quantitation Approaches”. Dit 254

pagina‟s bevattende document wordt afgesloten met het besluit dat: “EPA gelooft dat

discussie over alternatieven of verbetering van huidige detectie en kwantificatie concepten of

procedures moet verder gezet worden. Het is duidelijk dat er een brede interesse is in het

verbeteren van huidige procedures en gebruiken, maar dat men niet tot een consensus is

kunnen komen voor specifieke procedures.” (EPA, 2004). Er zijn zelfs veronderstellingen dat

er belangrijke fundamentele fouten in de LoD literatuur aanwezig zijn, die onderdeel zijn

geworden van de folklore (Voigtman, 2008).

Ook in andere vakgebieden wordt het onderwerp aangehaald. In het tijdschrift

“Epidemiology” verscheen bij de juli-editie van 2010 een supplement helemaal gewijd aan

deze problematiek. Het supplement beschrijft verschillende statistische methoden en modellen

voor het behandelen van de LoD zoals: de bepaling van de LoD gebruikmakend van lineaire

regressiemodellen, het Bayesian model en het gebruik van “multiple imputatie” waarvan

gesuggereerd wordt dat dit een veelbelovende methode kan zijn voor het analyseren van de

LoD. (Shisterman, et al., 2010).

Een interessante website die kan gebruikt worden voor het verdiepen in het thema is:

http://www.chemometry.com/Research/LOD.html. Hieronder zullen verschillende bepalingen

van de LoD besproken worden.

4.3.1. VERSCHILLENDE BEPALINGEN VAN DE DETECTIELIMIET

4.3.1.1. Bepaling met behulp van de kalibratiecurve.

De bepaling van de LoD met behulp van de kalibratiecurve werd voor het eerst

beschreven in 1970 door Hubaux A. en Vos R., gebaseerd op het predictie-interval (prediction

interval, PI) van een lineaire regressiemethode met homoscedastisch verdeelde data (zie

34

Figuur 4.12). Er worden twee betrouwbaarheidslimieten (Confidence Limits, CL)

gedefinieerd met een vooraf opgesteld betrouwbaarheidsniveau van 1-α-β. Wanneer een reeks

metingen zou uitgevoerd worden, zou α% van de data hoger dan de bovenlimiet liggen en β%

lager dan de onderlimiet. Noteer dat de publicatie spreekt over CL terwijl ze eigenlijk PI

bedoelt (Desimoni, et al., 2009). Noteer ook dat de vorm van de limieten een CI suggereert

(sterk vernauwend naar het gemiddelde toe). Het PI daarentegen is bijna lineair. Deze

benadering van de LoD is bijzonder complex omdat vanuit het signaaldomein voorspellingen

gemaakt worden naar het concentratiedomein. De oorspronkelijke benadering van Hubaux-

Vos wordt daarom soms als te eenvoudige gezien en nog uitgebreidere statistische modellen

worden voorgesteld om het probleem te beschrijven (Voigtman, 2008). Deze bepaling zal dan

ook niet verder behandeld worden in deze thesis.

Figuur 4. 12 Illustratie van de Hubaux-Vos-bepaling uit het oorspronkelijke artikel van 1970.

4.3.1.2. Bepaling via signaal over ruis verhouding.

De bepaling van de LoD met behulp van de S/N verhouding wordt door verschillende

richtlijnen vooropgesteld. De bepaling die aanbevolen wordt door de “Societe Francaise des

Sciences et Techniques Pharmaceutiques” (SFSTP) bestaat uit het bepalen van de maximale

amplitude van de basislijn gedurende een tijdsinterval dat overeenkomt met twintig maal de

breedte van de halve hoogte van de piek. De formule hiervoor opgesteld staat hieronder

weergegeven (Boqué, et al., 2009).

35

(4.1)

LD: Detectielimiet

z1-α: z-waarde voor significantieniveau 1-α

hnoise: helft van de maximale amplitude van de ruis

R: piekhoogte

Bij farmaceutische analyse worden dikwijls de richtlijnen van ICH, USP en Europese

farmacopee gevolgd. De ICH stelt voor de S/N waarde te bepalen door de verhouding te

nemen van het gemeten signaal van het laag geconcentreerde staal tot het signaal van de

basislijn. De LoD wordt beschouwd als de concentratie van de component met een S/N

verhouding van drie (Hubaux, et al., 1970). In de Europese farmacopee wordt de S/N waarde

als volgt gedefinieerd (Formule (4.2)) (Council of Europe, 2008).

(4.2)

S/N: signaal over ruis verhouding

H: Hoogte van de piek , dit is gemeten van het maximum van de piek tot de

geëxtrapoleerde basislijn van het signaal.

h: hoogte van de ruis wordt gemeten in het chromatogram in de buurt waar de

piek voorkomt.

Deze bepaling wordt gebruikt bij chromatografische toepassingen. Dit komt omdat de

benadering enkel kan gebruikt worden als er een basislijn met ruis aanwezig is. Deze methode

zal ook niet verder besproken worden in deze thesis.

4.3.1.3. Bepaling met behulp van de standaarddeviatie van de blanco.

Deze bepaling werd voor het eerst beschreven door Currie L.A. in 1968. De

“International Union of Pure and Applied Chemistry” (IUPAC) stelt ook de Currie-

benadering voor waarbij de LoD voor een bepaalde analysemethode gedefinieerd wordt als de

concentratie (cL) of de kwantiteit (qL) verkregen door de kleinste meting (xL) die kan

gedetecteerd worden met een behoorlijke zekerheid. De formule voor xL is hieronder

weergegeven (IUPAC, 2005-2009).

36

(4.3)

xL: waarde van de kleinste meting

: het gemiddelde van de blanco metingen

: standaarddeviatie van de blanco meting

: is een numerieke factor gekozen volgens het CI

Deze bepaling zal verder uitgediept worden in deze thesis.

4.3.1.4. Detectielimiet in farmaceutische discipline.

In onderstaande Tabel 4.1 zijn verschillende richtlijnen van verschillende organisaties

besproken die specifiek gebruikt worden in de farmaceutische discipline nl. “International

conference on harmonization” (ICH), “United States Food and Drug Administration” (US

FDA), “Association of Analytical Communities” (AOAC) en IUPAC. Om afbreuk van

interpretatie van de originele definitie te vermijden zijn deze in de tabel in het engels

weergegeven.

37

Tabel 4. 7 Vergelijking verschillende directieven van de detectielimiet methode validatie (Chandran, S, 2007).

Directieven ICH US FDA AOAC USP IUPAC

Definitie Lowest amount of analyte in the sample, which can be

detected but not necessarily

quantitated under stated

experimental conditions

Niet expliciet

beschreven

Lowest content that can be measured with reasonable

statistical certainty

Lowest amount of analyte in the sample which can be detected but not

necessarily quantitated under stated

experimental conditions

Smallest amount of conc. of analyte in the

sample that can be

reliably distinguished

from zero.

Methode 1. Door visuele evaluatie

2. Gebaseerd op de S/N.

Toepasbaar bij procedure die

basislijn ruis heeft.

Lage concentratie van analyt

wordt vergeleken met de

blanco.

3. Gebaseerd op SD van de respons en

richtingscoëfficiënt.

LOQ = 3.3 σ/s

s= richtingscoëfficiënt van de

kalibratiecurve

σ= SD van de respons

Niet

beschreven

Gebaseerd op meer dan 20

blanco‟s

Analyse van een staal met gekende

concentratie en door de minimale

concentratie vast te stellen waarbij de

analyt kan gedetecteerd worden. De

LoD moet voldoende laag zijn voor

analyse van stalen met gekende

concentratie van de analyt boven en

onder de vereiste LoD.

Niet gespecificeerd

Berekening Op basis van visueel

onderzoek of S / N dan dient

een chromatogram gepresenteerd te kunnen

worden

Op basis van berekening is

de schatting

gevalideerd door analyse van

een

geschikt aantal stalen die in de

buurt van de LoD liggen.

Niet

beschreven

De gemiddelde waarde van de

blanco metingen

(n=20) plus drie standaarddeviaties van

het gemiddelde, uitgedrukt in

analietconcentratie.

Niet gespecificeerd Niet gespecificeerd

Aanvaardbaarheidscriteria S/N > 2-3; niet gespecificeerd

in andere gevallen

Niet

beschreven

Niet gespecificeerd Niet gespecificeerd Niet gespecificeerd

38

4.3.2. BENADERING BESCHREVEN VOLGENS CURRIE

In 1995 verscheen door IUPAC in samenwerking met L.A. Currie de publicatie

“Nomenclature in evaluation of analytical methods including detection and quantification

capabilities” in Pure & Applied Chemistry. Dit document stelde onder andere een definitie op

voor de LoD die reeds beschreven is in Tabel 4.1. De theorie van de LoD wordt er

gedefinieerd als gebaseerd op het testen van hypothesen en de probabiliteit van fouten van de

eerste en tweede soort (zie verder). De probabiliteit voor een type I fout wordt weergegeven

door α, de probabiliteit van een type II fout door β (Boqué, et al., 2009) (Currie, 1995).

4.3.2.1.Kritische waarde

Bij het analyseren van vele blanco stalen zou er een concentratie verdeling ontstaan die

vergelijkbaar is met deze in Figuur 4.12. De concentratiewaarden zouden verdeeld zijn rond

nul met een bepaalde standaarddeviatie ( ). Om een “detectiebeslissing” te kunnen nemen

(analyt aanwezig of niet) moet men de kritische waarde (LC) definiëren. Het IUPAC

“definieert” LC als de waarde waarbij een onderscheid kan gemaakt worden tussen een

chemisch signaal en de ruis (Boqué, et al., 2009) (Currie, 1995).

De theorie voor de LoD is gebaseerd is op het testen van hypothesen. De nulhypothese

(H0) in dit geval stelt dat bij het meten van een staal, de geschatte waarde (L) gelijk is aan nul,

met andere woorden H0: L = 0. De alternatieve hypothese (HA) stelt dat bij het meten van een

staal de gemeten waarde (L) verschillend is van nul, ook genoteerd als: HA: L ≠ 0 (Currie,

1995).

Er werden ook twee soorten fouten vermeld. De fout van de eerste soort, ook wel type I

fout of vals-positieve genoemd. Dit wil zeggen dat er een kans bestaat dat bij het analyseren

van een blancostaal een resultaat verkregen wordt dat een concentratie voorstelt, hoger dan de

LC-waarde, zodat dus foutief zou besloten worden dat een analyt aanwezig is. De HA wordt

dan valselijk aanvaard (Boqué, et al., 2009).

Omgekeerd, bij het type II fout wordt foutief besloten dat er geen analyt aanwezig is.

Deze fout wordt ook verder nog besproken.

39

Figuur 4. 12 Verdeling van de waarden rond nul en weergave locatie van LC (Boqué, et al., 2009)

Bij de kritische waarde (LC) wordt er beslist of er iets- of niets gedetecteerd wordt. Deze

beslissing wordt genomen door het vergelijken van de geschatte waarde (L) met de kritische

waarde (LC) van de distributie. De kans op het overschrijden van LC is zodanig gekozen dat

deze niet groter is dan α als de analyt afwezig is (L=0) (Currie, 1995). Dit kan geschreven

worden als:

(4.4)

L: geschatte waarde

LC: kritische waarde

L=0: is voorwaarde van de nulhypothese

α: type I fout

Indien L normaal verdeeld is met een gekende variantie kan vergelijking (4.4) geschreven

worden als volgt:

(4.5)

: z-waarde voor een bepaald significantieniveau.

: standaarddeviatie van het blanco staal.

Als de geschatte standaarddeviatie van het blanco staal voorstelt (s0), gebaseerd op “v”-

vrijheidsgraden, dan wordt in volgens de Currie-benadering vervangen worden door een

student‟s t-test.

40

(4.6)

: t-waarde van de student-t verdeling met “v”-vrijheidsgraden en α als

significantieniveau.

: geschatte standaarddeviatie van het blanco staal.

4.3.2.2.Detectielimiet

Voor de LoD dient een waarde gekozen te worden die hoger ligt dan de LC-waarde. Want

indien de waarde van LC zou gekozen worden als minimaal detecteerbare concentratie. Zou in

50% van de gevallen een waarde lager dan LC gemeten worden en dus volgens de

detectiebeslissing aanvaard worden als blanco. Dit is weergegeven in Figuur 4.13 (Boqué, et

al., 2009).

Figuur 4. 13 Illustratie van de situatie wanneer LoD gelijk zou zijn aan LC (Boqué, et al., 2009).

Daarom wordt eerst de fout van de tweede soort besproken, ook wel type II fout of vals

negatief genoemd. Dit wil zeggen dat bij het analyseren van een staal met lage concentratie er

een resultaat verkregen wordt dat een concentratie heeft lager dan de LC-waarde. In dit geval

zou foutief besloten worden dat er geen analyt aanwezig is. De H0 wordt valselijk aanvaard

(Boqué, et al., 2009) (Currie, 1995).

De LoD moet dus een hogere concentratie hebben dan de LC-waarde om het risico op type

II fouten te verkleinen. Daarom moet een keuze gemaakt worden om een aanvaardbare

waarde voor β te kiezen (β: % lager dan LC). De standaardwaarden die door IUPAC voor α (α:

% groter dan LC) en β gebruikt worden bedragen voor elk 5% (zie Figuur 4.14) (Currie, 1995)

(Boqué, et al., 2009).

41

Figuur 4. 14 Weergave type I (α) en type II (β) fout (Boqué, et al., 2009).

De detectielimiet (LD) is de minimale concentratie die kan gedetecteerd worden, deze

beslissing wordt genomen door het vergelijken van de geschatte waarde (L) met de kritische

waarde (LC) van de distributie, zodanig dat de kans op een kleinere concentratie dan LC gelijk

is aan β als de analyt aanwezig is (dus L ≠0) (Currie, 1995). Dit kan geschreven worden als:

(4.7)

L: geschatte waarde

LC: kritische waarde

L=LD: voorwaarde voor de alternatieve hypothese

β: type II fout

Voor normaal verdeelde data met een gekende variantie wordt deze formule:

(4.8)

LC: kritische waarde

: waarde van de eenzijdig gestandaardiseerde normale verdeling voor een

bepaald significantieniveau (β).

: standaarddeviatie van het LoD staal.

In het speciale geval waarbij de variantie constant is tussen L=0 en L=LD kan het

rechter deel van vergelijking (4.8) gereduceerd worden tot ( . Als additioneel α

en β gelijk zijn geeft dit . Dit is met andere woorden gelijk aan 2LC. Als LC een

geschatte s0 gebruikt gebaseerd op “v”-vrijheidsgraden, dan wordt in de Currie-benadering

42

(z1-α+z1-β) vervangen door δα,β,v. Dit is een niet-centrale parameter voor de niet-centrale t-

verdeling. Voor α=β komt deze parameter overeen met 2t en kan weergegeven worden als

volgt: (Currie, 1995)

(4.9)

: niet-centrale parameter van de niet centrale t-verdeling voor α en β

voor “ v”-vrijheidsgraden.

: Standaarddeviatie van het blanco staal.

: t-waarde met “v”-vrijheidsgraden en significantieniveau α

Noteer dat de LoD hier anders wordt berekend dan besproken bij Linnet (4.3.3.).

Noteer ook dat σ0 moet gebruikt worden in vergelijking (4.9). Als enkel een geschatte waarde

s0 beschikbaar is, dan wil dit zeggen dat de minimaal detecteerbare waarde onzeker is over de

verhouding (σ/s). Gebruik makend van volgende formules kunnen betrouwbaarheidslimieten

voor LD berekend worden (Currie, 1995).

Als de resultaten normaal verdeeld zijn, dan is s²/σ² verdeeld als Χ²/v. Het 95% CI geschat

voor deze verhouding kan gegeven worden als:

(4.10)

Omgerekend geeft dit:

(4.11)

: Standaarddeviatie van steekproek

: aantal vrijheidsgraden

: Chi² waarde voor bepaald percentage voor “v”-vrijheidsgraden

Voor het berekenen van de 95% bovenste limiet van LD gebaseerd op de s0 voor n=5 wordt

dit: (Currie, 1995)

(4.12)

43

4.3.3. BENADERING VOLGENS LINNET

In 2004 publiceerde K. Linnet in het tijdschrift Clinical Chemistry het artikel “Partly

Nonparametric Approach for Determining the Limit of Detection”. Er wordt hierin

aangehaald dat de LoD zoals hierboven beschreven (zie 4.2.) een gaussiaanse verdeling

veronderstelt voor zowel de blanco als het gemeten staal en eveneens een lineaire

kalibratiecurve. Echter in deze „publictie‟ wordt de verdeling van de blanco vaak afgeknot aan

nul en is deze dus asymmetrisch en niet-gaussiaans (zie Figuur 4.15). Dit komt omdat

waarden kleiner dan nul beschouwd worden als nul. Daarom wordt een verdelingsvrije toets

procedure besproken. Deze procedure heeft het voordeel dat ze algemeen toepasbaar is zonder

dat het een bepaalde verdeling wordt verondersteld (Linnet, et al., 2004).

Figuur 4. 15 De blancowaarden zijn afgeknot aan nul. De blanco is asymmetrisch en niet-

gaussiaans verdeeld.

Voor de situatie in Figuur 4.15 waarbij de blancowaarden asymmetrisch en niet

gaussiaans verdeeld zijn, kan het 95e percentiel niet correct geschat worden door middel van

een parametrische benadering waarbij de limieten overeen zouden komen met: (Linnet, et al.,

2004)

(4.13)

: Limiet van de Blanco

: Gemiddelde van de blanco metingen

: SD van de blanco

B A

44

Noteer dat wanneer we deze formule voor een eenzijdig 95% CI vergelijken met

Formule (4.5) opgesteld door IUPAC in paragraaf 4.2., het gemiddelde niet wordt

meegerekend. Deze opmerking geldt ook voor de LoD (Linnet, et al., 2004).

De meest correcte manier om het 95e percentiel van een asymmetrische verdeling te

schatten is door het toepassen van de verdelingsvrije principes op geordende waarden. Het

aantal metingen van het blanco staal (nB) wordt gerangschikt volgens grootte. Dan kan het 95e

percentiel geschat worden als de waarde: (Linnet, et al., 2004)

(4.14)

nB: aantal metingen van een blanco staal

0.5: experimenteel bepaalde waarde voor 95e percentiel

Het limiterend percentiel van de blancoverdeling, welke α procent van de bovenste

staart van de verdeling afsnijdt, zal LoB genoemd worden (Figuur 4.15 B). De onzekerheid op

de schatting van de LoB voor de theoretische verdeling kan weergegeven worden voor de

standaard error van een niet-parametrisch geschat percentiel (SEnpar) dat overeenkomt met een

bepaald percentage (p) (Linnet K., 2004a.).

(4.15)

p: percentage van percentiel

d: is de densiteit van de verdeling aan het percentiel

N: Aantal stalen.

Deze vergelijking blijft geldig ook als de gaussiaanse verdeling afgeknot wordt aan

nul, zoals soms het geval bij de distributie van de blanco metingen. Noteer dat Linnet ook

parametrische bepalingen in acht neemt. Zo wordt de standaard-error van het parametrisch

geschatte percentiel geschreven als: (Linnet K., 2004a)

(4.16)

: oorspronkelijke standaarddeviatie

: standaard gaussiaanse afgeleide voor het gegeven percentiel

: aantal stalen

45

Indien de β waarde op 5% ligt voor een type II fout, dan moeten 95% van de waarden

hoger liggen dan de LoB. De concentratie van het staal in dit geval wordt gedefinieerd als de

minimaal detecteerbare concentratie wat overeenstemt met de LoD. Meestal is de distributie

van het staal gaussiaans, er kan dan een parametrische schatting gebeuren en in dit geval kan

het 5e percentiel van de verdeling bekomen worden door: (Linnet, et al., 2004)

(4.16)

μs: gemiddelde

σs: standaarddeviatie van de populatie

Algemeen kan gesteld worden dat

(4.17)

Indien de staalverdeling toch niet gaussiaans zou zijn, kan niet-parametrisch het 5e

percentiel van het staal geschat worden met de verdelingsvrije methode zoals hierboven

beschreven in Formule (4.14). Toch dient gezegd te worden dat de parametrische schatting

efficiënter is en daarom bij voorkeur dient gebruikt te worden (Linnet, et al., 2004).

De hoofdlijnen zoals hierboven beschreven zijn gebaseerd op theoretische

verdelingen. In de praktijk moet LoB geschat worden door herhaaldelijke metingen (nB) van

een blanco staal. De SD wordt bepaald uit de herhaaldelijke metingen van het staal met

relevante concentratie (ns). Dit is dus de methode om de LoD te schatten, op voorwaarde dat

het aantal herhaalde metingen (ns) niet te klein is. Volgende formule is een zuivere schatting

van Formule (4.17) (Linnet K., 2005)

(4.18)

: Geschatte LoD waarde

: Geschatte LoB waarde

: geschatte SD van de staal verdeling met “f”-vrijheidsgraden

:

is het (1-β) percentiel van de standaard gaussiaanse verdeling me t

“f”-vrijheidsgraden.

46

De onzekerheid van de LoDEST is samengesteld uit de componenten van de

onzekerheid van de LoBEST en van de metingen van de stalen. Een 95% CI voor de LoD kan

bekomen worden door het combineren van het 80% CI van de LoB en SDs, onder de

voorwaarde dat nb = ns en dat deze niet lager is dan 50 stalen. Het Bootstrap principe is een

alternatieve procedure die bij een lager aantal stalen kan gebruikt worden (Linnet, et al.,

2004).

4.3.4. Vergelijken principe van Linnet en Currie

De formules van de parametrische berekeningen van LC en LoB opgesteld door

respectievelijk Currie en Linnet zijn weergegeven in (4.6) en (4.13). Bij het doorvoeren van

de vereenvoudiging dat het gemiddelde van het blancostaal gelijk is aan nul, kunnen volgende

formules weergegeven worden als:

Indien deze formules berekend worden voor α =5 en aantal vrijheidsgraden = 4

bekomt men volgende uitdrukkingen in functie van SD.

Deze uitkomst is opmerkelijk daar het toch om dezelfde waarde gaat die wordt

berekend. Daarom wordt dit verder uitgewerkt in het addendum in bijlage.

47

5. CONCLUSIE

In deze masterthesis werd een HPLC-UV methode voor de bepaling van DPP gevalideerd.

Het zelfstandig plannen, werken en uitvoeren van de experimenten verliep heel vlot. Tevens is

er heel wat praktische kennis opgedaan over het gebruik en de werking van het HPLC-toestel.

Dit hield ook in dat werd aangeleerd aanpassingen uit te voeren, zoals een kolom vervangen

indien nodig. Er is ook kennis opgedaan over de gebruikte software van het HPLC toestel als

ook over statistische software als CBstat en dataverwerking software zoals Excel. Het

kalibratie onderzoek wees uit dat de OLR geforceerd door 0 het best passende regressiemodel

geeft. Tijdens de volledige validatieperiode voldeed het systeem dagelijks aan de

vooropgestelde systeemfunctie- en systeemgeschiktheidscontrole.

De validatie-experimenten toonden aan dat de lineariteit en imprecisie van de methode

voldeden aan de vooropgestelde specificaties. Voor de validatie van juistheid ligt het CI van

twee stalen buiten de limieten. Om uitsluitsel te geven over de juistheid zou het nodig zijn

meerdere metingen uit te voeren. De methodevergelijking gaf voor het procentuele B&A-

diagram aan dat zowel de SE als TE limiet overschreden werden, waaruit dient besloten te

worden dat de routinemethode significant verschillend is van de referentiemethode. Wanneer

gekeken wordt naar het absolute B&A-diagram met inclusie van absolute limieten in het lage

concentratie bereik, wordt opgemerkt dat de waarden wel binnen de specificaties vallen. Dus

dat de methoden niet significant verschillen. Aangezien het B&A-diagram geen rekening

houdt met concentratiegebonden fouten wordt een lineair regressieonderzoek uitgevoerd. Bij

lage concentraties wordt niet voldaan aan de specificaties van SE en TE, voor de hoge

concentraties echter wel. Het besluit uit de methodenvergelijking is dat er voor de hoge

concentraties geen significant verschil is tussen de routine- en referentiemethode, voor de lage

concentraties echter wel.

Het literatuuronderzoek over de LoD wees uit dat ondanks het eenvoudige concept er nog

steeds geen harmonisatie is. Ook al werden verschillende pogingen ondernomen door

organisaties en wetenschappers zoals Currie en Linnet. Er bestaat nog steeds geen

duidelijkheid over de terminologie en definities. De eenvoudigste berekeningen die

vooropgesteld zijn door verschillende wetenschappers stroken ook niet met elkaar. Dit zal in

vraag gesteld worden in het addendum bij deze thesis. Verder onderzoek is dan ook vereist

om duidelijkheid te brengen in deze problematiek.

48

Door middel van het literatuuronderzoek werden vaardigheden verworven over het

opzoeken van wetenschappelijke literatuur en informatie, en hoe deze massa informatie op

een kritische en efficiëntie manier kan verwerkt worden.

Er werd ook kennis gemaakt met verschillende soorten software voor het uitvoeren van

methodevalidatie. Zo kwam het bedrijf VWR (VWR international BVBA, Leuven, België) een

software pakket voorstellen, maar het programma “Agilent ChemStation Plus Method

Validation Pack” lijkt toch interessanter voor het uitvoeren van methodevalidatie.

49

6. BIBLIOGRAFIE

ATSDR. (1995). Toxicological Profile for dieethylphthalte. Atlanta : Agency for Toxic

Substances and Disease,

Bland, JM en Altman, DG. Statistical methods for assessing agreement between two methods

of clinical measurment (1986). 1 Lancet 307-310.

Boqué, R. en Vander Heyden, Y. The Limit of Detection. (2009). 22 LC-GC Europe. 82-85

Chandran, S. Comparison of various international guidelines for analytical method validation

(2007). 62, Pharmazie, 4-14

Currie, LA. Nomenclature in evaluation of analytical methods including detection and

quantification capabilities (IUPAC recommendations 1995). (1995) 67 Pure & Applied

chemistry . 1699-1723

Desimoni, E. en Brunetti, B. About estimating the limit of detection of heteroscedastic

analytical systems.(2009) 655 Analytica Chimica Acta. 30-37

Dolan, J.W.. Enhancing Signal-to-Noise. (2010) Special Issues Mar 1 LCGC

EPA. (2004). Revised Assessment of Detection and Quantitation Approaches. Washington

European Pharmacopoeia 6.0. [boekaut.] Council of Europa. Straatsburg : sn, 2008.

Hauser, R., Duty, S. en Godfrey-Bailey, L. Medications as a source of human exposure to

phthalates. (2004) 112 Environ. Health Perspect. 751-753

Heudorf, U., Mersch-Sundermann, V. en Angerer, J. Phthalates: Toxicology and

exposure.(2007) 210 International Journal of Hygiene and Enverionmental Health. 623-634

http ://www.chemcas.com.

http ://www.phthalates.com

http://be.mt.com/be/en/home/phased_out_products/others/AT261.html.

http://goldbook.iupac.org.

http://www.chemometry.com/Research/LOD.html

http://www.clsi.org/Content/NavigationMenu/Resources/HarmonizedTerminologyDatabase/H

armonized_Terminolo.htm.

http://www.freedrinkingwater.com.

http://www.sigmaaldrich.com/belgium-nederlands.html.

http://www.thermoscientific.com/ecomm/servlet/productsdetail?productId=11954633&group

Type=PRODUCT&searchType=0&storeId=11152.

Hubaux, A. en Vos, G. Decision and detection limits for linear calibration curves. (1970) 42

Analytical chemistry. 849-&

50

ICH. Validation of Analytical Procedures: Text and Methodology. (1995). UK : EMEA

International Standard ISO 9000. (2005). Quality management systems -- Fundamentals and

vocabulary. Genève

ISO. (2007). ISO/IEC Guide 99:2007 Vocabulaire international de métrologie -- Concepts

fondamentaux et généraux et termes associés (VIM).

Kaus, R. Detection limits and quantitation limits in the view of international harmonization

and the consequences for analytical laboratories. (1998) 3 Springer-Verlag, 150-154

Kennedy, John W. Evaluation of Precision Performance of Clinical Chemistry Devices;

Approved Guideline. (2004). 19 NCCLS.

Linnet, K. en Kondratovich, M. Appendix Non parametric Approach for Determining the

Limit of Detection (2004) (a). Clinical Chemistry, 50:4,732-740.

Linnet, K. en Kondratovich, M.. Partly Nonparametric Approach for Determining the Limit of

Detection (2004). Clinical Chemistry. 50:4, 732-740

Linnet, K. Estimation of the limit of detection with a bootstrap-derived standard error by a

partly non-parametric approach. Application to HPLC drug assays. (2005). Clin Chem Lab

Med, 43:4, 394-399.

Martino-Andrade, AJ. en Chahoud, I. Reproductive toxicity of phthalate esters. (2010). 54

Mol. Nutr. Food Res. 148-157

NCCLS EP5A2: Evaluation of Precision Performance of Quantitative Measurement

Methods; Approved Guidelines

NCCLS EP6A: Evaluation of the Linearity of Quantitative Measurement Procedures: A

Statistical Approach; Approved Guideline. Pennsylvania , (2003). ISBN 1

Schettler, T. Human exposure to phthalates via consumer products. (2006). 29 Int. J. Androl.

134-139

Shisterman, EF. en Little, RJ. Opening the Black box of biomarker measurement error.

(2010). 21 Epidemiology Supplemen 4 S1-S3

Stöckl, Dietmar. STT consulting. Imprecision. Method validation with confidence. (2007). 11-

14

Stöckl, Dietmar. STT consulting. Linearity. Method validation with confidence. (2007) 20-25

Stöckl, Dietmar. STT consulting. Method validation with confidence. Method validation with

confidence. (2007).

Voigtman, E.. Limits of detection and decision. Part 1. (2008) 63 Spectrochimica Acta, 115-

128

ADDENDUM

Detection decisions defined by the standard deviation of the

blank – Questions from “analytical freshmen”

Journal: Analytical Chemistry

Manuscript ID: ac-2011-013674

Manuscript Type: Letter

Date Submitted by the

Author: 30-May-2011

Complete List of Authors: Vermote, Arno; Universtity of Ghent, Faculty of Pharmaceutical

Sciences, Laboratory of Analytical Chemistry

Buyl, Manon; University of Ghent, Faculty of Pharmaceutical

Science, Laboratory of Analytical Chemistry

ACS Paragon Plus Environment

Analytical Chemistry

1

Detection decisions defined by the standard deviation of

the blank – Questions from “analytical freshmen”

Arno Vermote, Manon M.D.E.M. Buyl*

University of Ghent, Faculty of Pharmaceutical Sciences, Laboratory for Analytical Chemistry

AUTHOR EMAIL ADDRESS [email protected]

RECEIVED DATE

*CORRESPONDING AUTHOR: University of Ghent, Faculty of Pharmaceutical Sciences, Laboratory

for Analytical Chemistry. Tel: 09/264.81.04, Fax: 09/264.81.98, email: [email protected]

Page 1 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

2

ABSTRACT

As pharmacy students in our 4th

academic year, we consider us “analytical freshmen”. Our master

thesises included a literature study about detection decisions based on the standard deviation of the

blank (sbi). The more the study progressed, the more we were puzzled. In the end, we were left with

more questions than answers: i) why is the literature on such a seemingly simple concept (LC = µ + z1-α

σ0) so divergent?; ii) different “k-values” are proposed for substituting “z”, which one is correct?; iii)

why was the blank dropped in the classical IUPAC paper?; iv) what is the logic to substitue z * σ0 with t

* sbi and what is the statistical meaning of the latter?; v) what is the statistical meaning of imposing the

confidence interval of a standard deviation upon a t-statistic?; vi) is the confidence interval of LC

adequately described by the confidence interval of sbi, by the confidence interval of a percentile, or by

another approach?; vii) why is there so little communication between different analytical application

fields for such fundamental issues as the LC?; viii) with respect to LC, has Columbus's egg been found in

a recent publication?

KEYWORDS

Limit of detection, Limit of the blank, prediction interval, confidence interval

Page 2 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

3

MANUSCRIPT TEXT

To the Editor

We are two pharmacy students, just finishing our master thesis in our 4th

academic year. The

general topic of our thesises was method validation, including a literature review about detection

decisions. The more the literature study progressed, the more we were puzzled about the wealth of

literature on such a seemingly simple concept and why there today, still, is no common understanding

about the subject (see Reference 1 and the literature cited therein).1 In the end, we were left with more

questions than answers. Here, we present these questions (see table 1) with a focus on the so-called

“critical value for detection decisions”.2

Page 3 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

4

Table 1: Questions from “analytical freshmen”

Why is there so much literature on such a seemingly simple concept and why is there, still, no

common understanding about the subject?

There are different “k-values” proposed as substitue for “z”, which one is correct?

Why has xbarbi been dropped in the classical IUPAC paper?

In the classical IUPAC paper, what was the logic to substitue z * σ0 with t * sbi and what is the

statistical meaning of the latter?

What is the statistical meaning of imposing the confidence interval of a standard deviation upon a

t-statistic?

Is the confidence interval of LC adequately described by the confidence interval of sbi, by the

confidence interval of a percentile, or by another approach?

Why is there so little communication between the different analytical application fields for such

fundamental issues as the LC?

With respect to LC, has Columbus's egg been found?9

Page 4 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

5

The critical value for detection decisions (LC) (also called limit of the blank, LoB) is part of the

general concept of the limit of detection.2 The definition of LC is common across analytical application

fields and given by the equation LC = µ + z1-α σ0 (equation 1: see table 2), where µ is the population

mean of the blank measurements, z1-α is the one-sided z-value for a given probability (for example,

1.645 for 95% probability), and σ0 is the population standard deviation of the blank. A “generic”

equation for an experimentally estimated LC is given by the International Union of Pure and Applied

Chemistry (IUPAC), namely xL = xbarbi + k * sbi (equation 2; note, the IUPAC notation is retained

here). In the equation, xL is the smallest measure that can be detected with reasonable certainty for a

given analytical procedure, xbarbi is the mean of the blank measures, sbi is the standard deviation of the

blank measures, and k is a numerical factor chosen according to the confidence level desired.3

However, while the definition of LC is common across different application fields, the estimation

thereof shows striking differences between some, and the “k-factor” is one of the main reasons. For

example, Linnet4 used LC = xbarbi + Cn * z1-α * sbi (equation 3) while the classical IUPAC publication

2

uses LC = t1-α,ν * sbi (equation 4). In equation 3, Cn is a bias correction for sbi.5 Calculation of LC from 5

measurements (example in Reference 2) yields LC = xbarbi + 1.75 * sbi with equation 3 and LC = 2.13 *

sbi with equation 4, a striking difference for us. So, which of the k-factors is correct and why is xbarbi

dropped in the classical IUPAC publication? Further, we were particularly intrigued to uncover the logic

behind the substitution of z * σ0 with t * sbi in the IUPAC publication2 and what the statistical meaning

of the latter was. From our basic statistical education, two equations came into our mind, the one of the

confidence interval of a mean µ = xbarbi ± t1-α,ν * sbi/SQRT[n] (equation 5; SQRT = square root) and the

other of the prediction interval µ = xbarbi ± t1-α,ν * sbi/SQRT[1 + 1/n] (equation 6). Substituting n in

equation 5 with 1 and infinite in equation 6 would lead to t * sbi in both cases. However, in the first case

sbi cannot be calculated anymore, and in the latter case it would lead to the z-statistic. Anyway, we were

left with the question what t * s really addresses in statistical terms.

Page 5 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

6

Table 2: Equations used in the manuscript (consecutive order)

Number Equation Meaning

1 LC = µ + z1-α * σ0 Concept for LC

2 xL = xbarbi + k * sbi Generic experimental estimate for LC

3 LC = xbarbi + Cn * z1-α * sbi Tolerance interval concept for LC

4 LC = t1-α,ν * sbi IUPAC concept for LC

5 µ = xbarbi ± t1-α,ν * sbi/SQRT[n] Confidence interval for a mean

6 µ = xbarbi ± t1-α,ν * sbi/SQRT[1 + 1/n] Prediction interval for the next result

Page 6 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

7

There also arose questions in connection with the confidence intervals calculated in both

concepts. IUPAC2 used those of the standard deviation, while Linnet

4 used those of a centile.

Unfortunately, Linnet4 gives a simplified formula

6 which underestimates the confidence interval of a

centile for low n. Note, the confidence interval of a centile is de facto a tolerance interval7, and indeed,

tolerance intervals are used for detection decisions in wastewater analysis.8 Because the above, we used

a tabulated value for a one-sided tolerance interval in the calculation below (k = 4.21, 1-sided 95%

confidence and coverage).8 Calculation of the upper limit (UL) of LC from 5 measurements gives ULLC

= xbarbi + 4.21 * sbi with the tolerance interval and ULLC = 2.13 * (2.37 * sbi) = 5.06 * sbi with the

confidence interval of a standard deviation. Again, we are left with more questions than answers. What

is the statistical meaning of imposing the confidence interval of a standard deviation upon a t-statistic?

Why is the tolerance interval concept not addressed as such in certain fields of analysis? Why is it not

generally used? Why do different application fields not cross-reference each other?

Last but not least, it was stunning for us to read1 “Following promulgation (i.e., of Method 1631 B), a

lawsuit was filed challenging EPA on the validity of the method. The basis of the challenge included

several specific aspects of Method 1631 as well as the general procedures used to establish the MDL

(i.e., Method Detection Limit) and minimum level of quantitation (ML) published in the method”. This

happened in 1999, and to the best of our knowledge, all efforts since have not resulted in an agreement

about the procedure to be used for the MDL in the Clean Water Act. We conclude with our last

question: has the scientific community found Columbus's egg?: “Many labored to find the key to

accurately estimating XD (i.e., “Currie Detection Limit”) but there were too many false leads, statistical

errors, notational confusions and completely untested assumptions. With hindsight, it is obvious that the

non-central t distribution was lurking at the heart of the whole matter and it should have been unmasked

many years sooner”.9

Page 7 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

8

ACKNOWLEDGMENT

We thank Prof. Dr. Linda Thienpont for encouraging us to write this letter and devoting senior research

scientist time for its guidance. We thank Dr. Dietmar Stöckl for providing guidance to this letter and for

his patience for answering our questions.

Page 8 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960

9

REFERENCES

1 Revised assessment of detection and quantitation approaches. U.S. Environmental Protection

Agency (EPA): Washington, 2004 .

2 Currie, L.A. Pure & Appl. Chem. 1995, 67, 1699-1723.

3 International Union of Pure and Applied Chemistry Goldbook Home Page.

http://goldbook.iupac.org/index.html (accessed May 25, 2011).

4 Linnet, K. Clin. Chem. Lab. Med. 2005, 43, 394-399.

5 Gurland J.; Tripathi R.C. Amer. Stat. 1971, 25, 30-32.

6 Altman D.G. Practical statistics for medical research. Chapman & Hall: Boca Raton, 1997; pp 422.

7 Chakraborti S.; Li J. Amer. Stat. 2007, 61, 331-336.

8 Gibbons R.D. Statistical Methods for Groundwater Monitoring. John Wiley & Sons: New York,

1994.

9 Voigtman E.; Abraham K.T. Spectrochim. Acta B 2011, 66, 105-113.

Page 9 of 9

ACS Paragon Plus Environment

Analytical Chemistry

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960