STZ Datenanalyse
Steinbeis Transferzentrum
Prozesskontrolle und Datenanalyse
Reutlingen
 
Home
Wer wir sind
Leistungsangebot
Theorie
Datenanalyse
Versuchsplanung
Prozesskontrolle
Links
Impressum
Kontakt
 
Hauptkomponentenanalyse (PCA) Partial Least Squares Regression (PLS) Multivariate Curve Resolution (MCR)

Partial Least Squares Regression (PLS)


Die Partial Least Square Regression hat in den letzten Jahren sehr stark an Bedeutung gewonnen und ist zum fast ausschließlich verwendeten Regressionsalgorithmus für die multivariate Regression in der Chemie geworden. Vor allem in der Spektroskopie wird die PLS zur Kalibrierung von Eigenschaften aus Spektren verwendet.

Die Methode der PLS berechnet eine Regression von vielen unabhängigen x-Variablen auf eine oder mehrere y-Variablen. Der Unterschied zur Multilinearen Regression ist der, dass die x-Variablen hoch korreliert und interkorreliert sein dürfen, dass es viel mehr x-Variable als Objekte geben darf und trotzdem die Regression gerechnet werden kann.

Auch bei der PLS Regression werden die X-Daten in die Matrizen T und P zerlegt, wie bei der PCA. Allerdings wird bei der Zerlegung in die Hauptkomponenten für die X-Daten die Zielgröße y schon mit einbezogen.

Man hat auf der einen Seite die Datenmatrix X, die mit Hilfe der PCA in die beiden Matrizen
P (Faktormatrix) und T (Scoremetrix) zerlegt wird:

Auf der anderen Seite hat man die Zielgrößenmatrix Y, die auch nur aus einem einzigen Vektor bestehen kann. Hat diese Y-Matrix mehr als 1 Vektor, so macht man auch hier eine PCA und erhält die Faktormatrix Q mit der zugehörigen Scorematrix U:

Bei der PLS werden nun diese beiden Datenräume X und Y miteinander verbunden und zwar durch die Scorevektoren s und u. Für die Berechnung des ersten Faktors P1 im X-Datenraum wird der Y-Vektor mit der größten Varianz gewählt und für t1 eingesetzt. Mit diesem Anfangswert für für t1 wird die erste Schätzung für den Faktor P1 berechnet. Nach einigen Normierungen wird dann aus dem Faktor P1 wieder der zugehörige Scorevektor t1 berechnet und dieser wird nun als Ausgangswert für die Berechnung der PCA auf der Y-Seite genommen. Auf diese Art und Weise spielt der Algorithmus für die PLS die neu berechenten Scorevektoren immer wieder von der X-Seite auf die Y-Seite und berechnet damit Hauptkomponenten für die X-Daten, bei denen die Struktur der Y-Daten berücksichtigt ist.

Mit Hilfe des berechneten PLS-Kalibriermodels kann dann aus den gemessenen X-Werten die Zielgröße Y für unbekannte Objekte bestimmt werden.


© W.Kessler - Home