Elektronisches rechnen in der analytischen chemie—III1

Elektronisches rechnen in der analytischen chemie—III1

E~KTR~N~SCHES RECHNEN IN DER ANALYTISCHEN CHEMIE-III” ALGOGPROZEDUREN ZUR KORRELATIONSRECHNUNG G. GOITSC~LK OSRAM Studiengesellschaft Berlin, T&n&he...

1MB Sizes 27 Downloads 71 Views

E~KTR~N~SCHES RECHNEN IN DER ANALYTISCHEN CHEMIE-III” ALGOGPROZEDUREN

ZUR KORRELATIONSRECHNUNG

G. GOITSC~LK OSRAM Studiengesellschaft Berlin, T&n&he 1 Berlin 10, Hehnhottzstr.

Universitiit,

2-9, Berlin

fEiripegazgea 7 M&r 1967. ~~orn~~~

30

April

1967)

der Dateureihen im Rahmen vorgegebener Korrela~~e~~~ tionsfunktionen sind dumb die mathematisch-statistische Auswertemethode der Korre~atiomrechnung iiberpriifbar. Im folgeuden werden die mathematische Struktur der erforderlichen Re&erturozesse beschrieben und in der problemorientierten Sprache AL&L aIs universell verwendbare Prozeduren (LJnterprogramme) KORR und TEST formuliert. *Es wird gezeigt, dab derartige Universal-Prozeduren SCHWARZE K&TEN im Sinne der kybemetischen TerminoXogie darstellen, die als Bausteine ohne Kenntnis des mathematisehen Inhaites verwendet werden kbmren. Das Schreiben eines Rahmenprogrammes f&r speziehe Problemstelhmgen wird dadurch so wesentfich vereinfacht, da!J dies nach kurzer S&dung such ohne mathemat&he Vorbi~d~~ einwandfrei durchgefm werden kamr. An einem prak#is&en Be&spiel wird demonstriert, wie insgesamt 6 Korrelationsan&tze und 9 Vergleiche vou Ko~e~~o~k~ienten programmiert und in 9 min eIektrouisch ausgewertet werden. Der Zeitbedarf bei konventioneher Rechentechnik ist mehr als lOO-fach gr&%r. WESENTLICHE

VERWENDETE (ALGOL-SYMBOLE

BEGRIFFE UND IN KLAMMERN)

Gewtanzahl parallel ermittelter Mefldaten Llrufzahl fiir EinzelgriiBen Formaler Hauptparameter der Regressionsgeraden Formaler Nebenparameter der Regressionsgeraden Konstantes Glied der Regressionsgeraden (formal) Steigung der Re~e~~ion~ge~de~ (formal) Ko~lation~oe~ent Bes~~~~t~rna~ PtiifgriSBe fiir Realit% und Straffheit Standardabweichung in Y-Einhet’ten Mittlerer Fehler von [Uj Mittlerer Fehler van [v] t-Werte der t-Verteilung (tl, t,, r,) Boole’sche Variable (Yl , V2, V3) PriifgriiOe zum Vergleich van Korrelationskoefiienten Weitere GraBen sind im Text eindeutig definiert. * TeiI I--I%&R&z~ f967 34,361, T&I II-ZI&n#u, 1967. 13i5

SYMBGLE

n

(N)

i

(1)

Y

(Y) (8 of)

r;; tu rx3r r&4? or &J I?SV

tz @) (TAU) (SK) (=) cw

t

U-1

V 4

(v-1 (L)

1316

G. GEINFUHRUNG

Problemsteilung Liegen ftir n gleichartige Objekte oder Vorgiinge chemische, -physikalische oder sonstige variable MerkmalsgrGBen vor, so bildet der ,eindeutige Nachweis eines Zusammenhanges-einer KORRELATION-zwischen den einzelnen Merkmalen oft die Basis wertvoller neuer Erkenntnisse. Im einfachsten Falle wird eine Korrelation zwischem einem Hauptmerkmal mit n MerkmalsgrbDen yi und einem Nebenmerkmal mit n Merkmalsgriihen xi hinsichtlich Realtitiit und Straffheit zu beurteilen sein, wobei eine gee&net erscheinende Korrelationsfunktion y = F(x) vorzugeben ist. Bei mehreren Nebenmerkmalen resultiert als Korrelationsfunktion : x(l),, x(2),, * - * ,4%, * * * y = qm,

m,

***,

44, * * .)

(1)

Die einfachste Form der korrelativen Datenauswertung ist die EINFACHE LINEARE KORRELATIONSRECHNUNG bei der die GrGSen des Hauptmerkmals und des Nebenmerkmals bzw. der Nebenmerkmale zunlchst durch Substitution so umgeformt werden miissen, daB eine Linearfunktion (REGRESSIONSGERADE) Y=[u1+[v1*x (2) erhalten wird. Sowohl fur die ,,formalen Parameter“ Y als such fur X k&men beliebige Funktionen der ,,aktuellen Parameter“ y, x oder y, x(l), x(2), . . . , x(J), . . . eingesetzt werden, wie z.B. fur Y: In y oder sin y oder y2 oder y/x oder y * I& fur X: e-’ oder ln(1 + Xs) oder x( 1) - x(2) oder cos Weitere Beispiele siehe Gottschalk. l Bei mehreren Merkmalen besteht prinzipiell die Moglichkeit, die Auswertung des Datenmaterials durch eine MEHRFACHE LINEARE KORRELATIONSRECHNUNG zu erweitem und zu verfeinern. Hierauf wird in dieser Arbeit nicht eingegangen. Das Ziel einer Korrelationsrechnung ist zungchst die Em&lung der Korrelationsgriil3en r XY = Korrelationskoeilizient B = BestimmtheitsmaB 7r- - Prtifgri5Be fur Realitit und Straffheit der Korrelation Danach ist TVmit den Integralgrenzen

tl, fz, t, der f-Verteilung zu vergleichen.

Wird keine Korrelation (-rr < tr) gefunden, so entfallen weitere Rechmmgen. Bei zumindest wahrscheinlicher Korrelation (TV 2 tl) sind in einer weiteren Auswertungsstufe die RegressionsgrijBen [VI, [q = Konstanten der Regressionsgeraden [sg] = Standardabweichung in Y-Einheiten [s,], [sv] = ,,mittlerer“ Fehler von [u bzw. [u zu berechnen.

Elektronisches Rechnen in der amlytischen ChwnibIII

1317

Unterschiede in den Korrelationskoefhzienten ftir Funktionen, die gleichartige Objekte oder Vorgbge mathematisch beschreiben sollen, kiimren tiber den I-TEST beurteilt werden. Es mul3 hier ausdriicklich darauf hingewiesen werdan, dal3 der formal gesicherte Nachweis einer Korrelation -keinesfalls besagt, daB der durch die vorgegebene Korrelationsfunktion beschriebene Zusammenhang von GriiBen in jedem Falle sinnvoll ist. Eine sinnlose Ausgangs-Fragestellung-etwa nach dem Zusammenhang zwischen dem stindlichen Wasserverbrauch und der Zahl der stiindlich eingehenden Analysenproben in einem Laboratorium-erhtit nicht daduruh einen Sinn, da13vielleicht formal mathematisch ein Zusammenhang nachweisbar ist. Bevor man eine oder mehrere Korrelationsfunktionen aufstellt und rechnerisch verarbeitet, mul3 sehr sorgfaltig geprtift werden, ob eine log&he Verkniipfung iiberhaupt vorhanden oder zumindest denkbar ist. Bei zeit- oder mengensynchronen MeDdaten an EINEM Objekt oder Vorgang kann dies jedoch fast immer vorausgesetzt werden. Ein anderes Problem stellt die Authndung einer optimalen Korrelationsfunktion dar. Unter einer Reihe rechnerisch verarbeiteter Funktionsansatze zeichnet sich die Optimalfunktion dadurch aus, da8 sie Mt)GLICHST EXNFACH ist und unter Zihnlichen AnsHtzen den hochsten Korrelationskoefhzienten rxy und damit such die kleinste Standardabweichung [sg] besitzt. Die Verbal-Aussage ,,einfach“ bedeutet eine Dateninterpretation durch Funktionen mit einer kleinen Anzahl k an Funktionskonstanten, d.h. einem grol3en Freiheitsgrad f = n - k. Dariiber hinaus ist der wissenschaftliche Erkenntniswert eines Ansatzes hiiufig erst dann ausreichend belegt, wenn er aus bekannten, chemischen, physikalischen oder sonstigen Gesetzen synthetisch aufgebaut oder abgeleitet werden kann. Die Durchfiihrung von Korrelationsrechnungen fur eine Vielzahl denktheoretisch miiglicher Funktionen ist bei Anwendung konventioneller Rechenmethoden eine zeitraubende und fehleranfage Routinearbeit, die mit Recht gescheut wird, da sic das schijpferisch wissenschaftliche Arbeiten fur Tage oder sogar Wochen blockiert. Im folgenden wird gezeigt, daB es neuartige Programmier- und Rechentechniken im Rahmen der elektronischen Informationsverarbeitung gibt, die in wenigen Minuten zu zuverlIssigen Resultaten und Urteilen ffihren.

EIektronische ,Datenverarbeitung Wie in den Arbeiten I (ModelIanalysen)a und II (Varianzanalyse)s werden nachfolgend die Programme in der problemorientierten Sprache ALGOL (ALGO-rithmic L-anguage) unter Verwendung’der fur das Codesystem ALCOR CCIT zulassigen Zeichen formuliert. Die formalen Parameter Y und X der Korrelationsfunktion (2) kdnnen, wie bereits ausgefiihrt wurde, beliebige arithmetische Ausdriicke aus parallel ermittelten MerkmalsgrBBen beinhalten. Bei n Datengruppen ist eine n-fache gleichartige Uberftihrung der ermittelten MeBdaten in Y- bzw. X-GriiBen erforderlich, was bei 5 verschiedenen Ans%zen von Korrelationsfunktionen immerhin die Durchftihrung von 5.n Rechenoperationen von oft komplizierter Natur bedeutet. Es w&e bei diesem Tatbestand umstindlich und zeitraubend, wenn fur jeden Korrelationsansatz ein spezielles Programm erstellt, erprobt und gerechnet werden mu&e. Hier bietet ALGOL mit den als PROZEDUR bezeichneten Unterprogrammen einen Ausweg. Eine Prozedur braucht nur einmalig mit FORMALEN PARAMETERN formuhert und

1318

G. GOTBCHALK

kann sodann nach Vereinbarung ineinem RAHMENPROGRAMM beliebig oft unter Ersatz der formalen dnrch AKTUELLE PARAMETERaufgerufen werden. Bei jedem Aufruf wird das formale mathematische Modell der Prozedur aktuell durchgerechnet. Die nachfolgend aufgeftihrte Prozedur TEST zum Vergleich von Korrelationskoeffizienten ist sehr einfach aufgebaut. Die entsprechende Vereinbarung begirmt mit ‘PROCEDURE’ TEST (Nl, N2, Rl, R2);. . . . Nach dem Vereinbarungs-Wortsymbol ‘PROCEDURE’ folgt der gewiihlte Prozedurname TEST und danach die in runde Klammern eingeschlossene Liste der formalen Parameter, die aus den Datenumfiingen n, = Nl und n, = N2 sowie aus den zugehiirigen Korrelationskoefhzienten r,(l) =Rl und r,(2) = R2 der zu vergleichenden Korrelationsansatze besteht. Der weitere Inhalt der Prozedur an Vereinbarungen und Anweisungen braucht hier nicht diskutiert zu werden. Sind nun in einem Rahmenprogramm 3 Korrelationsrechnungen mit Resultaten r n = Rll

aus

n,, = Nil

R12

aus

nr2 = N12

Daten

r, = R13

aus

qa=

Daten

r12 =

N13

Daten

erhalten worden, so geniigen zur Durchftihrung der (3 = 3 miiglichen Vergleiche rll mit r12, rll mit r13, r12 mit r13 lediglich die Aufrufe: TEST (Nil, N12, Rll, R12); TEST (NIL N13, Rll, R13); TEST (N12, N13, R12, R13); im Anweisungsteil des Rahmenprogrammes. Es liegt nahe, such die Korrelationsrechnung selbst als Prozedur zu formulieren, etwa mit den formalen Eingangsparametern n = N,X,Y,t, = Tl, t, = T2 und t, = T3 und dem fur Vergleiche beniitigten formalen Ausgangsparameter rxy = R. In einer gewohnlichen Prozedur waren X und Y als FeIder zu vereinbaren, da sie stellvertretend fur jeweils n GriiBen mit der Laufzahl i = I = 1 bis IEstehen. Durch eine von dem danischem Mathematiker Jensen endeckte und an einfachen Beispielen beschriebene Variante der ALGOL-Prozedur wird es jedoch moglich, X und Y als gewiihnliche Variable einzufiihren, wenn zusatzlich die Laufzahl i = I als formaler Parameter aufgelistet wird. Die Vereinbarung einer Jensen-Prozedur beginnt mit ‘PROCEDURE’

KORR (N, I, Y, X, Tl, T2, T3, R);.. . .

Im Gegensatz zur gewohnlichen Prozedur mit X- und Y-Feldern, dtirfen in der Jensen-Prozedur die X- und Y-Variablen in Aufrufen durch arithmetische Ausdrticke ersetzt werden, die mit aktuellen FeldgriiBen formuliert sind. Damit kijnnen beliebige Korrelationsansatze unmittelbar in Prozeduraufruf realisiert und spezielle Substitutionsrechnungen im Rahmenprogramm erspart werden. MGgliche Zusammenhange z.B. zwischen einer Konzentration C und MeBgrSBe W mit AnsPtzen C = [Al] + [Bl] . F@ C = [A21 . W + [B2] . W2 C =

[A31 + [B3] . exp (&W)

umgeformt zu

;

= [A21 + [B2]. W

den aktuelleri Feld~~~e~ CD] und Wp] im R~~pr~~a~ als R~he~an~isungen

lassen sich tit

direkt

KURR (N, I, CfI], W[I] x Wfl], Tl, T2, T3, T4, RI); KORR (N, I, C[I]/W[I], W[I], Tl, T2, T?, T4, R2); KORR (N, I, C[I]$ EXP (W[I]/2), Tl, T2, T3, T4, R3); aufrufen, Im Sinne der kybernetischen Terminologie stellen die Prozeduren SCIIWARZE K;diSTEN (black boxes) dar. Es sind dies in sich geschlossene universelle Bausteine, die innerhalb eines Rahmensprogrammes beliebig oft verwendet werden k&men und zwar such von soIchen ~itar~~te~, die den im Inneren des Schwarzen Kastens konservierten ~~erna~~he~ ~~h~smus gar ni&t verstehen oder bereits wieder vergesgen ha&en, Mit wenigen genau festg&egten aktuellen ~I~GANG~I~o~tianen werden automatisch ganz bestimmte vorher bekannte akwelle AUSGANGSInformationen erhalten. Dieser rein0 I~~~O~~UT-~oze~ unterscheidet sich [email protected] nicht von der selbstverst%ulIichen Bedienung zahheicher schwarzer K&&en, die die technische Entwi&lung uns zur Verfi.igung gestellt hat. Auch bei Gebrauch etwa eines Radioapparates wird ein Input in Form des Einschaltens, der Senderwahl sowie der Lautstlrke- und TonhZjheneinstellung nacb einem uns zumeist nnbekannten Mechanismus in ein Output von TGnen oder SpraGhsendungen umgesetxt,, wobei der Benutzer es als b6chst abesaiissig erachtet, vorher das kompiizierte S&&schema und die physikalischen Grundlagen des Sende- und Empfangprozesses versteben zu w0Ik-n. Die a~rord~~i~hen VorteiIe einer sol&n Auswe~et~h~ik ~s~~tli~h Ei~a~bbei~ S&hnell~gkeit und ~~v~rl~~igkeit braucben aicht besonders hervorgehoben zu werden. Nach diesem I%intip konnen bestimmte Wissenskomplexe, wie matbematische Modelle, vom Facbspezialisten optimal programmiert und danach mit einem Minimum an Vorbildung von Wissenschaftlern und Wilfskr~ften anderer Fachgebiete als geschlossene Bau.usteineverwendet werden. Die Prozeduren KORR und TEST sind universelle matthematische Modelle, die ein Biologe, Soziologe, Betriebswirtschaftler oder ein beliebig anderer Fachwissenschaftler ebenso wie ein Chemiker anwenden kann. Speziell ist allein die jeweilige Problemstellung und das danach gestaltete zumeist sehr einfache Rahmenprogramm. Zu~~~enfassend zeigen die Abb. f und 2 nochmals wesentliche TeiIe der vorstehenden ~d~keng~~. ~AT~~~~~~~~~~

STRU5CTUB

~r~~d~~~~~~md Farfmzm Der Rechengang beginnt mit einer einfachen Summierung der formalen Parameter X und Y, die entsprechend den Funktionsans&en aus den primiiren Eingangsgri%en yII xl gebildet werden. Mit den formalen Mittelwerten 8 und F werden danach die n Abweichungen X - X und Y - P gebildet und zu varianzlhnlichen Ausdriicken lCX$VP und YXY aufsummiert. Tabelle 1 gibt unter m und a eine Zusammenstellung deer Rechenprozesse. Man beachte, daB X nnd Y keine einfacben Variablen, sondern Felder (Vektoren) aus jeweils n ~in~l~r~#en bzw* n Kombi~~~o~n aus mehreren ~~~~el~~~~ sind.

1320

G. GOTISCHALK

Dotenumfong Laufzahl Houptmerkmalsgrijl7en (arithmetircher Ausdruck ) NebenmerkmalsgrSOen (arithmetischer Ausdruck) Statistische GroGen (t-Werte)

EINGANGS -1NFORMATIONEN ( INPUT )

PROZEDUR KORR (BLACK BOX )

KorrelationsgroDen (dovon Korrelationskoeffizient ouch gespeichert ) Regressionsgr6l3en ( Bedingte Ausgobe ) Verbalurteile ABB.

l.-INPUT/OUTPUT-System

\\

AUSGANGS-INFDR+tATIONEN (OUTPUT )

der Prozedur KORR.

RAHMENPROGRAMM

Vereinbarungsteil

(Oecloroticns)

1

Rahme~rogrammicrung I

mit fofmakn F%ametefn

&?E!K

nit bnmahn Paramctern

Anweisungstcil .

(Statements)

Rahmmprogrammiuung



ipq

llRMiRI llRDRRl l lTRTl . ..m

l ‘=

. . .

Aufruf nU;taktuellen Parametern I Aufruf mit aktuellen Parametern 1 Aufruf mi? a&fuel/en Porametern lU Aufruf zum Vergleich der r-Werte von I/X Aufruf zum Vergleich der r - Werte von I@ Aufruf zum Vergleich der r- Werte von X/I1

/ ABB.

2.-Programm-Schema zur Durchftihrung von Korrelationsrechnungen Vergleichen fIir 3 Korrelationsfunktionen.

und r-

1321

Elektronisches Rechaen in der anaIytischen Chemie-III mm DER LKNEUEN ~0~~~~~ DXUCKTESYMBOLII = ~GO~~~N)

TABELLFY I.-MA~~

GrundgraPen

1

(Fm

aB_

VZUiarrUm

21

Sl=;$X=X

Vx = (n - 2) * St%= 5 s4 x s4 1

d$Y=Y W=(n-2)*sy4S5XS5

1

S3 +., S#=x--x=x-s1

vxY=(il-2).s~,+xSS

1

S5=Y-T=Y-s2

3i

Korrelationsgri%en Korrelationskoefnt:

R = r,, = ~=VXYp%XXW

Bestimmtheitsrnr&: B = rxua = VXY x VXY/(VX x VY) Priifgr@e: TAU = vr = I/(N - 2) x B/(1 - B) RegressionsgMJen

I

erechnung erfolgt nur fiir 7; 2 tl* (VI WAH.R) Konstanten:

V = Iv1 = 5

=?‘XY/VX

SK = [sd = S, * 4l-B

.bweich~~n:

SV = [sv] = jV(/TAU

= %b’

und

Vergleiche mit t-Werten der t-Verteihmg fiir f = n - 2 tmd den Sicherheiten S = 95 % : Tl = tl S=99%: Tz==t# s = 9!49%: T3 = t* Vl

WAHR NIGHT WAHR MCHT

fiir 7~ Z tl fiir rr < tl fiir Tr 2 tr

V2 WAHR WAHR

V3 WAHR NICHT WAHR

U=~]=~--~].W=S~-VXS~ X (1 - B)/(N -

2)

SU - [s,] = SV x v’s 6

Boole’sche Vqiable

5

und

Urteile

Wenn Vl nicht wahr: KEIElE KORRELATION

NACH%%ISBAR

Wenn V2 nicht wahr UND V1 w&r: KORRELATION NUR WAHRSC~ICH Wenn V3 nicht wahr UND V2 w&r: KORRELATION SIGNINACHGE~EN

fiir 7r < t*

wenn v3 wahr:

fiir 7-r1 t*

KORRELATION HOCHSIGMFIKANT NACHGEWIESEN

fiir

7r c

t8

KorrelationsgriiI3en und RegressionsgrlH3en Aus den Varianzen folgen umnittelbar der KorrelationskoeBMent r_,, Besti~theitsmafi 3 und die PrQfgrMe T? nach den Rechenformeln, die in a Tab. 1 aufgefiihrt sind. sofern iiberhaupt eine Korrelation nachweisbar ist, werden die Konstanten und [v] der Re~~sionsgeraden (2) und die Abwei~hungen [sgf, IQ,], [+] nach

das der [v] da

1322

G. Gm

Formeln in @ der Tab.‘1 berechnet, die aus dem Minimumsansatz ++[l’].X-

Y)B=$a=MINIMUM

abgeleitet werden konnen.

Einzelheiten siehe Gottscha1k.l

Boole’sche Variable und Urteile

Der numerische Wert der PrtifgrijBe 7r wird mit Werten t der t-Verteilung verg&hen, wobei diese Vergleiche durch Zuordnung Boole’scher Variabler in einfache JA/NEIN- oder WAHR/NICHT WAHR-Entscheidungen tiberfiihrt werden k6nnen. Zur Beurteilung der Realitgt und Straffheit des Zusammenhanges ist es zweckm&Big, eine vierstufige Urteilsskala heranzuziehen, die sich aus Vergleichen von Tr mit den Werten t 1; t,; t, fiir Statistische Aussage-Sicherheiten S = 95; 99; 99,9x (level of significance 0,05; 0,Ol; 0,001) und dem Korrelationsfreiheitsgradf = n- 2 (2 Konstanten) ergeben. Die Integralgrenzen t der t-Verteilung sind in statistischen Tabellenwerken oder Lehrbtichem tabelliert. In qund qder Tab. I sind die Boole’schen Variablen und die Urteile formuliert, wghrend nachfolgende Skizze die ,,Wahrheitstafel“ zu qverdeutlicht.

Vl wahr

/--‘I

tt

v2 wahr

Vl nicht wahr

V2 nicht wahr

V3 nicht wahr

nicht nachweisbar

wahrscheinlich

signifikant

\

V3 wahr ‘ai hochsigdkant

Vergleich von Korrelationskoefizienten Zum Vergleich von 2 KorrelationskoetIizienten ist eine PriifgrSBe Ir zu bilden und mit den Integralgrenzen il der Normalverteilung fur die Statistischen Sicherheiten S = 95 ; 99 ; 99,9 % (level of significance 0,05 ; 0,Ol; 0,001) zu vergleichen. Fiir die Beurteilung der Unterschiede wird such hier eine vierstufige Urteilsskala definiert. Die Unterschieds-Wahrheitstafel hat die gleiche Struktur wie die KorrelationsWahrheitstafel. Einzelheiten der sehr einfachen mathematischen Struktur des &Testes sind der Abb. 5 zu entnehmen. Theoretisch kbnnen bei der Durchrechnung von cc Korrelationsfunktionen insgesamt

0 i

a.1

=2!(a

_ 2j! = G.

(a -

0.

verschiedene A-TESTS durchgefiihrt werden, sofern dies in jedem Fall sinnvoll erscheint. Ein zumindest wahrscheinlich gr6Berer Korrelationskoeflizient gibt dem betreffenden Funktionsansatz Prior%@ vor dem anderen Ansatz. Eine solche Prioritgt ist jedoch problematisch, wenn sie mit einer komplizierten oder gesetzmlt3ig nicht aufschliisselbaren Funktion erzielt wird. PROGRAMMIERUNG

FluBdiagramm

Abbildung 3 zeigt das vollst%ndige Ablaufschema der Prozedur Prozedur TEST ist so einfach, da13ein FluBdiagramm tiberfliissig ist.

KORR.

Die

Elektronisches

Rechnen in der analytischen

1323

Chemie-III

!OZEDUR.- KOPF

KORR

VEREINBARUNGEN IR

ist

Awgongymmmeterl I

PW

‘THEN’

Resultatausqobe REGRESSIONSGROSSEN: REGRESSlONYjRCjSSEN

Urte!lsou+qobe av

,‘///.wonr[/&p

-

KORRELATION NUR WAHRSCHEINLICH ORATION

I

SI~FIKANT

NACHGEW~~SEN KO~ELATI~ KANT

(Vt nicht

w&r)

KEINE

KORRELATION

[ ABB.

3.-FluPdiapmm

HOCHSIGNIFINACmiEWlESEN

der ALGOGProzedur

ENDE

I

1

KORR.

und Rahmenprogramm Abbildung 4 bringt die ALGOL-Fo~~e~g der Prozedur KORR, w&rend Abb. 5 die mathe~tische Struktur und die ALGOL-Fo~~ie~g der einfachen Prozedur TEST enth% Die Prozeduren sind erprobt turd brauchen von einem Benutzer mu- sorgfZltig abgeschrieben und an ein Rechenzentrum gegeben zu werden. Die zukiinftige Arbeit besteht im Schreiben eines Rahmenprogrammes, in das die Prozeduren durch Nennung ihres Kenn-Namens im Vereinbarungsteil eingefiihrt und durch Aufrufe im Anweisungsteil rechnerisch aktiviert werden. Die Schwarzen K&ten der beiden Prozeduren bestehen im ALGOL aus separaten Lochstreifen-Rollen (in SonderfZllen Lochkartenstapel), die im Gegensatz etwa zum RadiogerZit sehr schnell vervielfaltigt und an andere Interessenten weitergegeben werden kiinnen. Bei Schreiben des Datenstreifens mit aktuellen Daten ist lediglich zu beachten, da13die Reihenfolge der Daten mit der Reihenfolge in der Leseanweisung ~~re~st~t.

A LGOL-Prozedwen

~2

"qV'¢

'S. ~ ~

~C

Ld

g

Im falgenden wird die Erstellung eines speziellen Ra~enpro~a~es Beispiel gezeigt.

an einem

BEISPIEL In dem nac~olgend~u Beispiel werden nur die fiir die elektronische Datenverarbeitung erforderlichen Informationen angefiihrt. Einzelheiten zur Versuchsdurchftibrung und Folgenmg aus den Ergebnissen der Korrelationsrechmmg fiir die Ansiitze [l l] und [21] siehe Got&chalk” (Beispiel 9).

A~5or~ton§kurven fiir 0

und

0

G in Giomm C in mMotfmt

--c

1

tl

3

a

10.10-3

'Clj

X,00

‘*CZi h3B.

2S,OO &--4X

$62

20*10‘*

3040-J

GJ

lo,00

7,L6

6,SZ

5,X

2,63

$27

3,62

3,25

3,06

9,lO

7,lO

L,20

L,76

3,83

2,49

2,&O

2,S8

2,03

8,85

md C2 als Funktion von G (&u&e

E~~~~~Rfo~matione~~=

~r~~~e~~~~~l~ng

In jeweils 10 Un~rsu~hungen wurde die 3mnchbarkeit von 2 verschiedenen Adso~tions~tteln @ und Q wr selektiven Entfe~~g eines stiirenden Bes~dteiles aus einer Losung getestet. Hauptmerkmal

(vorgegeben)

= Menge G an Adso~tions~ttel MerkmalsgrZiOen yi. = G, = G[I]

@

bzw.

@

in

Gramm

Nebenmerkmal = Restkonzentration C in mMol/ml in der Losung nach detinierter (gefunden) Behandlung von Lbsungen mit der Anfangskonzentration C, = 2,50. IO-a mMol/ml. M~krn~sgr~~en fiir 0: x(l), = Ci, = Cl[I] 0: x(2), = c2, = CZ[I] Abb~dung 6 bringt die ~ap~sche 9

~arste~ung

und die Tabelle der ak~e~en Daten.

1326

G. GOTTSCEIALK

Bei Einbeziehung der Anfangsko~entration C, = Cl[l] = C2[1] liegen insgesamt n = N = 11 Daten mit i = I = 1,2,3, , . . , I1 fiir jede Merkmalsreihe vor. ‘BEGIN’ ‘REAL’ TI,TZ,T3, Rll,R12,R13,R21,R22,R23; ‘INTEGER’ I ; ‘ARRAY’ G , Cl ,C2 cl:11 1 ; (

Etnlese-STOP

durch

hrnrerchend

lunge

Folge

van WU-Zeicheo

_~ ‘PROCEDURE’

KORR

(N,I,Y,X,Tl,TZ

,T3,R);

‘PROCEDURE’

TEST

(Nl,N2,RI,RZ);

*

READ (Tl,TZ,T3); &FOR* I : z 1 ‘STEP’ WR,TE

(‘I<

WRITE

I

I

‘UNTIL’

11

KORRELATIDNSRECHNUNG,

(“<~cIlluG

‘DO’

READ

-

*

-

(G LIT,,

.

-

-

-

Cl CT>,

C2 CT3 1;

AOSORPTIONSPROBLEM,

Nail”);

=tUJ+LV3/CI*);

KORR (11,I,GCZ1,1/CI CIJIT1,T2,T3,RlI); (w<~CIZl?lG.tUl+~V~~~l.~l”); KORR (l1,I,GCIl,ClC13~ C1CIl,TI,T2,T31R1Zl; WRlTE(“<~t131~C1/G=CUl+tV~~Cl”); KORR (l1,I,CI~~l/GCll,CIC~l, TI,TZ,T3,R13); WRITE (“CL [211,!, G =LU~+LVl/C2”); KDRR (Il,I,GCIl,l/C2~I3,Tl,T3,R21);. WRITE (“4 5 ~22~1?G=CUl+tVlxCZ.C2’); KDRR (11‘1. GLIl,C2CIlxC2C17~ Tl,T2,T31R22); WR,TE (“& C23l?,C2/G =Ud+tV?rC2”); KORR (~~,I,CZ[IJ~GC~J, C2EI1, Tl,TZ,T3,RZ31; WRITE

WRITE WRITE WRITE WRITE WRITE WRITE WRITE WRITE WRITE WRITE ‘END’

(‘c t”< (*
RAHMENF

VERGLEICH u DER i .sR-WERTE “); 2 % R11 Y MiTuRlZ : “1; TEST (?1,11,R11.R12]: Rllu MITuR13 : “): TEST(II,11.R1I.R13); TESTLII,11,R12,R13); & TEST(11,11,R21,R22]; % TEST(Il.II,R2I,R23l; TEST(ll,ll,R22,R23); TEST(11,11,R11.R21); 2 & R12uMlTuRZZ:“j; TEST[ll,II,R12,R22): i$ R13,MITuRZ3:“); TEST(ll,1I.R13,R23); ‘RDGRAMM

ABB. 7.-ALGOL-Rahmenprogramm

des Beispieles.

Nach dem ~raphi~hen Bild ist ein nichtlinearer Z~a~enh~g zu erwarten. Die formale Korrelationsfunktion

zwischen G und C

sol1 ati folgende aktuelle Funktionen angewendet werden: Adsorptionsmittel

@

G[I] = [U] + fv] X (l/Cl[I])

mit Rll

[12] G[I] = [U] + [VI x Cl[If x Cl[I]

mit R12

[ll]

1131 Cl[I]/G[I]

= W] + TV] x

CWI

mit R13

Elektronisches

Adso~tions~ttel @

1327

Rechnen in der analytischen Chemie-III

mit R21

PI X (l/C4?1)

[21f

GfIl = [U] i-

[22]

Cl11 = WI + Prl x C4?1 x CW

mit R22

[23]

C2[Il/GtII = WI + lYl x CW1

mit R23

Die Beziehungen [13] und [23] lassen sich leicht in die Langmuir’sche Adsorptionsisotherme tiberfiihren. Durch Umformung folgt : C

G=[uJ+[yl*C-Co(Oberflachenkonzentration) Von den 15 m~~ichen Vergleichen der 6 Korrelationskoe~zienten sinnvoll und zwar:

sind 9 Vergleiche

RI1 mit R12

R21 mit R22

Rll mit R21

Rll mit R13

R21 mit R23

Rf2 mit R22

R12 mit R13

R22 mit R23

R13 mit R23

Als t-Werte entnimmt man fiirf == n - 2 = 9 den Tabellen: tr = Tl = 2,26

(95%)

t, = T2 = 3,25

(99%)

ta = T3 = 4,78

(99,9%)

ALGULRahmenprogramm

Im Rahmenprogramm

werdea namentlich nur die aktuellen GriilJen

Tl, T2, T3, Rll, R12, R13, R21, R22, R23, I, G[I], Cl[I], C2[1] vereinbart und soweit sie Eingangs-Informationen darstellen such eingelesen; n = N = 11 wird direkt numerisch eingesetzt. Abbildung 7 zeigt das Rahmenprogramm mit den einmaligen Prozedurvereinbarungen, den schriftlichen Erl&tterungen durch WRITE-Anweisungen und den insgesamt 15 Prozedura~~fen. Entspr~hend den formu~e~en ~seanweisungen sind die aktuellen Eingangsdaten in der Reihenfolge (t,*

b

83,

GI,

Cl,,

C2,,

G,,

Cl,, C2,, . . . G,r, cl,,,

c2,,

im Datenstreifen numerisch aufzulisten. Resultate, Urteile, Bearbeitungszeiten

Tabelle 2 gibt eine Zusammenstellung der gerundeten Resultate, wahrend Abb. 8 Anfang, Mittelteil und Ende des von einer Rechenanlage ZUSE 223 ausgedruckten Ergebnis-Bogens zeigt. Die Du~hrechnung des Beispieles erfolgte mit einer relativ

X328

-~

I

Korrelationsrechnungeen

I

FUNKTIQN

Vergleich der r,, - Werte

.

:*

TJNN = Untenchied nicht nachwcsisbar (VW) = Unterschled nur wahrachmlrch

US = Unterschied sign:nifihnt UHS = Unterschied hcrohsignifikant

1329

Elektrmisches Recbxa in der anaiytischen Chew&--m

Cl11

GdUJtCV3fCt

KClZf6ZLATK)NSGRfXSSEN: Pm .9971!6837 .996552370 fimES~~~~ssEN!

CVI .342673172,-1

- .136350679,~~ KUTiELA~ION a .

w rSS693647l~p2

HOCHSIGNIFIKANT

CSKl .166044887

CSUl .I27559011

ISVI . 615282334m~3

csu3 . 14656?m,o16

ISVI * r6mson~,~,lz

NACIXXWIESEN

l

C2.a

l

CZ/G=rUltEV3xC2

f-tEGEss-EN: WI -.5095961t9m10

EV3 .115487(194~13

KORRELATION HOCHSIGNIFIKANT

VERGLEICH

tSKJ . 336706416mD

~

N&XXWlE%N

CER R-WERTE

fangsamen Klein-Rechenanlage wurden :

ZUSE 223, wobei folgende Kenng&Sen

Angezeigte Rechenbefeble im Befehlsregister fiir das Gesamtprogramm: Einlesen der Prozedur KORR : 1 min 40 set .. Einlesen der Prozedur TEST 43 SW Einlesen des Rahmenprogrammes : 2 min 53 set PRGG~M-~~ESE~IT

PEZ

Daten-Eintesezeit DEZ Recbenzeit ~Sch~eB-Loeher-Aus~a~)

BLEKTRONISCHE GESAMTZEIT

:5min RZ

BEARBEITUNGSZEIT

fiir das Beispiei

ermittelt 1 508

16.%x

**

16sec

: 3 min

26 set

EBZ: 3 min

42 set

: 8min

58sec

fb&IXrektausgabe aber 9 min 44 set)

F& die volIst&xdige Durchrechmmg und Beurteitung van mu einer der 6 Korrelatio~sf~o~~ werden xmr etwa 30 set RZ be&%@. Die Ausgabe 6ber

1330

G. GO-K

Schnell-Lo~her liefert einen Ergebnis-Lochstr~~en, der mit jedem AL~~S~hreiber beliebig oft in ~a~h~ft-3~gen nach Abb, 8 umgesetzt werden kann. Die Umsetz~gszeit betr@t 5 min 42 sec. Dieses Vorgehen bietet gegenuber der langsamen direkten ~ars~hr~t-Ausga~ den Vorteil einen wesentlichen Verktirzung der MaschinenBelegungszeit, da in der Z23-A&age die Rechenprozesse w%hrend des Druckvorganges unterbrochen werden.

0

0‘0033

0*0050

0,0100

h~.

Anfmgsltonzantration Co = 0,025 mMoL/ml

C

(in

f/C-Teilung

0,002s

oIoe2a

f

P-Regressionsgeraden und MeBpunkte.

Bei koaventioneller Rechentechnik mit Tischrechnern benijtigt such ein geiibter menschlicher Rechner fiir das Beispiel mindestens 15 Stunden = 900 min (2 bis 3 Arbeitstage) zu einer gleichartigen Durchrechnung und Urteilsbildung, was einem Zeitfaktor eon iiber 100 entspricht. Es sei erwahnt, da13 bereits mit neueren mittelgrofien Rechenanfagen die Gesamtzeit durchaus auf weniger als 1 min vermindert werden kann.

Elektronisches Recbnen in der analytischen Chemie-III

1331

~~kus~~on der Er~~b~~~e Die aktuellen Daten werden am besten durch die st~k~~l~ tionen [Ill und [21] G-[v]+E

~eicha~igen

Funk-

C

beschrieben, wobei die Standardabweichung in G bei [ll] mit [sx] = f0,19 g wesentlich kleiner als bei [21] mit [sx] = f0,83 g ist. Die Konstante [PJ (Steigung der Regressionsgeraden) stellt ein MaB des AdsorptionsvermiSgens A dar. A ist umso griil3er je kleiner [v] ist. 1 in g’. (mMol~~)-l A=[VI Im vorliegenden Beispiel besitzt das Adso~tions~ttel @I mit A2 = 46,5 em hiiheres Absorptionsvermiigen als @ mit A2 = 29,2. Wegen der in [.rx] erkennbaren sehr vie1 grijBeren ,,Dosier-Streuung” von @ gegentiber @ wird man aber dem Adsorptionsmittel @ wegen ,,besserer GIeichm&Qkeit“ zumeist den Vorzug geben. Der Vergleich von Rll mit R21 ergibt, da13 das Datenmaterial von @ signifikant besser als dasjenige von @ korreliert ist. Abbildung 9 zeigt im l/C; G-Diagramm die beiden Regressionsgeraden und die gefundenen Mehpunkte. Fur die Funktionen [12] und [22] vom Typ

ist eine Korrelation nur wahrscheinlich. Wie such die extrem grohen Standardabweichungen [.rx] zeigen, sind sie ~g~i~et zur Inte~re~tion des vor~egenden Datemnaterials. Die Unterschiede von Rl 1 zu RI2 bzw. von R21 zu R22 sind zudem hochsignifikant. Die Langmuir-5hnlichen Funktionen [13] und [23] vom Typ C

yj=

[cq+[vl*c

bzw. umgeformt

C G=[ul+[YIC

ergeben zwar eine signifikante bzw. hochsign$kante Korrelation, besitzen aber gegentiber den Funktionen [ll] und [21] einen kleineren KorrelationskoeBtizienten. Zwischen Rll und R13 ist der Unterschied hochsignifikant, w&rend zwischen R21 und R23 ein solcher nicht nachweisbar ist. Auf weitere Analysen der Auswertungsergebnisse kann hier nicht eingegangen werden. Die Ergebnisse der Korrelationsrechnngen bilden die Planungs~ndlage fur weitere gezielte Untersuchungen. Die sodann anf~lenden Resultate werden zweckm~~ig nach verfeinerten Methoden, insbesondere Ausgleichsrechnungen, aufgeschliisselt, wie in nachfolgenden Arbeiten gezeigt werden solI. Summary-The variable experimental parameters for similar objects or processes can be connected by means of relationships that in the first instance may be unknown. The reality and rigour of the connection of data series in the framework of given correlation functions can be checked by the statistical metbods of interpreting correlations. In this paper the mathematical details of the necessary calculations are given and formulated in ALGOL lauguage as universally applicable subprogramme procedures called KORR and TEST. It is shown that such universal procedures correspond to “black boxes” in cybernetic te~inolo~, and can be used as building blocks, without knowledge

1332

G.

GOTWHALK

of their mathematical content. The writing of an overall programme for special problems is thereby so essentially simplified that it can be done satisfactorily after a short training without a mathematical background. As a practical example, 6 correlation equations and 9 sets of correlation coefficients can be programmed and solved electronically in 9 min. The time taken by conventional methods is 100 times as great. R&m&-On peut relier les parametres exp&imentaux variables pour des objets ou des proc&Zs similaires au moyen de relations qui, en premiere instance, peuvent &re inconnues. La &lit6 et la rigueur de la liaison entre des series de dom&s dans le cadre de fonctions de correlation dontrees peuvent &re control&s par les methodes statistiques d’interpretation de correlations. Dans ce m&moire on donne les details mathematiques des calculs nec-essaires, et les formule en langage ALGOL a Mat de techniques de sub-programme universellement applicables, appelQs KORR et TEST. On montre que de telles techniques universelles correspondent aux “boites no@.” en terminologie cybemetique et peuvent &re utilisQs comme des blocs de construction, sans connaissance de leur contenu mathematique. L%criture d’un programme global pour des problemes sp&ciaux est de ce fait tellement simpliifiee qu’elle peut dtre faite de facon satisfaisante aprb un court entralnement sans un fond de connaissances mathematiques. A titre d’exemple pratique, 6 equations de correlation et 9 ensembles de coefficients de correlation peuvent 2tre programmes et r6solus Blectroniquement en 9 mn. Le temps necessitt par les m&odes ordinaires est 100 fois plus long. LITERATUR 1. G. Gottschalk, Einftihrung in die Grundlagen der chemischen Materialpriijiing. Hirzel-Verlag, Stuttgart, 1966. 2. Idem, Tahmta, 1967,14, 61. 3. Zdem, fbid., 1967, 14,361. 4. E. W. Dijkstra, EIektronische Datenoerarbeitung, Beiheft 2, S41/43, Verlag Vieweg, 1961.