E~KTR~N~SCHES RECHNEN IN DER ANALYTISCHEN CHEMIE-III” ALGOGPROZEDUREN
ZUR KORRELATIONSRECHNUNG
G. GOITSC~LK OSRAM Studiengesellschaft Berlin, T&n&he 1 Berlin 10, Hehnhottzstr.
Universitiit,
2-9, Berlin
fEiripegazgea 7 M&r 1967. ~~orn~~~
30
April
1967)
der Dateureihen im Rahmen vorgegebener Korrela~~e~~~ tionsfunktionen sind dumb die mathematisch-statistische Auswertemethode der Korre~atiomrechnung iiberpriifbar. Im folgeuden werden die mathematische Struktur der erforderlichen Re&erturozesse beschrieben und in der problemorientierten Sprache AL&L aIs universell verwendbare Prozeduren (LJnterprogramme) KORR und TEST formuliert. *Es wird gezeigt, dab derartige Universal-Prozeduren SCHWARZE K&TEN im Sinne der kybemetischen TerminoXogie darstellen, die als Bausteine ohne Kenntnis des mathematisehen Inhaites verwendet werden kbmren. Das Schreiben eines Rahmenprogrammes f&r speziehe Problemstelhmgen wird dadurch so wesentfich vereinfacht, da!J dies nach kurzer S&dung such ohne mathemat&he Vorbi~d~~ einwandfrei durchgefm werden kamr. An einem prak#is&en Be&spiel wird demonstriert, wie insgesamt 6 Korrelationsan&tze und 9 Vergleiche vou Ko~e~~o~k~ienten programmiert und in 9 min eIektrouisch ausgewertet werden. Der Zeitbedarf bei konventioneher Rechentechnik ist mehr als lOO-fach gr&%r. WESENTLICHE
VERWENDETE (ALGOL-SYMBOLE
BEGRIFFE UND IN KLAMMERN)
Gewtanzahl parallel ermittelter Mefldaten Llrufzahl fiir EinzelgriiBen Formaler Hauptparameter der Regressionsgeraden Formaler Nebenparameter der Regressionsgeraden Konstantes Glied der Regressionsgeraden (formal) Steigung der Re~e~~ion~ge~de~ (formal) Ko~lation~oe~ent Bes~~~~t~rna~ PtiifgriSBe fiir Realit% und Straffheit Standardabweichung in Y-Einhet’ten Mittlerer Fehler von [Uj Mittlerer Fehler van [v] t-Werte der t-Verteilung (tl, t,, r,) Boole’sche Variable (Yl , V2, V3) PriifgriiOe zum Vergleich van Korrelationskoefiienten Weitere GraBen sind im Text eindeutig definiert. * TeiI I--I%&R&z~ f967 34,361, T&I II-ZI&n#u, 1967. 13i5
SYMBGLE
n
(N)
i
(1)
Y
(Y) (8 of)
r;; tu rx3r r&4? or &J I?SV
tz @) (TAU) (SK) (=) cw
t
U-1
V 4
(v-1 (L)
1316
G. GEINFUHRUNG
Problemsteilung Liegen ftir n gleichartige Objekte oder Vorgiinge chemische, -physikalische oder sonstige variable MerkmalsgrGBen vor, so bildet der ,eindeutige Nachweis eines Zusammenhanges-einer KORRELATION-zwischen den einzelnen Merkmalen oft die Basis wertvoller neuer Erkenntnisse. Im einfachsten Falle wird eine Korrelation zwischem einem Hauptmerkmal mit n MerkmalsgrbDen yi und einem Nebenmerkmal mit n Merkmalsgriihen xi hinsichtlich Realtitiit und Straffheit zu beurteilen sein, wobei eine gee&net erscheinende Korrelationsfunktion y = F(x) vorzugeben ist. Bei mehreren Nebenmerkmalen resultiert als Korrelationsfunktion : x(l),, x(2),, * - * ,4%, * * * y = qm,
m,
***,
44, * * .)
(1)
Die einfachste Form der korrelativen Datenauswertung ist die EINFACHE LINEARE KORRELATIONSRECHNUNG bei der die GrGSen des Hauptmerkmals und des Nebenmerkmals bzw. der Nebenmerkmale zunlchst durch Substitution so umgeformt werden miissen, daB eine Linearfunktion (REGRESSIONSGERADE) Y=[u1+[v1*x (2) erhalten wird. Sowohl fur die ,,formalen Parameter“ Y als such fur X k&men beliebige Funktionen der ,,aktuellen Parameter“ y, x oder y, x(l), x(2), . . . , x(J), . . . eingesetzt werden, wie z.B. fur Y: In y oder sin y oder y2 oder y/x oder y * I& fur X: e-’ oder ln(1 + Xs) oder x( 1) - x(2) oder cos Weitere Beispiele siehe Gottschalk. l Bei mehreren Merkmalen besteht prinzipiell die Moglichkeit, die Auswertung des Datenmaterials durch eine MEHRFACHE LINEARE KORRELATIONSRECHNUNG zu erweitem und zu verfeinern. Hierauf wird in dieser Arbeit nicht eingegangen. Das Ziel einer Korrelationsrechnung ist zungchst die Em&lung der Korrelationsgriil3en r XY = Korrelationskoeilizient B = BestimmtheitsmaB 7r- - Prtifgri5Be fur Realitit und Straffheit der Korrelation Danach ist TVmit den Integralgrenzen
tl, fz, t, der f-Verteilung zu vergleichen.
Wird keine Korrelation (-rr < tr) gefunden, so entfallen weitere Rechmmgen. Bei zumindest wahrscheinlicher Korrelation (TV 2 tl) sind in einer weiteren Auswertungsstufe die RegressionsgrijBen [VI, [q = Konstanten der Regressionsgeraden [sg] = Standardabweichung in Y-Einheiten [s,], [sv] = ,,mittlerer“ Fehler von [u bzw. [u zu berechnen.
Elektronisches Rechnen in der amlytischen ChwnibIII
1317
Unterschiede in den Korrelationskoefhzienten ftir Funktionen, die gleichartige Objekte oder Vorgbge mathematisch beschreiben sollen, kiimren tiber den I-TEST beurteilt werden. Es mul3 hier ausdriicklich darauf hingewiesen werdan, dal3 der formal gesicherte Nachweis einer Korrelation -keinesfalls besagt, daB der durch die vorgegebene Korrelationsfunktion beschriebene Zusammenhang von GriiBen in jedem Falle sinnvoll ist. Eine sinnlose Ausgangs-Fragestellung-etwa nach dem Zusammenhang zwischen dem stindlichen Wasserverbrauch und der Zahl der stiindlich eingehenden Analysenproben in einem Laboratorium-erhtit nicht daduruh einen Sinn, da13vielleicht formal mathematisch ein Zusammenhang nachweisbar ist. Bevor man eine oder mehrere Korrelationsfunktionen aufstellt und rechnerisch verarbeitet, mul3 sehr sorgfaltig geprtift werden, ob eine log&he Verkniipfung iiberhaupt vorhanden oder zumindest denkbar ist. Bei zeit- oder mengensynchronen MeDdaten an EINEM Objekt oder Vorgang kann dies jedoch fast immer vorausgesetzt werden. Ein anderes Problem stellt die Authndung einer optimalen Korrelationsfunktion dar. Unter einer Reihe rechnerisch verarbeiteter Funktionsansatze zeichnet sich die Optimalfunktion dadurch aus, da8 sie Mt)GLICHST EXNFACH ist und unter Zihnlichen AnsHtzen den hochsten Korrelationskoefhzienten rxy und damit such die kleinste Standardabweichung [sg] besitzt. Die Verbal-Aussage ,,einfach“ bedeutet eine Dateninterpretation durch Funktionen mit einer kleinen Anzahl k an Funktionskonstanten, d.h. einem grol3en Freiheitsgrad f = n - k. Dariiber hinaus ist der wissenschaftliche Erkenntniswert eines Ansatzes hiiufig erst dann ausreichend belegt, wenn er aus bekannten, chemischen, physikalischen oder sonstigen Gesetzen synthetisch aufgebaut oder abgeleitet werden kann. Die Durchfiihrung von Korrelationsrechnungen fur eine Vielzahl denktheoretisch miiglicher Funktionen ist bei Anwendung konventioneller Rechenmethoden eine zeitraubende und fehleranfage Routinearbeit, die mit Recht gescheut wird, da sic das schijpferisch wissenschaftliche Arbeiten fur Tage oder sogar Wochen blockiert. Im folgenden wird gezeigt, daB es neuartige Programmier- und Rechentechniken im Rahmen der elektronischen Informationsverarbeitung gibt, die in wenigen Minuten zu zuverlIssigen Resultaten und Urteilen ffihren.
EIektronische ,Datenverarbeitung Wie in den Arbeiten I (ModelIanalysen)a und II (Varianzanalyse)s werden nachfolgend die Programme in der problemorientierten Sprache ALGOL (ALGO-rithmic L-anguage) unter Verwendung’der fur das Codesystem ALCOR CCIT zulassigen Zeichen formuliert. Die formalen Parameter Y und X der Korrelationsfunktion (2) kdnnen, wie bereits ausgefiihrt wurde, beliebige arithmetische Ausdriicke aus parallel ermittelten MerkmalsgrBBen beinhalten. Bei n Datengruppen ist eine n-fache gleichartige Uberftihrung der ermittelten MeBdaten in Y- bzw. X-GriiBen erforderlich, was bei 5 verschiedenen Ans%zen von Korrelationsfunktionen immerhin die Durchftihrung von 5.n Rechenoperationen von oft komplizierter Natur bedeutet. Es w&e bei diesem Tatbestand umstindlich und zeitraubend, wenn fur jeden Korrelationsansatz ein spezielles Programm erstellt, erprobt und gerechnet werden mu&e. Hier bietet ALGOL mit den als PROZEDUR bezeichneten Unterprogrammen einen Ausweg. Eine Prozedur braucht nur einmalig mit FORMALEN PARAMETERN formuhert und
1318
G. GOTBCHALK
kann sodann nach Vereinbarung ineinem RAHMENPROGRAMM beliebig oft unter Ersatz der formalen dnrch AKTUELLE PARAMETERaufgerufen werden. Bei jedem Aufruf wird das formale mathematische Modell der Prozedur aktuell durchgerechnet. Die nachfolgend aufgeftihrte Prozedur TEST zum Vergleich von Korrelationskoeffizienten ist sehr einfach aufgebaut. Die entsprechende Vereinbarung begirmt mit ‘PROCEDURE’ TEST (Nl, N2, Rl, R2);. . . . Nach dem Vereinbarungs-Wortsymbol ‘PROCEDURE’ folgt der gewiihlte Prozedurname TEST und danach die in runde Klammern eingeschlossene Liste der formalen Parameter, die aus den Datenumfiingen n, = Nl und n, = N2 sowie aus den zugehiirigen Korrelationskoefhzienten r,(l) =Rl und r,(2) = R2 der zu vergleichenden Korrelationsansatze besteht. Der weitere Inhalt der Prozedur an Vereinbarungen und Anweisungen braucht hier nicht diskutiert zu werden. Sind nun in einem Rahmenprogramm 3 Korrelationsrechnungen mit Resultaten r n = Rll
aus
n,, = Nil
R12
aus
nr2 = N12
Daten
r, = R13
aus
qa=
Daten
r12 =
N13
Daten
erhalten worden, so geniigen zur Durchftihrung der (3 = 3 miiglichen Vergleiche rll mit r12, rll mit r13, r12 mit r13 lediglich die Aufrufe: TEST (Nil, N12, Rll, R12); TEST (NIL N13, Rll, R13); TEST (N12, N13, R12, R13); im Anweisungsteil des Rahmenprogrammes. Es liegt nahe, such die Korrelationsrechnung selbst als Prozedur zu formulieren, etwa mit den formalen Eingangsparametern n = N,X,Y,t, = Tl, t, = T2 und t, = T3 und dem fur Vergleiche beniitigten formalen Ausgangsparameter rxy = R. In einer gewohnlichen Prozedur waren X und Y als FeIder zu vereinbaren, da sie stellvertretend fur jeweils n GriiBen mit der Laufzahl i = I = 1 bis IEstehen. Durch eine von dem danischem Mathematiker Jensen endeckte und an einfachen Beispielen beschriebene Variante der ALGOL-Prozedur wird es jedoch moglich, X und Y als gewiihnliche Variable einzufiihren, wenn zusatzlich die Laufzahl i = I als formaler Parameter aufgelistet wird. Die Vereinbarung einer Jensen-Prozedur beginnt mit ‘PROCEDURE’
KORR (N, I, Y, X, Tl, T2, T3, R);.. . .
Im Gegensatz zur gewohnlichen Prozedur mit X- und Y-Feldern, dtirfen in der Jensen-Prozedur die X- und Y-Variablen in Aufrufen durch arithmetische Ausdrticke ersetzt werden, die mit aktuellen FeldgriiBen formuliert sind. Damit kijnnen beliebige Korrelationsansatze unmittelbar in Prozeduraufruf realisiert und spezielle Substitutionsrechnungen im Rahmenprogramm erspart werden. MGgliche Zusammenhange z.B. zwischen einer Konzentration C und MeBgrSBe W mit AnsPtzen C = [Al] + [Bl] . F@ C = [A21 . W + [B2] . W2 C =
[A31 + [B3] . exp (&W)
umgeformt zu
;
= [A21 + [B2]. W
den aktuelleri Feld~~~e~ CD] und Wp] im R~~pr~~a~ als R~he~an~isungen
lassen sich tit
direkt
KURR (N, I, CfI], W[I] x Wfl], Tl, T2, T3, T4, RI); KORR (N, I, C[I]/W[I], W[I], Tl, T2, T?, T4, R2); KORR (N, I, C[I]$ EXP (W[I]/2), Tl, T2, T3, T4, R3); aufrufen, Im Sinne der kybernetischen Terminologie stellen die Prozeduren SCIIWARZE K;diSTEN (black boxes) dar. Es sind dies in sich geschlossene universelle Bausteine, die innerhalb eines Rahmensprogrammes beliebig oft verwendet werden k&men und zwar such von soIchen ~itar~~te~, die den im Inneren des Schwarzen Kastens konservierten ~~erna~~he~ ~~h~smus gar ni&t verstehen oder bereits wieder vergesgen ha&en, Mit wenigen genau festg&egten aktuellen ~I~GANG~I~o~tianen werden automatisch ganz bestimmte vorher bekannte akwelle AUSGANGSInformationen erhalten. Dieser rein0 I~~~O~~UT-~oze~ unterscheidet sich
[email protected] nicht von der selbstverst%ulIichen Bedienung zahheicher schwarzer K&&en, die die technische Entwi&lung uns zur Verfi.igung gestellt hat. Auch bei Gebrauch etwa eines Radioapparates wird ein Input in Form des Einschaltens, der Senderwahl sowie der Lautstlrke- und TonhZjheneinstellung nacb einem uns zumeist nnbekannten Mechanismus in ein Output von TGnen oder SpraGhsendungen umgesetxt,, wobei der Benutzer es als b6chst abesaiissig erachtet, vorher das kompiizierte S&&schema und die physikalischen Grundlagen des Sende- und Empfangprozesses versteben zu w0Ik-n. Die a~rord~~i~hen VorteiIe einer sol&n Auswe~et~h~ik ~s~~tli~h Ei~a~bbei~ S&hnell~gkeit und ~~v~rl~~igkeit braucben aicht besonders hervorgehoben zu werden. Nach diesem I%intip konnen bestimmte Wissenskomplexe, wie matbematische Modelle, vom Facbspezialisten optimal programmiert und danach mit einem Minimum an Vorbildung von Wissenschaftlern und Wilfskr~ften anderer Fachgebiete als geschlossene Bau.usteineverwendet werden. Die Prozeduren KORR und TEST sind universelle matthematische Modelle, die ein Biologe, Soziologe, Betriebswirtschaftler oder ein beliebig anderer Fachwissenschaftler ebenso wie ein Chemiker anwenden kann. Speziell ist allein die jeweilige Problemstellung und das danach gestaltete zumeist sehr einfache Rahmenprogramm. Zu~~~enfassend zeigen die Abb. f und 2 nochmals wesentliche TeiIe der vorstehenden ~d~keng~~. ~AT~~~~~~~~~~
STRU5CTUB
~r~~d~~~~~~md Farfmzm Der Rechengang beginnt mit einer einfachen Summierung der formalen Parameter X und Y, die entsprechend den Funktionsans&en aus den primiiren Eingangsgri%en yII xl gebildet werden. Mit den formalen Mittelwerten 8 und F werden danach die n Abweichungen X - X und Y - P gebildet und zu varianzlhnlichen Ausdriicken lCX$VP und YXY aufsummiert. Tabelle 1 gibt unter m und a eine Zusammenstellung deer Rechenprozesse. Man beachte, daB X nnd Y keine einfacben Variablen, sondern Felder (Vektoren) aus jeweils n ~in~l~r~#en bzw* n Kombi~~~o~n aus mehreren ~~~~el~~~~ sind.
1320
G. GOTISCHALK
Dotenumfong Laufzahl Houptmerkmalsgrijl7en (arithmetircher Ausdruck ) NebenmerkmalsgrSOen (arithmetischer Ausdruck) Statistische GroGen (t-Werte)
EINGANGS -1NFORMATIONEN ( INPUT )
PROZEDUR KORR (BLACK BOX )
KorrelationsgroDen (dovon Korrelationskoeffizient ouch gespeichert ) Regressionsgr6l3en ( Bedingte Ausgobe ) Verbalurteile ABB.
l.-INPUT/OUTPUT-System
\\
AUSGANGS-INFDR+tATIONEN (OUTPUT )
der Prozedur KORR.
RAHMENPROGRAMM
Vereinbarungsteil
(Oecloroticns)
1
Rahme~rogrammicrung I
mit fofmakn F%ametefn
&?E!K
nit bnmahn Paramctern
Anweisungstcil .
(Statements)
Rahmmprogrammiuung
’
ipq
llRMiRI llRDRRl l lTRTl . ..m
l ‘=
. . .
Aufruf nU;taktuellen Parametern I Aufruf mit aktuellen Parametern 1 Aufruf mi? a&fuel/en Porametern lU Aufruf zum Vergleich der r-Werte von I/X Aufruf zum Vergleich der r - Werte von I@ Aufruf zum Vergleich der r- Werte von X/I1
/ ABB.
2.-Programm-Schema zur Durchftihrung von Korrelationsrechnungen Vergleichen fIir 3 Korrelationsfunktionen.
und r-
1321
Elektronisches Rechaen in der anaIytischen Chemie-III mm DER LKNEUEN ~0~~~~~ DXUCKTESYMBOLII = ~GO~~~N)
TABELLFY I.-MA~~
GrundgraPen
1
(Fm
aB_
VZUiarrUm
21
Sl=;$X=X
Vx = (n - 2) * St%= 5 s4 x s4 1
d$Y=Y W=(n-2)*sy4S5XS5
1
S3 +., S#=x--x=x-s1
vxY=(il-2).s~,+xSS
1
S5=Y-T=Y-s2
3i
Korrelationsgri%en Korrelationskoefnt:
R = r,, = ~=VXYp%XXW
Bestimmtheitsrnr&: B = rxua = VXY x VXY/(VX x VY) Priifgr@e: TAU = vr = I/(N - 2) x B/(1 - B) RegressionsgMJen
I
erechnung erfolgt nur fiir 7; 2 tl* (VI WAH.R) Konstanten:
V = Iv1 = 5
=?‘XY/VX
SK = [sd = S, * 4l-B
.bweich~~n:
SV = [sv] = jV(/TAU
= %b’
und
Vergleiche mit t-Werten der t-Verteihmg fiir f = n - 2 tmd den Sicherheiten S = 95 % : Tl = tl S=99%: Tz==t# s = 9!49%: T3 = t* Vl
WAHR NIGHT WAHR MCHT
fiir 7~ Z tl fiir rr < tl fiir Tr 2 tr
V2 WAHR WAHR
V3 WAHR NICHT WAHR
U=~]=~--~].W=S~-VXS~ X (1 - B)/(N -
2)
SU - [s,] = SV x v’s 6
Boole’sche Vqiable
5
und
Urteile
Wenn Vl nicht wahr: KEIElE KORRELATION
NACH%%ISBAR
Wenn V2 nicht wahr UND V1 w&r: KORRELATION NUR WAHRSC~ICH Wenn V3 nicht wahr UND V2 w&r: KORRELATION SIGNINACHGE~EN
fiir 7r < t*
wenn v3 wahr:
fiir 7-r1 t*
KORRELATION HOCHSIGMFIKANT NACHGEWIESEN
fiir
7r c
t8
KorrelationsgriiI3en und RegressionsgrlH3en Aus den Varianzen folgen umnittelbar der KorrelationskoeBMent r_,, Besti~theitsmafi 3 und die PrQfgrMe T? nach den Rechenformeln, die in a Tab. 1 aufgefiihrt sind. sofern iiberhaupt eine Korrelation nachweisbar ist, werden die Konstanten und [v] der Re~~sionsgeraden (2) und die Abwei~hungen [sgf, IQ,], [+] nach
das der [v] da
1322
G. Gm
Formeln in @ der Tab.‘1 berechnet, die aus dem Minimumsansatz ++[l’].X-
Y)B=$a=MINIMUM
abgeleitet werden konnen.
Einzelheiten siehe Gottscha1k.l
Boole’sche Variable und Urteile
Der numerische Wert der PrtifgrijBe 7r wird mit Werten t der t-Verteilung verg&hen, wobei diese Vergleiche durch Zuordnung Boole’scher Variabler in einfache JA/NEIN- oder WAHR/NICHT WAHR-Entscheidungen tiberfiihrt werden k6nnen. Zur Beurteilung der Realitgt und Straffheit des Zusammenhanges ist es zweckm&Big, eine vierstufige Urteilsskala heranzuziehen, die sich aus Vergleichen von Tr mit den Werten t 1; t,; t, fiir Statistische Aussage-Sicherheiten S = 95; 99; 99,9x (level of significance 0,05; 0,Ol; 0,001) und dem Korrelationsfreiheitsgradf = n- 2 (2 Konstanten) ergeben. Die Integralgrenzen t der t-Verteilung sind in statistischen Tabellenwerken oder Lehrbtichem tabelliert. In qund qder Tab. I sind die Boole’schen Variablen und die Urteile formuliert, wghrend nachfolgende Skizze die ,,Wahrheitstafel“ zu qverdeutlicht.
Vl wahr
/--‘I
tt
v2 wahr
Vl nicht wahr
V2 nicht wahr
V3 nicht wahr
nicht nachweisbar
wahrscheinlich
signifikant
\
V3 wahr ‘ai hochsigdkant
Vergleich von Korrelationskoefizienten Zum Vergleich von 2 KorrelationskoetIizienten ist eine PriifgrSBe Ir zu bilden und mit den Integralgrenzen il der Normalverteilung fur die Statistischen Sicherheiten S = 95 ; 99 ; 99,9 % (level of significance 0,05 ; 0,Ol; 0,001) zu vergleichen. Fiir die Beurteilung der Unterschiede wird such hier eine vierstufige Urteilsskala definiert. Die Unterschieds-Wahrheitstafel hat die gleiche Struktur wie die KorrelationsWahrheitstafel. Einzelheiten der sehr einfachen mathematischen Struktur des &Testes sind der Abb. 5 zu entnehmen. Theoretisch kbnnen bei der Durchrechnung von cc Korrelationsfunktionen insgesamt
0 i
a.1
=2!(a
_ 2j! = G.
(a -
0.
verschiedene A-TESTS durchgefiihrt werden, sofern dies in jedem Fall sinnvoll erscheint. Ein zumindest wahrscheinlich gr6Berer Korrelationskoeflizient gibt dem betreffenden Funktionsansatz Prior%@ vor dem anderen Ansatz. Eine solche Prioritgt ist jedoch problematisch, wenn sie mit einer komplizierten oder gesetzmlt3ig nicht aufschliisselbaren Funktion erzielt wird. PROGRAMMIERUNG
FluBdiagramm
Abbildung 3 zeigt das vollst%ndige Ablaufschema der Prozedur Prozedur TEST ist so einfach, da13ein FluBdiagramm tiberfliissig ist.
KORR.
Die
Elektronisches
Rechnen in der analytischen
1323
Chemie-III
!OZEDUR.- KOPF
KORR
VEREINBARUNGEN IR
ist
Awgongymmmeterl I
PW
‘THEN’
Resultatausqobe REGRESSIONSGROSSEN: REGRESSlONYjRCjSSEN
Urte!lsou+qobe av
,‘///.wonr[/&p
-
KORRELATION NUR WAHRSCHEINLICH ORATION
I
SI~FIKANT
NACHGEW~~SEN KO~ELATI~ KANT
(Vt nicht
w&r)
KEINE
KORRELATION
[ ABB.
3.-FluPdiapmm
HOCHSIGNIFINACmiEWlESEN
der ALGOGProzedur
ENDE
I
1
KORR.
und Rahmenprogramm Abbildung 4 bringt die ALGOL-Fo~~e~g der Prozedur KORR, w&rend Abb. 5 die mathe~tische Struktur und die ALGOL-Fo~~ie~g der einfachen Prozedur TEST enth% Die Prozeduren sind erprobt turd brauchen von einem Benutzer mu- sorgfZltig abgeschrieben und an ein Rechenzentrum gegeben zu werden. Die zukiinftige Arbeit besteht im Schreiben eines Rahmenprogrammes, in das die Prozeduren durch Nennung ihres Kenn-Namens im Vereinbarungsteil eingefiihrt und durch Aufrufe im Anweisungsteil rechnerisch aktiviert werden. Die Schwarzen K&ten der beiden Prozeduren bestehen im ALGOL aus separaten Lochstreifen-Rollen (in SonderfZllen Lochkartenstapel), die im Gegensatz etwa zum RadiogerZit sehr schnell vervielfaltigt und an andere Interessenten weitergegeben werden kiinnen. Bei Schreiben des Datenstreifens mit aktuellen Daten ist lediglich zu beachten, da13die Reihenfolge der Daten mit der Reihenfolge in der Leseanweisung ~~re~st~t.
A LGOL-Prozedwen
~2
"qV'¢
'S. ~ ~
~C
Ld
g
Im falgenden wird die Erstellung eines speziellen Ra~enpro~a~es Beispiel gezeigt.
an einem
BEISPIEL In dem nac~olgend~u Beispiel werden nur die fiir die elektronische Datenverarbeitung erforderlichen Informationen angefiihrt. Einzelheiten zur Versuchsdurchftibrung und Folgenmg aus den Ergebnissen der Korrelationsrechmmg fiir die Ansiitze [l l] und [21] siehe Got&chalk” (Beispiel 9).
A~5or~ton§kurven fiir 0
und
0
G in Giomm C in mMotfmt
--c
1
tl
3
a
10.10-3
'Clj
X,00
‘*CZi h3B.
2S,OO &--4X
$62
20*10‘*
3040-J
GJ
lo,00
7,L6
6,SZ
5,X
2,63
$27
3,62
3,25
3,06
9,lO
7,lO
L,20
L,76
3,83
2,49
2,&O
2,S8
2,03
8,85
md C2 als Funktion von G (&u&e
E~~~~~Rfo~matione~~=
~r~~~e~~~~~l~ng
In jeweils 10 Un~rsu~hungen wurde die 3mnchbarkeit von 2 verschiedenen Adso~tions~tteln @ und Q wr selektiven Entfe~~g eines stiirenden Bes~dteiles aus einer Losung getestet. Hauptmerkmal
(vorgegeben)
= Menge G an Adso~tions~ttel MerkmalsgrZiOen yi. = G, = G[I]
@
bzw.
@
in
Gramm
Nebenmerkmal = Restkonzentration C in mMol/ml in der Losung nach detinierter (gefunden) Behandlung von Lbsungen mit der Anfangskonzentration C, = 2,50. IO-a mMol/ml. M~krn~sgr~~en fiir 0: x(l), = Ci, = Cl[I] 0: x(2), = c2, = CZ[I] Abb~dung 6 bringt die ~ap~sche 9
~arste~ung
und die Tabelle der ak~e~en Daten.
1326
G. GOTTSCEIALK
Bei Einbeziehung der Anfangsko~entration C, = Cl[l] = C2[1] liegen insgesamt n = N = 11 Daten mit i = I = 1,2,3, , . . , I1 fiir jede Merkmalsreihe vor. ‘BEGIN’ ‘REAL’ TI,TZ,T3, Rll,R12,R13,R21,R22,R23; ‘INTEGER’ I ; ‘ARRAY’ G , Cl ,C2 cl:11 1 ; (
Etnlese-STOP
durch
hrnrerchend
lunge
Folge
van WU-Zeicheo
_~ ‘PROCEDURE’
KORR
(N,I,Y,X,Tl,TZ
,T3,R);
‘PROCEDURE’
TEST
(Nl,N2,RI,RZ);
*
READ (Tl,TZ,T3); &FOR* I : z 1 ‘STEP’ WR,TE
(‘I<
WRITE
I
I
‘UNTIL’
11
KORRELATIDNSRECHNUNG,
(“<~cIlluG
‘DO’
READ
-
*
-
(G LIT,,
.
-
-
-
Cl CT>,
C2 CT3 1;
AOSORPTIONSPROBLEM,
Nail”);
=tUJ+LV3/CI*);
KORR (11,I,GCZ1,1/CI CIJIT1,T2,T3,RlI); (w<~CIZl?lG.tUl+~V~~~l.~l”); KORR (l1,I,GCIl,ClC13~ C1CIl,TI,T2,T31R1Zl; WRlTE(“<~t131~C1/G=CUl+tV~~Cl”); KORR (l1,I,CI~~l/GCll,CIC~l, TI,TZ,T3,R13); WRITE (“CL [211,!, G =LU~+LVl/C2”); KDRR (Il,I,GCIl,l/C2~I3,Tl,T3,R21);. WRITE (“4 5 ~22~1?G=CUl+tVlxCZ.C2’); KDRR (11‘1. GLIl,C2CIlxC2C17~ Tl,T2,T31R22); WR,TE (“& C23l?,C2/G =Ud+tV?rC2”); KORR (~~,I,CZ[IJ~GC~J, C2EI1, Tl,TZ,T3,RZ31; WRITE
WRITE WRITE WRITE WRITE WRITE WRITE WRITE WRITE WRITE WRITE ‘END’
(‘c t”< (*
RAHMENF
VERGLEICH u DER i .sR-WERTE “); 2 % R11 Y MiTuRlZ : “1; TEST (?1,11,R11.R12]: Rllu MITuR13 : “): TEST(II,11.R1I.R13); TESTLII,11,R12,R13); & TEST(11,11,R21,R22]; % TEST(Il.II,R2I,R23l; TEST(ll,ll,R22,R23); TEST(11,11,R11.R21); 2 & R12uMlTuRZZ:“j; TEST[ll,II,R12,R22): i$ R13,MITuRZ3:“); TEST(ll,1I.R13,R23); ‘RDGRAMM
ABB. 7.-ALGOL-Rahmenprogramm
des Beispieles.
Nach dem ~raphi~hen Bild ist ein nichtlinearer Z~a~enh~g zu erwarten. Die formale Korrelationsfunktion
zwischen G und C
sol1 ati folgende aktuelle Funktionen angewendet werden: Adsorptionsmittel
@
G[I] = [U] + fv] X (l/Cl[I])
mit Rll
[12] G[I] = [U] + [VI x Cl[If x Cl[I]
mit R12
[ll]
1131 Cl[I]/G[I]
= W] + TV] x
CWI
mit R13
Elektronisches
Adso~tions~ttel @
1327
Rechnen in der analytischen Chemie-III
mit R21
PI X (l/C4?1)
[21f
GfIl = [U] i-
[22]
Cl11 = WI + Prl x C4?1 x CW
mit R22
[23]
C2[Il/GtII = WI + lYl x CW1
mit R23
Die Beziehungen [13] und [23] lassen sich leicht in die Langmuir’sche Adsorptionsisotherme tiberfiihren. Durch Umformung folgt : C
G=[uJ+[yl*C-Co(Oberflachenkonzentration) Von den 15 m~~ichen Vergleichen der 6 Korrelationskoe~zienten sinnvoll und zwar:
sind 9 Vergleiche
RI1 mit R12
R21 mit R22
Rll mit R21
Rll mit R13
R21 mit R23
Rf2 mit R22
R12 mit R13
R22 mit R23
R13 mit R23
Als t-Werte entnimmt man fiirf == n - 2 = 9 den Tabellen: tr = Tl = 2,26
(95%)
t, = T2 = 3,25
(99%)
ta = T3 = 4,78
(99,9%)
ALGULRahmenprogramm
Im Rahmenprogramm
werdea namentlich nur die aktuellen GriilJen
Tl, T2, T3, Rll, R12, R13, R21, R22, R23, I, G[I], Cl[I], C2[1] vereinbart und soweit sie Eingangs-Informationen darstellen such eingelesen; n = N = 11 wird direkt numerisch eingesetzt. Abbildung 7 zeigt das Rahmenprogramm mit den einmaligen Prozedurvereinbarungen, den schriftlichen Erl&tterungen durch WRITE-Anweisungen und den insgesamt 15 Prozedura~~fen. Entspr~hend den formu~e~en ~seanweisungen sind die aktuellen Eingangsdaten in der Reihenfolge (t,*
b
83,
GI,
Cl,,
C2,,
G,,
Cl,, C2,, . . . G,r, cl,,,
c2,,
im Datenstreifen numerisch aufzulisten. Resultate, Urteile, Bearbeitungszeiten
Tabelle 2 gibt eine Zusammenstellung der gerundeten Resultate, wahrend Abb. 8 Anfang, Mittelteil und Ende des von einer Rechenanlage ZUSE 223 ausgedruckten Ergebnis-Bogens zeigt. Die Du~hrechnung des Beispieles erfolgte mit einer relativ
X328
-~
I
Korrelationsrechnungeen
I
FUNKTIQN
Vergleich der r,, - Werte
.
:*
TJNN = Untenchied nicht nachwcsisbar (VW) = Unterschled nur wahrachmlrch
US = Unterschied sign:nifihnt UHS = Unterschied hcrohsignifikant
1329
Elektrmisches Recbxa in der anaiytischen Chew&--m
Cl11
GdUJtCV3fCt
KClZf6ZLATK)NSGRfXSSEN: Pm .9971!6837 .996552370 fimES~~~~ssEN!
CVI .342673172,-1
- .136350679,~~ KUTiELA~ION a .
w rSS693647l~p2
HOCHSIGNIFIKANT
CSKl .166044887
CSUl .I27559011
ISVI . 615282334m~3
csu3 . 14656?m,o16
ISVI * r6mson~,~,lz
NACIXXWIESEN
l
C2.a
l
CZ/G=rUltEV3xC2
f-tEGEss-EN: WI -.5095961t9m10
EV3 .115487(194~13
KORRELATION HOCHSIGNIFIKANT
VERGLEICH
tSKJ . 336706416mD
~
N&XXWlE%N
CER R-WERTE
fangsamen Klein-Rechenanlage wurden :
ZUSE 223, wobei folgende Kenng&Sen
Angezeigte Rechenbefeble im Befehlsregister fiir das Gesamtprogramm: Einlesen der Prozedur KORR : 1 min 40 set .. Einlesen der Prozedur TEST 43 SW Einlesen des Rahmenprogrammes : 2 min 53 set PRGG~M-~~ESE~IT
PEZ
Daten-Eintesezeit DEZ Recbenzeit ~Sch~eB-Loeher-Aus~a~)
BLEKTRONISCHE GESAMTZEIT
:5min RZ
BEARBEITUNGSZEIT
fiir das Beispiei
ermittelt 1 508
16.%x
**
16sec
: 3 min
26 set
EBZ: 3 min
42 set
: 8min
58sec
fb&IXrektausgabe aber 9 min 44 set)
F& die volIst&xdige Durchrechmmg und Beurteitung van mu einer der 6 Korrelatio~sf~o~~ werden xmr etwa 30 set RZ be&%@. Die Ausgabe 6ber
1330
G. GO-K
Schnell-Lo~her liefert einen Ergebnis-Lochstr~~en, der mit jedem AL~~S~hreiber beliebig oft in ~a~h~ft-3~gen nach Abb, 8 umgesetzt werden kann. Die Umsetz~gszeit betr@t 5 min 42 sec. Dieses Vorgehen bietet gegenuber der langsamen direkten ~ars~hr~t-Ausga~ den Vorteil einen wesentlichen Verktirzung der MaschinenBelegungszeit, da in der Z23-A&age die Rechenprozesse w%hrend des Druckvorganges unterbrochen werden.
0
0‘0033
0*0050
0,0100
h~.
Anfmgsltonzantration Co = 0,025 mMoL/ml
C
(in
f/C-Teilung
0,002s
oIoe2a
f
P-Regressionsgeraden und MeBpunkte.
Bei koaventioneller Rechentechnik mit Tischrechnern benijtigt such ein geiibter menschlicher Rechner fiir das Beispiel mindestens 15 Stunden = 900 min (2 bis 3 Arbeitstage) zu einer gleichartigen Durchrechnung und Urteilsbildung, was einem Zeitfaktor eon iiber 100 entspricht. Es sei erwahnt, da13 bereits mit neueren mittelgrofien Rechenanfagen die Gesamtzeit durchaus auf weniger als 1 min vermindert werden kann.
Elektronisches Recbnen in der analytischen Chemie-III
1331
~~kus~~on der Er~~b~~~e Die aktuellen Daten werden am besten durch die st~k~~l~ tionen [Ill und [21] G-[v]+E
~eicha~igen
Funk-
C
beschrieben, wobei die Standardabweichung in G bei [ll] mit [sx] = f0,19 g wesentlich kleiner als bei [21] mit [sx] = f0,83 g ist. Die Konstante [PJ (Steigung der Regressionsgeraden) stellt ein MaB des AdsorptionsvermiSgens A dar. A ist umso griil3er je kleiner [v] ist. 1 in g’. (mMol~~)-l A=[VI Im vorliegenden Beispiel besitzt das Adso~tions~ttel @I mit A2 = 46,5 em hiiheres Absorptionsvermiigen als @ mit A2 = 29,2. Wegen der in [.rx] erkennbaren sehr vie1 grijBeren ,,Dosier-Streuung” von @ gegentiber @ wird man aber dem Adsorptionsmittel @ wegen ,,besserer GIeichm&Qkeit“ zumeist den Vorzug geben. Der Vergleich von Rll mit R21 ergibt, da13 das Datenmaterial von @ signifikant besser als dasjenige von @ korreliert ist. Abbildung 9 zeigt im l/C; G-Diagramm die beiden Regressionsgeraden und die gefundenen Mehpunkte. Fur die Funktionen [12] und [22] vom Typ
ist eine Korrelation nur wahrscheinlich. Wie such die extrem grohen Standardabweichungen [.rx] zeigen, sind sie ~g~i~et zur Inte~re~tion des vor~egenden Datemnaterials. Die Unterschiede von Rl 1 zu RI2 bzw. von R21 zu R22 sind zudem hochsignifikant. Die Langmuir-5hnlichen Funktionen [13] und [23] vom Typ C
yj=
[cq+[vl*c
bzw. umgeformt
C G=[ul+[YIC
ergeben zwar eine signifikante bzw. hochsign$kante Korrelation, besitzen aber gegentiber den Funktionen [ll] und [21] einen kleineren KorrelationskoeBtizienten. Zwischen Rll und R13 ist der Unterschied hochsignifikant, w&rend zwischen R21 und R23 ein solcher nicht nachweisbar ist. Auf weitere Analysen der Auswertungsergebnisse kann hier nicht eingegangen werden. Die Ergebnisse der Korrelationsrechnngen bilden die Planungs~ndlage fur weitere gezielte Untersuchungen. Die sodann anf~lenden Resultate werden zweckm~~ig nach verfeinerten Methoden, insbesondere Ausgleichsrechnungen, aufgeschliisselt, wie in nachfolgenden Arbeiten gezeigt werden solI. Summary-The variable experimental parameters for similar objects or processes can be connected by means of relationships that in the first instance may be unknown. The reality and rigour of the connection of data series in the framework of given correlation functions can be checked by the statistical metbods of interpreting correlations. In this paper the mathematical details of the necessary calculations are given and formulated in ALGOL lauguage as universally applicable subprogramme procedures called KORR and TEST. It is shown that such universal procedures correspond to “black boxes” in cybernetic te~inolo~, and can be used as building blocks, without knowledge
1332
G.
GOTWHALK
of their mathematical content. The writing of an overall programme for special problems is thereby so essentially simplified that it can be done satisfactorily after a short training without a mathematical background. As a practical example, 6 correlation equations and 9 sets of correlation coefficients can be programmed and solved electronically in 9 min. The time taken by conventional methods is 100 times as great. R&m&-On peut relier les parametres exp&imentaux variables pour des objets ou des proc&Zs similaires au moyen de relations qui, en premiere instance, peuvent &re inconnues. La &lit6 et la rigueur de la liaison entre des series de dom&s dans le cadre de fonctions de correlation dontrees peuvent &re control&s par les methodes statistiques d’interpretation de correlations. Dans ce m&moire on donne les details mathematiques des calculs nec-essaires, et les formule en langage ALGOL a Mat de techniques de sub-programme universellement applicables, appelQs KORR et TEST. On montre que de telles techniques universelles correspondent aux “boites no@.” en terminologie cybemetique et peuvent &re utilisQs comme des blocs de construction, sans connaissance de leur contenu mathematique. L%criture d’un programme global pour des problemes sp&ciaux est de ce fait tellement simpliifiee qu’elle peut dtre faite de facon satisfaisante aprb un court entralnement sans un fond de connaissances mathematiques. A titre d’exemple pratique, 6 equations de correlation et 9 ensembles de coefficients de correlation peuvent 2tre programmes et r6solus Blectroniquement en 9 mn. Le temps necessitt par les m&odes ordinaires est 100 fois plus long. LITERATUR 1. G. Gottschalk, Einftihrung in die Grundlagen der chemischen Materialpriijiing. Hirzel-Verlag, Stuttgart, 1966. 2. Idem, Tahmta, 1967,14, 61. 3. Zdem, fbid., 1967, 14,361. 4. E. W. Dijkstra, EIektronische Datenoerarbeitung, Beiheft 2, S41/43, Verlag Vieweg, 1961.