Talanta, 1967. Vol. 14. pp. 361 to 376 Pergamon Press Ltd.
Printed in Northern Ireland
ELEKTRONISCHES RECHNEN IN DER ANALYTISCHEN CHEMIE-II* ALGOL-PROGRAMM
FUR DIE EINFACHE
VARIANZANALYSE
G. GOTTSCHALK OSRAM Studiengesellschaft
Berlin, Technische Universitat
Berlin
(Eingegangen am 9 September 1966. Angenommen am 14 November 1966) Znsannnenfassnng-Innere Homogenitat und Gcsamt-Homogenitat eines gruppenweise angefallenen Datenmaterials 1st sich durch die mathematisch-statistische Methode der einfachen Varianzanalyse objektiv priifen und sicherstellen. Die bisher bekannte varianzanalytische Datenauswertung wird durch den van Nalimov vorgeschlagenen r-Test erweitert, wodurch such die innere Homogenitlt der Einzeldaten in jeder Gruppe beurteilt werden kann. Erst der varianzanalytisch gefiihrte Nachweis einer Homogenitlt gewiihtleistet die einwandfreie Zusammenfassung einer Vielzahl von Einzelinformationen auf die 2 filr ein Untersuchungsproblem charakteristischen Kenndaten, GesamtMittelwert x’ und die totale Varianz ss bzw. Standardabweichung s. Die einfache Variamanalyse weist zwar keine schwierigen Rechenoperationen auf, ist aber bei mehr als 50 Einzeldaten bereits sehr zeitraubend und anfallig fiir Rechenfehler. Bei konventioneller Rechentechnik werden z.B. fur 10 Gruppen mit insgesamt 100 Einzeldaten 3 bis 6 Stunden je Person benotigt, w&hrend bei elektronischer Datenverarbeitung die Resultate in weniger als 5 min anfallen. Ein geeignetes ALGOL-Programm wird mitgeteilt. Am Beispiel des Vergleiches der Resultate flammenphotometrischer Natriumbestimmungen aus 7 Laboratorien ftlr eine gleichartige vorgegebene Glasprobe wird eine der wichtigsten Anwendungsm6glichkeiten der einfachen Varianzanalyse in der analytischen Chemie ausftihrlicher behandelt. VERWENDETE BEGRIFFE (ALGOL-SYMBOLE IN
UND SYMBOLE KLAMMERN)
Gesamtzahl der Untersuchungen Anzahl der Gruppen Gruppenumf&rge Laufzahlen, ftir Gruppen fiir Einzelwerte innerhalb der Gruppen Einzelwerte innerhalb der Gruppen Gruppen-Mittelwert Gruppen-Varianz (Standardabweichung sJ) Gesamt-Mittelwert Varianz zwischen den Gruppen Mittlere Varianz innerhalb der Gruppen Totale Varianz (Gesamt-Standardabweichung s) Integralgrenzen r der r-Verteilung ftir S = 95 % Vergleichsgr6Se zum r-Test VergleichsgriiBe zum F-Test * Teil I-Tahta, 7
1967, 14,61. 361
IJ J
CL) (Jl
i (0 xi ml) zJ W-0 sJ2 (v) It (GXM) VZ (VZ) VI (VI) s2 (GV)
rJ
W
7
@Au)
e2
(-4
G. GOI-ISCHALK
362
EINFUHRUNG
Problemstellung
Jm Rahmen der Untersuchung von Objekten und Vorgangen werden haufig mehrere Gruppen gleichartiger Untersuchungsbefunde erhalten. Zur einwandfreien Beurteilung und Zuordnung der Tatbestiinde und Einfliisse ist die Kl%n.mg der Frage unerl3.l3lich, ob die Daten insgesamt einer gemeinsamen Grundgesamtheit mit definiertem Lage- und Streuungsparameter angeharen oder ob die Kenndaten der k einzelnen Gruppen sich voneinander durch tiberzuftige Abweichungen unterscheiden. Man spricht in diesem Zusammenhang von der Homogenittt bzw. Inhomogenitat das Datenmaterials. Eine objektive Entscheidung ermiiglicht die mathematisch-statistische Methode der Varianzanalyse. Bei inhomogenem Datenmaterial kiinnen Gesamt-Mittelwert 3 und totale Varianz s2 oder Standardabweichung s systematisch verfalscht sein tmd diirfen daher nicht als umfassende KenngrbBen zu dem betreffenden Problem interpretiert werden. Durch Weglassen von Gruppen mit stark abweichenden Gruppen-Kenndaten 3, und sJ und emeute varianzanalytische Durchrechnung des restlichen Datenmaterials kann eine Homogenisierung fiir einen Datenrest und eine Separierung von ,,AusreiDer“Gruppen erreicht werden. Die mit diesem Vorgehen zwangstiufig verbundene Verkleinerung der Gruppenanzahl k und der Gesamtanzahl n der Einzeldaten bedeutet aber such stets einen Verlust an Aussage-Sicherheit. Daher ist die weitere varianzanalytische Aufschltisselung eines Rest-Datenmaterials mit weniger als n/2 Einzeldaten kaum mehr sinnvoll. Unter den zahlreichen Mijglichkeiten fur die Anwendung der Varianzanalyse seien im folgenden nur einige genannt. Zusammenfassung chronologisch angefallener Priifbefunde (Zeiteiny¶uQ
Beispiel: Ermittlung der Jahres-Kenndaten
aus k = 12 Monats-Kenndaten.
Mengenverteilungen (ProzeB- oder Herstellungseinjh&) Beispiel : Homogenitlt
der Verteilung eines bestimmten Stoffes nach definierten Mischprozessen bzw. Herstellbedingungen.
Trendreihen (EinfluBanalyse fiir verschiedene Parameter)
Beispiel: Konstanz oder Anderung der Resultate von Analysengruppen bei systematischer Variation eines Zustandsparameters wie Temperatur, Druck, Volumen oder such Konzentration zugesetzter Stoffe etc. Zuverltissigkeitstest fiir Priifverfahren Beispiel : Resultatvergleich
von verschiedenen Laboratorien auf der Basis einer vorgegebenen Priifsubstanz. Ftir diesen wichtigen Anwendungsbereich wird abschliefiend ein typisches Beispiel durchgerechnet und diskutiert.
Eine Datengruppe besteht aus I, Einzeldaten x, in Form von gleichartigen Analysenbefunden oder such physikalischen MerkmalsgriiBen, die im allgemeinen zu einem Niveauwert f, und einem Streuungswert sJ2 bzw. s zusammengefaht J
363
ALGOL-Prograxnmftir Varianzanalyse werden k&men. Ftir k Gruppen ist danach ein k-maliger Berechnungsgang, folgt, durchzufiihren : Gruppen-Mittelwert
wie
~+X~ (1)
Gruppen-Varianz
SJ
a-
-
j&
5
(xi
-
nJj2
I Laufzahl der Einzelwerte in einer Gruppe wobei i= 1,2,..., k Laufzahl der Gruppen (Gruppen-Nummern) J= 1,2..... Abbildung 1 -gibt einem Uberblick fiir ein Datenmaterial von k = 5 Gruppen mit verschiedenem Umfang. 1. Gruppe I,
= 7
2. Gruppe I2 = 10
5 Gruppe
L Gruppe I,
= 13
I,
= 9
Xl
Xl
X2
X2
X2
X3
X3
X3
Xl x2 X3
Xl
X4
X4
X4
X4
X5
X5
X5
x5
X6
X6
X5
X6
X,
X7
X7
X7 Xe X
XI
*2
X9
X0
X
*ill X11 Xl2 -+--
v Ti;
,
T
-I5:
ABB.I.-Eimeldaten,
Mittelwerte und Variamen fti ein Beispiel mit k = 5 Gruppen.
Ein spezieller Sonderfall liegt vor, wenn zwar die Gruppen-Kenndaten l bekamrt, die Einzelwerte xi jedoch nicht mehr zugaqlich sind. Die varianzanalytische Zusammenfassung solcher Daten ist problematisch, da die oft starke Rundung der Gruppen-Kenndaten zu einer betrachtlichen Verfalschung des Endurteils fdhren kann. Nur bei hinreichend groBer Ziffernzahl in der Angabe von 2 und s wird man such ftir die Durchrechnung des Sonderfalles zuverlassige Endresultate erwarten diirfen. Besser ist aber in jedem Fall die Angabe und Verrechnung der Einzeldaten xt einer jeden Gruppe. Weitere Einzelheiten zu den ZweckmlBigsten Rechengringen und Datenpriifungen bringt das Kapitel tiber die mathematische Struktur der einfachen Varianzanalyse. J,
J
JEJ,
SJ
J
EIektronische Datenverarbeitung Wie bereits bei der Arbeit I (Modellanalysen) werden fur den Normalfall und den Sonderfall der Varianzsanalyse Rechenprogramme in der problemorientierten Universalsprache ALGOL (ALGO-rithmic Language) unter Verwendung der fur das Codesystem ALCOR CCIT zulhsigen Zeichen formuliert. Bei Vorliegen der Programme beschrlnkt sich such hier die weitere Tatigkeit des Benutzers auf die Au&stung der Untersuchungsbefunde in programmrichtiger Reihenfolge, wie dies Abb. 2 zeigt.
G. GOTWXIALK
364 NormaLfaLL f-
*, I I] Xl!
I*, Xl,
rll XZ I
M---
-.-. X1,
+---
--"'xl
t-
rt, x*,
+---
;
Anzahl
der
Gruppen
Umfang und r -Wert der 1. Gruppe Einzelwerte xi der 1. Gruppe
Umfang und r- Wert der letzten Gruppe Etnzelwerte xi der Letzten Gruppe
fr,
Sonderfall Anzahl
6, I $1
I,,
Ti,,
sr,,
51’
Sk
;
der
Daten
der
Daten
der
Gruppen 1. Gruppe
letzten
Gruppe
-_
ABB. 2.-Datenlisten
bei einfachen Varianzanalysen.
Weitere Einzelheiten iiber den Gebrauch von ALGOL siehe Arbeit I und die dort angeftihrte ALGOL-Literatur. MATHEMATISCHE
STRUKTUR
Rechengtinge
Bei der k-maligen Gruppenrechnung ermittelt man zweckm&g zunachst die Gruppensummen SJ der Einzelwerte xi und Q,S, der Einzelwert-quadrate xt, woraus in einfacher Weise die Gruppen-Kenndaten ZJ, sJ 2 bzw. sJ berechnet werden kiinnen, soweit sie nicht im Sonderfall bereits vorgegeben sind. Tabelle I zeigt die RechengZnge der Gruppenrechnung. Wie noch gezeigt wird, la& sich die ,,innere” HomogenitHt der Daten xt innerhalb einer jeden Gruppe durch die mathematisch-statistische Prtifmethode des r-Testes sicherstellen. TABELLEI.-GR~.wEN
DER
Normalfall
GraDen Summe der Eiizelwerte
GRWPENRECHNUNO
SJ =
lJ*.?J
Summe der Einzelwert-Quadrate
(b -
QSJ =
Mittelwert
ZJ = XMJ
VarianZ
SJ” = Standardabweichung
VJ = SJ)
1). SJ' + sfJ* SJ
vorgegeben
=
. (bzw.
Sonderfall
*&
(QSJ
- & . SJ}
365
ALGOL-Programm fti Varianzamlyse
Das gesamte Datenmaterial der k-Gruppen wird danach zu einem tlbergeordneten Niveauwert X und 3 Streuungswerten VZ, VI und s2 zusammengeftit, wobei die k Gruppensummenpaare SJ, QSJ, die Mittelwerte ZJ und die Gruppenumfange ZJ in diese Gesamtrechnung eingehen, wie Tab. II zeigt. TAB-
II.-GREEN
DER
G~SAMTRECHNUN~
summen n=N=
Gesam-Anzahl Gesamtsumme
der
Einzelwerte Gesamtsummeder Einzelwert-Quadrate Gesamtsumme des Produktes aus Gruppenmittel mal Gruppemumme
1
1
Endresultate Gesamt-Mittelwert Varianz zwkhen den Gruppen Mittlere Varianz innerhalb der Gruppen Totale Varianz &xv. Standardabweichung s)
ss=GV=
Zur Prtifung des gesamten Datenmaterials ein F-Test durchgeftihrt.
n&
{(& - 1). vz + (n - k) * VI-)
auf Homogenitlt
wird abschliehend
Pri$ung der Gruppen-Homogenitiit durch den r-Test Die Gruppen-Kenndaten ZJ und s J bzw. sJ2 sind nur dann einwandfreie GruppengraBen, wenn keiner der Einzelwerte x, innerhalb der betreffenden Gruppe extrem weit vom Mittelwert abweicht. Die ,,innere“ Homogenit2t der Gruppendaten x, kann durch den r-Testl*” tiberprtift und sichergestellt werden. Hierzu bildet man fit den kleinsten und grbljten x,-Wert und eventuellen weiteren stark vom Mittelwert abweichenden xi-Werten die PriifgrtiBe : 71 =
I%--fJI SJ
(2)
366
G. Go-
Mit den Integralgrenzen r der r-Verteilung wird T+ verglichen, wobei fdr die jeweilige numerische Gr6i3e von r = rJ der vom Gruppenumfang ZJ abh&rgige Freihei~~ad f = lJ - 2 und die Statistische Sicherheit S = 95 % oder S = 99 % (Level of significance 0,0.5 bzw. 0,Ol) mai3gebend ist. AIs Fur&ion vonf und S ist r tabelliert.lee Theoretisch kann TV2 r(9.5) l-Ma1 unter 20 Werten x1 und T# 2 r(99) sogar nur l-Ma1 unter 100 Werten erwartet werden. Die Gruppendaten sind praktisch als in sich homogen zu beurteilen, wenn bei ZJ = 10 bis 20 I-Mal, bei IJ = 21 bis 40 2-Mal, bei fJ = 41 bis 60 3-Ma1 PriifgroBen TV2 r(95) gefunden werden. Praktisch ist T$ B r(99) l-Ma1 fdr IJ = 50 bis 100 zullssig. Ftir IJ = 10 entnimmt man z.B. der Tabelle flirf = 8 die r-Werte: r(95) = 1,895
r(99) = 2,294
und
Eine homogene Datengruppe liegt in diesem Fall dann vor, wenn h&h&ens l-Ma1 75 L r(95) = 1,895 vorkommt. Bei mehreren Befunden rt 2 ~(95) oder sogar solche mit TV2 499) sind die betreffenden x,-Werte als ,,AusreiSer” einzustufen. Die varianzanalytischen Berechmmgen miissen sodann unter Fortlassen der AusreiBer wiederholt werden. Dariiber hinaus sollte man bemtiht sein, die Ursachen fiir AusreiBer aufzudecken. Der r-Test setzt die Kenntnis der Einzelwerte xt voraus. Liegen im Sonderfall nur die Gruppendaten IJ, fJ, s vor, so kann auf innere Homogenitiit nicht gepriift werden, wodurch eine erhijhte Gefahr der systematischen Resultatve~~schung resultiert. Fiir die Praxis ist eine umgeformte Beziehung (2) einfacher zu handhaben. Mit T( 2 r folgt : J
J
gleich oder groSer als eine aus Wenn der absolute Differenzbetrag (xi - 2 bzw. gebildeten Priifgrafie PG id, so tit@ eine Uberschreitung der vorgegebenen r-Grenze vor. Das Normalprogramm enthtit den r-Test und druckt ftir externe Vergleiche die Versuchsnummer i = I, den betreffenden Wert xi = X[I], die G&Be T*= TAU und den Wert r J = R[J] aus, wenn die r(95)- Grenze tiberschritten wird. J)
rJ(S>,
sJ
fJ,
VJ
Priifung der Gesamt-Homogenitdt durch den F-Test
Die Homogenitat gepriift und beurteilt.
des gesamten Datenmaterials Die einfache PrilfgroBe
wird durch einen F-Test?
(4) ist hierzu lediglich mit den Integralgrenzen
F der PVerteilung
ftir die Freiheitsgrade
von VZ, d.h. f, = k - 1 und von v1, d.h. fi = n - k sowie vorgegebenen Statist&hen Sicherheiten S = 95/99/99,9 % (Level of significance 0,05/0,01/0,001) zu vergleichen. Die F-Werte sind als Funktion vonf,, fa und s tabelliert,1-4 doch mu13 eventuell
ALGOGProgamm
f& Variamanalyse
367
interpoliert werden. Wegen F 4 1 zeigt eine Priifgriihe 19~5 1 such ohne Vergleich mit den F-Werten stets ein streng homogenes Datenmaterial an. In allen Fallen o2 > 1 urteilt man zweckm2iDig, wie folgt :2 e2 < F(95): F(95) 2 Ba< F(99): F(99) 5 t12< F(99,9):
82 r F(99,9) :
streng homogen homogen nahezu homogen inhomogen
Nur fiir e2 < F(99,9), bei strengen MaBstiben sogar fur B2 < F(95), stellen Mittelwert 2, totale Varianz s2 bzw. Standardabweichung seine zuliissige aufnur 2 Kenndaten konzentrierte Information zu dem betreffenden Problem dar. In einem inhomogenen Datenmaterial sind dagegen tiberzufallige Eintliisse wirksam. Wie bereits in der Einfting beschrieben, kann durch Fortlassen von Gruppen mit stark abweichenden Gruppenkenndaten zJ, sJ2 bzw. sJ und erneute Rechnung eine Homogenitat der Restdaten und eine Separierung von AusreiBerGruppen erreicht werden. Im nachfolgend angeftihrten Normal- und Sonderprogramm wird lediglich 8s berechnet und ausgedruckt, w&rend der Vergleich mit F-Werten extern erfolgen mu& Dies erspart in vielen Fallen eine zeitraubende Interpolationsrechnung ftir nicht tabellierte F-Werte tmd ermiiglicht eine eventuelle andere Abstufung des Urteils. PROGRAMMIERUNG
FM3diagramm Abbildung 3 zeigt das vollstiindige Ablaufschema der einfachen Varianzanalyse fur den Normalfall. Die Gruppenrechnung wird nur I-Mal formuliert und so dann in einem k-maligen Zyklus durchgefti. Dieses Vorgehen erspart die Indizierung durch die Gruppen-Nummer J. Es kann ZJ = L, rJ = R und xdJ = X[I] gesetzt werden. Die richtige Auflistung der Eingangsdaten fur den Normalfall zeigt Abb. 2. Im Sonderfall der einfachen Varianzanalyse mit vorgegebenen Gruppendaten I,, RJ, s J beschr&kt sich der k-Zyklus auf das Einlesen dieser GraBen, wobei such hier lJ = L, fJ = XM, r J = SJ gesetzt werden kann. Es sei ausdriicklich darauf hingewiesen, dab die elektronische Rechnung ftir den Sonderfall gegentiber einer konventionellen Rechentechnik nur dann merkliche zeitliche und sonstige Vorteile besitzt, wenn mindestens 10 Gruppen zusammenzufassen sind. ALGOL-Programm Die relativ kurzen und einfachen ALGOL-Programme fiir den Normalfall und den Sonderfall sind in den Tabellen III und IV zusammengestellt. Die Programme sind erprobt und brauchen von einem Benutzer nur sorgfaltig abgeschrieben und an ein Rechenzentrum gegeben zu werden: Die zukiinftige Arbeit beschrlinkt sich sodann auf die Auflistung der Befunde in programmrichtiger Reihenfolge nach Abb. 2. Weitere Hinweise zur ALGOGProgrammierung wurden in Arbeit I gebracht, in der such ausftihrlichere ALGOGLiteratur angegeben wird.
G. GOTISCHALK
[BEGINN] EINGABE 1 VEREINBARUNGEN
1
1
+
-------H
EINLESEN
van
4
]
Gleichartiger k - mallger Handlungsoblauf fix jede Gruppe ) = 1,2.... . & 1
,
b
.fi, rj
EINLESEN van und den zugehorigen
+ BERECHNUNG der Gruppen-Summen S Gruppen - Quadratssummen
-
1 BlLDUNG “on Gruppen- Mittelwert Gruppen - Varlanz
-
OS
XM
V
I
/ Zahlen streifen der Elngangs daten
1 AUSGABE PrufgroOen: k-l, VZ,n-R,VI,
Tabelle
der
3’
1 SJ
:
Endresultate
F,,.t2,
5
ABB. 3.-Ablaufschema
4BE GIuppendaten
der einfachen Varianzanalyse.
ALGOL-Propmm
369
fiir Varianzanalyse
TABELLE III.-ALGOL-PROGRAMM ~iiR DEN NORMAFALL DEREINFACHEN VARLWZANALYSE ‘BEGIN’
‘COMMENT EINFACHE VARIANZANALYSE; ‘REAL’ GS, GQS, GSQ, R, S, QS, XM, V, PG, TAU, VZ, VI GXM, GV; ‘INTEGER’ K, N, J, L, I; READ (K); WRITE (“< = EINFACHE u VARIANZANALYSE, GRUPPEN - K =“); WRITE(“<==GRUPPE?,J~L&XM?!iV~SJ”);
TYPE (K);
GS: = GQS: = GSQ: = N: = o; ‘FOR’ J: = 1 ‘STEP’ 1 ‘UNTIL’ K ‘DO *BEGIN’ READ (L, R); ‘BEGIN’ ‘ARRAY’ X [l :L]; S: = QS: = o; ‘FOR’ I: = 1 ‘STEP’ 1 ‘UNTIL’ L ‘DO’ ‘BEGIN READ (X[I]); s: = s + X[I]; ‘END’ GRUPPENSUMMEN; QS:=QS+X[I] xX[I]; XM: = S/L; V: = (QS - S x XM)/(L - 1); PG:=RxSQRT((L-l)xV/L); PRINT (J, L, XM, V, SQRT (V)); ‘FOR’ I: = 1 ‘STEP’ 1 ‘UNTIL’ L ‘DO’ ‘BEGIN’ ‘IF’ ABS (Xp] - XM) ‘NOT LESS PG ‘THEN’ ‘BEGIN TAU: = ABS (X[I]-XM) x R/PG; WRITE (” < = R - TEST: L I .?a X[I] g TAU 2 R”); PRINT (I, X[I], TAU, R); ‘END’ AUSGABE ‘END’ R-TEST; N: = N + L; GS: = GS + S; GQS: = GQS + QS; GSQ: = GSQ f S x XM; ‘END’ X-FELD; ‘END’ SUMMIEREN; GXM: VZ: VI: GV:
= = = =
GS/N; (GSQ - GS x GXM)/(K - 1); (GQS - GSQ)/(N - K); (GQS - GS x GXM)/(N - 1);
WRITE(“<~~PRUEFGROESSEN:<=1~F1=K-l,!?,VZ1??,F2= N - K ,?, VI ?it THETA-QUADRAT”); PRINT(K-l,VZ,N-K,VI,VZ/VI); WRITE(“<==ENDRESULTATE:<=?.tN~GXM~GVi!iS’*); PRINT (N, GXM, GV, SQRT (GV)); ‘END’ PROGRAMM
FUER EINFACHE VARIANZANALYSE
BEISPIEL
Das nachfolgende Beispiel wurde an einer relativ kleinen und langsamen Rechenanlage ZUSE 23 gerechnet. Der Zeitbedarf fm das einmalige Einlesen des ALGOLProgrammes betrQt fiir den Normalfall 2 Minuten und fur den Sonderfall 1 Minute. Ftir das Einlesen des Zahlenstreifens der Eingangsdaten sowie fur Rechnung und Resultatausgabe werden weitere 3 bzw. 1,5 Minuten benStigt. Das direkte Ausdrucken der Resultate in Klarschrift beansprucht bei den hier formulierten Programmen etwa 75 % der Zeit, da bei der Z 23 die Rechenvorgtige w%hrend des Druckvorganges unterbrochen werden. Bei einer griiheren Anzahl zu verarbeitender Zahlenstreifen ist es daher vorteilhafter, die Resultate nicht in Klarschrift sondern zun%hst in der
370
G. GO~~S~LK TABELLE IV.-ALGOL-PR~GRAMM ~isR DEN SONDERFALL DEREINFACHEN VARL~NZANALYSE
‘BEGIN’ ‘COMMENT’ EINFACHE VARIANZANALYSE,
SONDERFALL;
‘REAL’ GS, GQS, GSQ, XM, SJ, S, GXM, VZ, VI, GV; ‘INTEGER’ K, N, L, J; READ (K); WRITE (“ < I EINFACHE u VARIANZANALYSE, TYPE (K);
SONDERFALL
u K = “);
GS: = GQS: = GSQ: = N: = o; ‘FOR’ J: = 1 ‘STEP’ 1 ‘UNTIL’ K ‘DO’ ‘BEGIN’ READ (L, XM, SJ); S:=LXXM; N:=N+L; GS:=GS+S; GQS: = GQS + (L - 1) x SJ x SJ + XM x S; GSQ: = GSQ + XM x S; ‘END’ SUMMJEREN; GXM: VZ: VI: GV:
= = = =
GS/N; (GSQ - GS x GXM)/(K - 1); (GQS - GSQ)/(N - K); (GQS - GS x GXM)/(N - 1);
WRITE (,‘ < = = PRUEFGROESSEN:
< = SF1 = K - 1 ?, VZ 2 F2 = N - K ?_,VI ?!itTHETA-QUADRAT”);
PRINT. (K - 1, VZ, N - K, VI, VZ/VI) ; WRITE (,‘ < = = ENDRESULTATE: < = ti GXM 2 GV 2 S”); PRINT (N, GXM, GV, SQRT (GVB; ‘END’ PROGRAMM FUER EJNFACHE VARIANZANALYSE,
SONDERFALL
vie1 schnelleren Lochstreifenform ausgeben zu lassen. Die Lochstreifen kiinnen spater iiber einen ALGOL-Schreiber in beliebig viele Klarschriftexemplare umgesetzt werden.
seti
Zielsetzung :
~berprtlfung der Zuverlassigkeit und Ermittlung der Standardabweichung eines flammenphotometrischen Prtifverf’ahrens filr Natriumgehalte zwischen 1,0 bis 2,0 Gew % in einem hiiufig verwendeten Glastyp.
Teilnehmer :
7 Laboratorien.
Vorbereitung:
Durch eine neutrale, hinsichtlich der Auswertung federfiihrende Institution wird eine 1000-g GroBprobe eines typischen Glases auf eine Korngri33e von weniger als 60 y vermahlen und sorgflaltig homogenisiert. Jedem Laboratorium wird eine Kleinprobe von 20 g in gut verschlossener Kunststoff-Pulverflasche iibersandt.
Auilagen :
Jedes Laboratorium (Gruppe) hat mindestens I, = 6 flammenphotometrische Bestimmungen durchzuftihren, wobei der erforderlithe AbrauchprozeB je Bestimmung mit Einwaagen im Bereich G = 100 bis 500 mg erfolgen ~011. Eine Probenteilung des gel&ten Rtickstandes wird ebenso wie Arbeitstechnik und
ALGOL-Programm ftir Varianzanalyse
371
benutztes GerZit freigestellt. Von den Laboratorien sind die Einzelergebnisse xi = Hi in Gew% Na auf 2 Stellen nach dem Komma sowie die jeweils verwendeten Arbeitsvorschriften (Einwaagen, Reagentien, AufschluBtechnik, Probenteilung, Art des Gerates) mitzuteilen. Die erhaltene Resultatmatrix zeigt Tab. V, die allen beteiligten Laboratorien mit den Ergebnissen der varianzanalytischen Auswertung nach AbschluB der Untersuchungen zugestellt wird. Sind an dem Versuch Laboratorien verschiedener Firmen, Institute oder sonstige Untersuchungsstellen beteiligt, so ist aus gewichtigen sachlichen und psychologischen Griinden von der neutralen Stelle unbedingt eine anonyme Aufschltisselung und Bewertung durchzuftihren. Hierzu werden den beteiligten Laboratorien willkiirlich Gruppennummem zugeordnet. Jedes Laboratorium erhalt neben den Endunterlagen nur seine eigene Nummer, nicht aber die Nummem Bei diesem Vorgehen wird man gewisse berechtigte der anderen Laboratorien. Vorurteile gegen solche fiir den Fortschritt der analytischen Prtiftechnik sehr wertvolle Ringsversuche vermeiden konnen. Neben den Einzelresultaten Hi enthalt entnommenen r-Werte fur S = 95 und 99% Tab. V such die aus Tabelle@ Statistischer Sicherheit. TABELLEV.-EIN~LWER~
Laboratorium (Gruppe)
1
x, = Hd IN Gew.%
2
3
Na AUS 7 LABORATORIEN
4
5
6
7
Gruppendaten
HI 1,57 1,68 1,46 1,63 1,70 1,52 1.57 HP 1,71 I,59 1,49 1,58 1,69 1,60 1,54 H* 1,64 1,51 1,55 1,59 1,72 1,54 1,65 H. 1,66 1,62 1,41 1,60 1,77 1,62 1,61 H6 1,61 1,65 1,48 1,53 1,73 I,68 1,59 HR 1.72 1,49 1,50 1,55 1,65 1,58 1,53 ________________________________________~~~~~~~~~~~~~~~~~~~~~~--~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~ H, 1,63 1,61 1,68 1,59 J& 1,75 1,67 HB 1,70 HI0 1,76 Gruppemunfang I, Priifgi%Ber, (95) rJ (9%
6
7
6
7
10
6
8
1,814 2,051
1,848 2,142
1,814 2,051
1,848 2,142
1,895 2,294
1,814 2,051
1,870 2,208
Die Daten der Tab. V wurden nach Abb. 2 aufgelistet und unter Verwendung des Normal-Programmes durchgerechnet. Tabelle VI zeigt das erhaltene Resultatbild in Klarschrift. 1. Urteil: Wichtigste Gral3e ist zunachst das gefundene e2 = 14,807. &‘-Werte mit dem Freiheitsgrad fr = 6 und fa = 43 sind im allgemeinen nicht tabelliert. Doch zeigt bereits der benachbarte Wert F{ fi= 6, fi’ = 40, S = 99,9 %} = 4,73 < e2
da8 das gesamte Datenmaterial als eindeutig inhomogen zu beurteilen ist. Die Tabelle der Gruppendaten wird nicht durch Ausgabe von r-Testwerten unterbrochen, so da8 alle Gruppen in sich homogen sind. Gruppe 3 weist mit Rs = 1,482 Gew % Na den Kleinsten und Gruppe 5 mit Bs = I,71 5 Gew % Na den hiichsten Gruppen-Mittelwert auf.
372
G. GOl-l-SCHALK TABLEVI.-KLARSC HRWIBILDDJB VARLWZANALYSEFUR AL.LEK = 7 GRIPPEN
ALCORA ZUSE Z 23 MODUS EINFACHE VARIANZANALYSE, GRUPPE J
4 L
GRUPPEN K = 7 XM
V
SJ
1
6
.165166666101
.3336668011,,-2
.57763898810-1
2
7
.159571428101
.5061914521,,-2
.71147132810-1
3
6
.148166666101
.2136671541,,-2
.46224144510-1
4
7
.158428571101
.l 1952370410-2
.345722000,,-1
5
10
.171500000101
.l 149995571,,-2
.3807880731,,-1
6
6
.158999999101
.3320005531,,-2
.57619489110-1
7
8
.1593750001(11
.23982141610-2
.48971564810-1
PRUEFGROESSEN: Fl=K-1 6 ENDRESULTATE :
vz .38342157910-l
N
GXM .161000000101
50
TAEIELLE WI.TEILE
F2=N-K 43
.6967%05,,-2
VI THETA-QUADRAT .2589464181,,-2 .148069852102 S .8347O62381,,-1
DER KLARSCHRIFm UDER DER FOLGERECHNUNGEN
Rechnung ohne Gruppe 3 (K = 6)
PRUEFGROESSEN: Fl=K-1 5 ENDRESULTATE: N 44
.2355;:50816-l GXM .162750000,,1
F2=N-K 38 GV .50796519810-2
.2649::87,6-2
THETA-QUADRAT .889083961101
S .7127167731,,-1
Rechnung ohne Gruppe 5 (K = 6)
PRUEFGROESSEN: Fl=K-1 5 ENDRESULTATE :
vz .18448O66710-1
N
GXM .158375000,,1
40
F2=N-K 34
.48855%Oo10-2
VI .28910917310-2
THETA-QUADRAT .638100356101
S .6989689331,,-1
Rechnung ohne Gruppen 3 und 5 (K = 5)
PRUEFGROESSEN Fl=K-1 4 ENDRESULTATE N 34
: vz .4670083521,,-2
F2=N-K 29
VI .30211662410-2
: GXM .160176470,,1
GV .322103500,,-2
S .56754162810-1
THETA-QUADRAT .154578833*,,1
ALGOLProgramm
Ll
L Homogener
I
373
fiir Varianzanalyse
Dotenrest
ous
5 Gruppen
Htiufigkeitsanteile
der
Ausreafler - Gruppe 3
= Haufigkeitsonteile
der
AusreiOer - Gruppe 5
tzzi
H I” Gew % No
ABE. 4.-Histogramm
der absoluten
HZufi
-
fiir die Klassenbreite
AH = 0,OS
G.
374
CiOTTSCHALK
12
11
5 Restgruppen mit E, SW he Gruppen 3 und 5)
6 Gru_ppe 5 mit H~-,s~
mit Hs,sws 3
1,LO
1,50
1,60 H
ABB.
5.-Homogener
in Gew %
Na
Datenrest und Ausreaer-Gruppen mit Schiitzwerten H, SE.
1,m c
1,80
als Normalvexteilungen
ALGOL-Programm fiir Varknzanalyse
375
Auf Grund des 1. Urteils wurden erneute Rechnungen unter Fortlassen der Gruppe 3 bzw. der Gruppe 5 bzw. der Gruppen 3 und 5 durchgefiihrt. Tabelle VII zeigt die Teile : PrtifgriiBen und Endresultate der betreffenden Klarschriftbilder. Die Gruppen-Kenndaten bleiben naturgemu unvertindert. Zwischenurteile: Ohne Gruppe 3 wird 8%= 8,891 (fi = 5, fa= 38) und ohne Gruppe 5 0” = 6,381 (fi = 5, fe = 34) erhalten. Bereits der NIherungswert F{fi = 5,f,’ = 30, s = 99,9X} = 5,53 < 8”
Endurteil :
zeigt, da8 das jeweilige Restmaterial nach wie vor inhomogen ist. Der kleinere Bs-Wert bei Fortlassen der Gruppe 5 M3t darauf schlieBen, da8 Gruppc 5 einen grijBeren Eintlufl hinsichtlich der Inhomogenitit besitzt als Gruppe 3. Ohne Gruppe 3 und 5 resultiert t@= 1,546 < F( fi= 4, fa= 29, S = 95 %} = 2,70 das hei& ein ,,streng homogenes“ Gesamt-Kenndaten :
Datemnaterial
mit den
Den Einflu8 der Inhomogenit%t erkennt man an den bisherigen Gesamtdaten : alle Gruppen: B = 1,610 Gew % Na s, = f0,083 Gew% Na (VK = f5,18 Rel%) ohne Gruppe 3 : g = 1,628 Gew % Na sH = fO,O71 Gew% Na (VK = &4,38 Rel%) ohne Gruppe 5: !? = 1,584 Gew% Na sn = fO,O70 Gew% Na (VK = f4,41 Rel%) Die Resultate der Laboratorien 3 und 5 mit & = 1,482 bzw. I?s = 1,715 Gew% Na sind nach der varianzanalytischen Aufschliisselung eindeutig zu niedrig bzw. zu hoch. AbschlieBend zeigen die Abbildungen 4 und 5 die Verteilung der absoluten IBMIgkeiten und die mit den Schltzwerten R und sn resultierenden Normalverteilungen. Sommary-_Thehomogeneity within and between groups of data cau be objectively tested and estabhshed by a simple analysis of variance. The analysis of variance methods already known can be extended by means of the r-test proposed by Nalimov, whereby the homogeneity of single values in each group can be assessed. Only the proof of homogeneity obtained by analysis of variance guarantees the unequivocal interpretation of a large number of single results from the two characteristic
376
G. GOTTSCHALK
parameters-the variance s’ (or the standard deviation s) and the mean value 2. Certainly simple analysis of variance requires no difiicult calculations, but, even with only 50 results to be used, is ~~ns~g and subject to arithmetical slips. For example, by conventional calculation methods 3-6 hr are needed for one person to handle groups containing 100 results, whereas the results can be obtained in 5 min with an electronic computer. A suitable ALGOL programme is given, and as an example of use of this potentially important application of analysis of variance, a detailed comparison is made of the flame photometric determination of sodium in a homogeneous glass sample by 7 laboratories. R&n&-On peut objectivement examiner et etablir l’homogeneite B l’interieur et entre des groupes de donnkes par une analyse simple de la variance. Les methodes d’analyse de variance deja connues peuvent 6tre &endues au moyen de l’essai-r propose par Nalimov, par lequel l’homogeneit6 de valeurs isolks de chaque groupe ut Qre apprkciee. Settle la preuve ~hornog~n~i~ obtenue par Pa!ls!?yse de la variance garantit l’inte~~tation non equivoque d’un grand nombre de rksuhats simples a partir des deux parametres caracttkistiques de la variance, s* (ou l&art type s) et la valeur moyenne 5. L’analyse simple de la variance n’exige certainement pas de calculs diiciles mais, m6me avec seulement 50 resultats a utiliser, elle prend beaucoup de temps et est sujette &des erreurs arithmetiques par inadvertance. Par exemple, par les m&hodes de c&u1 ordinaires, une personne nkcessite 3-6 h pour traiter des groupes contenant 100 rf?sultats, alors que les r6suhats peuvent We obtenus en 5 mn avec un calculateur 6l~~onique. On donne un programme ALGOL appropriket, comme exemple d’emploi de cette application potentiellement importante de l’analyse de la variance, on pro&de a une comparaison detailMe du dosage photomkique de tlamme du sodium dans un kchantillon de verre homogene effectu6 par 7 laboratoires. LITERATUR 1. V. V. Nalimov, The Application of ~ufkemafica~ Sfafistics to Chemical Analysis, Pergamon, Oxford, 1963. 2. G. Gottschalk, Einftikrung in die Grundlagen der chemiscken Matericrlpriifung (Planung, Auswerfung, Beurteilung), Verlag S. Hirzel, Stuttgart, 1966. 3. Idem, Statistik in der quanfitativen chemiscken Analyse, Enke-Verlag, Stuttgart, 1962. 4. U. Graf und H. J. Henning, Formeln und Tabelien der matkentatiscken Sfutistik, Springer-Verlag, Berlin, 1953.