Zusammenfassung
Die österreichische Bildungsstandardüberprüfung für das Fach Mathematik 8. Schulstufe aus dem Jahr 2012 (BIST-Ü M8 2012) erlaubt als Vollerhebung (N = 79.678) einen Vergleich von Noten und Testleistungen nicht nur auf der Populationsebene, sondern auch auf der Ebene von Klassen bzw. Lerngruppen. Regressions- und Mehrebenenanalysen zeigen, dass Schüler/innen der 1. Leistungsgruppe Hauptschule bei gleichen Testleistungen deutlich bessere Noten erhalten als Schüler/innen der Allgemeinbildenden Höheren Schulen (AHS). Außerdem erzielen Mädchen, Kinder aus Elternhäusern mit einem höheren Sozialstatus sowie Schüler/innen mit Migrationshintergrund bei gleichen Testleistungen bessere Noten als Jungen, Kinder aus Elternhäusern mit einem niedrigeren Sozialstatus und als Schüler/innen ohne Migrationshintergrund. Die Ergebnisse werden im Hinblick auf mögliche zugrundeliegende Mechanismen diskutiert. Sie spiegeln den Stand der Benotungspraxis vor der flächendeckenden Umwandlung der Hauptschulen in Neue Mittelschulen wieder.
Abstract
The Austrian educational standards assessment for 8th grade Mathematics in 2012 (BIST-Ü M8 2012), as a complete survey (N = 79,678), allows to compare grades with test performances not only at the population level, but also at the level of classes or learning groups. Corresponding regression and multi-level analyses show that students in the 1st performance group “Hauptschule” receive significantly better marks for the same test performance than students of the “Allgemeinbildende Höhere Schule” (AHS). In addition, girls, children from households with higher social status, and students with an immigrant background achieve better grades than boys, children from households with lower social status, and students without an immigrant background. The results are discussed with regard to possible underlying mechanisms. They reflect the state of grading practice before the nation-wide conversion of secondary schools into “Neue Mittelschulen” (NMS).
Notes
Abweichend von der allgemein üblichen Formel wurden hier +2 Noten in der 2. Leistungsgruppe und +3 Noten in der 3. Leistungsgruppe addiert.
In Abb. 1 wurden die Originalwerte beibehalten.
Eine genaue Dokumentation aller Variablen sowie der Anteile fehlender Werte findet sich unter https://www.bifie.at/wp-content/uploads/2017/08/M812I_EXTERN_2_0_Almanach.pdf (Zugriff 08.10.2018).
Die Leistungsgruppe hat fehlende Werte, die bei der multiplen Imputation geschätzt wurden. Der geschätzte Wert variiert über die 10 Datensätze. Mplus kann mit variierenden Werten in Gruppierungsvariablen nicht umgehen.
Eine Zentrierung am grand mean gewährleistet, dass der Effekt des L2-Prädiktors mittlere Testleistung der Klasse bzw. Lerngruppe für die Effekte der L1-Prädiktoren (insb. individuelle Testleistungen) kontrolliert wird. Dadurch wird die Signifikanz des partiellen Regressionskoeffizienten geprüft, was die Frage beantwortet, inwieweit die Zusammensetzung der Klasse bzw. Lerngruppe über die individuellen Testleistungen hinaus einen Effekt hat (Enders und Tofighi 2007; Lüdtke et al. 2009).
Die Zahl der Cluster lag in der AHS bei 1190 Klassen, in der 1. LG HS bei 2600, in der 2. LG HS bei 2562 und in der 3. LG HS bei 1951 Lerngruppen.
Die praktische Relevanz von Effekten mit einem log β < 0,05 dürfte nicht sehr hoch sein.
Literatur
Baumert, J., Trautwein, U., & Artelt, C. (2003). Schulumwelten – institutionelle Bedingungen des Lehrens und Lernens. In Deutsches PISA Konsortium (Hrsg.), PISA 2000 – Ein differenzierter Blick auf die Länder der Bundesrepublik Deutschland (S. 261–331). Opladen: Leske + Budrich.
Bos, W., Voss, A., Lankes, E.-M., Schwippert, K., & Thiel, O. (2004). Schullaufbahnempfehlungen von Lehrkräften für Kinder am Ende der vierten Jahrgangsstufe. In W. Bos, E.-M. Lankes, M. Prenzel, K. Schwippert, R. Valtin & G. Walther (Hrsg.), IGLU. Einige Länder der Bundesrepublik Deutschland im nationalen und internationalen Vergleich (S. 191–228). Münster: Waxmann.
Bruneforth, M., Lassnigg, L., Vogtenhuber, S., Schreiner, C., & Breit, S. (Hrsg.). (2016). Das Schulsystem im Spiegel von Daten und Indikatoren. Nationaler Bildungsbericht Österreich 2015, Bd. 1. Graz: Leykam.
von Davier, M., Gonzales, E., & Mislevy, R. J. (2009). What are plausible values and why are they useful? In IEA-ETS Research Institute (Hrsg.), Issues and methodologies in large-scale assessments. IERI monograph series, (Bd. 2, S. 9–36). Hamburg, Princeton: IEA-ETS Research Institute.
Ditton, H., & Krüsken, J. (2006). Der Übergang von der Grundschule in die Sekundarstufe I. Zeitschrift für Erziehungswissenschaft, 9(3), 348–372.
Eder, F. (2003). Tests und Lehrerurteil. Wie gut stimmen externe Leistungstests mit Lehrereinstufungen überein? In E. J. Brunner, P. Noack, G. Scholz & I. Scholl (Hrsg.), Diagnose und Intervention in schulischen Handlungsfeldern (S. 125–140). Münster: Waxmann.
Eder, F., & Dämon, K. (2010). Leistungsvergleiche zwischen Hauptschule und AHS-Unterstufe. In F. Eder & G. Hörl (Hrsg.), Schule auf dem Prüfstand (S. 13–56). Wien: LIT.
Enders, C. K., & Tofighi, D. (2007). Centering predictor variables in cross-sectional multi-level models: a new look to an old issue. Psychological Methods, 12(2), 121–138.
Fend, H. (2006). Neue Theorie der Schule. Einführung in das Verstehen von Bildungssystemen. Wiesbaden: VS.
George, A. C., Itzlinger-Bruneforth, U., & Trendtel, M. (2015). Stichprobenziehung in Bildungsstandardüberprüfungen und Pilotierungen. Technische Dokumentation – BIST-Ü. Salzburg: BIFIE.
Gignac, G. E., & Szodorai, E. T. (2016). Effect size guidlines for individual differences researchers. Personality and Individual Differences, 102, 74–78.
Hochweber, J. (2010). Was erfassen Mathematiknoten? Münster, New York, München, Berlin: Waxmann.
Köller, O. (2005). Bezugsnormorientierung von Lehrkräften: Konzeptuelle Grundlagen, empirische Befunde und Ratschläge für praktisches Handeln. In R. Vollmeyer & J. C. Brunstein (Hrsg.), Motivationspsychologie und ihre Anwendungen (S. 189–202). Stuttgart: Kohlhammer.
Lüdtke, O., Robitzsch, A., Trautwein, U., & Kunter, M. (2009). Assessing the impact of learning environments: how to use student ratings of classroom or school characteristics in multilevel modeling. Contemporaray Educational Psychology, 34, 120–131.
Maaz, K., Baeriswyl, F., & Trautwein, U. (2013). Herkunft zensiert? Leistungsdiagnostik und soziale Ungleichheiten in der Schule. In D. Deißner (Hrsg.), Chancen bilden. Wege zu einer gerechteren Bildung – ein internationaler Erfahrungsaustausch (S. 184–341). Wiesbaden: Springer.
Menard, S. (2011). Standards for standardized logistic regression coefficients. Social Forces, 89(4), 1409–1428.
Robitzsch, A., Pham, G., & Yanagida, T. (2016). Fehlende Daten und Plausible Values. In S. Breit & C. Schreiner (Hrsg.), Large-Scale Assessment mit R: Methodische Grundlagen der österreichischen Bildungsstandard-Überprüfung (S. 259–249). Wien: facultas.
Schmid, C., Paasch, D., & Katstaller, M. (2016). Kompositionseffekte bei der Notenvergabe in Mathematik auf der 4. Schulstufe der österreichischen Volksschule. Zeitschrift für Bildungsforschung, 6, 265–283. https://doi.org/10.1007/s35834-016-0170-3.
Schöps, K., Walter, O., Zimmer, K., & Prenzel, M. (2006). Disparitäten zwischen Jungen und Mädchen in der mathematischen Kompetenz. In PISA-Konsortium Deutschland (Hrsg.), PISA 2003. Untersuchungen zur Kompetenzentwicklung im Verlauf eines Schuljahres (S. 209–224). Münster: Waxmann.
Schreiner, C., & Breit, S. (Hrsg.). (2012). Mathematik, 8. Schulstufe: Bundesergebnisbericht. https://www.bifie.at/system/files/dl/01_BiSt-UE_M8_2012_Bundesergebnisbericht.pdf
Tent, L., & Birkel, P. (2010). Zensuren. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 949–958). Weinheim, Basel: Beltz.
Walter, O. (2014). Immigrant optimism in Deutschland? Die Überprüfung einer Hypothese anhand der mathematikbezogenen Motivation und realistischen Bildungsaspiration von Schülerinnen und Schülern mit Migrationshintergrund. Empirische Pädagogik, 28(1), 36–53.
Wilhelm, O., & Kunina-Habenicht, O. (2015). Pädagogisch-psychologische Diagnostik. In E. Wild & J. Möller (Hrsg.), Pädagogische Psychologie (S. 305–327). Berlin, Heidelberg: Springer.
Yen, W. M., & Fitzpatrick, A. R. (2006). Item response theory. In R. L. Brennon (Hrsg.), Educational measurement (S. 111–154). Westport: Praeger.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Schmid, C. Asymmetrien zwischen Noten und Testleistungen am Ende der 8. Schulstufe? Eine Analyse auf Grundlage der österreichischen Bildungsstandardüberprüfung Mathematik 2012. Z f Bildungsforsch 8, 249–268 (2018). https://doi.org/10.1007/s35834-019-00229-3
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s35834-019-00229-3
Schlüsselwörter
- Noten
- Bildungsstandards
- Leistungsäquivalente Notenvergabe
- Soziale Bezugsnorm
- Mehrebenenanalyse
- Sekundarstufe I