Wie viel Wissenschaft braucht Ernährung

Unser Talent, rasche Schlussfolgerungen zu ziehen, verleitet uns allzu schnell dazu, Muster in eigentlich zufälligen Daten zu erkennen und alternative Erklärungen für ein bestimmtes Ergebnis zu ignorieren. Auch zunächst vernünftig erscheinende Ergebnisse werden oft leichtfertig ohne weiteres Hinterfragen akzeptiert. Eine Analyse von Möglichkeiten und Grenzen.

Der Mensch im Allgemeinen – und vielleicht der wissenschaftlich arbeitende Mensch im Besonderen – ist sehr gut in Selbsttäuschung. In einem viel beachteten Paper aus 2005 meinte schon John Ioannidis, Kritiker der derzeitigen Praxis der Ernährungsforschung, dass die Unfähigkeit, unsere eigene Voreingenommenheit zu verstehen, dazu führt, eine Vertrauenskrise hinsichtlich der Reproduzierbarkeit veröffentlichter wissenschaftlicher Ergebnisse aufzubauen.

Moderate Unterschiede schwer zu messen

Ioannidis postulierte 2013, dass es auch in der ernährungswissenschaftlichen Forschung häufig zu nicht plausiblen Ergebnissen kommt. Im Gegensatz zu gravierenden ernährungsbedingten Mangelerscheinungen und extremen Ernährungsmustern können die Wirkungen von eher moderaten Unterschieden der Nährstoffaufnahme sehr schwer mit entsprechendem Maß an Zuverlässigkeit auf Ebene der gesamten Bevölkerung untersucht werden. Um jedoch eine weniger kontroversielle Datenlage im Bereich der Ernährungswissenschaft zu produzieren, sollten die Stolpersteine der Vergangenheit vermieden werden und eine vernünftige Erwartungshaltung gegenüber den zu erwartenden Resultaten sollte entstehen. Nicht plausible Ergebnisse, die „zu gut, um wahr zu sein“ erscheinen, bedrohen die Ernährungswissenschaften an mehreren Fronten, zum Beispiel Assoziationen aus Beobachtungsstudien, Wirksamkeit von Interventionen in randomisierten Studien oder die Abschätzung der Auswirkungen auf die Bevölkerung. Zu nahezu jedem Nährstoff lassen sich Publikationen aus Peer-Reviewed-Journals finden, die einen Zusammenhang mit nahezu jedem Endpunkt angeben.

Nicht plausible Ergebnisse veröffentlicht

Viele der publizierten Studienergebnisse sind völlig unplausibel. In vielen Studien wird nach wie vor angegeben, dass das relative Risiko einer Krebserkrankung mit lediglich ein paar Portionen eines einzelnen Nährstoffes pro Tag halbiert werden soll. Gemeinsam mit Jonathan Schoenfeld wählte John Ioannidis 50 häufige Zutaten aus zufällig selektierten Rezepten eines Kochbuches für eine Literaturrecherche in PubMed aus (Schoenfeld, Ioannidis, 2013). Für 40 dieser 50 Zutaten fanden die Autoren Publikationen in einem Zusammenhang mit dem Krebsrisiko. 103 Studien von insgesamt 264 Einzelstudien schlussfolgerten, dass das getestete Lebensmittel mit einem erhöhten Krebsrisiko assoziiert ist, 88 Studien fanden ein geringeres Krebsrisiko. Drei Viertel der Studien zeigten nur eine schwache Signifikanz (p zwischen 0,001 und 0,05) oder keine Signifikanz (p > 0,05). Statistisch signifikante Ergebnisse wurden häufiger als nicht signifikante Ergebnisse im Abstract angegeben als im Volltext des Manuskriptes. 36 Metaanalysen präsentierten dagegen zurückhaltendere Ergebnisse, hier gaben nur vier Studien ein erhöhtes und neun ein geringeres Risiko für Krebserkrankungen an. Man kann darüber streiten, ob die von Schoenfeld und Ioannidis gewählte Vorgehensweise ein wahres Abbild der vollständigen Literatur ist. Die Autoren räumen selbst ein, dass ihre Übersicht nicht erschöpfend ist. Sie sehen ihre Arbeit aber durchaus als repräsentativ für eine Literaturrecherche an, die etwa ein Forscher, Arzt, Patient oder Konsument anhand der wissenschaftlichen Literatur für eine Meinungsbildung durchführen würde. Man kann davon ausgehen, dass diese Multiplikatoren auf genau diesem Weg einen wesentlichen Teil ihres Meinungsbildungsprozesses beschreiten, muss sich allerdings die Frage gefallen lassen, ob diese Vorgehensweise die tatsächliche wissenschaftliche Datenlage abbilden kann.

Eher Belege für Muster denn einzelne Nährstoffe?

Interessanterweise ermittelte Ioannidis zudem, dass größere Wirkungen (Effect Sizes) für komplexe Ernährungsmuster plausibler sind als die Summe der Wirkungen von verschiedenen Nährstoffen oder einzelnen Verhaltensmustern. Ein vielzitiertes Beispiel ist die sogenannte Mediterrane Diät, aus der sich in der Lyon Diet Heart Studie und der Primary Prevention of Cardiovascular Disease Studie (PREDIMED) eine Reduzierung des Krankheitsrisikos um 70 bzw. 30 % ergibt. Möglicherweise sind diese Wirkungen jedoch künstlich aufgebläht, denn beide Studien wurden beendet, als signifikante Zwischenergebnisse vorlagen, wodurch die Ermittlung des tatsächlichen Behandlungseffektes überhöht wird. Auch die Auswahl einer Hochrisikopopulation (Patienten mit Herz-Kreislauf-Erkrankungen bzw. dem metabolischen Syndrom) und ungünstiger Kontrolldiäten etwa in der PREDIMED-Studie, bei der 37 % der Energiezufuhr aus Fett im „Niedrigfett“-Arm der Kohorte stammte, können die Ergebnisse in eine bestimmte Richtung beeinflusst haben. Und schließlich können überhöhte Wirkungen auch dadurch entstehen, dass die Probandenkollektive trotz Randomisierung unausgewogen sind. Die Daten aus der PREDIMED-Studie lösten eine rasant wachsende Zahl an Publikationen aus, die äußerst unplausible Behauptungen aufstellen. So wurde etwa verbreitet, dass durch den Konsum von mehr als drei Portionen Nüssen pro Tag die Gesamtsterblichkeit um 39 % sinkt (Guasch-Ferre, Bullo et al. 2013). Echt?

Studienanforderungen

Trotz aller Einschränkungen sind die Daten aus randomisierten Studien doch ein großer Schritt vorwärts. Sie lassen hoffen, dass in der Zukunft Ernährungsinterventionen gefunden werden können, die eine 5- bis 10%ige Reduktion der Sterblichkeit nicht nur bei Hochrisikopatienten, sondern auch in der allgemeinen Bevölkerung erreichen. Aufgrund dieser eher geringen Unterschiede werden allerdings Studien notwendig sein, die eine um den Faktor 10 höhere Stichprobengröße aufweisen müssen als das Probandenkollektiv der PREDIMED-Studie (n = 7447). Zudem sind ein langfristiges Follow-up, die Verknüpfung mit den Sterberegistern und ein enormer Aufwand bei der Kontrolle der Einhaltung der diätetischen Vorgaben erforderlich. Interventionsstudien sollten sich aber zudem nicht nur auf Ernährungsveränderungen beschränken, sondern idealerweise auch Verhaltensmodifikationen und andere sozioökonomische Faktoren berücksichtigen, die den Lebensstil und das Einhalten gesundheitlicher Strategien beeinflussen.

Hoher Einfluss der Ernährung fraglich

Der US-amerikanische Gesundheitsbericht führt 26 % der Todesfälle und 14 % der DALY (Disability Adjusted Life Years) auf die Ernährung zurück, ohne Berücksichtigung der Fettsucht. Kein anderer Risikofaktor erreicht auch nur annähernd den Effekt der Ernährung, auch nicht Rauchen und körperliche Inaktivität. Ioannidis sieht auch dies als unplausibles Ergebnis an, da er die zugrundeliegenden Daten aus den oben erwähnten Ernährungsstudien anzweifelt. Möglicherweise sind sozioökonomische Faktoren die Wurzel des Problems; der Haken ist jedoch, dass diese kaum in diesen Studien berücksichtigt werden. Schlechte Ernährungsweisen korrelieren wahrscheinlich mit einem oder mehreren Einflüssen sozialer Faktoren auf die Gesundheit. Dennoch: Auch wenn der Einfluss der Ernährung nur ein Zehntel der genannten Zahlen betragen würde, sollte dieser Effekt beachtet werden. Schlüssigere Ergebnisse sind aber nicht aus einer weiteren Million an Beobachtungsstudien oder kleineren randomisierten Studien zu erwarten, solche Studien können lediglich dazu dienen, ein Studiendesign für eine umfassende „Mega“-Interventionsstudie zu entwickeln.

Messen wir, was wir glauben?

Neben den Beanstandungen von John Ioannidis hat ein weiteres Paper für Aufsehen gesorgt: Archer et al. kritisierten heftig, auf welcher Datengrundlage Empfehlungen für die Ernährung der US-amerikanischen Bevölkerung zustande kommen (Archer, Pavela et al., 2015). Sie argumentieren zu Recht, dass sich die Lebensmittelverfügbarkeit und der Ernährungsstatus in den USA im vergangenen Jahrhundert auf einem nie zuvor erreichten Niveau befanden. Ähnliches lässt sich für nahezu alle entwickelten Länder formulieren. Typische Ernährungsmangelkrankheiten, z. B. Pellagra, Beri-Beri, Rachitis oder Kropf, waren noch im frühen 20. Jahrhundert große Herausforderungen für die Gesundheitspolitik. Inzwischen wird laut dem Bericht des US Center for Disease Control and Prevention (CDC) davon ausgegangen, dass nahezu 80 % der amerikanischen Bevölkerung kein Risiko für eine Unterversorgung eines der sieben Vitamine aufweisen, für die Ergebnisse aus Biomarkern vorlagen (Vitamin A, B6, B12, C, D, E und Folate). Etwa 90 % der Frauen im gebärfähigen Alter haben kein Risiko für Eisenmangel, und im Vergleich zu älteren Berichten sind die Folatspiegel um etwa 50 % gestiegen (Pfeiffer, Sternberg et al., 2013). Im Allgemeinen sind die Menschen der entwickelten Länder also frei von Nährstoffmängeln und den damit verbundenen Krankheiten.

Ein Dilemma: Erinnerungslücken

Archer et al. stellen nun die Frage, ob Daten zum Ernährungsverhalten, die auf dem Erinnerungsvermögen der Probanden beruhen, valide sein können. Viele Ernährungsstudien basieren auf solchen Daten, etwa die sogenannten 24-h-Recalls, Diet History, Food Frequency Questionnaires oder vergleichbare Instrumente. Nicht nur die Ernährungsberichte der USA, sondern auch viele europäische Ernährungsberichte basieren zumindest teilweise auf solchen Erhebungsmethoden. Diesen Instrumenten liegt die Annahme zugrunde, dass die Wahrnehmung, Speicherung von Ereignissen und die Wiedergabe dieser Ereignisse des Menschen akkurate und verlässliche Instrumente zur Gewinnung wissenschaftlicher Daten sind. In der Tat gibt es aber einige Evidenz dafür, dass diese Annahme falsch ist (Bernard, Killworth et al., 1984; Schacter and Graf, 1989; Patihis, Frenda et al., 2013). Die Diskrepanz zwischen der objektiven Realität und ihrer Wahrnehmung durch den Menschen ist außerhalb der Ernährungsforschung gut untersucht. Auf Grundlage dieser Untersuchungen können die erinnerungsbasierten Daten aus retrospektiven Ernährungserhebungen wohl am besten definiert werden als bloße Attributionen basierend auf mentalen Erfahrungen unter dem starken Einfluss der idiosynkratischen Eigenschaften, früheren Erfahrungen und Informationen, Wissen und Glauben, Motivation, Zielen und Verhalten der Befragten sowie dem sozialen Zusammenhang, in dem Erinnerungen kodiert oder wiedergegeben werden.

Jede zweite Angabe ist – mehr oder weniger – falsch

Eine schon etwas ältere Übersichtsarbeit über die Validität von Daten aus persönlichen Berichten zeigt an einigen Beispielen unter anderem aus der Gesundheitsversorgung, Ernährung, Strafrecht und Ökonomie, dass davon auszugehen ist, dass etwa die Hälfte der Informationen der interviewten Menschen in unterschiedlichem Ausmaß falsch ist (Bernard, Killworth et al., 1984). Im Bereich der Ernährung bestimmen frühere Erfahrungen zusätzlich, was im Gedächtnis gespeichert wird, und eben nicht nur die aktuelle Wahrnehmung des Verhaltens. Insbesondere wiederholt auftretende Ereignisse werden nur noch minimal kognitiv verarbeitet, sodass die aktuelle Erinnerung an solche Ereignisse relativ schlecht ist und damit beim Versuch, diese Erinnerungen abzurufen, diese so rekonstruiert werden, dass sie eher den wiederholten Erfahrungen entsprechen als einer getreuen Wiedergabe der spezifischen Erinnerung an das vor kurzem Ereignete (Freeman, Romney et al., 1987). Kronenfeld et al. etwa publizierten eine Studie, in der Restaurantgäste nach Verlassen des Restaurants gefragt wurden, welche Kleidung die Kellnerinnen und Kellner getragen hatten. Die Gäste stimmten deutlicher in ihren Berichten über die Kleidung der Kellnerinnen als über jene der Kellner überein, obwohl keines der Restaurants überhaupt Kellner beschäftigte. Über die im Restaurant gespielte Musik befragt, gaben die Gäste mehr Details in Bezug auf Restaurants an, in denen überhaupt keine Musik gespielt wurde. Die Abwesenheit der spezifischen visuellen oder akustischen Information verleitete die Probanden also dazu, aus den gestellten Fragen abzuleiten, dass es wohl männliches Servicepersonal und Musik gegeben haben musste und sie gaben kulturelle Normen für ihre Beschreibung der vermeintlichen Ereignisse wieder (Kronenfeld, Kronenfeld et al., 1972).

Verzerrte Erinnerung – je nach Kontext

In diesem Zusammenhang ist auch das Deese-Roediger/McDermott-Paradigma (DRM) zu erwähnen, eine Methode zur Untersuchung von falschen Erinnerungen in der kognitiven Psychologie. Hier wird den Probanden eine Reihe von semantisch verwandten Wörtern vorgelegt (z. B. Frühstück, Marmelade, Orangensaft, Kaffee, Müsli) und sie werden nach einer gewissen Zeit gebeten, diese Begriffe zu wiederholen. Hier werden extrem häufig Begriffe genannt, die zwar in diesem Zusammenhang häufig auftreten (z. B. Eier), aber in der eigentlichen Liste gar nicht vorkamen. Dieses Paradigma hat einen so starken Effekt auf die Induzierung von falschen Wiedergaben, dass solche Verzerrungen der Erinnerung auch bei Personen mit außerordentlichen Gedächtnisleistungen auftreten können. Häufig sind sich die Probanden bei ihren falschen Erinnerungen sicherer als bei den tatsächlich präsentierten Begriffen (Gallo, 2010). Im Bereich der Ernährung spielen die oben genannten Phänomene mit hoher Wahrscheinlichkeit auch eine Rolle: Probanden geben an, Dinge gegessen zu haben, die sie häufig zu einer bestimmen Mahlzeit essen, auch wenn sie diese bei der erfragten Gelegenheit überhaupt nicht konsumierten. Insbesondere Food Frequency Questionnaires mit langen Listen an semantisch verbundenen Begriffen sind besonders anfällig für die Provokation falscher Häufigkeiten. Umgekehrt kann es jedoch auch vorkommen, dass Dinge nicht berichtet werden, die so häufig vorkommen, dass sie kaum kognitiv verarbeitet und somit auch nicht reproduziert werden, etwa der Kaffeekonsum beim Frühstück.

Fazit

Bei all berechtigter Kritik an unserem Wissenschaftssystem im Allgemeinen und den Problemen der Ernährungswissenschaft im Besonderen fehlt es dennoch an konkreten Verbesserungsvorschlägen seitens dieser Kritiker. Es ist in der Tat einfach und wichtig, die Limitationen in einem Großteil der ernährungswissenschaftlichen Literatur aufzuzeigen, schwieriger ist es jedoch, daraus realisierbare Lösungsansätze abzuleiten. Dies ist meine Kritik an den Kritikern: Sie müssen zeigen, wie es besser zu machen ist.

Ernährungswissenschaftliche Forschung beschäftigt sich mit den Fragen nach der Wirkung unserer Ernährung auf den menschlichen Stoffwechsel auf allen Ebenen – von den molekularen Mechanismen, den Zellorganellen, den Zellen, den Organen, dem gesamten Organismus und seiner Umwelt. Es geht darum zu verstehen, wie Ernährung funktioniert. Hier hat ernährungswissenschaftliche Forschung eine grundlegende Bedeutung. Ob sich ein besseres Verständnis dieser Grundlagen in konkrete Empfehlungen für die Menschheit umsetzen lassen muss, halte ich unter Berücksichtigung der hohen Ansprüche an die wissenschaftliche Evidenz für schwer machbar. Für eine wissenschaftlich korrekt durchgeführte Studie etwa zur Absicherung der Auswirkung einer verminderten Salzzufuhr auf die Entstehung von koronaren Herzkrankheiten werden aufgrund der relativ geringen Effekte – wegen des Aufwands der Reduktion der Salzzufuhr ohne Veränderung der sonstigen Ernährung und des langen Zeitraumes, bis es zu messbaren Effekten kommt – wohl kaum die beträchtlichen finanziellen Mittel aufzutreiben sein. Daher kann die Frage, wenn überhaupt, nur in kleineren, kurzfristigeren Studien angegangen werden, die dadurch dann aber auch in ihrem Evidenzgrad zur Ableitung von Empfehlungen limitiert sind. Wichtig ist, diese Limitierungen der ernährungswissenschaftlichen Forschung zu kennen und diese transparent darzustellen. Dann kann zumindest jeder Einzelne entscheiden, inwieweit diesen Ergebnissen zu trauen ist und wie sinnvoll es ist, diese für sich selbst umzusetzen.

Dieser Text ist eine gekürzte und adaptierte Fassung des Artikels „Wie viel Wissenschaft braucht Ernährung?“ aus der ernährung heute 2_2017.

Literaturverzeichnis

Archer E, Pavela G, Lavie CJ: The Inadmissibility of What We Eat in America and NHANES Dietary Data in Nutrition and Obesity Research and the Scientific Formulation of National Dietary Guidelines. Mayo Clinic Proceedings 90 (7): 911–926 (2015).

Bernard HR, Killworth P, Kronenfeld D, Sailer L: The Problem of Informant Accuracy – the Validity of Retrospective Data. Annual Review of Anthropology 13: 495–517 (1984).

Black AE et al: Critical-Evaluation of Energy-Intake Data Using Fundamental Principles of Energy Physiology. 2. Evaluating the Results of Published Surveys. European Journal of Clinical Nutrition 45 (12): 583–599 (1991).

Freeman LC, Romney AK, Freeman SC: Cognitive Structure and Informant Accuracy. American Anthropologist 89 (2): 310–325 (1987).

Gallo DA: False Memories and Fantastic Beliefs: 15 Years of the DRM Illusion. Memory & Cognition 38 (7): 833–848 (2010).

Goldberg GR et al: Critical-Evaluation of Energy-Intake Data Using Fundamental Principles of Energy Physiology. 1. Derivation of Cutoff Limits to Identify Under-recording. European Journal of Clinical Nutrition 45 (12): 569–581 (1991).

Guasch-Ferre M et al: Frequency of Nut Consumption and Mortality Risk in the PREDIMED Nutrition Intervention Trial. Bmc Medicine 11 (2013).

Ioannidis JPA: Why Most Published Research Findings are False. Plos Medicine 2 (8): 696–701 (2005)

Ioannidis JPA: Implausible Results in Human Nutrition Research. Bmj-British Medical Journal 347 (2013).

Kronenfeld DB, Kronenfeld J, Kronenfeld JE: Towards a Science of Design for Successful Food Service. Institutions and Volume Feeding Management 70: 38–44 (1972).