Unboundedly

統計的因果推論・疫学についてのお話

炭水化物は体に悪い?脂質をたくさん摂るほど健康に良い?:2017年世界一に選ばれた科学論文を解説

久しぶりのブログ更新です。今回は、「炭水化物を摂取すると死亡率があがる」「脂肪はたくさん摂っても死亡率に影響がない」ことを示したとして2017年世界中で話題になった以下の論文について、論文自体の問題点やメディアで取り上げられている内容の誤りについてまとめます。

Dehghan, Mahshid, et al. "Associations of fats and carbohydrate intake with cardiovascular disease and mortality in 18 countries from five continents (PURE): a prospective cohort study." The Lancet 390.10107 (2017): 2050-2062.

http://www.thelancet.com/journals/lancet/article/PIIS0140-6736(17)32252-3/abstract

この論文は、Lancet*1という医学研究分野ではトップクラスに権威のある学術誌から出版されたことや、世界18か国のコラボレーションから得た13万人以上を追跡したデータを使った大規模な研究であること、”従来の食事ガイドラインを覆す発見である”などとして各方面で非常に話題になりました。なんと、2017年世界で影響を与えた科学論文ランキング1位にも選ばれたそうです。

日本でもメディアがこぞって研究の内容を取り上げています。

東洋経済:

CareNet:炭水化物の摂取増加で死亡リスク上昇/Lancet|医師・医療従事者向け医学情報・医療ニュースならケアネット

Business Journal:炭水化物の摂取量が増えると死亡率も上がる?日本糖尿病学会推奨の食事に矛盾 | ビジネスジャーナル

実はこの論文、専門家*2の間で「使用されているデータや分析のアプローチが不適切」「分析結果の解釈が正しくない」として批判されています。また、論文自体の問題もさることながら、その結果がさらに歪められ、誇張されてメディアで報道されていることも問題視されています。

この論文について、世界的な肥満研究の権威でハーバード公衆衛生大学院教授であり、現在栄養学部の学部長を務めるFrank Hu氏から直接話を聞く機会があったので、彼の批判+私が問題と思う点を今回まとめます。科学が乱用され、誤った栄養知識が広まらないことを願って。時間がない人は問題点1と結論・教訓だけご確認ください

f:id:KRSK_phs:20180829051422p:plain

誤った論文の結論・その解釈

まず最初に、「結果」と「結論・解釈」は異なるということを述べておきます。「結果」はあくまで、論文中に示された手順・手法に沿って行った分析から得られた数字であり、事実です(ねつ造していない限り)。問題は、その数字をどのように「解釈」し、「結論」を導くかです。使われた手法などが適切でない場合、得られた数字に対して有意義な解釈をすることは難しいです。さらに、「結果」で示されていないことまで勝手に「解釈」してしまうことも問題です。この違いを意識しながら、問題の論文を読んでみましょう。

本研究から得られた「結果」は次のようなものです。

1.「炭水化物を“最も多く”食べていた人たち」は「“最も少なく”食べていた人たち」と比べて、全死亡率が28%高い。*3
2.「総脂肪摂取が“多い”人たち」は「総脂質摂取が“最も少ない”人たち」と比べて全死亡率が低い。「“最も多い”人たち」は死亡率が23%低い。
3.総脂肪だけでなく、脂肪の種類*4によらず「脂肪摂取が“多い”人たち」のほうが「摂取が“最も少ない”人たち」と比べて死亡率が低い。

 論文の内容に忠実に書くと、この研究の発見は上記のようなものになります。回りくどい書き方をしているように見えるかもしれませんが、理由があります。本記事を読み終えた後にこの結果を読み直すと面白い気づきがあると思います。

ここから得られる筆者らの「解釈・結論」(と予想されるもの)は以下のようなものです。

(1.炭水化物をたくさん食べると死亡率が上がる)
(2.脂肪は種類によらず、たくさん食べた方が死亡率が下がる)
3.従来の食事ガイドラインと反する発見であり、ガイドラインの改定が必要

 脂肪の摂取、とくに「飽和脂肪酸(バターや赤身肉に多く含まれる脂肪)」の摂取を控えることが健康に良いとするWHO(世界保健機関)の食事ガイドラインと反する結果が今回得られたことから、3の結論を導いています。

さて、お気づきの方も多いでしょうが、上記の「結果」から「結論」を導くうえで筆者らは非常に強烈な前提をおいています観察された関連=因果関係という前提です。この両者は通常異なることが多いことは、いたるところで説明されていますし、本ブログでも以前扱いました。

実は筆者らは論文中で、注意深く"causal(因果)"だとか“effect(効果)”といった表現を避け、“association(関連)”という言い方を一貫して使っています。ですが、食事ガイドラインを改定すべきという強烈な結論 を導いていることから、彼らが観測された関連を因果的に解釈しているように(少なくとも私には)思われます。

しかしながら、分析上いくつかの問題点があり、今回の研究で観測された関連=因果関係というのは難しいだろうというのが実際です。それ以外にもいくつか課題があり、全体として非常にミスリーディングな結論が導かれています。各点について以下で説明します。

また、メディアでは本研究の結果を踏まえて次のような解釈がされています。

・炭水化物の摂取を少なくして、脂質の摂取を増やすべき
・糖質ダイエット(炭水化物の摂取を極端に減らすこと)は健康に良い

 いずれも完全な誤りです。少なくとも本研究の内容を踏まえて導くことができる結論ではありません。特に二つ目はひどく歪められた解釈です。冒頭でも紹介した東洋経済オンラインの記事はこのパターンです。どうも記事を書いた医師が糖質ダイエットを推奨してお金を儲けている人らしいので、自分の都合のいい解釈を勝手にしたのだと推察します。

そもそも、どのようなデータを使ったか?

栄養と健康に関するこれまでの研究の多くが、北米やヨーロッパ諸国の人を対象としたものでした。これに対して著者らは、このように限られた国で行われた研究の結果をアジアなどの他国に応用できないのではないかと主張しています。

そこで彼らはProspective Urban Rural Epidemiology (PURE) studyという研究プロジェクトを開始しました。アジア諸国を含めた全18か国から、13万人以上のデータを集めたのです。参加国はカナダやスウェーデンなど比較的裕福な国から、バングラディシュ・インド・パキスタン・ジンバブエなど貧しい国まで様々です。

実は、「貧しい国」からのデータが含まれている(しかもデータ全体の大半がこれらの国から)ことが肝となります。以下少しの間、このことを頭の片隅に入れておいてください。

問題点1:行われた“比較”とメッセージが一致しない 

「〇〇をする・食べると△△(病気)のリスクが~%下がる(もしくは上がる)」という文言をニュースや雑誌などで見かけたことがある人は多いと思います。このように、健康になるためのHow to的なメッセージの多くは「疫学」と呼ばれる分野の研究結果を踏まえています。*5

非常に大雑把に言えば、疫学では異なるグループ間の比較によって、ある要因と健康の間に関連があるかどうかを調べています。例えば、タバコとガンの関係が知りたければ、タバコを吸っている人たちと吸っていない人たちを比較してガンの発生率が異なるかどうかを比べるといった具合です。詳しくは過去記事をどうぞ。

問題となっている論文も、もれなく疫学のカテゴリーに入ります。ですので、どのようなグループ間の比較を行っているのかを注意深く見る必要があります

著者らは次の手順で比較を行いました。①各個人が一日に摂取する総カロリーのうち、炭水化物や脂質がそれぞれどのくらいの割合を占めているかを測定。②その割合が低い人から高い人に順番に並べる。③人数が均等になるように五つのグループに分ける。

出来上がった5つのグループはQ1-Q5と名付けられ、Q1が最もその栄養素からのカロリー摂取が少ないグループ、Q5が最もその栄養素からのカロリー摂取が多いグループとなります。まどろっこしいので以下では、〇〇からのカロリー摂取が少ない(多い)=〇〇の摂取が少ない(多い)として書いていきますが、厳密にはこのように定義されています。

そのうえで、著者らが行った比較とはQ1vsその他のグループの比較です。例えば、炭水化物の摂取が“最も少ない”人たち(Q1)とそれよりも“多く”摂取している人たち(Q2-Q5)とを比較して、死亡率が違うかどうかを比較したわけです。

そして次のような「結果」が得られました。

  • 炭水化物:Q1と比較してQ5で死亡率が1.28倍
  • 総脂肪:Q1と比較してQ5で死亡率が0.77倍

一見すると、炭水化物を減らしたほうが健康に良さそうだし、脂質はたくさんとった方が体に良さそうです。

では、このように定義された“多い(Q5)”とか“少ない(Q1)”という表現が、実際のどのくらいの摂取量を指すのかを確認してみましょう。論文Table 2に示された内容によると、以下の通りです。

f:id:KRSK_phs:20171230143214p:plain

炭水化物

アメリカの食事ガイドラインによると、成人に推奨される炭水化物からのエネルギー摂取割合は45~65%となっています。これと比べて、Q5の77.2%というのは非常に高い値といえます。つまり、一日のカロリーの大半を炭水化物から摂取していることになります。どのような食事をしたら、このような状況が起きるか考えてみてください。

実はこれ、貧しい国に住む人々に典型的な食事パターンなのです。高価な野菜・果物や肉にアクセスできない彼らは、炭水化物(特に白米などの精製された穀物)を食べることで飢えをしのいでいます。このような人たちにとっては、炭水化物だけでなくタンパク質や脂質の主な源も白米だったりするわけです。

さきほど、今回の研究で使用されたデータの多くが貧しい国に住む人々のものだという事実に触れました。このように極端に高い炭水化物からのカロリー摂取は、Poverty diet(貧しい人々の食事パターン)を示唆するものと考えられます。したがって、観測された炭水化物と死亡率の関連は炭水化物自体の効果ではなく、彼らのおかれている貧困の影響やPoverty dietによる栄養失調の影響ではないかと考えることができます

これらは交絡と呼ばれる現象で、因果関係がないのに関連が生じる原因の一つです。

 Poverty dietによる交絡

f:id:KRSK_phs:20171230151455p:plain

 貧困による交絡

f:id:KRSK_phs:20171230153244p:plain

Poverty dietや貧困による交絡の可能性を示唆する内容が、実は論文中に示されています。著者らは関連が見られた総死亡の代わりに、循環器疾患全般・心筋梗塞・脳卒中の発生や循環器疾患による死亡について、炭水化物摂取量の異なるグループ間の比較をおこないました。結果、これらのアウトカムと炭水化物摂取が“多いこと”(vs Q1)との関連は全くありませんでした。その代わり、循環器“以外”の疾患による死亡(non-cardiovascular disease mortality)との関連にかなり強い関連が見られました。

では、特に貧しい国における循環器以外の疾患とはなにか。ずばり感染症です。結核・マラリア・ポリオだとかそういうやつです。栄養失調や住んでいる地域や住居の衛生状態の悪さによって感染症のリスクは高まりますので、交絡が生じている可能性が高いということです。

ちなみに「極端に炭水化物摂取が多い」ことと総死亡の関連が見られただけで、そもそも糖質ダイエット(極端な炭水化物カット)が健康によいかどうかの話は全くしていません。仮に交絡がなく見られた関連が因果関係であったとしても、本研究の結果から、糖質ダイエットの健康効果が証明された!などと騒いでいる人は論外ということです。

総脂質

同じくアメリカの食事ガイドラインによると、総脂質からのカロリー摂取割合の推奨は20-35%となっています。これをふまえると、この研究で「最も脂質をたくさん摂取した人たち」と定義されたQ5グループの35.3%はわずかに推奨ラインを越えてはいるものの、そんなに過剰に摂取しているとは言えずむしろ健康的な摂取量の範囲内とみることができます。

これに対して比較対象のQ1は10.6%となっています。推奨摂取割合の下限(20%)の約半分であり、相当脂質の摂取量が少ない集団であると言えます。

つまり、「Q1 vs Q5で比較を行った結果、Q5のほうが死亡率が低かった」という結果は「脂質をたくさん摂取した人の死亡率が低い」ではなく「脂質摂取が通常の人と比較して、極端に少ないひとの死亡率が高い」ことを示していると考えられます。なにごとも適度な量が体にいいってことです。

あるいは、炭水化物と同じくpoverty dietによる交絡の可能性もあります。精製米からの栄養摂取がほとんどの場合、脂質からのカロリーの割合は低くなるからです。 

いずれにしても、「脂質をたくさん摂取したほうが死亡率が低い」→「脂質の摂取を控えるべきとする現在のガイドラインは誤り」という風に議論を運んでいくのは全くミスリーディングであり、データをゆがめて解釈していると言えます。

問題点2. 社会経済状況の調整が不十分

筆者らも論文中に研究の限界としてpovert dietや貧困による交絡の可能性に言及しています。追加の解析もおこなっており、さすがに査読者にこっぴどくつつかれたのかもしれません。以下のように書かれています。

Furthermore, while high-carbohydrate and low-fat diets might be a proxy for poverty or access to health care, all of our models adjusted for education and study centre (which tracks with country income and urban or rural location) and would be expected to account for differences in socioeconomic factors across intake categories. 

(要約:貧困による交絡はありうるが、教育歴と場所を調整したので社会経済的要因の差は問題ではない)

んなわけねーだろ、というのが率直な感想です。そもそも途上国では教育歴は社会経済的要因のmeasurementとしてあまり適していないし、それ一つですべてを説明できるわけがないのです。

一応、追加の解析として別の社会経済的要因も調整したと書いています。この補助解析に該当するTable S12を確認しました。世帯所得・世帯資産・国の経済レベルを使ったようなのですが、それぞれどのように測定され、変数化されたのか全く説明がありませんでした。

極めつけは、各統計モデルでそれぞれの要因一つのみの調整しかしていないことです。要するに、世帯所得の調整を行ったときにはなぜか教育歴やその他の要因の調整を行っていないのです。教育歴や所得などは社会経済的要因の異なる側面を反映していますし、そもそも一つ社会経済的要因の変数をぽいっと入れたくらいでは貧困による交絡を完全に処理することができるとは到底思えないので、当然複数の要因を同時に調整するべきだと思うのですが、そうするとなにか不都合なことでもあったのかしらと勘繰りたくなるほど不十分で不自然な解析です。

問題点3.そもそもデータが信頼できない?

 実はこのPURE study、どのようにしてデータを収集したのか細かい内容が論文中で論じられていません。例えば、中国においてどのような人たちを対象に、どうやって調査をお願いしてデータを集めたのか、そういった重要な内容が論文からはわかりません。軽く「詳しい内容は他の文献に書いてあるから確認してね!」と書いてあったので、その他のPURE study発の論文を確認してもやはり書いていない。最も重要なデータの質が評価できないのです。

例えばTable 1を確認すると、中国人のデータでは脂質からのカロリー摂取割合が平均17.7%とあります。これは食事ガイドラインの基準からみても低いですし、中国人の脂肪摂取量に関する他の調査(いずれも30%前後が平均)とも一致しません。いったいどういう集団を対象にデータを収集したのか疑問ですし、そのようなデータから得られた結果に信頼がおけるとも思えません。

問題点4.複数の国からのデータをマージすることの妥当性

そもそも今回、炭水化物や脂質の摂取量はFood Frequency Questionnaire (FFQ)と呼ばれる方法を使って測定されています。栄養疫学研究でよく使われる、非常に信頼がおける手法です。しかし細かい説明は割愛しますが、FFQは正確な栄養摂取量の測定には不向きであるとされています。

その代わり、似たような食文化を持つ集団における摂取量の相対的なランキング(順番付け)をするのにFFQは非常に適しています。言い換えると、「炭水化物を〇〇g平均して毎日食べている」みたいなことはFFQから言えないが「この人は同じ集団内のだいたいの人よりもたくさん摂取している」というのは得意なのです。

このような理由からFFQは比較的均質な集団を対象に使用すべきだといえます。だからこそ、これまでの栄養疫学はUSなど特定の国の、さらに均質な集団(医療専門職で働く人のみを対象とした研究が有名です)のデータを使用したものが多かったのです。

今回のPURE studyでは食文化も異なる様々な国からのデータを一緒にして解析してしまっているので、不適切なアプローチではないかと思います。

 問題点5.「炭水化物」というカテゴリーは粗すぎる

「炭水化物」にもいろいろな種類があります。様々な研究から、精製された白米や小麦から得る炭水化物と玄米やリンゴなどから得る炭水化物では健康への影響が全く異なることが知られています。食事ガイドラインでも、whole grain(未精製)炭水化物の摂取を増やすことが推奨されています。詳しくはこちら

なので、異なる種類の炭水化物すべてをまとめて、「炭水化物」という一つのカテゴリーに無理やりまとめて分析すること自体がナンセンスであると言えます。脂質に関しては各種類の脂質ごとに分析をしているのに、なぜか炭水化物はそのままです。FFQのデータならば炭水化物の種類を分けた分析もできたはず、なのにしていない。なにか不都合なことでもあったのでしょうか、と勘繰りたくなります。

健康に良い炭水化物があるにも関わらず、炭水化物全体の名誉を棄損しているように思えます。一部の不良外国人を見て〇〇人はあーだこーだとステレオタイプを作ってしまう輩と同じですので、このような分析の仕方はとてもミスリーディングです。

問題点6.脂質の種類ごとの解析が不十分

脂質に関しては、総脂質だけでなく各脂質の種類ごとに健康への影響を評価しています。しかし、飽和脂肪酸やいくつかの不飽和脂肪酸が評価された一方でトランス脂肪酸に関する分析がありません

トランス脂肪酸は、多くの研究から健康に悪い影響があることが知られています。さらに言えば、各脂肪酸の摂取の多寡は他の種類の摂取の多寡と表裏一体(特定の種類をたくさん摂取している人は他の脂肪酸の摂取が少ない、など)ですのでトランス脂肪酸の摂取が交絡となっている可能性があります

どういうわけだか、トランス脂肪酸のデータはなかったようですが、本来ならばトランス脂肪酸も含めた解析が必要になります。

栄養疫学の専門家であるImamura氏よりコメントをもらいました。トランス脂肪酸に関しては、バイアスの方向性を考慮するとたとえ調整できたとしても結論を覆すことはないのでは、ということでした。

twitter.com

結論

以上をふまえての問題点をふまえて以下が結論です。

f:id:KRSK_phs:20171230173418p:plain

教訓

また、今回のまとめから以下のような教訓が得られると思います。

健康に関する(疫学)研究を見るときのチェックリスト

  • どのような比較がされているか?
  • 「多い」「少ない」など、あいまいな表現はどのように定義されているか?
  • 観測されている関連は因果関係か? (交絡やその他バイアスはないか)
  • データはどのように得られているのか?不自然な集団を扱っていないか?
  • 使用されている変数はどのように測定され、定義されているか? 

その研究を取り上げたメディアに触れるときの心構え

  • 出版されたジャーナルの知名度や論文の話題性自体に意味はない。論文の内容を吟味すべき
  • 「医師」や「〇〇大教授」など権威づけられた個人が書いているからといって正しいとは限らない(むしろ経験上、変なこと書いてる場合が多い)
  • 記事を書いているひとのバックグラウンドを確認する(糖質ダイエットビジネスに関わるひと、タバコ会社の関係者などはアウト)
  • 主張されている内容が、論文の結果に基づいているものか、見当違いな拡大解釈をしていないか注意する

参考文献

本記事の内容は「栄養疫学」と呼ばれる分野の考えに基づいています。私も栄養疫学のコースをいくつか受けたことがありますが、栄養摂取量の測定・統計解析の方法など本当に奥の深い世界です。以下の二冊が参考になります。

まず一冊目は大御所Walter Willettによる栄養疫学の教科書。ハーバード公衆衛生大学院の栄養学部の前学部長です。栄養疫学で使われる主な測定方法や、測定誤差にどう対応するかなど手法的に重要な内容が書かれています。

Nutritional Epidemiology (Monographs in Epidemiology and Biostatistics)

Nutritional Epidemiology (Monographs in Epidemiology and Biostatistics)

 

 二冊目は、ハーバード公衆衛生大学院栄養学部の現学部長であるFrank Huによる肥満研究の教科書。直接PUREスタディと関連するわけではないですが、”肥満”や身長・体重などをどう統計的にモデルしていくべきなのか、非常に勉強になりました。

Obesity Epidemiology: Methods and Applications

Obesity Epidemiology: Methods and Applications

 

 日本語訳も出ています。

肥満の疫学

肥満の疫学

  • 作者: フランク・B・フー,小林身哉,八谷寛,小林邦彦
  • 出版社/メーカー: 名古屋大学出版会
  • 発売日: 2010/09/27
  • メディア: 単行本
  • クリック: 9回
  • この商品を含むブログ (1件) を見る
 

 

*1:世界五大医学誌の一つです。

*2:データから人々の健康に影響する要因をさぐる疫学者、特に栄養と健康の関連を研究する栄養疫学者

*3:厳密には「炭水化物からのエネルギー摂取の割合が最も高い集団と低い集団の比較

*4:飽和脂肪酸・単価不飽和脂肪酸・多価不飽和脂肪酸

*5:もちろん基礎研究も重要ですが、疫学研究のほうがよりゴシップとして取り上げられることが多い印象です。