受動喫煙の防止策として、室内全面禁煙を目指す厚労省側とそれに反発する自民たばこ議連が争っています。本件に関しTwitter上でも、なかなか面白いディスカッションがおきています。
室内禁煙による受動喫煙対策は「科学的根拠(エビデンス)」に基づくものであり、国際的なスタンダードとなっているため実施すべきであるとする(私自身を含めた)公衆衛生・医療関係者らの主張に対して、経済学者・統計学者の方々から辛辣なご批判が届いています。
指摘されている内容を読んでみると、たしかに言っていることに一理ある。というか指摘はおおむね”正しい”のです。やはり経済学者はデータ分析に厳しい。とても素晴らしいことだと思いますし、私も彼らを尊敬し、そのようになりたいと日々思って勉強しています。しかし今回の件に関する批判はごもっともとして、あたかも「室内禁煙は支持するデータは全くのデタラメで信用ならん。やはり禁煙なんてすべきでない」とするのは早計だと思うのです(彼らがそう考えていると言っているのではありません。研究者からの「それらしい」批判を読んだ一般の方々に誤解してほしくないと私が思っているだけです)。
室内禁煙を支持する人間の一人として、そして批判にさらされている「疫学研究」に関わる人間の一人として私の個人的な考えを述べつつ、議論を整理できればと思い下手な文章を久しぶりに書いてみた次第です。なお繰り返しですが、批判をしてくださった特定の個人に対して彼らが間違っているとかジャッジするつもりはないし、むしろとても誠実でまじめな科学者なのだと尊敬していることをご理解ください。
まずは論点の整理から。室内禁煙の是非をめぐる議論には三段階の合意(下記1-3)と別の争点(下記4)があります。
1. そもそも受働喫煙は健康に対して悪影響があるのか?
2. 大なり小なり健康影響があるとして、わざわざ法改正してまで対策をすべきか?
3. 受動喫煙対策をするとして、屋内全禁煙が妥当なのか?厳しすぎないか?
4. 科学者という立場で喫煙の健康リスクなど、具体的な数字を一般に伝えるときのサイエンス・コミュニケーションに関する指摘
本記事ではそれぞれ順に触れたいと思います。長くなりすぎたので、今回は1についてのみ書きます。残りは明日以降。
- 統計で受動喫煙の健康リスクってどうやって出すの?統計における「因果」とは?
- 疫学研究の結果をどう解釈するべきか?
- 科学的根拠(エビデンス)に基づく政策とは?
- 「受動喫煙による死亡は年間15000人」はけしからんのか?
統計で受動喫煙の健康リスクってどうやって出すの?統計における「因果」とは?
今回あった批判のなかに、「根拠としている論文がずさんな分析をしていて、結果が因果関係を示していない!」というものがありました。この批判に対する私の考えを述べる前に、そもそも受動喫煙の健康リスクをどうやって統計的に導くのか、本当に受動喫煙が「原因」だと言えるのか、どの程度信用がおけるものなのか、ということについて書きたいと思います。
以下、若干テクニカルな話も含まれます。細かい議論に興味がない人は流し読みで雰囲気だけつかんでいただければ結構です。
「因果関係」なるものをどう定義しているのか
受動喫煙が健康に与える「影響」を評価するときに興味があるのは、いわゆる因果関係と呼ばれるものです。本当に受動喫煙が「原因」となって、肺がんなどの病気という形で「結果」が起きているのかを知りたいわけです。「受動喫煙を防止したら本当に病気が減るのか?」を知るためには因果関係が必要です。
統計学における「因果関係」は、受動喫煙と病気というコンテクストではフォーマルに以下のように定義されます。
受動喫煙(A)が、ある”集団”における疾病Dの発生リスク(例:10年間の追跡中に100,000人中何人でDが発生するか)に与える影響(因果関係)= 仮にその集団全員が受動喫煙をしたときの疾病D発生リスク と 仮にその集団の誰も受動喫煙をしなかったときの疾病D発生リスクの差もしくは比
ちなみに数式で書くと以下のようなイメージ*1
例えば、ある集団(1000人としましょう)において、受動喫煙がどのくらい肺がんを引き起こしているか、その「因果関係」を知りたいとします。定義上は以下のような手順で「因果関係」が求まります。
- この1000人全員を受動喫煙に(無理やり)曝露させ、一定期間追跡したあとの肺がん発生リスクを調べる。例として1000人中50人が肺がんになったとする。
- タイムマシーン的なものを開発して追跡開始前まで戻り、まったく同じ1000人の誰も受動喫煙に曝露させず、同じだけの期間追跡し同様のリスクを計算する。例として1000人中30人が肺がんになったとする。
- ”リスク差”は50/1000 - 30/1000 = 20件/1,000人、”リスク比”は50/1000 ÷ 30/1000 = 50/30 = 1.67
この場合、最終的に得られた数字(20/1000, 1.67)は因果関係を表す数字として解釈できます。というかそう定義したのですからいちゃもんのつけようがありません。この集団では、受動喫煙が「原因」で肺がん発生のリスクが1.67倍になるということです。仮にこの集団全員が受動喫煙の影響を受けていた場合、法規制などによって受動喫煙をゼロにすることで20人の命を救うことができます。
問題はこれらの数値が現実に求められない、ということ。だって誰かに無理やり受働喫煙させたりすることはできないし、そもそもタイムマシーンなんて存在しないのだから。
どうやってデータから"因果関係”っぽいもの”を導くか
実際のデータからわかるのは、受動喫煙をしている集団における疾病D発生リスクと受動喫煙をしていない集団における疾病D発生リスクの差、比です。上記の因果関係の定義では比較している二つのグループが全く同じ人間から構成されているのに対して、受動喫煙をしている集団と受動喫煙をしていない集団はそれぞれ異なる人々の集合であることがポイントです。
数式では以下のようになります。
これは数学の用語を使うと”条件付き確率”の差や比になります。
仮に1000人の集団における肺がんリスクを考えてみましょう。受動喫煙をしている人としていない人の割合が半々だったとします。
- 受動喫煙をしている人500人を一定期間追跡して、肺がん発生リスクを調べる。例として500人中30人肺がんが発生したとする。
- 受動喫煙をしていない人500人を同じだけの期間追跡して、肺がん発生リスクを調べる。500人中10人肺がんが発生したとする。
- ”リスク差”は30/500 - 10/500 = 40件/500人=80/1000人、”リスク比”は30/500 ÷ 10/500 = 30/10 = 3
よく「タバコを吸うと〇〇のリスクが△倍」みたいな文言とともに疫学研究の結果が紹介されることがありますが、すべてこのような条件付き確率の差や比であることに留意ください。ではこれを”真の因果関係を表す値”としてとらえることができるか?答えはNOです。少し考えればわかることなのですが、受動喫煙をしている人としていない人では、受動喫煙以外の要因の影響で肺がんになるリスクがそもそも違う可能性が高いのです。例えば、受動喫煙をしている人はしていない人と比べて食生活も不健康なのかもしれません。つまり、両グループを比較するのがフェアじゃないということです。受動喫煙をしている人は食生活のせいで肺がんリスクが高まっているのに、それを受働喫煙のせいにされたのでは”損”していますよね。
したがって単なる条件付き確率の比較から得られた値は因果関係を示すものとは言えず、受動喫煙が「原因」でリスクが三倍になったとか言えないわけです。
しかし以下の条件下では条件付き確率の比較=因果関係と考えることができます。少しややこしいので興味がない人は読み飛ばしてください。
なぜならこの条件をつかって少し式変形をしてあげると、
なるからです。①、②の条件は、要するに二つのグループの比較がフェアな状態にする、ということです。RCTだろうとコホート研究だろうと、アイデアは同じです。受動喫煙の場合は、ランダム割付することはできないので、コホート研究をすることになります。この場合、性別・年齢・食生活など受働喫煙ありグループとなしグループの比較をアンフェアにするもの(交絡因子)を回帰分析などを使って”調整”してあげることでより、フェアな比較にしてあげるというイメージです。RCTはこのフェアな比較が確率的に期待されるというだけです。逆を言えば、RCTでなくてもあらゆる交絡因子を調整すれば、理論上はまったく同じように因果効果を見ることができます(そんなことができるかどうかは別として)。
統計的因果推論とはとどのつまり、研究デザインや統計解析の工夫をこらして、両者の比較をできるだけフェアにすることで、条件付き確率の比較を因果関係の定義に近づけようという営みです。
疫学研究の結果をどう解釈するべきか?
統計的因果推論によって得られた疫学研究の結果を解釈するうえで二つ重要な点があります。
1.バイアスなんてものは必ず存在するし、厳密な因果関係なんて一生分からない
コホート研究などを用いて、受動喫煙が肺がん発生リスクに与える影響を調べたとしましょう。先ほど書いたように、全ての交絡因子を統計的に調整してあげれば、理論上は因果関係をドンピシャで推定することができます。全て、というのがポイントです。現実には我々は神様ではありませんので、肺がんに影響するような要因をすべて把握することはできません。したがって、多かれ少なかれ”調整漏れ”が生じてしまい、因果関係を見るための条件が崩れてしまうのです。これはなにもコホート研究に限った話ではありません。RCTであっても、実施する人数が少なくて偶然アンフェアな比較になってしまうこともありますし、追跡する過程で両グループに差が生じて妥当な比較ができなくなってしまうかもしれません。要はドンピシャ正確な因果関係なんて一生分からないのです。
だからといって、統計的因果推論に意味がないわけではありません。観測可能である条件付き確率の比較と因果関係がどの程度異なっている(バイアスがある)のかを考えるのが重要です。
例えば、ある集団における受動喫煙が肺がん発生リスクに与える"真の因果効果”がリスク比で1.2だったとしましょう。さきほどの定義にのっとるならば、この集団全員が受動喫煙をした場合は仮におなじ人全員が受動喫煙をしなかった場合と比べて肺がん発生数が1.2倍になるということです。
コホート研究を行って条件付き確率の比較を行った結果、リスク比1.4だったとしましょう。この差はバイアスです。因果効果を過大評価していることになり、大変けしからんと怒られてしまうわけです。でも、「受動喫煙が肺がんのリスクをある程度上昇させる」という結論は変わりません。したがって、これはこれで意味のある情報だと私は考えます。
逆に真の因果効果がない場合(リスク比1)、受働喫煙があろうがなかろうが肺がんリスクは変わりません。したがって、観測された”バイアスのある”リスク比1.4は受働喫煙防止の必要性を示唆しますが、実際にはそんなことしてもお金の無駄なのでこんな”トンデモ”な数字を根拠として提示するな、ということになります。
また(あり得ない話ですが)、真の因果効果が健康に保護的な方向であった場合(リスク比0.8など)、同様の理由で1.4という観測結果はけしからんとなるわけです。本当は健康に良いものを禁止すべきという印象を与えてしまうのですから。
要するにバイアスも程度の問題なのです。後に述べる(交絡バイアスのための)感度分析という手法を使ってある程度バイアスの程度に目星をつけたうえで、不完全だと自覚しつつも使える情報は使って意思決定を行うことが必要だと思います。
2.あくまで「集団レベル」の話をしている
統計的に見ることが因果関係はあくまで集団レベルでの話です。ある集団において、受動喫煙を無くしたときに何人くらい肺がんの発生が減らせそうか、という話しかしていません。それ以上でもそれ以下でもありません。
言い換えると、個人に対する言及はしていないのです。受動喫煙をしていても肺がんを発症しない人もいれば受動喫煙なんて全くしていないのに肺がんになってしまう不幸な人もいます。俺の親戚のおじさんは毎日二箱タバコを欠かさず吸っているけど、90歳の今もピンピン健康だからタバコと肺がんの関係は必ずしも因果ではない!と主張するのは全くの見当違いというわけです。
生物学的なメカニズムも(少なくともこの比較だけからは)なにもわかりません。受働喫煙によって、体の中でなにがおきて肺がんにつながるのかさっぱり見当がつきません。
繰り返しですが、言えるのは、「受動喫煙がなくなると〇〇人の命が救われる、リスクが△倍下がる」などといったことです。なんとなく「因果関係」という言葉の直感的なイメージと一致しないのでむずがゆいかもしれませんが、落ち着いて考えてみるとこれは受動喫煙を防止する政策を作るかどうかの意思決定をするには十分な情報だと思います。
科学的根拠(エビデンス)に基づく政策とは?
”エビデンス”という言葉が流行ってしますが、少し誤解されているようなので私なりの解釈を述べます。はっきり言って超私見なので悪しからず。例えば「受動喫煙が肺がんリスクをあげるというエビデンスがある」といった表現が使われるとき、多くの人は「受動喫煙が肺がんを引き起こすことが証明された」と理解しているようです。しかし、これは誤った解釈だと言えます。これまで述べてきた理由により、”証明”することはできません。いかなる研究から得られた因果効果の推定にもある程度のバイアスがあります。
これはもうどうしようもありません。倫理的な理由からRCTができないなどの制約のなかで、限られたリソースを使って研究をしているのですから不完全なものになるのは必然です。それが気に食わないというのなら、すいませんとしか言いようがありません。もちろんそれでもできる限りバイアスを減らす努力はすべきですが、それにも限界があります。これが現実なのです。
しかし、”質が低い”コホート研究に基づいている主張だから信用ならんというのなら、どのあたりが質が低いのかを議論しないと全くナンセンスな指摘になります。さらに、例えば交絡因子の調整が十分になされていないコホート研究の場合、どんな未測定の交絡因子がありそうで、それによるバイアスがどの程度ありそうなのかを議論しなければいけません。けしからん分析をしていてバイアスが結構ありそうだから切り捨てる、というのは科学版ゼロリスク主義でしかなく、情報とその研究を行うのに使われた資源がもったいないと私は考えます。
さらにいうと、エビデンスは一つの研究結果から作られるものではありません。一部の人から見たら、けしからん分析をしている研究でも、賢く使って積み重ねていくことで合意が形成されていくことだってあるんです。全くのゴミはいくら集めてもゴミですが、使えそうなガラクタを集めると何か意味のあるものになったりするわけです。
例えば、喫煙と肺がんの関係なんかはその典型です。RCTができないので、観察研究に頼るしかありません。必然的に個々の研究にはある程度のバイアスが生じます。しかし、あらゆる時代、場所、集団において一貫して両者の関連は(かなり強い程度)で報告されてきました。これらすべてをバイアスで説明するのは難しそうです。そうやって先人たちの努力が積み重なることで、喫煙が肺がんのリスクを高めることが間違いないであろうという合意が形成されるわけです。
エビデンスとは不完全でも使用可能(available)な情報の集合体であり、あくまで意思決定の材料の一つにすぎません。因果関係でないものを根拠にしているから、不正確な数字を使っているから、エビデンスに基づいているとは言えない、は誤りです。「エビデンスに基づく政策」は科学的根拠だけをもとに政策を決めることではありません。たとえ不正確な情報でも、そのバイアスの程度を吟味したうえで価値判断を加えながら利用すれば立派なevidence-based policyだと私は思います。
私は喫煙者だが健康に問題がないから、対策なんて行き過ぎだと根拠のない個人的な感想をもとに政治を決めるおじさん達に任せるよりはよっぽどいいですよね。
「受動喫煙による死亡は年間15000人」はけしからんのか?
前提となる数字が怪しい?
さて、「受動喫煙によって年間15000人が死亡している」という情報に対して、けしからん方法で導かれた信用ならん数字であるという怒りの声が届いています。
算出のロジックは以下にわかりやすくまとめられていました。
ロジック自体には特に不自然なところはないはずです。問題となるのは、その計算で使用している数字が正しくない可能性があるということ、したがってその結果である受動喫煙による死亡者数も不正確かもしれないという点です。全くおっしゃる通りです。以下に「受動喫煙による日本人女性の肺がん死亡者数」の算出に使用する数字を列挙してみました。カッコ内は上記のブログが使用している数字です。元の論文もほぼ同じ数字を使っています。それぞれ社会調査データや疫学研究の結果から得られた数字を使用しています。
- 日本人女性の肺がん死亡者数(20000人)
- 能動喫煙割合(10%)
- 能動喫煙の肺がん死リスク比2.8
- 受動喫煙割合30%
- 受動喫煙の肺がん死リスク比1.3
以下勝手な想像力も働かせながら順に考えていきます。さすがに日本人女性の肺がん死亡者数が誤っているというのはないでしょう。死亡者数なんてのは死亡届などもあり、しっかり管理されているのでおおよそ正確な数字が得られそうです。
能動・受働喫煙割合は少しトリッキーです。日本全国における女性の喫煙割合の推定をするためには、元となったデータが女性日本国民からのランダムサンプリングによるものである必要があります。ちょっと怪しいですが、因果推論と比べると比較的単純でそこまで大きい誤差もないのではないでしょうか。能動喫煙割合がほんとは20%なのに、推定は10%だったなんてことはない気がします。
能動喫煙の肺がん死リスク比2.8は疫学研究からなのでしょう。因果じゃない!と思わず難癖をつけたくなってしまうところですが、この数字は肺がん死全体における能動喫煙者の割合を出す目的だけに使われるものであり、必ずしも「因果」を示すものでなくてよいはずです。単純にリスクの比が必要なだけです。
一番の鬼門はやはり最後の受動喫煙の肺がん死リスク比1.3でしょう。最終的なメッセージとして「受動喫煙が原因の肺がん死」を言うためには、これが因果関係を示すものである必要があります。ではこの1.3という数字がどこから来たのか、原著を確認するとメタアナリシスですが相当古くマイナーなジャーナルから出ているもので、”質の低い”コホート研究を集めたものである可能性が出てきました。要するに怪しいということです。
これはけしからん。こんないい加減な数字で計算するなんてトンデモ科学だということで、もう少し最近のメタアナリシスを探しました。
Taylor, Richard, Farid Najafi, and Annette Dobson. "Meta-analysis of studies of passive smoking and lung cancer: effects of study type and continent." International journal of epidemiology 36.5 (2007): 1048-1059. https://academic.oup.com/ije/article/36/5/1048/776352/Meta-analysis-of-studies-of-passive-smoking-and
掲載されている雑誌も疫学分野でもトップジャーナルの一つです。
同様に家庭内で受動喫煙が女性の肺がんリスクに与える影響を確認すると、メタアナリシスの結果リスク比が1.22となっています。メタアナリシスといえど、コホート研究の寄せ集めであり、個々の研究にはバイアスがあることが予想されます。バイアスがあるものを集めてもバイアスがあるものしか出てきませんので、まだ鵜呑みにできません。
いい加減な研究を集めているなんてまったくもってけしからんと思って、どんなとんでも論文の結果を使っているのかと、確認してみる。そのなかでも、最も「けしからん」研究、すなわち過大に受動喫煙の因果効果を見積もっている研究に注目した。Jeeらによる論文はリスク比1.9と推定している。とんでもないことだと思い、いったいどんな因果推論上の対策をしたのか確認。年齢、社会経済状態、住居、夫の野菜摂取量、夫の職業の影響を調整しているようである。当然これらですべての交絡因子を網羅しているわけではないだろう。したがって、ある程度のバイアスが生じていることになる。ほかの研究は個別に確認できていないが他も似たり寄ったりなのではないかと推測する。
それらバイアスのある研究の結果を併合して得られた1.22という数字もバイアスがあることになり、真の因果効果を示していません。
感度分析によって考えるバイアスの”程度”
さて、ここでいったん悲観的になってみます。この1.22という数字がすべてバイアスで説明ついてしまう、言い換えると、真の因果効果はリスク比1であり、受動喫煙と肺がんリスクに因果関係などないという前提にたって考えます。どの程度のバイアスが起きていることになるのでしょうか?真の効果が1なのに1.22という数字を導いてしまうほどの強さのバイアスが起きる未測定の交絡ってどういうものなのかを考えます。
(交絡バイアスのための)感度分析という考え方を使います。詳細は複雑なので省略します。また別の機会に。やり方はいろいろありますが、今回は以下の論文に基づき感度分析を行います。
Ding, Peng, and Tyler J. VanderWeele. "Sensitivity analysis without assumptions." Epidemiology (Cambridge, Mass.) 27.3 (2016): 368. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4820664/
1.22というバイアスを引き起こすためには、その未測定交絡因子と受動喫煙、肺がんそれぞれの関連の強さがリスク比で1.22+sqrt(1.22*(1.22-1)) = 1.74である交絡因子によるものより、強い交絡である必要があります。これより弱い交絡ではバイアスだけで観測されている関連を説明できず、なんらかの因果関係が働いていることになります。未測定交絡因子と受動喫煙の関連がリスク比1.74より小さい場合、その未測定交絡因子と肺がんの関連がリスク比で1.74よりも大きいものでなければ交絡だけで観測されている関連が説明できません。
しかも、この計算式は"without assumption”ということでかなり保守的な結果がでるようになっています。つまり、本当はもっと強いバイアスでないと説明できない可能性が高いということです。また、この1.74という数字はすでに調整されている交絡因子とは独立した関連を指していて、年齢や社会経済状態などとは無関係のメカニズムを通して1.74のリスク比となる交絡因子を考えなければいけません。
さて、人の健康に関するデータ分析に関わったことがある人なら直感的にわかると思うのですが、リスク比1.74というのは結構強烈な強さの関連です。感染症など原因がはっきりしているものならまだしも、がんのように様々な要因が複合的に作用して疾病につながるようなケースでは一つの要因でこれだけ強力な関連が見られることはレアです。ましてや主要な交絡因子とは独立した経路でそこまで強い関連を見ることが相当難しいと言えます。未測定交絡のバイアスだけで片付けるには1.22という観測されたリスク比はあまりにも”大きすぎる”ということになるのです。バイアスがあったとしても、少なからず肺がんと受動喫煙の間に因果関係がありそうです。つまり、受動喫煙を減らすことで集団レベルで肺がんを減らすことができる。
もう少し現実的に、未測定交絡と受動喫煙・肺がんの関連がリスク比でそれぞれ1.2だった場合を考えましょう。調整されている交絡因子とは独立して1.2です。この場合、バイアスの大きさの程度を表す数値を計算することができ、B = 1.2*1.2/(1.2+1.2-1) = 1.03。真の因果効果は1.22/1.03=1.17ということになります(詳しくは論文を参照ください)。しかも、これもwithout assumptionなので保守的な結果、つまり実際のバイアスよりも多めにバイアスを見積もったうえでの結果になります。1.17を1.22として推定していたのは明らかな”バイアス”になりますし、”不正確”であったということになります。ただし、因果関係がないとまではいえないし、あまり大きな違いとも言えない気がします。
ためしに、このバイアスが受動喫煙による死亡者数の推計にどう影響するのか考えてみましょう。要するに上記のブログで行われた計算のうち、リスク比1.3を別のメタアナリシス由来の1.22からさらに交絡によるバイアスを考慮した1.17に差し替えればいいわけです。結果は742人、もともとの論文にある1131人と比較するとだいぶ少ない。70%弱である。これがほかのアウトカムにも同等のバイアスが生じていたとすると、本当に受動喫煙で死んでいる人は15000*0.7=10500人くらいということになる。元の15000人は過大評価だと言えるのです。しかしそれでも(少なくとも私の目には)10500人という数は依然として多いように思えるし、いい加減な数字を使うから根拠のないデタラメだといって怒るほど大きな誤りではないようにも思えます。
もちろん上記の計算自体結構いろいろ前提をおいて、シミュレーションしているのであてにならんと言われればそれまでですが、繰り返し言うように完璧な推定なんて不可能です。たとえ不確実でも、既存の情報をうまいこと活用してよりよい社会を作るための方向性を決めましょうという態度のほうが柔軟なんじゃないかなと思うのです。まあ寛容な心で多めに見てください。
科学者たるもの、数字が不確実なものであることを明記せずに垂れ流すのはけしからんという主張もあると思います。これはエビデンスの妥当性とは別の問題で、サイエンス・コミュニケーションの話とつながってくるのかなと思いますが、この件については明日以降次の記事で思うところを書いてみます!
さて、長々と書きましたが最後にまとめます。
まとめ1:
そもそも統計をつかってドンピシャの因果効果を求めることは実質不可能
まとめ2:
バイアスの大きさがどの程度なのか、目星をつけることが大切
まとめ3:
バイアスがある不完全な情報でも拒絶するのでなく、うまく活用することが重要
まとめ4:
(おそらくだが)バイアスを考慮しても受動喫煙には健康を損なう因果効果がありそう
次回以降は、受動喫煙が健康を損なうという点には合意したうえで、受動喫煙防止をすべきなのか(なぜ健康がそこまで重要なのか)、なぜそれが”室内禁煙”であるべきなのかについて主に書いていきます。勢いで書いて今午前4時なので乱文だと思います。失礼しました。
*1:より一般的に書くなら期待値とすべきなのでしょうが、簡単のため確率としました