본문 바로가기
BI

인과추론 입문서 '원인과 결과의 경제학'

by wizmusa 2023. 6. 18.

원인과 결과의 경제학 - 넘치는 데이터 속에서 진짜 의미를 찾아내는 법

나카무로 마키코, 쓰가와 유스케 (지은이) / 윤지나 (옮긴이) / 리더스북 2018/09/20

원제 : 原因と結果の經濟學 (2017년)

https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=168895139

 

트위터에선가 '인과추론'을 익히기에 좋은 책이라고 추천한 글을 보고 냅다 사서 읽었습니다. 저자가 아주 쉬운 인과추론 입문서라고 밝혔듯이 통계학 지식이 거의 없어도 찬찬이 읽으면 오롯이 이해가 갈 정도로 쉬운 수준입니다. Python에서는 무슨 라이브러리를 쓴다든가 하는 내용은 없습니다. 실무를 시작하며 인과추론을 어떻게 시작해야 할지에 대한 내용은 딱히 없어서 다른 책을 더 찾아 읽어야 하겠습니다만, 원론적인 지침을 이해하기에는 좋았습니다. 어떻게 보면 통계학도보다는 보통 사람들이 악의적인 속임수로 쓰인 숫자에 농락 당하지 않고 현실을 온전히 관찰하기를 바라는 마음에 쓴 책이 아닐까 싶습니다.


반응형

프롤로그 : 당신이 알고 있는 사실은 진실인가? 10
데이터, 어떻게 해석할 것인가 13ㅣ사실과 사실 사이에 대한 합리적 의심 16ㅣ인과관계의 유무가 왜 문제되는가 18ㅣ착각으로부터 자유로워지는 법 20

19세기를 대표하는 미국의 사상가이자 작가인 랠프 월도 에머슨은 "얄팍한 사람은 운을 믿는다. 강한 사람은 원인과 결과를 믿는다"고 말했다. '인과 추론'은 결국 데이터가 범람하는 시대의 필수 교양이라 할 수 있을 것이다.


제1장
근거 없는 통설에 속지 않으려면 - 인과 추론의 본질

인과관계와 상관관계 27ㅣ가장 먼저 체크해야 할 세 가지 포인트 28ㅣ‘우연의 일치’는 아닌가? 29ㅣ‘제3의 변수’는 없는가? 32ㅣ‘역의 인과관계’는 존재하지 않는가? 34ㅣ‘반사실’로 증명하다 37ㅣ만약 타임머신이 있다면 38ㅣ현실과 이론의 차이 41ㅣ비교 가능하다는 것의 의미 44ㅣ상상력이 부족하면 시간과 돈을 낭비하게 된다 46
COLUMN 1 초콜릿 소비량이 증가하면 노벨상 수상자도 늘어난다? 50

근거에도 단계가 있다.

방법 메타 분석 랜덤화 비교 시험 자연 실험과 준실험 회귀 분석
복수의 랜덤화 비교 시험 통합. 가장 확실하게 인과관계 증명. 랜덤으로 실험군과 대조군을 나누어 인과관계 평가. 인과추론의 이상형. 세상에 존재하는 '실험과 같은 상황'을 적절히 이용해 인과관계 평가. 이미 데이터가 있을 때에 이용. 교란 요인의 데이터가 있을 때에 영향 배제.
에비던스 수준 높다     낮다

복수의 랜담화 비교 시험을 종합한 메타 분석의 경우, 에비던스 수준은 높지 않다. 메타 분석의 에비던스 강도는 그 근거가 된 연구의 에비던스 강도에 의해 결정된다.


제2장
건강검진을 받으면 오래 살 수 있다? - 제대로 된 비교는 랜덤이 진리

‘실험’을 통해 증명하다 57ㅣ왜 꼭 랜덤이어야 할까? 59ㅣ‘건강검진’과 ‘장수’ 사이에 인과관계는 있을까? 61ㅣ통계적으로 유의미하다는 것 62ㅣ충분히 검증된 정책인가 64
ㅣ막대한 세금이 투입된 정책의 함정 66ㅣ의료비 본인 부담률, 인상해도 괜찮을까 67ㅣ의료비와 건강 사이에는 인과관계가 없다 71
COLUMN 2 유리한 데이터의 취사선택을 방지하려면 73

 동전이 네 번 연속 앞면이 나올 확률은 0.5 x 0.5 x 0.5 X 0.5 = 0.625 (약 6%)이고, 다섯 번 나올 확률은 0.5 x 0.5 x 0.5 X 0.5 X 0.5 = 0.03125 (약 3%)이다. 통계적으로 유의미한지를 판단하는 기준이 되는 5%는 이 두 확률의 딱 중간 정도 된다.

 의료비의 본인 부담률 인상은 잦은 병원 출입을 막아 국가 전체의 의료비가 억제되는 것으로 나타났다. 다만 소득이 낮고 건강 상태가 나쁜 사람들의 경우 본임 부담률 인상이 건강 상태를 악화 시키는 결과를 가져온다. 본인 부담률의 인상은 대체로 건강 상태에 악영향은 없지만, 빈곤층의 건강 상태에는 악영향을 미치는 것으로 보인다. 의료비의 본인 부담률 인상을 검토할 때에는 빈곤층에 악영향을 주지 않도록 저소득층의 본인 부담률은 낮게 설정하는 등 탄탄한 안전망을 유지하는 시스템이 필요할 것으로 보인다.

 메타분석: 일본 국립암연구센터 - 연구 결과는 여러 개이지만 각각은 대상자 수가 적어 통계적으로 유의미한 결과를 얻을 수 없었으나, 아홉 개의 관찰 연구를 종합한 메타 분석 결과를 통해 일본인도 (서구 선진국처럼) 간접흡연에 의해 폐암 발병 위험이 1.3배 상승한다고 발표했다. 일본인의 데이터를 이용한 논문 중에서 인과관계를 시사하는 모든 논문을 과학적으로 확립된 절차에 따라 종합분석한 것이라고 강조했다.


제3장
남성 의사가 여성 의사보다 뛰어나다? - 우연히 일어난 상황을 이용해볼 수 있다면

주어진 데이터로 상황을 재현하다 79ㅣ‘의사의 성별’과 ‘환자의 사망률’ 사이에 인과관계는 있을까? 81ㅣ여성 의사가 담당하면 환자의 사망률이 낮아진다 82ㅣ출생 시 체중이 건강에 미치는 영향 84ㅣ다음 세대를 위하여 86
COLUMN 3 금연을 의무화하니 심장병 환자가 줄었다? 88

자연실험에 해당하는 상황을 찾기는 어려우므로, 이를 모방하는 '준실험'을 한다. 이중차분법, 조작변수법, 회귀 불연속 설계, 매칭법.


제4장
어린이집을 늘리면 여성 취업률이 올라갈까? - ‘트렌드’에 속지 마라

실험을 모방하다 95ㅣ단순 비교는 의미가 없다 96ㅣ어쩌다 우연히 97ㅣ물론 예외도 있다 98ㅣ대조군의 차이로 효과를 추정하는 법 101ㅣ이중차분법이 성립하기 위한 조건 104ㅣ규제 완화가 정답일까? 107ㅣ어린이집을 늘려도 어머니의 취업률은 상승하지 않는다 108ㅣ‘최저임금’과 ‘고용’ 사이에 인과관계는 있을까? 111
COLUMN 4 “일찍 자지 않으면 도깨비가 나온다”는 말은 교육적으로 옳을까? 114


제5장
텔레비전을 많이 보면 아이들 머리가 나빠진다? - 제3의 변수를 이용하라

‘이벤트’를 이용한다 119ㅣ조작 변수법이 성립하기 위한 두 가지 전제조건 121ㅣ‘텔레비전 시청’과 ‘성적’은 무슨 관계? 123ㅣ텔레비전을 보면 성적이 오를 수도 있다! 125ㅣ어머니의 학력이 높으면 아이의 건강 상태가 좋을까? 126ㅣ교육은 투자다 127
COLUMN 5 여성 임원을 늘리면 기업은 성장할까? 129

제6장
공부 잘하는 친구와 사귀면 성적이 오를까? - 갑자기 튀어나온 ‘점프’에 주목하라

49명과 50명의 차이 137ㅣ부모들의 착각 139ㅣ공부 잘하는 친구들에 둘러싸여도 성적은 오르지 않는다 141ㅣ‘고령자의 의료비 본인 부담률’과 ‘사망률’이 상관 있을까? 142ㅣ의료비 부담이 상승해도 사망률의 변화는 없다 143
COLUMN 6 잘못 해석한 데이터의 함정 147

제7장
명문대를 졸업하면 연봉이 높을까? - 비슷한 대상들끼리의 조합을 찾아라

‘짝’을 찾아낸다 153ㅣ여러 변수를 종합하여 균형을 맞춰라 155ㅣ성향 점수 매칭법이 성립하려면 158ㅣ출신 대학이 미래 수입에 미치는 효과 159ㅣ명문대에 가도 수입은 오르지 않는다 161
COLUMN 7 랜덤화 비교 시험의 실전판 ‘A/B 테스트’ 164

제8장
어떻게 해도 도저히 예측이 불가능하다면 - 기존 데이터를 다시 들여다보자

적합하지 않은 데이터밖에 없을 때는 169ㅣ최적선을 긋는 방법 170ㅣ교란 요인의 영향을 배제하려면 172
COLUMN 8 인과 추론은 어떻게 발전해왔나? 175

보론 ① 분석의 타당성과 한계에 대해 180
보론 ② 인과 추론의 5단계 184

 (1) 원인은 무엇인가?

 (2) 걸과는 무엇인가?

 (3) 세 가지 체크포인트를 확인: 우연의 일치는 아닌가? 교란 요인은 존재하지 않는가? 역의 인과관계는 존재하지 않는가?

 (4) 반사실을 만들어낼 것

 (5) 비교 가능해지도록 조정할 것

에필로그 187

 인과관계를 밝히는 필수 교양이라 할 '인과 추론'이 연구자들의 전재 특허였던 시대는 이미 끝났다. 해외에서는 인과 추론에 근거한 연구 성과가 사람들의 생활을 확실히 변화시키고 있다.

 "개인의 경험담을 모아 놓은 것은 데이터도 아니고 에비던스도 아닙니다. 우리는 의심의 여지가 없는 데이터를 모으고 있고, 오바마 케어의 효과를 검증하고 있습니다. 그 결과 평균적으로는 미국 국민의 보험료는 오바마 케어로 저렴해진 것으로 나타났습니다. 사람에 따라서는 보험료가 올라 손해를 보고 계신 분도 있을지 모르지만, 그런 개인들의 이야기에 현혹되지 마시고 데이터를 이용해 큰 그림을 볼 수 있도록 해주십시오."

함께 읽을 책 194
참고 문헌 197
옮긴이의 글 207

반응형