본문 바로가기
데이터분석 부트캠프

[데이터분석 부트캠프] 데이터 리터러시 #1 데이터 해석 오류, 데이터 분석 접근법

by yyezzi 2025. 10. 20.
반응형

* 데이터 리터러시란?

- 데이터를 읽는 능력

- 데이터를 이해하는 능력

- 데이터를 비판적으로 분석하는 능력

- 결과를 의사소통에 활용할 수 있는 능력

>>> 데이터 수집과 데이터 원천을 이해하고, 주어진 데이터에 대한 다양한 활용법을 이해하고, 데이터를 통한 핵심 지표를 이해하는 것.

>>> 올바른 질문을 던질 수 있도록 만들어 줌

 

* 데이터 해석 오류

- 심슨의 역설 (Simpson's Paradox)

1) '부분'에서 성립한 대소 관계가 그 부분을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우

2) 전체에 대한 결론이 언제나 개별 집단에 그대로 적용되지 않으므로 데이터 기반 결론이라고 해서 맹목적으로 받아들여서는 안된다.

- 시각화를 활용한 왜곡: 자료의 표현 방법에 따라서 해석의 오류 여지가 존재

 

- 샘플링 편향 (Sampling Bias): 전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류가 발생

 

* 상관관계: 두 변수가 얼마나 상호 의존적인지 파악 > 방법: 한 변수가 증가하면 다른 변수도 따라서 증가/감소하되 그 추이를 따름

* 인과관계: 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태, 인과가 명확함

>>> 상관관계는 인과관계가 아님!

        - 상관관계만으로 섣불리 의사결정 하지 않기

        - 양쪽을 모두 활용해 합리적인 의사판단 하기

 

* 데이터 분석 접근법

- 문제 및 가설정의

- 데이터 분석

- 결과 해석 및 액션 도출

>>> '생각'이 주요한 단계에서 데이터 리터러시가 필요

>>> 데이터 분석이 목적이 되지 않도록 '왜?'를 항상 생각해야 함

반응형