* 데이터 리터러시란?
- 데이터를 읽는 능력
- 데이터를 이해하는 능력
- 데이터를 비판적으로 분석하는 능력
- 결과를 의사소통에 활용할 수 있는 능력
>>> 데이터 수집과 데이터 원천을 이해하고, 주어진 데이터에 대한 다양한 활용법을 이해하고, 데이터를 통한 핵심 지표를 이해하는 것.
>>> 올바른 질문을 던질 수 있도록 만들어 줌
* 데이터 해석 오류
- 심슨의 역설 (Simpson's Paradox)
1) '부분'에서 성립한 대소 관계가 그 부분을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우
2) 전체에 대한 결론이 언제나 개별 집단에 그대로 적용되지 않으므로 데이터 기반 결론이라고 해서 맹목적으로 받아들여서는 안된다.
- 시각화를 활용한 왜곡: 자료의 표현 방법에 따라서 해석의 오류 여지가 존재
- 샘플링 편향 (Sampling Bias): 전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류가 발생
* 상관관계: 두 변수가 얼마나 상호 의존적인지 파악 > 방법: 한 변수가 증가하면 다른 변수도 따라서 증가/감소하되 그 추이를 따름
* 인과관계: 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태, 인과가 명확함
>>> 상관관계는 인과관계가 아님!
- 상관관계만으로 섣불리 의사결정 하지 않기
- 양쪽을 모두 활용해 합리적인 의사판단 하기
* 데이터 분석 접근법
- 문제 및 가설정의
- 데이터 분석
- 결과 해석 및 액션 도출
>>> '생각'이 주요한 단계에서 데이터 리터러시가 필요
>>> 데이터 분석이 목적이 되지 않도록 '왜?'를 항상 생각해야 함
'데이터분석 부트캠프' 카테고리의 다른 글
| [데이터분석 부트캠프] 파이썬 #4 리스트, 인덱스, 슬라이싱, 튜플, 딕셔너리 (0) | 2025.10.22 |
|---|---|
| [데이터분석 부트캠프] 데이터 리터러시 #2 문제 정의, 데이터 유형, 지표 설정, 결론 도출 (0) | 2025.10.21 |
| [데이터분석 부트캠프] 파이썬 #3. 조건문, 반복문 (0) | 2025.10.17 |
| [데이터분석 부트캠프] 파이썬 #2 덧붙이기, 정렬, 딕셔너리 (0) | 2025.10.16 |
| [데이터분석 부트캠프] 파이썬 #1 변수, 문자열 (0) | 2025.10.14 |