1. 데이터 수집
- 목적: 연구 주제에 적합한 데이터 수집
- 정의: 변수와 관측치를 식별하고 결정
- 방법: 적절한 조사 설계 선택
- 획득: 데이터 수집 도구 사용하여 정보 수집
- 저장: 안전하게 데이터 보관
2. 변수 선택
- 단계적 변수 선택: 모든 독립 변수를 초기에 포함하고 통계적으로 유의하지 않은 변수를 제거해나가는 방법으로 모델을 구축
- 후진 제거: 모든 변수를 포함한 상태에서 유의하지 않은 변수를 하나씩 제거하는 방법
- 전진 선택: 유의미한 변수를 하나씩 추가하는 방식으로 모델을 만들어가는 방법
- 단계별 선택: 후진 제거와 전진 선택을 혼합하여 변수를 선택하는 방법
- 정보 기준 변수 선택: AIC나 BIC와 같은 정보 기준을 사용하여 모델을 평가하고 변수를 선택하는 방법
3. 모형 설정
- 종속 변수 설정: 로지스틱 회귀 분석에서는 예측하려는 현상을 나타내는 변수를 종속 변수로 설정합니다.
- 독립 변수 설정: 모형에 포함할 예측 요인들을 독립 변수로 설정해야 합니다.
- 상호작용 변수 고려: 상호작용이 있다고 예상되는 변수들을 고려하여 모형에 포함시킬 수 있습니다.
- 통계적 유의성: p-값을 기준으로 통계적으로 유의한 변수들을 모형에 포함시켜야 합니다.
4. 모형 적합
- 1. 후진 소거법: 통계적 유의성이 낮은 변수를 하나씩 제거하며 모형을 적합시킨다.
- 2. 순차적 적합법: 변수를 추가하는 방식과 제거하는 방식 중 어떤 조합이 모형에 더 적합한지 파악한다.
- 3. 다중 공선성: 독립 변수들 간의 강한 상관관계를 고려하여 적절한 변수를 선택한다.
5. 결과 해석
- 독립변수의 유의성: **변수의 가중치가 통계적으로 유의미한지 확인해야 한다.** 독립변수가 종속변수에 미치는 영향을 판단할 수 있다.
- 오즈비: **모형에서 얻은 오즈비를 통해 변수 간 상대적인 영향을 해석할 수 있다.** 오즈비가 1보다 크면 양의 상관관계, 1보다 작으면 음의 상관관계가 있다.
- 모형적합도: **희생 함수 값과 로그 가능도 값 등을 통해 모형의 적합도를 판단할 수 있다.** 모형이 데이터를 얼마나 잘 설명하는지 확인한다.
- 예측력: **ROC 곡선을 통해 모형의 예측 능력을 평가할 수 있다.** ROC 곡선 아래 면적이 클수록 예측력이 높다.
'정보모음' 카테고리의 다른 글
마이 트립 닷컴 - 여행 정보 한 곳에서 모두 확인하세요! (0) | 2024.07.03 |
---|---|
해외 항공권 예약 방법 및 꿀팁 (0) | 2024.07.03 |
강아지와 함께 하는 즐거운 산책 팁과 노하우 (0) | 2024.06.25 |
쿠팡 리뷰 체험단 - 솔직한 후기와 혜택 소개 (0) | 2024.06.21 |
바나 힐 투어 - 자연 속 힐링 여행의 즐거움 (0) | 2024.06.21 |