본문 바로가기
정보모음

SPSS로지스틱 회귀 분석 - 효과적인 데이터 분석 방법 소개

by fodilapiudys 2024. 6. 25.

1. 데이터 수집

 

Data Collection

 

  • 목적: 연구 주제에 적합한 데이터 수집
  • 정의: 변수와 관측치를 식별하고 결정
  • 방법: 적절한 조사 설계 선택
  • 획득: 데이터 수집 도구 사용하여 정보 수집
  • 저장: 안전하게 데이터 보관

 

 

2. 변수 선택

 

Feature selection

 

  • 단계적 변수 선택: 모든 독립 변수를 초기에 포함하고 통계적으로 유의하지 않은 변수를 제거해나가는 방법으로 모델을 구축
  • 후진 제거: 모든 변수를 포함한 상태에서 유의하지 않은 변수를 하나씩 제거하는 방법
  • 전진 선택: 유의미한 변수를 하나씩 추가하는 방식으로 모델을 만들어가는 방법
  • 단계별 선택: 후진 제거와 전진 선택을 혼합하여 변수를 선택하는 방법
  • 정보 기준 변수 선택: AIC나 BIC와 같은 정보 기준을 사용하여 모델을 평가하고 변수를 선택하는 방법

 

 

3. 모형 설정

 

Interaction term

 

  • 종속 변수 설정: 로지스틱 회귀 분석에서는 예측하려는 현상을 나타내는 변수를 종속 변수로 설정합니다.
  • 독립 변수 설정: 모형에 포함할 예측 요인들을 독립 변수로 설정해야 합니다.
  • 상호작용 변수 고려: 상호작용이 있다고 예상되는 변수들을 고려하여 모형에 포함시킬 수 있습니다.
  • 통계적 유의성: p-값을 기준으로 통계적으로 유의한 변수들을 모형에 포함시켜야 합니다.

 

 

4. 모형 적합

 

Goodness-of-fit.

 

  • 1. 후진 소거법: 통계적 유의성이 낮은 변수를 하나씩 제거하며 모형을 적합시킨다.
  • 2. 순차적 적합법: 변수를 추가하는 방식과 제거하는 방식 중 어떤 조합이 모형에 더 적합한지 파악한다.
  • 3. 다중 공선성: 독립 변수들 간의 강한 상관관계를 고려하여 적절한 변수를 선택한다.

 

 

5. 결과 해석

 

Odds ratio

 

  • 독립변수의 유의성: **변수의 가중치가 통계적으로 유의미한지 확인해야 한다.** 독립변수가 종속변수에 미치는 영향을 판단할 수 있다.
  • 오즈비: **모형에서 얻은 오즈비를 통해 변수 간 상대적인 영향을 해석할 수 있다.** 오즈비가 1보다 크면 양의 상관관계, 1보다 작으면 음의 상관관계가 있다.
  • 모형적합도: **희생 함수 값과 로그 가능도 값 등을 통해 모형의 적합도를 판단할 수 있다.** 모형이 데이터를 얼마나 잘 설명하는지 확인한다.
  • 예측력: **ROC 곡선을 통해 모형의 예측 능력을 평가할 수 있다.** ROC 곡선 아래 면적이 클수록 예측력이 높다.