티스토리 뷰

[입력 파라미터]

  1. y_true (array-like):
    • 테스트 데이터의 실제 클래스 레이블.
    • 모델의 예측값(y_pred)과 비교하여 성능을 평가하는 기준
  2. y_pred (array-like):
    • 모델이 예측한 클래스 레이블.
    • 테스트 데이터를 기반으로 학습된 모델이 반환한 예측 결과
  3. labels (list, optional):
    • 평가하려는 클래스 레이블의 목록.
    • 특정 레이블만 선택적으로 보고서에 포함하려면 이 파라미터를 설정함.
    • 기본값은 모든 클래스
  4. target_names (list of strings, optional):
    • 클래스 레이블에 대한 이름.
    • 클래스 레이블(예: 0, 1, 2)을 사람이 이해하기 쉬운 이름으로 매핑할 때 사용됨.
    • 예: ['Class A', 'Class B', 'Class C'].
  5. sample_weight (array-like, optional):
    • 각 샘플의 가중치.
    • 특정 샘플에 더 큰 중요도를 부여하려는 경우 사용됨.
  6. digits (int, optional):
    • 출력 소수점 자릿수.
    • 보고서에서 소수점 아래 몇 자리까지 출력할지를 결정함.
  7. output_dict (bool, optional):
    • True로 설정하면 출력 결과를 딕셔너리로 반환.
    • False인 경우 텍스트 형식으로 반환됨(기본값).
  8. zero_division (int or "warn", optional):
    • 계산 중 0으로 나누기가 발생할 때의 동작을 정의.
    • 0: 0을 반환.
    • 1: 1을 반환.
    • "warn": 경고 메시지를 출력하고 0을 반환.

[출력 파라미터]

  1. precision (정밀도):
    • 특정 클래스에서 모델이 예측한 값 중 실제로 해당 클래스인 샘플의 비율.
    • 계산식: (True Positive) / (True Positive + False Positive)
  2. recall (재현율):
    • 특정 클래스에서 실제 해당 클래스인 샘플 중 모델이 올바르게 예측한 비율.
    • 계산식: (True Positive) / (True Positive + False Negative)
  3. f1-score:
    • 정밀도와 재현율의 조화 평균.
    • 정밀도와 재현율 간의 균형을 평가.
    • 계산식: 2 * (Precision* Recall) / (Precision + Recall)
  4. support:
    • 각 클래스에 속한 실제 샘플의 개수.
    • 모델 성능 평가를 위한 각 클래스의 샘플 수를 나타냅니다.
  5. accuracy (정확도):
    • 전체 샘플 중 모델이 올바르게 분류한 비율.
    • 계산식: (Number of Correct Predictions) / (Total Number of Preditions)
  6. macro avg (매크로 평균):
    • 모든 클래스의 precision, recall, f1-score의 단순 평균.
    • 클래스 간 데이터 비율이 동일한 가정 하에 사용.
  7. weighted avg (가중 평균):
    • 각 클래스의 support를 가중치로 반영한 precision, recall, f1-score의 평균.
    • 클래스 간 데이터 비율이 불균형할 때 더 적합.
반응형