미식가의 개발 일기

[머신러닝] predict vs predict_proba 본문

ML, DL

[머신러닝] predict vs predict_proba

대체불가 핫걸 2024. 7. 27. 17:18

predict

  • 주어진 입력 데이터에 대해 예측된 클래스 레이블을 출력
  • 입력 데이터가 어떤 데이터에 속하는지 

 

sklearn에서 제공하는 iris 데이터로 predict

데이터 불러온 후 타켓 데이터 확인 
import pandas as pd
from sklearn.datasets import load_iris

# 타겟 데이터 값 중복 없이 출력
pd.unique(load_iris().target)
array([0, 1, 2])
  • iris 데이터의 target 데이터는 위에 코드와 같이 (0, 1, 2) 3개의 요소로 구성되어 있음

 

예측 값을 타겟 별로 출력
display(predictions[0:3], predictions[60:63], predictions[100:103])
array([0, 0, 0])
array([1, 1, 1])
array([2, 2, 2])
  • 주어진 데이터가 어느 타겟에 속하는지 출력

 

predict_proba

  • 각 클래스에 속할 확률을 제공
  • 예측된 클래스뿐만 아니라 각 클래스에 대한 확률값이 필요한 경우 사용

 

sklearn에서 제공하는 iris 데이터로 predict_proba

  • predict와 똑같은 방법으로 iris 데이터 사용

 

예측 값을 타겟별로 출력
display(probabilities[0:3], probabilities[60:63], probabilities[90:93])
array([[1., 0., 0.],
       [1., 0., 0.],
       [1., 0., 0.]])
array([[0., 1., 0.],
       [0., 1., 0.],
       [0., 1., 0.]])
array([[0.  , 0.97, 0.03],
       [0.  , 1.  , 0.  ],
       [0.  , 0.99, 0.01]])
  • 주어진 데이터가 각 클래스에 속할 확률을 출력

 

반응형