22.03.21 Sample과 Feature / 혼동행렬(Confusion Matrix)

2022. 3. 21. 15:12카테고리 없음

대부분 머신러닝 문제는 1개 이상의 독립변수 input x를 가지고 종속변수 output y를 예측하는 문제이다.

머신러닝 모델 중 특히 인공신경망은 독립변수 x, 종속변수 y, 가중치 w, 편향 b를 행렬 연산을 통해 연산하는 경우가 많다. training set을 행렬로 표현하는 경우가 많다. 

Sample : 머신러닝에서 하나의 데이터, 위 그림 행렬에서는 하나의 row

Feature : 종속변수 y를 예측하기 위한 각각의 독립변수 x, 위 그림 행렬에서 하나의 column

 

 

혼동 행렬(Confusion Matrix)

Accuracy : 맞춘 문제수 / 전체 문제수

Confusion Matrix : 그러나 맞춘 결과 틀린 결과에 세부적인 내용을 알려주지 않으므로, TF의 경우를 세부적으로 알려주는 행렬, TP, TN, FP, FN이 있다.

TP(Ture Positive) : 실제 True인 정답을 True라고 예측(정답)

TN(True Negative) : 실제 False인 정답을 False라고 예측(정답)

FP(False Positive) : 실제 False인 정답을 True라고 예측(오답)

FN(False Negative) : 실제 True인 정답을 False라고 예측(오답)

 

정밀도(Precision) = 검출된 것중 맞춘 것

 

재현율(Recall) = 검출된 것의 비율

정확도(Accuracy) = 총전체 중 정답만