22.03.21 Sample과 Feature / 혼동행렬(Confusion Matrix)
2022. 3. 21. 15:12ㆍ카테고리 없음
대부분 머신러닝 문제는 1개 이상의 독립변수 input x를 가지고 종속변수 output y를 예측하는 문제이다.
머신러닝 모델 중 특히 인공신경망은 독립변수 x, 종속변수 y, 가중치 w, 편향 b를 행렬 연산을 통해 연산하는 경우가 많다. training set을 행렬로 표현하는 경우가 많다.
Sample : 머신러닝에서 하나의 데이터, 위 그림 행렬에서는 하나의 row
Feature : 종속변수 y를 예측하기 위한 각각의 독립변수 x, 위 그림 행렬에서 하나의 column
혼동 행렬(Confusion Matrix)
Accuracy : 맞춘 문제수 / 전체 문제수
Confusion Matrix : 그러나 맞춘 결과 틀린 결과에 세부적인 내용을 알려주지 않으므로, TF의 경우를 세부적으로 알려주는 행렬, TP, TN, FP, FN이 있다.
TP(Ture Positive) : 실제 True인 정답을 True라고 예측(정답)
TN(True Negative) : 실제 False인 정답을 False라고 예측(정답)
FP(False Positive) : 실제 False인 정답을 True라고 예측(오답)
FN(False Negative) : 실제 True인 정답을 False라고 예측(오답)
정밀도(Precision) = 검출된 것중 맞춘 것
재현율(Recall) = 검출된 것의 비율
정확도(Accuracy) = 총전체 중 정답만