분류 전체보기(175)
-
22.06.09 CNN은 어떻게 차와 사람을 구분할까? 6주차
지난 주 복습 - norm regularization : 모델 parameter의 norm값을 넣어 모델의 복잡도를 낮춤? - early stopping : 성능이 더 나아지지 않으면 학습 멈춤 - dropout : parameter의 일부분을 랜덤하게 0으로 대체함 - batch normalization : activation의 분포를 원하는 형태로 만들어 학습과정을 안정화. 6주차 목차 - padding, stride : feature map의 크기를 결정함 - feature map: CNN에서 hidden layer를 표현하는 방법. 컴퓨터 비전 컴퓨터비전 예시 왼쪽 : segmentation 오른쪽위 : object detection 오른쪽아래 : GAN 컴퓨터가 어떻게 이미지를 인식할까? - 이..
2022.06.12 -
22.06.03 인공신경망을 어떻게 학습시킬까 5주차
4주차 복습 - 그냥 linear만 쌓으면 결국은 a*b*x = cx로 표현, 결국 선형이 되므로 비선형인 activation function을 포함하는 MLP를 사용한다. - loss function : classification은 cross entropy, regression은 미분이 가능하고 표현이 간단한 MSE를 사용. 5주차 목차 - 외우기 않고 배우는 모델 - training 데이터를 외우기만 하는 모델이 만들어질 수 있다.(overfitting) -> regularization 등을 사용한다. - batch normalization : forward 계산을 진행하면서 각 레이어별로 activation value가 있는데 그 value들의 분포를 조정해주는 기법이다. 학습의 안정도와 속도를 키..
2022.06.04 -
22.06.02 인공신경망이란? 딥러닝이란? 4주차
3주차 복습 목차 Multi Layer Perceptron = MLP Activation Function = 선형 성질을 가진 모델에 비선형적인 성질을 부여함으로서 표현력이 부족한 선형적 모델로 회귀하지 않게 하는 장치? Loss Function = 뭘 기준으로 모델을 학습시킬 것인가. 1. Multi Layer Perceptron MLP Perceptron = 여러 층으로 되어 있음. 학습 알고리즘 중 하나. 선형적인 성질을 가진 학습 알고리즘(w1x1 + w2x2 ..) input 입력 벡터를 받아서 각각의 dimension에서 가중치를 곱해줘서 더하고, 그 결과물을 가지고 OX 문제를 푸는 알고리즘. 그림에서는 4차원 입력벡터 w1x1 + w2x2 + w3x3+ w4x4 이 결과를 activatio..
2022.06.02 -
22.05.23 RUL 예측 SOTA 모델 논문 요약 - stacked DCNN, RVE, Semi-supervised deep architecture
stacked DCNN - NCMAPSS - 20개의 변수는 서로 다른 스케일을 가지고, 그런 데이터를 학습시키면 모델의 수렴이 느려진다. 따라서 표준 정규화를 데이터에 적용시켰다. 그리고 나면 정규화된 데이터의 time window(이전의 데이터를 몇 개 볼건지)를 sliding하면서 네트워크의 인풋에 넣는다. 네트워크는 Level1과 Level2가 있다. Level1 : DCNN 사용.(Conv - Batch Normalization - Activation Func - Pooling - Dropout) 잠재적으로 유용한 특성을 추출. input 신호의 time window 인코딩을 생성. (1. 높은 차원의 feature를 낮춤, 2. 노이즈 제거) Level2 : DCNN 사용.(FC - ReLU)..
2022.05.23 -
22.05.21 RUL 예측 CNN, RNN, LSTM, FNN, AR - CMAPSS
0. Abstract 비지도 및 지도(반지도) 학습의 조합은 레이블이 지정된 훈련 데이터의 양이 감소하더라도 높은 RUL 예측 정확도를 제공할 가능성이 있습니다. 이 논문은 반 지도 설정을 사용하는 RUL 예측에서 지도되지 않은 사전 훈련의 효과를 조사합니다. 추가적으로, 훈련 절차에서 다양한 양의 하이퍼 매개변수를 조정하기 위해 GA(Genetic Algorithm) 접근 방식이 적용됩니다. CNN(Convolutional Neural Network ) 및 LSTM(Long-Short Term Memory)와 같은 DL 기술 은 터보팬 엔진 성능 저하 에 대한 RUL 예측에서 빠른 발전과 기존 예후 알고리즘을 능가하는 성능을 보였습니다 그러나 CNN과 LSTM은 모두 순전히 지도 학습에 의존합니다. 즉..
2022.05.23 -
22.05.21 RUL 예측 평가 지표 파악
1. RUL 예측에 대한 RMSE, MSE, MAE가 무엇일까 SSE 전체제곱합 실제 정답 - time series t일때의 예측값 RMSE 제곱근 평균오차제곱합, MSE 평균오차제곱합 MSE는 많은 통계 분석 패키지, 라이브러리에서 모델 훈련 시 비용함수(cost function) 또는 모델 성능 평가시 기본 설정 통계량으로 많이 사용합니다. RMSE (Root Mean Square Error) 는 MSE에 제곱근을 취해준 값으로서, SSE를 제곱해서 구한 MSE에 역으로 제곱근을 취해주어 척도를 원래 값의 단위로 맞추어 준 값입니다. MAE 평균절대오차 2. Overfitting이란? Overfitting이 되지 않게 하려면 - Overfitting이란 training data를 불필요할정도로 과하게..
2022.05.21