'분류 전체보기' 카테고리의 글 목록 (2 Page)

22.06.09 CNN은 어떻게 차와 사람을 구분할까? 6주차

지난 주 복습 - norm regularization : 모델 parameter의 norm값을 넣어 모델의 복잡도를 낮춤? - early stopping : 성능이 더 나아지지 않으면 학습 멈춤 - dropout : parameter의 일부분을 랜덤하게 0으로 대체함 - batch normalization : activation의 분포를 원하는 형태로 만들어 학습과정을 안정화. 6주차 목차 - padding, stride : feature map의 크기를 결정함 - feature map: CNN에서 hidden layer를 표현하는 방법. 컴퓨터 비전 컴퓨터비전 예시 왼쪽 : segmentation 오른쪽위 : object detection 오른쪽아래 : GAN 컴퓨터가 어떻게 이미지를 인식할까? - 이..

2022.06.12

22.06.03 인공신경망을 어떻게 학습시킬까 5주차

4주차 복습 - 그냥 linear만 쌓으면 결국은 a*b*x = cx로 표현, 결국 선형이 되므로 비선형인 activation function을 포함하는 MLP를 사용한다. - loss function : classification은 cross entropy, regression은 미분이 가능하고 표현이 간단한 MSE를 사용. 5주차 목차 - 외우기 않고 배우는 모델 - training 데이터를 외우기만 하는 모델이 만들어질 수 있다.(overfitting) -> regularization 등을 사용한다. - batch normalization : forward 계산을 진행하면서 각 레이어별로 activation value가 있는데 그 value들의 분포를 조정해주는 기법이다. 학습의 안정도와 속도를 키..

2022.06.04

22.06.02 인공신경망이란? 딥러닝이란? 4주차

3주차 복습 목차 Multi Layer Perceptron = MLP Activation Function = 선형 성질을 가진 모델에 비선형적인 성질을 부여함으로서 표현력이 부족한 선형적 모델로 회귀하지 않게 하는 장치? Loss Function = 뭘 기준으로 모델을 학습시킬 것인가. 1. Multi Layer Perceptron MLP Perceptron = 여러 층으로 되어 있음. 학습 알고리즘 중 하나. 선형적인 성질을 가진 학습 알고리즘(w1x1 + w2x2 ..) input 입력 벡터를 받아서 각각의 dimension에서 가중치를 곱해줘서 더하고, 그 결과물을 가지고 OX 문제를 푸는 알고리즘. 그림에서는 4차원 입력벡터 w1x1 + w2x2 + w3x3+ w4x4 이 결과를 activatio..

2022.06.02

22.05.23 RUL 예측 SOTA 모델 논문 요약 - stacked DCNN, RVE, Semi-supervised deep architecture

stacked DCNN - NCMAPSS - 20개의 변수는 서로 다른 스케일을 가지고, 그런 데이터를 학습시키면 모델의 수렴이 느려진다. 따라서 표준 정규화를 데이터에 적용시켰다. 그리고 나면 정규화된 데이터의 time window(이전의 데이터를 몇 개 볼건지)를 sliding하면서 네트워크의 인풋에 넣는다. 네트워크는 Level1과 Level2가 있다. Level1 : DCNN 사용.(Conv - Batch Normalization - Activation Func - Pooling - Dropout) 잠재적으로 유용한 특성을 추출. input 신호의 time window 인코딩을 생성. (1. 높은 차원의 feature를 낮춤, 2. 노이즈 제거) Level2 : DCNN 사용.(FC - ReLU)..

2022.05.23

22.05.21 RUL 예측 CNN, RNN, LSTM, FNN, AR - CMAPSS

0. Abstract 비지도 및 지도(반지도) 학습의 조합은 레이블이 지정된 훈련 데이터의 양이 감소하더라도 높은 RUL 예측 정확도를 제공할 가능성이 있습니다. 이 논문은 반 지도 설정을 사용하는 RUL 예측에서 지도되지 않은 사전 훈련의 효과를 조사합니다. 추가적으로, 훈련 절차에서 다양한 양의 하이퍼 매개변수를 조정하기 위해 GA(Genetic Algorithm) 접근 방식이 적용됩니다. CNN(Convolutional Neural Network ) 및 LSTM(Long-Short Term Memory)와 같은 DL 기술 은 터보팬 엔진 성능 저하 에 대한 RUL 예측에서 빠른 발전과 기존 예후 알고리즘을 능가하는 성능을 보였습니다 그러나 CNN과 LSTM은 모두 순전히 지도 학습에 의존합니다. 즉..

2022.05.23

22.05.21 RUL 예측 평가 지표 파악

1. RUL 예측에 대한 RMSE, MSE, MAE가 무엇일까 SSE 전체제곱합 실제 정답 - time series t일때의 예측값 RMSE 제곱근 평균오차제곱합, MSE 평균오차제곱합 MSE는 많은 통계 분석 패키지, 라이브러리에서 모델 훈련 시 비용함수(cost function) 또는 모델 성능 평가시 기본 설정 통계량으로 많이 사용합니다. RMSE (Root Mean Square Error) 는 MSE에 제곱근을 취해준 값으로서, SSE를 제곱해서 구한 MSE에 역으로 제곱근을 취해주어 척도를 원래 값의 단위로 맞추어 준 값입니다. MAE 평균절대오차 2. Overfitting이란? Overfitting이 되지 않게 하려면 - Overfitting이란 training data를 불필요할정도로 과하게..

2022.05.21

ILoveIT

ILoveIT

태그

최근글

댓글

공지사항

아카이브

분류 전체보기(175)

티스토리툴바