엘리스 AI트랙(12)
-
22.01.28(중요) Tensorflow로 배우는 CNN 핵심정리
영상의 특징량 inter-class variation 다른 클래스를 구분 사람이 빠르게 움직이거나, 프레임이 바뀌거나, 노이즈가 끼는 경우 좋은 특징량의 조건 1. Repeatability (geometric, photometric)한 변화가 생겨도 2. Saliency(내가 관심있는 부분만 보겠다) 3. Locality(영상 밖에 관심있는 게있거나, 너무 크면 안된다. 이는 작은 영역에서 있어야 한다) 특징량의 종류 Local(각 개체) vs Global(음식) 컨볼루션, 패딩, 피처맵 가로성분의 특징이 도드라졌다 111 그런데 컨볼루션을 계속하다보면 이미지가 작아진다는 문제점이 있다. -> 패딩 패딩 -> 이미지 점점 안작아지고, 테두리 정보 안 잃어버리고 컨볼루션 할 수 있다 입력영상을 넣고 커널을..
2022.01.29 -
22.01.26 자연어처리 기초
자연어처리(Natural Language Processing NLP) 컴퓨터를 통해 인간의 언어를 분석 및 처리하는 인공지능의 한 분야 자연어처리 적용 사례 : 문서분류, 키워드추출, 감정분석 1. 텍스트 전처리 Tokenization 단어 : 3개 단어 개수 및 빈도수 확인 rstrip : 줄바꿈 기호 없애주려고 전처리1 특수기호 제거 : 정규표현식 사용해서 쓰는 문자만 추리기 re regex.sub() 을 하면 regex로 지정하지 않은 애들은 '' 사라지게 된다. 전처리2 Stopword 제거(문법적인.. 크게 의미를 가지고 있지 않은 단어들 제거) nltk 사용하기 전처리2 : Stemming 동일한 의미의 단어지만 문법으로 표현방식이 다양한 단어를 하나로 합쳐주기 실습 1 데이터 내 단어 빈도수..
2022.01.26 -
22.01.23 모델 서비스하기
학습된 모델 저장하고 불러오기 tensorflow 모델 구성요소 tensorflow 모델 저장 형식 SavedModel 활용방법 model.save().h5해야 h5는 가능, default는 savedmodel임 Checkpoint 불러오기 save_weights_only는 False가 좋다. 모델 서비스 하기 flask, javascript등 으로 웹에 서비스 가능 Tensorflow.js flask에서 서비스하기 서버 안정화 처리 실행 가능한 작업 제한 -> 간단한 구현 가능하고, 가벼운 모델이면 서비스 다운을 방지할 수 있으나 -> 사용자가 작업을 예약하는 건 불가능, 대규모 서비스에서는 안됨 다른방법 (작업 큐를 이용한 비동기 처리) 큐 먼저 입력-> 먼저 출력 큐를 이용한 처리 (프로세스 분리)..
2022.01.23 -
22.01.23 LSTM, GRU
LSTM, GRU 모두 RNN 모델 LSTM은 Vanilla RNN의 기울기 소실 문젤즐 해결 (Long Short Term Memory 장단기 메모리) LSTM 특징 Cell State 두번쨰 hidden state느낌 연관이 있는 단어 등 Gate 3종류의 게이트를 4개의 FC layer로 구성 Forget Gate 이전 hidden state와 현재 입력을 가지고 어떤 정보를 잊을지 결정 Input Gate 현재 입력받은 정보에서 어떤 것을 cell state에 저장할지 결정 망각 + input = 새로운 cell state Output Gate 다음 hidden state와 출력값 계싼 GRU Gated Recureent Unit LSTM이 가지는 게이트를 간소화하고, Cell State를 아예 ..
2022.01.23 -
22.01.19 CNN, 이미지 데이터
CNN은 대표적인 딥러닝 모델 -> 이미지(JPG,PNG) 분류에 특화되어있다. 픽셀 이미지의 기본 단위 : 픽셀 픽셀 하나당 색깔, 밝기 정보를 가진다. 각 픽셀은 3가지 색 값을 저장할 수 있으므로 RGB 채널이 있다. 그 RGB 채널은 8비트(01001110)의 수로 이뤄져있다. R:0~255 , G:0~255 , B:0~255 가능 총 8*3 = 24 비트, 2^24개의 색을 표현 가능하다 한가지 값만 가지면 흑백, 밝기만 저장함. 딥러닝을 활용한 이미지처리 기술 분야 1. 사물인식(Object Detection) 센터 스테이지 : 사람 영상에서 사람얼굴을 인식해 화면 가운데에게 오게 해주는 apple의 기술 2. 이미지 캡셔닝 ( Image Captioning) 사진을 보고 설명하는 기술? ->..
2022.01.19 -
22.01.15 딥러닝 학습의 문제점
1. 학습 속도 문제 ( 최적화 알고리즘 ) - 전체 학습 데이터셋을 사용해 손실함수를 계산하기 떄문에 계산량이 너무 많아짐 -> 부분데이터만 활용해서 손실함수를 계산하자(SGD) 그러나 SGD도 한계가 있긴 하다. 그래서 최적화 알고리즘이 GD -> SGD, momentum, adagrad, RMSProp, adam 등 여러 알고리즘들이 등장했다. momentum : 과거에 이동했던 방식을 기억하면서 그 방향으로 일정 정도를 추가적으로 이동하는 방식 adagrad : 많이 변화하지 않은 변수는 learning rate를 크게하고, 많이 변화한 변수들은 leargnin rate를 작게 하는 것 RMSProp : 기억을 하긴 하는데 과거의 기울기는 잊고 최근 기울기 정보를 크게 반영 adam : 가장 최근..
2022.01.16