[Day 37] 새벽 중 파이토치 traffic sign 분류 및 detection 모델

 안녕하세요?
오늘은 Day 37입니다!


오늘 한 것은:
  • Traffic sign classification (and localization)


첫 번째 ~~


Computer vision 지식을 실제로 적용하기 위해 동물 분류 모델을 만들어 보도록 했다

There are some limitations with Kaggle's GPU so I had to tone down the picture sizes, the augmentations and model complexity.

그래도 ~ 
data augmentation
이미지 사례

카테거리는 {'cat': 0, 'dog': 1, 'elephant': 2, 'horse': 3, 'lion': 4}이다

데이터를 베치로 나눴다

모델이 다음과 같이 단순하다

훈련이 시간이 너무 걸려서 아래에 위 모델의 성능을 볼 수 있다
실은 epoch 좀 더 올리면 정확도도 높일 텐데요 ~
분류 결과 이미지:
이상한 분류도 있기도 하다 ㅎㅎ

자 ~~ 그런데 오늘의 목적은 traffic sign 분류 모델이며 그 후 traffic sign localizaion 모델이였다


traffic sign 분류 모델의 notebook 아직 public 아닌데 이미지로만 보여드릴게요 ~ 
데이터 class은 43이다 (아래 사진 그 중 21가지 class이다)
이미지 사이즈가 다양해서 resize 했다

모델의 주고는 다음과 같다
이 경우에도 여러 가지 모델 구조 해 봤는데 성능이 좋지 않아서 인터넷에서 AlexNet와 비슷한 위 모델을 찾게 되었다
성능이 ~~ 대단하다! 

이 모델은 traffic sign 이미지 분류 모델인데 목적은 traffic sign detection 모델이다
classification + bounding box < 여기에서 볼 수 있다

이 경우에 CustomDataset 정의해야 한다

사레:


위에 있는 분류 모델과 비교하면 모델 구조의 차이점은 그밖에 없었다 (문제가 무엇인지 아직 모른다)
(adding an bbox_output at the end)

문제가 훈련 함수인지 모델 구조인지 데이터셋인지 ~ 아직 모르겠습니다

어제 야채/사과 bounding box 모델에 따라 이 모델에 어제 배운 것을 적용했는데 훈련이 갔는데도 정확도와 손실이 낮아지지 않고 내일 다시 도전하겠습니다!!! ㅎㅎ 


지금 2시37분인데 이제 자야겠다 ~ 

오늘은 여기까지입니다!
내일 뵐게요! ^^



Popular posts from this blog

[Day 198] Transactions Data Streaming Pipeline Porject [v1 completed]

[미리 공부] 기초 통계 복습 (Day 1는 1월2일)

[Day 61] Stanford CS224N (NLP with DL): Machine translation, seq2seq + a side CDCGAN mini project