VISION (6) 썸네일형 리스트형 사물탐지 (1) - 사물탐지 프로젝트 프레임워크 전까지는 이미지 분류에 대한 얘기를 했었는데, 실제로 우리가 현실에서 업무를 수행하기에 더욱 필요한 부분은 바로 사물탐지 분야이다. 이미지에는 둘 이상의 대상이 있는 경우가 다수이다. 당장 이 귀여운 사진만 하더라도 '개, '고양이' 라는 레이블로 분류문제를 수행할 수는 없다. 대신에 이제 개로 추정되는 사물이, 고양이로 추정되는 사물이 각각 어디즈음 위치해 있다는 문제를 풀어야 한다. 이렇게 사물탐지는 크게 두가지의 과업이 존재한다. 1. 이미지 내에서 물체의 위치 특정. 2. 이미지 내의 각 물체를 분류. 실생활에서도 사물탐지에 관련된 사례가 많다. 자율주행에서 보행자, 차량, 도로 및 보행물의 인식 로봇의 주변 사물탐지 등 시대가 발전할 수록 빠르게 고도화되고 익숙해지는 기술이 아닐까 싶다 오늘은 .. [이미지 분류 프로젝트] 데이콘 도배 하자 (2) - 인코딩 해결,이미지 증강 이번 주는 인코딩 관련 문제 해결 & 이미지 증강을 통한 성능 향상에 초점을 맞춰서 진행 해 보았다. 우선 인코딩 이슈.. 지난번에 점수 0 뜬거 보고 아무리 데이터의 질이 나쁘더라도 이럴 수 있나..? 뭐 클래스 불균형이 너무 심해서 그런갑다 했는데 무슨 파일 뜯어보니 인코딩이 엉망이었다. 무엇이 그렇겗?귱금하슇죣?? 지난번 자모분리현상 부터 왜이런진 모르겠는데.. ANSI로 인코딩 하면 육안상 괜찮은데 데이콘에서 받아들이지 못해서 점수가 0으로 나오고, utf-8은 위 사진처럼 미친듯이 깨지더라 그래서 혼자 터득해본 방법은 1. csv를 메모장으로 열기 2. utf-8(BOM) 으로 저장하기 그럼 이렇게 이쁜 결과를 얻을 수 있다. 나중에 알고보니 그냥 to_csv 할 때 encoding = 'utf.. [이미지 분류 프로젝트] - 데이콘 도배 하자 (1) https://dacon.io/competitions/official/236082/data 도배 하자 유형 분류 AI 경진대회 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 총 19가지의 도배 하자 이미지 유형을 분류하는 AI 모델을 개발해야 한다. 평가 산식은 weighted f1 score이고, 논문으로 공개된 사전 학습 모델을 사용할 수 있다고 한다. 다른 분들이 올려주신 코드 & 베이스라인을 거의 따와서 하나하나 뜯어보며 체화해보고자 한다. [1. EDA - 도배 이미지 확인] https://dacon.io/competitions/official/236082/codeshare/7898?page=1&dtype=recent [EDA] 도배 .. 고급 합성곱 신경망 구조 (2) - AlexNet, VGGNet, InceptionNet https://rhks13.tistory.com/43 고급 합성곱 신경망 구조 (1) - CNN의 패턴과 LeNet 전통적인 CNN을 기반으로 다양한 최신 합성곱 신경망 구조들이 등장했다. 이번 포스팅부터는 그 새로운 구조들의 특징과 각 구조들이 어떻게 발전되어 탄생했는지 정리해보려 한다. 우선 그에 rhks13.tistory.com 지난 포스팅에 이어 더 나아진 CNN 모델들을 살펴보겠다 1. AlexNet 앞서보았던 LeNet은 얇은 층으로 구성되고, MNIST 데이터를 단순히 10개의 클래스로 구분하는 과제를 수행했다. 훨씬 복잡한 이미지를 더 많은 클래스로 구분하려면 LeNet만으로는 힘들 수 있다. 이렇게 LeNet에 비해 더 복잡한 문제를 해결할 수 있도록 2012년에 등장한 구조가 바로 Al.. 고급 합성곱 신경망 구조 (1) - CNN의 패턴과 LeNet 전통적인 CNN을 기반으로 다양한 최신 합성곱 신경망 구조들이 등장했다. 이번 포스팅부터는 그 새로운 구조들의 특징과 각 구조들이 어떻게 발전되어 탄생했는지 정리해보려 한다. 우선 그에 앞서 CNN의 공통적인 디자인 패턴에 대해 알아보자. 1. 특징 추출과 분류 특징의 추출과 결과의 분류를 담당하는 부분이 다르다. 앞선 포스팅에서 설명했던 것과 같이 CNN에서는 합성곱층(필터)을 이용해 특징을 추출하고, 해당 특징들을 계속해서 추출하다 1차원 벡터화 한 후 전결합층을 통해 최종 분류 결과를 도출한다. 2. 이미지의 깊이는 증가, 크기는 감소 이미지는 높이 X 폭 X 깊이로 나타내어진다. 이때 CNN을 통과 할 수록 이미지 깊이는 깊어지고, 크기(높이 x 폭)는 작아진다. 인풋에서의 깊이는 색상이었다. 회.. 컴퓨터 비전 기초 - 프로세스와 CNN Computer Vision(CV) 는 인간의 시각이 할 수 있는 일을 수행하는 자율적 시스템을 만드는 것을 말한다. 사실은 단순한 스캔을 넘은, 시각적 인지를 일컫는다. 시각적 입력을 통해 주변의 상황을 실질적으로 인식하는 과정을 딥러닝을 통해 구현한 것이다. 우리의 눈과 사고회로는 한개의 머리와 두 개의 팔, 두 개의 다리를 가지며 직립보행하는 두 형상을 사람으로 인식하고, 5번과 8번 블록을 선택할 것이다. 너무나 자연스러운 현상이지만 이를 컴퓨터에게 하나하나 설명해주기란 쉽지않다. 이러한 과정을 인공신경망을 통해 구현하고 배포하는 과정을 통틀어 Computer Vision이라 한다. 오늘은 비전의 프로세스와, 가장 기초적인 합성공 신경망(Convolutional neural network)에 대해.. 이전 1 다음