• 제목/요약/키워드: 컨볼루셔널 뉴럴 네트워크

검색결과 11건 처리시간 0.019초

계층적 CNN을 이용한 방송 매체 내의 객체 인식 시스템 성능향상 방안 (Performance Improvement of Object Recognition System in Broadcast Media Using Hierarchical CNN)

  • 권명규;양효식
    • 디지털융복합연구
    • /
    • 제15권3호
    • /
    • pp.201-209
    • /
    • 2017
  • 본 논문은 계층적 Convolutional Nerual Network(CNN)을 이용한 스마트폰용 객체 인식 시스템이다. 전체적인 구성은 스마트폰과 서버를 연결하여 서버에서 컨볼루셔널 뉴럴 네트워크로 객체 인식을 하고 수집된 데이터를 매칭시켜 스마트폰으로 객체의 상세정보를 전달하는 방법이다. 또한 계층적 컨볼루셔널 뉴럴 네트워크와 단편적 컨볼루셔널 뉴럴 네트워크와 비교하였다. 계층적 컨볼루셔널 뉴럴 네트워크는 88%, 단편적 컨볼루셔널 뉴럴 네트워크는 73%의 정확도를 가지며 15%p의 성능 향상을 보였다. 이를 기반으로 스마트폰과 방송매체와 연동한 T-Commerce 시장 확장의 가능성을 보여준다. 아울러 방송영상을 시청하면서 Information Retrieval, AR/VR 서비스도 제공 가능하다.

XOR연산 기반의 데이터 재구성 기법을 활용한 컨볼루셔널 뉴럴 네트워크 성능 향상 기법 (Techniques for Performance Improvement of Convolutional Neural Networks using XOR-based Data Reconstruction Operation)

  • 김영웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.193-198
    • /
    • 2020
  • 컨볼루셔널 뉴럴 네트워크 기술의 다양한 활용은 컴퓨팅 분야의 발전을 가속화하고 있으나, 이에 대한 반대급부로 심각한 하드웨어 성능 부족을 초래하고 있다. 그 대응책으로 뉴럴 네트워크 가속기, 차세대 메모리 소자 기술, 그리고 고대역폭 메모리 구조 등이 제안되었으나, 이들은 각각 범용성, 기술 성숙도, 그리고 높은 비용의 문제를 야기하여 적극적으로 도입되기 어려운 실정이다. 따라서 현재의 하드웨어 범용성을 그대로 유지하면서도 컨볼루셔널 뉴럴 네트워크 기술의 성능을 증대시킬 수 있는 방안이 필요하다. 본 연구는 메인메모리 내부에서 리프레쉬 동작이 수행되는 상황에서도 미리 저장된 XOR 비트 값을 사용하여 리프레쉬 동작의 종료 시점까지 대기하지 않아도 읽기 동작을 완료할 수 있는 DRAM 기반 메인메모리 기술을 제안한다. 실험 결과 제안 기법은 5.8%의 수행 속도 향상 및 1.2%의 에너지 절감, 그리고 10.6%의 EDP 향상을 보여주었다.

컨볼루셔널 뉴럴 네트워크를 이용한 주인공 식별 기반의 영상장면 탐색 기법 (A scene search method based on principal character identification using convolutional neural network)

  • 권명규;양형식
    • 융합정보논문지
    • /
    • 제7권2호
    • /
    • pp.31-36
    • /
    • 2017
  • 본 논문은 대량의 영상에서 특정 출연자가 나오는 영상부분을 탐색하여 재생하고자 한다. TV영상 프로그램에서 주인공이나 특정 장면을 탐색 하려면 영상을 플레이하거나 코너를 설정하여 시청한다. 기존 방식은 장면 탐색이나 코너별 시청시 수동으로 offset값을 설정 하여야만 한다. 그러나 본 논문에서 제안하는 방식은 주인공 얼굴을 학습 시킨후 영상인식으로 주인공을 찾고 주인공이 등장하는 장면으로 이동하여 영상을 재생 하게 된다. 특정 출연자에 대한 데이터는 크롤링 기법을 활용하여 추출 및 수집한다. 수집된 데이터를 기반으로 컨볼루셔널 뉴럴 네트워크 알고리즘을 사용하여 학습하고 이를 이용하여 성능 평가를 진행한다. 성능 평가는 드라마를 재생하면서 추출된 키 프레임에서 학습 된 특정 출연자를 추출, 판단하는 방법으로 정확도를 측정한다. 학습된 장면을 얼마나 빨리 그리고 정확하게 탐색 하는지 성능 확인결과 약 93%의 정확도를 확보하였다. 도출된 성능을 기반으로 특정 장면만을 시청하는 코너별 시청, 인물 탐색 및 상세정보 retrieval 등 영상서비스에 응용 하고자 한다.

한국어 오디오 캡션 시스템 개발 (Development of Korean Audio Caption System)

  • 강태호;김주희;이준하
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.364-367
    • /
    • 2020
  • 오디오 캡셔닝(Audio Captioning)은 시스템이 입력으로 오디오 신호를 받아들이고 해당 신호의 텍스트 설명을 출력하는 중간 번역 작업이다. 이 논문에서는 컨볼루셔널 뉴럴 네트워크(CNN), 트랜스포머의 딥러닝 알고리즘을 사용하여 주변 환경 소리에 대한 오디오 캡셔닝을 자동으로 수행하고 한글화된 출력 결과를 제공하는 모델을 제시한다. 본 연구 결과, 모델의 성능 평가 척도인 SPIDEr 점수는 0.1977이 나왔다.

  • PDF

전역 및 지역 특징 기반 딥러닝을 이용한 프린터 장치 판별 기술 (Printer Identification Methods Using Global and Local Feature-Based Deep Learning)

  • 이수현;이해연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권1호
    • /
    • pp.37-44
    • /
    • 2019
  • 디지털 IT 기술의 발달로 인하여 프린터와 스캐너의 성능이 향상되고 가격이 저렴해지면서 일반인들도 쉽게 접할 수 있게 되었다. 그러나 이에 따른 부작용으로 공문서 및 사문서 위조 등의 범죄들이 쉽게 이루어질 수 있다. 따라서 해당 문서가 어떤 프린터를 사용하여 출력 되었는가를 특정할 수 있다면 수사 범위를 줄이고 용의자를 판별하는데 도움이 된다. 본 논문에서는 프린터 장치 판별을 위하여 딥러닝 모델을 제안한다. 먼저 최근 인식 등에서 범용적으로 활용되는 지역 특징 기반의 컨볼루셔널 뉴널 네트워크를 이용한 프린터 장치 판별 모델을 제안하고, 전역 특징 기반의 처리 과정을 네트워크 모델에 도입함으로 인하여 수렴 속도 및 정확도를 향상한 기법을 제안한다. 제안한 모델의 성능은 8개의 프린터 장치를 활용하여 기존 프린터 판별을 위한 특징 기반 기술과 비교를 수행하였다. 그 결과 제안하는 지역 특징 기반의 모델과 전역 특징 기반의 모델이 각각 97.23% 및 99.98%의 높은 판별 정확도를 달성하였고, 기존 기술들에 비하여 높은 정확도를 갖는 우수성을 보였다.

데이터 증강을 통한 딥러닝 기반 주가 패턴 예측 정확도 향상 방안 (Increasing Accuracy of Stock Price Pattern Prediction through Data Augmentation for Deep Learning)

  • 김영준;김여정;이인선;이홍주
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.1-12
    • /
    • 2019
  • 인공지능 기술이 발전하면서 이미지, 음성, 텍스트 등 다양한 분야에 적용되고 있으며, 데이터가 충분한 경우 기존 기법들에 비해 좋은 결과를 보인다. 주식시장은 경제, 정치와 같은 많은 변수에 의해 영향을 받기 때문에, 주식 가격의 움직임 예측은 어려운 과제로 알려져 있다. 다양한 기계학습 기법과 인공지능 기법을 이용하여 주가 패턴을 연구하여 주가의 등락을 예측하려는 시도가 있어왔다. 본 연구는 딥러닝 기법 중 컨볼루셔널 뉴럴 네트워크(CNN)를 기반으로 주가 패턴 예측률 향상을 위한 데이터 증강 방안을 제안한다. CNN은 컨볼루셔널 계층을 통해 이미지에서 특징을 추출하여 뉴럴 네트워크를 이용하여 이미지를 분류한다. 따라서, 본 연구는 주식 데이터를 캔들스틱 차트 이미지로 만들어 CNN을 통해 패턴을 예측하고 분류하고자 한다. 딥러닝은 다량의 데이터가 필요하기에, 주식 차트 이미지에 다양한 데이터 증강(Data Augmentation) 방안을 적용하여 분류 정확도를 향상 시키는 방법을 제안한다. 데이터 증강 방안으로는 차트를 랜덤하게 변경하는 방안과 차트에 가우시안 노이즈를 적용하여 추가 데이터를 생성하였으며, 추가 생성된 데이터를 활용하여 학습하고 테스트 집합에 대한 분류 정확도를 비교하였다. 랜덤하게 차트를 변경하여 데이터를 증강시킨 경우의 분류 정확도는 79.92%였고, 가우시안 노이즈를 적용하여 생성된 데이터를 가지고 학습한 경우의 분류 정확도는 80.98%이었다. 주가의 다음날 상승/하락으로 분류하는 경우에는 60분 단위 캔들 차트가 82.60%의 정확도를 기록하였다.

  • PDF

Design of Deep Learning-based Location information technology for Place image collecting

  • Jang, Jin-wook
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권9호
    • /
    • pp.31-36
    • /
    • 2020
  • 본 연구에서는 딥러닝 처리기술을 이용한 이미지 분석을 통하여 위치정보가 없는 사진의 위치를 사용자에게 제공하는 장소이미지 수집기술을 설계하였다. 본 서비스는 사용자가 생활 중에 관심 있는 장소의 이미지 사진을 서비스에 업로드하면 해당 장소의 이름과 위치뿐만 아니라 관련 주변 정보를 확인 할 수 있는 서비스 개발을 목적으로 설계되었다. 본 연구는 이미지에 해당하는 정보를 제공하고 그 위치 정보를 기반으로 사용자가 관심 있는 주변정보를 제공할 수 있는 서비스의 기반기술이다. 이를 통하여 다양한 서비스에 활용이 가능하다.

정제 모듈을 포함한 컨볼루셔널 뉴럴 네트워크 모델을 이용한 라이다 영상의 분할 (LiDAR Image Segmentation using Convolutional Neural Network Model with Refinement Modules)

  • 박병재;서범수;이세진
    • 로봇학회논문지
    • /
    • 제13권1호
    • /
    • pp.8-15
    • /
    • 2018
  • This paper proposes a convolutional neural network model for distinguishing areas occupied by obstacles from a LiDAR image converted from a 3D point cloud. The channels of a LiDAR image used as input consist of the distances to 3D points, the reflectivities of 3D points, and the heights of 3D points from the ground. The proposed model uses a LiDAR image as an input and outputs a result of a segmented LiDAR image. The proposed model adopts refinement modules with skip connections to segment a LiDAR image. The refinement modules with skip connections in the proposed model make it possible to construct a complex structure with a small number of parameters than a convolutional neural network model with a linear structure. Using the proposed model, it is possible to distinguish areas in a LiDAR image occupied by obstacles such as vehicles, pedestrians, and bicyclists. The proposed model can be applied to recognize surrounding obstacles and to search for safe paths.

유사 이미지 분류를 위한 딥 러닝 성능 향상 기법 연구 (Research on Deep Learning Performance Improvement for Similar Image Classification)

  • 임동진;김태홍
    • 한국콘텐츠학회논문지
    • /
    • 제21권8호
    • /
    • pp.1-9
    • /
    • 2021
  • 딥 러닝을 활용한 컴퓨터 비전 연구는 여전히 대규모의 학습 데이터와 컴퓨팅 파워가 필수적이며, 최적의 네트워크 구조를 도출하기 위해 많은 시행착오가 수반된다. 본 연구에서는 네트워크 최적화나 데이터를 보강하는 것과 무관하게 데이터 자체의 특성만을 고려한 CR(Confusion Rate)기반의 유사 이미지 분류 성능 향상 기법을 제안한다. 제안 방법은 유사한 이미지 데이터를 정확히 분류하기 위해 CR을 산출하고 이를 손실 함수의 가중치에 반영함으로서 딥 러닝 모델의 성능을 향상시키는 기법을 제안한다. 제안 방법은 네트워크 최적화 결과와 독립적으로 이미지 분류 성능의 향상을 가져올 수 있으며, 클래스 간의 유사성을 고려해 유사도가 높은 이미지 식별에 적합하다. 제안 방법의 평가결과 HanDB에서는 0.22%, Animal-10N에서는 3.38%의 성능향상을 보였다. 제안한 방법은 다양한 Noisy Labeled 데이터를 활용한 인공지능 연구에 기반이 될 것을 기대한다.

한글 인식을 위한 CNN 기반의 간소화된 GoogLeNet 알고리즘 연구 (Streamlined GoogLeNet Algorithm Based on CNN for Korean Character Recognition)

  • 김연규;차의영
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1657-1665
    • /
    • 2016
  • CNN(Convolutional Neural Network)을 사용한 심화 학습이 다양한 분야에서 진행되고 있으며 관련 연구들은 이미지 인식의 많은 분야에서 높은 성능을 보이고 있다. 본 논문에서는 한글 인식을 위해 대규모 한글 데이터베이스를 학습할 수 있는 CNN 구조의 간소화된 GoogLeNet을 사용한다. 본 논문에 사용된 데이터베이스는 대규모 한글 데이터베이스인 PHD08로 총 2,350개의 한글 문자에 대해 각 2,187개의 샘플을 가져 총 5,139,450개의 데이터로 구성되어 있다. 간소화된 GoogLeNet은 학습의 결과로 학습 종료 시점에서 PHD08에 대해 99% 이상의 Top-1 테스트 정확도를 보였으며 실험의 객관성을 높이기 위해 PHD08에 존재하지 않는 한글 폰트로 이루어진 한글 데이터를 제작하여 상용 OCR 프로그램들과 분류 성능을 비교하였다. 상용 OCR 프로그램들은 66.95%에서 83.17%의 분류 성공률을 보인 반면, 제안하는 간소화된 GoogLeNet은 평균 89.14%의 분류 성공률을 보여 상용 OCR 프로그램들보다 높은 분류 성공률을 보였다.