• 제목/요약/키워드: Feature learning

검색결과 1,924건 처리시간 0.032초

Development of a software framework for sequential data assimilation and its applications in Japan

  • Noh, Seong-Jin;Tachikawa, Yasuto;Shiiba, Michiharu;Kim, Sun-Min;Yorozu, Kazuaki
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.39-39
    • /
    • 2012
  • Data assimilation techniques have received growing attention due to their capability to improve prediction in various areas. Despite of their potentials, applicable software frameworks to probabilistic approaches and data assimilation are still limited because the most of hydrologic modelling software are based on a deterministic approach. In this study, we developed a hydrological modelling framework for sequential data assimilation, namely MPI-OHyMoS. MPI-OHyMoS allows user to develop his/her own element models and to easily build a total simulation system model for hydrological simulations. Unlike process-based modelling framework, this software framework benefits from its object-oriented feature to flexibly represent hydrological processes without any change of the main library. In this software framework, sequential data assimilation based on the particle filters is available for any hydrologic models considering various sources of uncertainty originated from input forcing, parameters and observations. The particle filters are a Bayesian learning process in which the propagation of all uncertainties is carried out by a suitable selection of randomly generated particles without any assumptions about the nature of the distributions. In MPI-OHyMoS, ensemble simulations are parallelized, which can take advantage of high performance computing (HPC) system. We applied this software framework for several catchments in Japan using a distributed hydrologic model. Uncertainty of model parameters and radar rainfall estimates is assessed simultaneously in sequential data assimilation.

  • PDF

An Identification of the Image Retrieval Domain from the Perspective of Library and Information Science with Author Co-citation and Author Bibliographic Coupling Analyses

  • 윤정원;정은경;변지혜
    • 한국문헌정보학회지
    • /
    • 제49권4호
    • /
    • pp.99-124
    • /
    • 2015
  • As the improvement of digital technologies increases the use of images from various fields, the domain of image retrieval has evolved and become a growing topic of research in the Library and Information Science field. The purpose of this study is to identify the knowledge structure of the image retrieval domain by using the author co-citation analysis and author bibliographic coupling as analytical tools in order to understand the domain's past and present. The data set for this study is 245 articles with 8,031 cited articles in the field of image retrieval from 1998 to 2013, from the Web of Science citation database. According to the results of author co-citation analysis for the past of the image retrieval domain, our findings demonstrate that the intellectual structure of image retrieval in the LIS field consists of predominantly user-oriented approaches, but also includes some areas influenced by the CBIR area. More specifically, the user-oriented approach contains six specific areas which include image needs, information seeking, image needs and search behavior, image indexing and access, indexing of image collection, and web image search. On the other hand, for CBIR approaches, it contains feature-based image indexing, shape-based indexing, and IR & CBIR. The recent trends of image retrieval based on the results from author bibliographic coupling analysis show that the domain is expanding to emerging areas of medical images, multimedia, ontology- and tag-based indexing which thus reflects a new paradigm of information environment.

상황 인식 모바일 컴퓨팅을 위한 사운드 분류 시스템의 설계 및 구현 (Design and Implementation of a Sound Classification System for Context-Aware Mobile Computing)

  • 김주희;이석준;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권2호
    • /
    • pp.81-86
    • /
    • 2014
  • 본 논문에서는 스마트폰 사용자의 실시간 상황 인식을 위한 효과적인 사운드 분류 시스템을 제안한다. 이 시스템은 전처리 과정에서 입력 사운드 데이터로부터 고요한 사운드와 화이트 노이즈를 미리 여과해버림으로써, 제한적인 계산 자원의 불필요한 소모를 막을 수 있다. 또한 에너지 레벨이 낮은 사운드 데이터들은 사전에 증폭시킴으로써, 이들에 대한 분류 성능을 향상시킬 수 있다. 또, 제안하는 사운드 분류 시스템은 HMM 분류 모델의 효율적인 학습과 적용을 위해 k-평균 군집화를 이용하여 특징 벡터들에 대한 차원 축소와 이산화를 수행한다. 한 대학 연구동내 일상생활로부터 수집한 8가지 유형의 사운드 데이터 집합을 이용하여 제안한 시스템의 성능 분석 실험을 수행하였다. 이 실험을 통해 본 논문에서 제안한 사운드 분류 시스템은 높은 분류 성능을 보여 주었다.

Rotation Invariant Face Detection Using HOG and Polar Coordinate Transform

  • Jang, Kyung-Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.85-92
    • /
    • 2021
  • 이 논문에서는 회전각도에 무관하게 회전 얼굴과 회전각도를 효과적으로 검출하는 방법이 제안되었다. 회전된 얼굴 검출은 회전에 따른 얼굴 외형의 큰 변화로 인해 어려운 분야이다. 제안한 극좌표계 변환 방법은 회전 각도와 무관하게 얼굴 구성요소들의 위치 정보가 유지되기 때문에 회전으로 인한 얼굴의 외형 변화가 없게 된다. 이에 따라 회전이 없는 정면 얼굴 검출에 사용되지만 회전에 민감한 특성을 갖는 HOG와 같은 특징들이 회전얼굴을 검출하는 과정에서 효과적으로 사용될 수 있다. 극좌표계 변환된 영상에서 얻은 HOG 특징을 SVM을 이용하여 학습하고 회전 얼굴을 검출하였다. 학습 데이터는 회전이 없는 정면 얼굴 영상만을 사용하였다. 3600개 회전 얼굴 영상에 대한 실험 결과 97.94 %의 회전각도 검출률을 얻었다. 또한, 다수의 회전 얼굴이 포함된 배경이 있는 영상들에서 회전 얼굴들의 위치와 회전 각도를 정확하게 검출하였다.

콘포머 기반 한국어 음성인식 (A Korean speech recognition based on conformer)

  • 구명완
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.488-495
    • /
    • 2021
  • 본 논문에서는 콘포머 기반 한국어 음성인식 시스템을 제안한다. 콘포머는 트랜스포머 모델에 콘볼루션신경망(Convolution Neural Network, CNN) 기능을 보강한 구조이며 광역 정보를 잘 표현할 수 있는 트랜스포머와 지역 정보를 잘 표현할 수 있는 CNN을 결합한 신경망이다. 음성인식 기본 시스템으로 트랜스포모에 기반한 음성인식시스템을 개발하였으며 언어모델로는 Long Short-Term Memory(LSTM)을 사용하였다. 콘포머 기반 음성인식시스템은 트랜스포머 대신에 콘포머를 사용하였고 언어모델로는 트랜스포머를 이용하였다. 성능 평가를 위해 AI-hub에 있는 Electronics and Telecommunications Research Institute(ETRI) 음성코퍼스를 활용하였으며 트랜스포머 기반 음성인식 시스템은 오인식률이 11.8 %이 되었으며 콘포머 기반 음성인식시스템은 오인식률이 5.7 %가 되었다. AI-hub에 있는 다른 영역의 NHN다이퀘스트 음성 코퍼스를 추가해도 유사한 성능이 유지가 되어 제안된 콘포머 음성인식시스템의 유효성을 입증하였다.

가려진 얼굴의 인식 (Recognition of Occluded Face)

  • 강현철
    • 한국정보통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.682-689
    • /
    • 2019
  • 부분 기반 영상 표현(part-based image representation)에서는 영상의 부분적인 모습을 기저 벡터로 표현하고 기저 벡터의 선형 조합으로 영상을 분해하며, 이 때 기저 벡터의 계수가 곧 물체의 부분적인 특징을 의미하게 된다. 본 논문에는 부분 기반 영상 표현 기법인 비음수 행렬 분해(non-negative matrix factorization, NMF)를 이용하여 얼굴 영상을 표현하고 신경망 기법을 적용하여 가려진 얼굴을 인식하는 얼굴 인식을 제안한다. 표준 비음수 행렬 분해, 투영 경사 비음수 행렬 분해, 직교 비음수 행렬 분해를 이용하여 얼굴 영상을 표현하였고, 각 기법의 성능을 비교하였다. 인식기로는 학습벡터양자화 신경망을 사용하였으며, 인식기에서의 거리 척도로는 유클리디언 거리를 사용하였다. 실험 결과, 전통적인 얼굴 인식 방법에 비하여 제안한 기법이 가려진 얼굴 인식에 보다 강인함을 보인다.

도로 노면 파손 영상의 다중 분류 심층 신경망 평가를 통한 Backbone Network 선정 기법 (A Selection Method of Backbone Network through Multi-Classification Deep Neural Network Evaluation of Road Surface Damage Images)

  • 심승보;송영은
    • 한국ITS학회 논문지
    • /
    • 제18권3호
    • /
    • pp.106-118
    • /
    • 2019
  • 최근 들어 인공 지능을 이용한 영상 객체 인식에 대한 연구 및 개발이 활발하게 진행되고 있다. 그 연장선상에서 도로 유지 및 관리 분야에도 관련 연구의 활용도가 크게 향상될 것으로 기대된다. 그 중에서도 특히 도로 노면 파손 객체 인식 (Object Detection) 을 위한 인공 지능모델이 지속적으로 개발되고 있다. 이러한 객체 인식 알고리즘을 개발하려면 우선적으로 특징지도를 생성하는 Backbone Network가 반드시 필요한데, 본 논문에서는 이를 선정하는 방법을 제안하고자 한다. 이를 위해 6,000여 장의 도로 노면 파손 영상 데이터를 확보하고, 근래에 많이 사용되는 4종류의 심층 신경망을 활용하여 성능을 비교한다. 3가지의 성능 평가 방법을 적용하여 심층 신경망의 특징을 분석하고 최적의 심층 신경망을 결정한다. 또한 하이퍼 파라미터의 최적 조율을 통해 성능을 향상시키고, 최종적으로 도로 노면 파손 영상 분류를 위하여 85.9%의 정확도로 수행이 가능한 경량화된 Backbone Network용 심층 신경망을 제안한다.

Generative Adversarial Network를 활용한 Image2Vec기반 이미지 검색 모델 개발 (An Development of Image Retrieval Model based on Image2Vec using GAN)

  • 조재춘;이찬희;이동엽;임희석
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.301-307
    • /
    • 2018
  • 검색에서 이미지는 시각적 속성이 중요지만, 기존의 검색방법은 문서 검색을 위한 방법에 초점이 맞춰져 있어 이미지의 속성 정보가 미반영된 키워드 중심의 검색 시스템이 대부분이다. 본 연구는 이러한 한계를 극복하고자 이미지의 벡터정보를 기반으로 유사 이미지를 검색할 수 있는 모델과 스케치로 검색 쿼리를 제공하여 유사 이미지를 검색할 수 있는 시스템을 개발하였다. 제안된 시스템은 GAN을 이용하여 스케치를 이미지 수준으로 업 샘플링하고, 이미지를 CNN을 통해 벡터로 변환한 후, 벡터 공간 모델을 이용하여 유사 이미지를 검색한다. 제안된 모델을 구현하기 위하여 패션 이미지를 이용하여 모델을 학습시켰고 패션 이미지 검색 시스템을 개발하였다. 성능 측정은 Precision at k를 이용하였으며, 0.774와 0.445의 성능 결과를 보였다. 제안된 방법을 이용하면 이미지 검색 의도를 키워드로 표현하는데 어려움을 느끼는 사용자들의 검색 결과에 긍정적 효과가 나타날 것으로 기대된다.

구조 인식 심층 합성곱 신경망 기반의 영상 잡음 제거 (Image Denoising Via Structure-Aware Deep Convolutional Neural Networks)

  • 박기태;손창환
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.85-95
    • /
    • 2018
  • 스마트폰의 보급이 확산되고 대중화됨에 따라 대부분의 사람들은 사진을 촬영하기 위해 모바일 카메라를 애용하고 있다. 하지만 저조도 환경에서 사진을 촬영할 때 광량이 부족한 이유로 원치 않는 잡음이 발생할 수 있다. 이런 잡음을 제거하기 위해, 최근 심층 합성곱 신경망에 기반한 잡음 제거 기법이 제안되었다. 이 기법은 성능 측면에서 큰 진전을 보였을지라도 여전히 텍스처 및 에지 표현 능력이 부족하다. 따라서 본 논문에서는 영상의 구조를 향상시키기 위해 에지의 방향 정보를 나타내는 호그 영상을 활용하고자 한다. 그리고 잡음 영상과 호그 영상을 스택으로 쌓은 후, 입력 텐서를 형성하여 심층 합성곱 신경망을 학습시키는 기법을 제안하고자 한다. 실험 결과를 통해, 제안한 기법은 기존의 기법보다 정량적인 화질 평가에서 더 우수한 결과를 얻을 수 있었으며 시각적인 측면에서도 텍스처 및 에지의 향상을 달성할 수 있었다.

문자 수준 딥 컨볼루션 신경망 기반 추천 모델 (A Recommendation Model based on Character-level Deep Convolution Neural Network)

  • 기가기;정영지
    • 한국정보통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.237-246
    • /
    • 2019
  • 추천 시스템의 등급 예측 정확도를 높이기 위해서는, 사용자 항목 등급 데이터뿐만 아니라 주석, 태그 또는 설명과 같은 항목의 보조 정보도 고려해야만 한다. 기존 접근법에서는 단어 단위에서 bag-of-words 모델을 사용하여 보조 정보를 모델링한다. 그러나 이러한 모델은 보조 정보를 효과적으로 활용할 수 없으므로 보조 정보를 제한적으로 이해하게 된다. 한편, 컨볼루션 신경망(CNN)에서는 보조 정보로부터 특징 벡터를 효과적으로 포착하고 추출할 수 있다. 따라서 본 논문에서는 새로운 추천 모델을 위해 딥 CNN을 행렬 분해에 통합시킨 문자 수준의 딥 컨볼루션 신경망 기반 행렬 분해 (Char-DCNN-MF) 방법을 제안한다. Char-DCNN-MF에서는 보조 정보를 더 심층적으로 이해하고 추천 성능을 더욱 향상시킬 수 있다. 실험은 세 가지 다른 실제 데이터 세트에서 수행되었으며 그 결과는 Char-DCNN-MF가 다른 비교 모델보다 유의적으로 뛰어난 성능을 보여주었다.