• 제목/요약/키워드: 입력 특징

검색결과 2,152건 처리시간 0.023초

심실빈맥/심실세동 분류를 위한 NEWFM 기반의 퍼지규칙 추출 (Extracting Fuzzy Rules for Classifying Ventricular Tachycardia/Ventricular Fibrillation Based on NEWFM)

  • 신동근;이상홍;임준식
    • 인터넷정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.179-186
    • /
    • 2009
  • 본 논문은 가중 퍼지소속함수 기반 신경망(Neural Network with Weighted Fuzzy Membership Functions, NEWFM)을 이용하여 Creighton University Ventricular Tachyarrhythmia DataBase(CUDB)의 심전도(ECG) 신호로부터 정상리듬(Normal Sinus Rhythm, NSR)과 심실빈맥/심실세동(Ventricular Tachycardia/Ventricular Fibrillation, VT/VF)을 분류하는 방안을 제시하고 있다. NEWFM에서 사용할 특징입력을 추출하기 위해서 첫 번째 단계에서는 웨이블릿 변환(wavelet transform, WT)을 이용하였다. 두 번째 단계에서는 첫 번째 단계에서 생성된 웨이블릿 계수들을 위상공간 재구성(Phase Space Reconstruction, PSR)과 첨단(Peak) 추출 기법의 입력 값으로 이용하여 2개의 특징입력을 추출하였다. NEWFM은 이들 2개의 특징입력을 이용하여 정상리듬과 심실빈맥/심실세동을 분류하였고 그 결과로 90.13%의 분류성능을 나타내었다.

  • PDF

경계 특징을 이용한 모자이크 블록 추출 방법 (A Method for Extracting Mosaic Blocks Using Boundary Features)

  • 장석우;박영재;허문행
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2949-2955
    • /
    • 2015
  • 최근 들어 사진, 애니메이션, 동영상과 같은 디지털 시각 매체가 폭발적으로 증가함에 따라서 의도적 또는 비의도적으로 입력 영상 내에 모자이크 블록들을 생성해야 할 필요성이 증가하고 있다. 본 논문에서는 입력된 컬러 영상에 존재하는 모자이크 블록들을 경계 특징을 이용하여 효과적으로 검출하는 방법을 제안한다. 제안된 방법에서는 먼저 입력 영상으로부터 캐니 에지를 검출하고, 검출된 에지로부터 모자이크 블록의 경계 특징을 추출하여 모자이크 블록이 존재할 가능성이 있는 후보 영역들을 찾는다. 그런 다음, 기하학적인 특징을 활용하여 비 모자이크 영역들을 제거하고 실제적인 모자이크 블록들만을 검출한다. 본 논문의 실험 결과에서는 제안된 방법이 다양한 종류의 입력 영상에서 모자이크 블록들을 강건하게 검출한다는 것을 보여준다.

다중의 특징 분석을 통한 비 유사 영역의 자동적인 검출 (Automatic Detection of Dissimilar Regions through Multiple Feature Analysis)

  • 장석우;정명희
    • 한국산학기술학회논문지
    • /
    • 제21권2호
    • /
    • pp.160-166
    • /
    • 2020
  • 모바일 기반의 하드웨어 기술이 발전함에 따라 많은 종류의 응용 프로그램들이 개발되고 있다. 그리고 이런 응용프로그램들의 인터페이스가 올바르게 동작하는지를 자동으로 검사하려는 수요가 증가하고 있다. 본 논문에서는 입력되는 여러 가지 유형의 영상으로부터 주요한 특징의 비교 분석을 통해서 응용 프로그램의 실행 오류 화면을 강인하게 검출하는 접근 방법을 제시한다. 본 논문에서 제시된 방법에서는 먼저 입력되는 영상으로부터 영상을 대표하는 주요한 다중의 특징을 추출한다. 그런 다음, 추출된 다중의 특징의 차이를 비교함으로써 입력된 영상이 목표 영상과 동일한 정상적인 영상인지, 아니면 목표 영상과 유사하지만 서로 다른 오류 영상인지를 효과적으로 판단한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 종류의 영상으로부터 주요한 다중의 특징 비교를 통해서 정상적인 영상과 오류가 발생한 영상을 정확하게 검출한다는 것을 보여준다. 본 논문에서 제안된 접근 방법은 비디오 색인, 객체 검출 및 추적, 영상 감시 등과 같은 컴퓨터 비전과 관련된 많은 실제 응용 분야에서 유용하게 사용될 것으로 기대된다.

3D 스캔 데이터를 이용한 얼굴 애니메이션 시스템 (A Facial Animation System Using 3D Scanned Data)

  • 구본관;정철희;이재윤;조선영;이명원
    • 정보처리학회논문지A
    • /
    • 제17A권6호
    • /
    • pp.281-288
    • /
    • 2010
  • 본 논문에서는 3차원 얼굴 스캔 데이터와 사진 이미지를 이용하여 고화질의 3차원 얼굴 모델과 모핑 애니메이션을 생성하는 시스템 개발에 대해 기술한다. 본 시스템은 얼굴 특징점 입력 도구, 얼굴 텍스처매핑 인터페이스, 3차원 얼굴 모핑 인터페이스로 구성되어 있다. 얼굴 특징점 입력 도구는 3차원 텍스처매핑과 모핑 애니메이션을 위한 보조 도구로서 얼굴의 특징점을 입력하여 텍스처매핑과 임의의 두 얼굴간의 모핑 영역을 정할 때 사용된다. 텍스처매핑은 3D 스캐너로부터 획득한 얼굴의 기하 데이터에 세 방향의 사진 이미지를 이용하여 매핑한다. 3D 얼굴모핑은 얼굴 특징점 입력 도구로부터 얻은 특징점을 중심으로 얼굴 영역을 분류하여 임의의 두 얼굴 간의 영역간 매핑을 실현한다. 본 시스템은 사용자가 별도의 프로그래밍 작업 없이 대화형 인터페이스에서 3D 스캐너에서 획득한 얼굴 메쉬 데이터를 이용하여 사진 이미지로 텍스처 매핑을 실행하여 사실적인 3D 얼굴 모델을 얻을 수 있고, 임의의 서로 다른 얼굴 모델들간의 모핑 애니메이션을 쉽게 실현할 수가 있다.

Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구 (A Study on Image Generation from Sentence Embedding Applying Self-Attention)

  • 유경호;노주현;홍택은;김형주;김판구
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.63-69
    • /
    • 2021
  • 사람이 어떤 문장을 보고 그 문장에 대해 이해하는 것은 문장 안에서 주요한 단어를 이미지로 연상시켜 그 문장에 대해 이해한다. 이러한 연상과정을 컴퓨터가 할 수 있도록 하는 것을 text-to-image라고 한다. 기존 딥 러닝 기반 text-to-image 모델은 Convolutional Neural Network(CNN)-Long Short Term Memory(LSTM), bi-directional LSTM을 사용하여 텍스트의 특징을 추출하고, GAN에 입력으로 하여 이미지를 생성한다. 기존 text-to-image 모델은 텍스트 특징 추출에서 기본적인 임베딩을 사용하였으며, 여러 모듈을 사용하여 이미지를 생성하므로 학습 시간이 오래 걸린다. 따라서 본 연구에서는 자연어 처리분야에서 성능 향상을 보인 어텐션 메커니즘(Attention Mechanism)을 문장 임베딩에 사용하여 특징을 추출하고, 추출된 특징을 GAN에 입력하여 이미지를 생성하는 방법을 제안한다. 실험 결과 기존 연구에서 사용되는 모델보다 inception score가 높았으며 육안으로 판단하였을 때 입력된 문장에서 특징을 잘 표현하는 이미지를 생성하였다. 또한, 긴 문장이 입력되었을 때에도 문장을 잘 표현하는 이미지를 생성하였다.

분절 특징을 이용한 음성 신호의 모델링 (Modeling of Speech Signals Using Segmental-Features)

  • 윤영선;오영환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.371-373
    • /
    • 2000
  • 본 논문에서는 분절 특징을 모수적 궤적 모델을 이용하여 표현하고, 이 특징을 분절 HMM(segmental HMM)의 입력으로 하는 음성 신호의 모델링 방식을 제안한다. 분절 특징은 음성의 경향을 나타내는 궤적으로 표현되고, 그 궤적은 연속되는 프레임 상에서 전이 정보를 포함하도록 디자인 행렬과 다항식의 회귀 함수를 이용하여 구해진다. 이 궤적을 분절 HMM에 적용하기 위하여, 외적 분절 변이와 내적 분절 변이에 대한 확률 분포 표현을 개선하였다. 제안된 방법의 효과를 살펴보기 위하여 TIMIT 데이터 베이스를 이용하여 실험한 결과, 제안된 분절 특징은 음성 신호의 인접한 프레임간의 상관관계를 표현하는 동적 특징과 같은 효과를 보였으며, 1차 미분계수를 포함하여 분절 특징을 구한 경우에는 기존의 특징 표현보다 좋은 성능을 보였다.

  • PDF

고무타이어 문자열 입력영상 개선을 위한 전처리와 광학조건에 관한 연구 (A Study on Optical Condition and preprocessing for Input Image Improvement of Dented and Raised Characters of Rubber Tires)

  • 류한성;최중경;권정혁;구본민;박무열
    • 한국정보통신학회논문지
    • /
    • 제6권1호
    • /
    • pp.124-132
    • /
    • 2002
  • 영상처리라는 것은 문자를 인식하거나 물체를 인식하는 등 어떠한 물체의 특징을 추출하여 그에 대한 정보를 가지고 자동제어 시스템이나 인식시스템에 도입하는 것이다. 그러나 이러한 시스템들에 도입시키기 위해서는 찾고자 하는 물체의 특징을 잘 검출할 수 있어야 하며 검출된 특징의 패턴도 잘 잘 구별해야 한다. 그러나 본 논문에서 다루고 있는 고무 타이어의 특성은 배경과 문자열이 존재하는 특징면이 잘 구분되지 않는다는 것이다. 이것은 곧 특징 추출이 어렵다는 것을 간접적으로 나타내고 있는 것이다. 그러므로 수많은 논문에서 손실된 특징 정보를 복원하기 위한 기술과 끊어진 문자 정보를 유추하여 맞춰 내는 등의 기술을 많이 연구해 왔다. 그러나 우리는 무엇보다 처음에 입력받는 영상이 좋아야만 나머지 필터링이나 영상 처리기법이 쉽다고 생각하여 입력 영상을 개선시킬 수 있는 광학적인 환경에 관심을 두기로 하였다. 본 논문은 이리한 영상처리기법 중에서 입력 영상을 보다 선명하게 받아들이기 위한 조건을 찾고 광학적인 이론을 찾고자 하는 논문이다. 본 논문은 타이어를 생산하는 라인에서 타이어에 각인되어 있는 문자를 인식하고 상위 컴퓨터인 호스트 컴퓨터에 자료를 전송함으로써 물류를 관리하고, 다음 공정인 전수 검사공정에서 각 타이어에 맞는 휠을 끼우기 위한 작업을 위한 것이다. 이러한 시스템을 위해서는 나은 양질의 입력영상을 획득해야만 인식과정에서 오인식을 줄일 수 있고 자동화 공정에 응용할 수 있다. 양질의 입력영상을 획득하기 위해서는 빛의 입사각도와 피사체가 이루는 각도가 어떠한 각의 형태를 가지는가 하는 것이 중요하며 또한 이것을 받아들이는 카메라의 각도가 피사체와 어떠한 각을 이루는가? 하는 것도 중요한 문제이다. 본 논문에서는 이에 대한 최적조건을 실험적인 방법으로 찾고, 이에 대한 결과를 광학적으로 증명해 보고자 한다.

퍼지신경망과 비중복면적 분산 측정법을 이용한 최소의 특징입력 및 퍼지규칙의 추출 (Extracting Minimized Feature Input And Fuzzy Rules Using A Fuzzy Neural Network And Non-Overlap Area Distribution Measurement Method)

  • 임준식
    • 한국지능시스템학회논문지
    • /
    • 제15권5호
    • /
    • pp.599-604
    • /
    • 2005
  • 본 논문은 가중 퍼지소속함수 기반 신경망(Neural Network with Weighted Fuzzy Membership Functions, NEWFM)을 이용하여 위스콘신 유방암(Wisconsin breast cancer)의 진단을 수행하는 퍼지규칙을 추출하고, 비중복면적 분산 측정법을 사용하여 특징입력수를 최소로하는 방안을 제안하고 있다. NEWFM 구조의 중간 부분인 하이퍼박스(hyperbox)들은n 개의 대, 중, 소로 구성된 가중 퍼지소속함수 집합으로 구성되며, 학습 후 각 집합의 대, 중, 소로 구성된 가중 퍼지소속함수는 퍼지집합의 경계합(bounded sum)을 사용하여 다시 하나의 가중 퍼지소속함수로 합성(BSWFM) 된다. n 개의 특징입력(feature input)은 학습된 모든 하이퍼박스에 연결되어 예측 작업을 수행한다. 여기에 비중복면적 분산 측정법을 적용하여 중요도가 낮은 특징입력을 제거하면서 최소의 m 개 특징입력만을 사용한 하이퍼박스로 단순화시킨다. 이러한 방법으로 위스콘신 유방암의 9개의 특징입력 중 4개를 사용하여 NEWFM으로 추출된 2개의 퍼지규칙은 99.71%의 예측 인식율을 가지며 이는 퍼지규칙의 수와 인식율에 있어 현재 발표된 논문의 결과보다 우수함을 보여준다.

가변 길이 입력 발성에서의 화자 인증 성능 향상을 위한 통합된 수용 영역 다양화 기법 (Integrated receptive field diversification method for improving speaker verification performance for variable-length utterances)

  • 신현서;김주호;허정우;심혜진;유하진
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.319-325
    • /
    • 2022
  • 화자 인증 시스템에서 입력 발성 길이의 변화는 성능을 하락시킬 수 있는 대표적인 요인이다. 이러한 문제점을 개선하기 위해, 몇몇 연구에서는 시스템 내부의 특징 가공 과정을 여러가지 서로 다른 경로에서 수행하거나 서로 다른 수용 영역(Receptive Field)을 가진 합성곱 계층을 활용하여 다양한 화자 특징을 추출하였다. 이러한 연구에 착안하여, 본 연구에서는 가변 길이 입력 발성을 처리하기 위해 보다 다양한 수용 영역에서 화자 정보를 추출하고 이를 선택적으로 통합하는 통합된 수용 영역 다양화 기법을 제안한다. 제안한 통합 기법은 입력된 특징을 여러가지 서로 다른 경로에서 다른 수용 영역을 가진 합성곱 계층으로 가공하며, 가공된 특징을 입력 발성의 길이에 따라 동적으로 통합하여 화자 특징을 추출한다. 본 연구의 심층신경망은 VoxCeleb2 데이터세트로 학습되었으며, 가변 길이 입력 발성에 대한 성능을 확인하기 위해 VoxCeleb1 평가 데이터 세트를 1 s, 2 s, 5 s 길이로 자른 발성과 전체 길이 발성에 대해 각각 평가를 수행하였다. 실험 결과, 통합된 수용 영역 다양화 기법이 베이스라인 대비 동일 오류율을 평균적으로 19.7 % 감소시켜, 제안한 기법이 가변 길이 입력 발성에 의한 성능 저하를 개선할 수 있음을 확인하였다.

자동 특징 추출기법에 의한 최소의 주식예측 특징선택 (Minimized Stock Forecasting Features Selection by Automatic Feature Extraction Method)

  • 이상홍;임준식
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.206-211
    • /
    • 2009
  • 본 논문은 가중 퍼지소속함수 기반 신경망(Neural Network with Weighted Fuzzy Membership Functions, NEWFM)기반의 자동 특징 추출기법을 사용하여 1일 후의 주식 예측을 하는 방안을 제안하고 있다. 비중복면적 분산측정 법에 의해 중요도가 가장 낮은 특징입력을 자동적으로 하나씩 제거하면서 최소의 특징입력을 선택하였다. 특징입력으로써 CPP$_{n,m}$(Current Price Position of the day n)과 최근 32일간의 CPP$_{n,m}$을 웨이블릿 변환한 38개의 계수들 중 비중복면적 분산측정법에 의해서 자동적으로 추출된 2개의 계수가 사용되었다 제안된 방법으로 1989년부터 1998년까지의 실험군을 사용한 결과로써 60.93%의 예측율을 나타내었다.