• 제목/요약/키워드: 입력 특징

검색결과 2,145건 처리시간 0.025초

한국어 음성인식 플랫폼 (ECHOS) 개발 (Development of a Korean Speech Recognition Platform (ECHOS))

  • 권오욱;권석봉;장규철;윤성락;김용래;장광동;김회린;유창동;김봉완;이용주
    • 한국음향학회지
    • /
    • 제24권8호
    • /
    • pp.498-504
    • /
    • 2005
  • 교육 및 연구 목적을 위하여 개발된 한국어 음성인식 플랫폼인 ECHOS를 소개한다. 음성인식을 위한 기본 모듈을 제공하는 BCHOS는 이해하기 쉽고 간단한 객체지향 구조를 가지며, 표준 템플릿 라이브러리 (STL)를 이용한 C++ 언어로 구현되었다. 입력은 8또는 16 kHz로 샘플링된 디지털 음성 데이터이며. 출력은 1-beat 인식결과, N-best 인식결과 및 word graph이다. ECHOS는 MFCC와 PLP 특징추출, HMM에 기반한 음향모델, n-gram 언어모델, 유한상태망 (FSN)과 렉시컬트리를 지원하는 탐색알고리듬으로 구성되며, 고립단어인식으로부터 대어휘 연속음성인식에 이르는 다양한 태스크를 처리할 수 있다. 플랫폼의 동작을 검증하기 위하여 ECHOS와 hidden Markov model toolkit (HTK)의 성능을 비교한다. ECHOS는 FSN 명령어 인식 태스크에서 HTK와 거의 비슷한 인식률을 나타내고 인식시간은 객체지향 구현 때문에 약 2배 정도 증가한다. 8000단어 연속음성인식에서는 HTK와 달리 렉시컬트리 탐색 알고리듬을 사용함으로써 단어오류율은 $40\%$ 증가하나 인식시간은 0.5배로 감소한다.

화자 구분 시스템의 관심 화자 추출을 위한 i-vector 유사도 기반의 음성 분할 기법 (I-vector similarity based speech segmentation for interested speaker to speaker diarization system)

  • 배아라;윤기무;정재희;정보경;김우일
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.461-467
    • /
    • 2020
  • 잡음이 많고 여러 사람이 있는 공간에서 음성인식의 성능은 깨끗한 환경보다 저하될 수밖에 없다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 신호가 섞인 혼합 음성에서 관심 있는 화자의 음성만 추출한다. 중첩된 구간에서도 효과적으로 분리해내기 위해 VoiceFilter 모델을 사용하였으며, VoiceFilter 모델은 여러 화자의 발화로 이루어진 음성과 관심 있는 화자의 발화로만 이루어진 참조 음성이 입력으로 필요하다. 따라서 본 논문에서는 Probabilistic Linear Discriminant Analysis(PLDA) 유사도 점수로 군집화하여 혼합 음성만으로도 참조 음성을 대체해 사용하였다. 군집화로 생성한 음성에서 추출한 화자 특징과 혼합 음성을 VoiceFilter 모델에 넣어 관심 있는 화자의 음성만 분리함으로써 혼합 음성만으로 화자 구분 시스템을 구축하였다. 2명의 화자로 이루어진 전화 상담 데이터로 화자 구분 시스템의 성능을 평가하였으며, 분리 전 상담사(Rx)와 고객(Tx)의 음성 Source to Distortion Ratio(SDR)은 각각 5.22 dB와 -5.22 dB에서 분리 후 각각 11.26 dB와 8.53 dB로 향상된 성능을 보였다.

노이즈 영상으로부터 모아레 기준 위상의 강인 자동 생성 방법 (A Robust Method for Automatic Generation of Moire Reference Phase from Noisy Image)

  • 고국원;김민영
    • 한국산학기술학회논문지
    • /
    • 제10권5호
    • /
    • pp.909-916
    • /
    • 2009
  • 본 연구는 위상천이 영사식 모아레 측정기의 기준 위상 측정단계에서 기준 위상의 검출 정확도를 높이기 위한 방안으로, 일반적인 N-bucket 방법이 아닌, 줄무늬 패턴 투사 영상의 직접적인 영상처리를 기반으로, 노이즈가 포함된 영상으로부터 기준 위상을 자동으로 검출하고 보정하는 방법을 다룬다. 일반적으로 기준위상을 정확히 구하기 위해서는 상대적으로 노이즈가 원천적으로 적은 고정밀도의 교정 시편과 이에 맞는 세분화된 교정방법이 필요하다. 하지만, 고가의 시편 제작비용 절감과 고정도 교정을 위한 교정시간의 단축을 위해, 상대적으로 일반 정밀도등급의 제작된 시편으로부터 획득된 영상을 이용하여, 효율적인 기준위상 교정 방법을 제안한다. 투사된 평행 라인 띠가 시편에서 반사되어 카메라로 입력되는 영상으로부터, 영상처리 라인마스크를 이용하여 격자 라인들의 중심점을 정밀하게 추출하고, 각 라인들에서 추출된 샘플링점 기반의 최소자승법을 이용하여, 라인 특징치인 기울기와 절편을 추출함으로써 실제 관측되는 격자 라인의 중심선을 획득하였으며, 획득된 중심선들을 이용하여 N-bucket 알고리즘에 적용할 수 있도록 위상을 추출한 후, 기준위상을 자동으로 생성하였다. 본 연구를 통하여 고가의 시편 제작 없이 빠르게 자동으로 기준위상을 추출할 수 있었다.

모바일 기기 기반 사용자 중심형 전시관 정보 안내 시스템의 설계 및 구현 (Design and Implementation of user centric pavilion information guide system based on commercial mobile device)

  • 윤현주;부소영;최유주
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.187-199
    • /
    • 2006
  • 본 논문에서는 PDA(Personal Digital Assistant: 이하 PDA라 약칭함)와 같은 모바일 기기를 기반으로 하여 사용자가 원하는 대로 시스템의 인터페이스가 구성되는 사용자 중심형 전시관 정보 안내 시스템을 제안한다. 이는 PDA나 휴대폰 등과 같은 모바일 기기를 기반으로 제작함으로써 이동하는 사용자에게 휴대성의 편리를 제공하며, 기존의 브라우저와는 다르게 작은 디바이스 화면에서도 모든 데이터들에 대한 정보가 한 화면에 디스플레이되며, 사용자와의 인터랙션을 통하여 사용자가 원하는 정보를 중심으로 시스템의 인터페이스와 정보 요소를 구성할 수 있게 하여 이용에 편리성을 더한다. 또한 안내 대상의 위치 정보와 상세 정보 등을 글, 이미지, 음성, 동영상 등의 다양한 형태로 사용자에게 제공하는 데 그 특징이 있다. 본 논문에서 시스템은 미디어 정보 데이터베이스를 갖추고 있는 미디어 데이터 서버와 데이터베이스와 휴대용 안내시스템을 실시간으로 동시에 제어하기 위한 휴대용 시스템 컨트롤 서버 그리고 사용자의 요구 사항을 입력받고 구성된 안내 정보를 디스플레이하는 휴대용 안내 시스템 등으로 구성된다. 각 시스템은 TCP/IP기반의 네트워크 연결과 여러 전시관 형태나 데이터의 종류에 따라 갱신 및 추가, 교환이 가능하도록 하기 위한 XML(extensible Markup Language)과 JAVA 2 Micro Edition 기반의 제작을 제시한다. 이는 어떤 모바일 기기에서도 사용할 수 있게 하는 시스템의 범용성을 높일 수 있다.

  • PDF

3D 프린팅 시간 단축을 위한 상하 레이어 폴리라인 병합 기반 가변 슬라이싱 (Adaptive Slicing by Merging Vertical Layer Polylines for Reducing 3D Printing Time)

  • 박지영;강주형;이혜인;신화선
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권5호
    • /
    • pp.17-26
    • /
    • 2016
  • 본 논문에서는 상하 레이어 폴리라인 병합(merging) 기반 가변(adaptive) 슬라이싱 기법을 제안한다. 먼저 출력 가능한 최소 두께 값을 사용하여 입력된 3D 폴리곤 모델을 균일(uniform) 슬라이싱하고 각 레이어 단면 영역의 경계에 대한 폴리라인(polyline)들을 생성한다. 다음으로 상하 연결성이 높은 폴리라인들을 그룹화한 후, 각 그룹 내에서 불필요한 폴리라인들을 삭제한다. 삭제할 레이어를 결정하기 위해 기하오차척도인 커스프 높이(cusp height)를 계산하고 이를 기반으로 적정 레이어 두께를 결정한다. 마지막으로레이어 두께 범위 내의 폴리라인들을 삭제함으로써 한 개 레이어로 병합된다. 제안 방법은 형상의 특징을 최대한 유지함과 동시에 출력 시간을 효과적으로 단축시킨다는 장점을 가진다. 성능 검증을위해 제안 기법과 전역적 가변 슬라이싱 기법을 사용하여 총 10개 3D 폴리곤 모델을 슬라이싱 한 후 출력 시간을 결정짓는 수치인 폴리라인의 총 길이를 측정하였다. 실험 결과, 모든 모델에 대해 제안한 기법의 폴리라인 총 길이가 더 짧았으며 이는 더 빠른 시간에 출력을 완료할 수 있다는 것을 의미한다.

SSL과 패스워드 기반의 신용카드 간편결제 프로토콜 (Simple Credit Card Payment Protocols Based on SSL and Passwords)

  • 김선범;김민규;박종환
    • 정보보호학회논문지
    • /
    • 제26권3호
    • /
    • pp.563-572
    • /
    • 2016
  • 현재 국내에서는 다양한 신용카드 간편결제 프로토콜이 제시되고 있다. 제시되는 프로토콜의 특징은 사용자 인증을 위해 공인인증서 대신 패스워드를 사용하고, ActiveX를 통해 별도의 보안모듈을 설치할 필요가 없다는 것이다. 본 논문에서는 표준화된 보안 프로토콜인 SSL(Secure Socket Layer)과 패스워드 인증을 이용하여 두 개의 새로운 간편결제 프로토콜을 제안한다. 첫 번째는 온라인 쇼핑몰과 PG(Payment Gateway)가 다른 경우로써 국외의 페이팔(PayPal)을 이용한 간편결제와 유사하고, 두 번째는 온라인 쇼핑몰과 PG가 같은 경우로써 국외의 아마존(Amazon)에서 제공하는 결제방식과 유사하다. 제안되는 두 개의 프로토콜 모두 온라인 쇼핑 시, 쇼핑과정과는 독립된 별도의 사전등록절차를 요구하지 않고 쇼핑과정에서 자연스럽게 등록 및 결제를 처리할 수 있다. 또한 로그인 패스워드와는 다른 결제 패스워드를 입력하도록 하여 안전성을 향상시켰다. 본 논문에서 제시한 프로토콜은 현재 다양한 업체에서 제시하는 간편결제 프로토콜을 보다 더 정확하게 이해하고, 그 안전성을 분석하는데 도움이 될 것이다.

시맨틱웹을 활용한 초등학교 학습자료 검색시스템 (An Elementary Educational Contents Retrieval System Using Semantic Web)

  • 이희경;전우천
    • 정보처리학회논문지A
    • /
    • 제13A권6호
    • /
    • pp.545-554
    • /
    • 2006
  • 웹의 활용이 보편화 되면서 웹을 통한 자료의 검색이 증가하고 있으나, 웹상의 방대한 자료 중에서 학습자가 꼭 필요한 학습자료를 찾는 것은 쉬운 일이 아니다. 검색엔진을 이용할 경우 원하는 정보를 어느 정도 찾을 수 있으나 검색어 일치방식에 의존하는 현재의 검색엔진의 특성상 결과가 만족스럽지 못한 경우가 많다. 또한 검색 결과 중에서 연관이 없는 정보를 필터링하기 위해 사용자가 많은 시간을 낭비하기도 한다. 본 연구에서는 웹 자원의 의미정보를 구조화하여 정보의 효율적인 검색, 통합, 재사용을 가능하도록 하는 시맨틱 웹(Semantic Web)기술을 활용하여 초등학교 학습자료에 적합한 온톨로지(Ontology)를 제안하고, 의미적 연관관계를 통해 학습내용에 접근할 수 있도록 초등학교의 역사분야 학습 내용에 관한 온톨로지를 구축하였다. 또한 이를 기반으로 학습자료를 검색할 수 있는 시스템을 설계하고 구현하였다. 본 검색시스템의 특징은 다음과 같다. 첫째, 학습자료와 연관된 사용자 질의어를 보다 상세하게 입력받아 검색결과를 얻는다. 둘째, 사용자 질의어를 바탕으로 학습자료 온톨로지에 질의하여 검색어가 포함된 결과 및 검색어와 연관된 정보를 검색결과로 얻는다. 셋째, 질의어와 연관된 내용을 함께 제시함으로써 학습의 효율을 높일 수 있다.

GIS를 이용한 지질자료 기반 통합 주제정보의 다중 버퍼 영역분석 (Multi-Buffer Zone Analysis of Geo-Based Integrated Thematic Mappable Information by Using GIS)

  • 이기원;박노욱;권병두
    • Spatial Information Research
    • /
    • 제7권2호
    • /
    • pp.159-173
    • /
    • 1999
  • GIS는 다양한 지구과학분야의 응용에 중요한 방법 중 하나로 인식되고 있으며 최근 지구과학정보의 공간통합을 위한 다양한 방법들이 개발되고 있다. 그러나, 현재 공간분석 통합 결과에 대한 정량화 분석에 대해서는 그다지 많이 연구되고 있지 않으며, 이러한 측면에 일부 기인하여 GIS에서 제공하는 분석기법들을 자연과학분야에의 그대로 적용하는데는 부족한 면이 있다. 본 연구에서는 GIS 공간분석 측면에서 "다중버퍼 영역분석" 이라는 간단한 방법을 소개하고, 실제 자료를 이용하여 광물부존 지역예측 문제에 본 제안 방법을 적용하였다. GIS 측면에서 볼 때, 본 방법은 격자기반 버퍼링 혹은 근접성분석 기법을 지구과학 자료의 해석을 위해 확장하여 응용한 것이다. 본 방법은 GIS의 가장 기본적인 도형 모델인, 점, 선, 면으로 표현할 수 있는 중요한 지질학적 지표 특징에 대하여 지구과학적 현상이나 양상이 주로 원형 상으로 나타나는 경우에 대하여 적용이 가능하다. 이러한 방법을 적용하여 하나의 지질학적 현상을 설명하는데 있어서 항공물리탐사, 지표탐사, 지질조사, 위성 영상 자료 등과같은 복합적인 지구과학자료들이 어떻게 영향을 미치고 있는 가를 정량적으로 밝혀내는 데 이용할 수 있다. 결론적으로 GIS에서 제공하는 분석기법의 적용은 공간 통합에 의한 주제도 작성문제와 연계되어 제한적인 공간 영역내에서 복합적인 입력 자료들에 대한 상호 영향을 추론하는데 활용될 수 있을 것으로 생각된다.

  • PDF

단일 투사 절대 코드 패턴을 이용한 3차원 얼굴 데이터의 유클리디안 복원 (A Euclidean Reconstruction of 3D Face Data Using a One-Shot Absolutely Coded Pattern)

  • 김병우;유선진;이상윤
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.133-140
    • /
    • 2005
  • 본 논문에서는 3차원 얼굴 인식기에서의 입력 데이터로 적합한 얼굴 데이터의 유클리디안 복원 시스템을 제안한다. 카메라 영상을 통한 유클리디안 복원을 위해서는 카메라의 보정정보와 복원할 특징 점의 대응 쌍 정보가 필요한데, 보정정보는 시스템의 변경이 없다면 불변한다. 따라서 고속의 유클리디안 복원을 위해서는 스테레오 영상간의 대응 쌍 정보 획득이 가장 중요하다. 시스템은 두 개의 카메라와 프로젝터 한 대로 구성하며, 피사체에 패턴을 투사하고 두 개의 카메라로부터 영상을 획득함으로써 동작한다. 사용 패턴은 단일 투사 줄무늬 패턴을 사용하며 줄무늬의 색도 정보와 채도 정보를 이용하여 '절대 코드 패턴'을 생성한다. 사용 시스템은 두 개의 카메라를 사용하기 때문에 색도 정보와 채도 정보가 비슷한 두 개의 영상을 얻을 수 있으며 이것은 획득한 두 개의 영상에 있는 줄무늬들에 대해 동일한 절대 라벨을 얻을 수 있게 한다. 절대 라벨링 된 줄무늬는 에피폴라 라인(epipolar line)상의 점들과 일대일 정합을 통해 고속의 3차원 데이터 복원을 가능하게 한다. 제안 방식은 얼굴 데이터에 적용되었으며 정확도와 총 소요 시간의 측정을 통해 제안 방식이 기존 방식에 비해 정확도 면에서 뒤지지 않으면서도 복원 속도 면에서 장점을 가짐을 확인할 수 있었다.

신경 회로망과 통계적 기법을 이용한 종합주가지수 예측 모형의 개발 (Development of the KOSPI (Korea Composite Stock Price Index) forecast model using neural network and statistical methods))

  • 이은진;민철홍;김태선
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.95-101
    • /
    • 2008
  • 주가지수는 경제 및 정치적 상황을 포함한 다양한 주변 환경에 영향을 받는 관계로 정확한 주가지수 예측모형의 개발은 매우 어려운 문제로 여겨지고 있다. 본 논문에서는, 신경회로망과 통계적인 방법을 이용하여 종합주가지수(KOSPI)를 예측하는 에이전트 시스템 기법을 제안한다. 예측오차의 평균 및 편차를 최소화하기 위해서, 에이전트시스템은 특징추출, 변수선정, 예측 엔진선정 및 분석을 위한 부(sub)에이전트 모듈들을 포함하고 있다. KOSPI(Korea Composite Stock Price Index) 예측을 위한 에이전트시스템 구현의 첫 번째 단계로서, 주성분분석을 이용하여 22개의 표준기본경제지표에서 12개의 경제지표를 추출하였다. 열두 개의 추출된 경제지표들은 예측하고자하는 예측일에 따라 최량부분적합법을 이용하여 다시 한 번 입력 변수들을 선정하게 된다. 성능평가를 위해 주가지수의 변동폭이 다른 두 종류의 실험데이터를 대상으로 예측을 진행한 결과 30일의 연속적인 종합주가지수예측에 있어 11.92포인트의 평균오차율을 보였다. 또한, 예측시점에 따라 관련이 높은 기본지표의 종류 및 개수가 다르게 나타나므로 제안한 주가예측 에이전트시스템 구조가 유용함을 보였다.