• 제목/요약/키워드: System GMM Model

검색결과 143건 처리시간 0.028초

화자식별 시스템의 계산량 감소를 위한 화자 프루닝 방법 (A Speaker Pruning Method for Reducing Calculation Costs of Speaker Identification System)

  • 김민정;오세진;정호열;정현열
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.457-462
    • /
    • 2003
  • 본 논문에서는 GMM (Gaussian Mixture Model)에 기반한 문맥독립 화자식별 시스템의 식별성능 향상과 실시간 처리를 위한 계산량 감소를 위하여 화자 프루닝 (Speaker Pruning) 방법을 제안한다. 기존의 화자식별 방법인 최대유사도(Maximum Likelihood) 방법과 가중모델순위 (Weighting Model Rank) 방법, 수정된 가중모델순위 (Modified WMR) 방법 등은 입력 음성 전체와 모든 화자모델들과의 유사도를 프레임 단위로 계산하여 가장 큰 누적 유사도를 가지는 화자를 식별화자로 결정하는 방법으로써, 입력 프레임 및 등록 화자수가 늘어남에 따라 계산량 및 식별시간이 늘어나는 단점이 있었다. 이러한 단점을 해결하기 위하여, 제안방법은 입력음성 프레임의 일부분만을 이용하여 화자모델들과의 프레임 유사도를 계산한 후 계산된 유사도를 이용하여 등록화자의 상위 일부분의 화자만을 선택하고, 선택된 화자들에서만 유사도 계산을 수행함으로서 계산량 및 식별시간을 줄이는 방법이다. 또한, 화자 프루닝을 적용할 경우 화자수가 가변 되더라도 수정된 가중모델 순위방법을 적용할 수 있어 식별성능을 높일 수 있다. 식별실험결과, 제안방법을 적용한 경우 기존의 최대 유사도 방법이나 가중모델순위 방법보다 최대 65%의 계산량 및 식별시간을 감소시킬 수 있었으며, 약 2%의 향상된 식별결과를 나타내어, 본 논문에서 제안한 방법의 유효성을 확인할 수 있었다.

해상환경에서 MITL 시스템을 활용한 VTG 기반 기동표적 추적성능 개선 기법 (VTG based Moving Target Tracking Performance Improvement Method using MITL System in a Maritime Environment)

  • 백인혜;우상효
    • 한국멀티미디어학회논문지
    • /
    • 제22권3호
    • /
    • pp.357-365
    • /
    • 2019
  • In this paper, we suggest the tracking method of moving multi-objects in maritime environments. The image acquisition is conducted using IR(InfraRed) camera sensors on an airborne platform. Under the circumstance of maritime, the qualities of IR images can be significantly degraded due to the clutter influence, which directly gives rise to a tracking loss problem. In order to reduce the effects from the clutters, we introduce a technical approach under Man-In-The-Loop(MITL) system for enhancing the tracking performance. To demonstrate the robustness of the proposed approach based on VTG(Valid Tracking Gate), the simulations are conducted utilizing the airborne IR video sequences: Then, the tracking performances are compared with the existing Kalman Filter tracking techniques.

지적재산권 보호가 해외직접투자 유입에 미치는 영향에 관한 실증연구 - 미국 다국적기업을 중심으로 - (An Empirical Study on the Effect of Protection of Property Right on Foreign Direct Investment - Focused on US. Multinational Corporations -)

  • 강석민
    • 경영과정보연구
    • /
    • 제33권3호
    • /
    • pp.21-33
    • /
    • 2014
  • 본 연구는 최근에 해외직접투자의 결정요인으로써 간주되고 있는 투자대상국의 지적재산권 보호의 영향에 관하여 실증분석 하였다. 2000부터 2008년까지 미국의 다국적기업들을 대상으로 고정효과 모형(FEM)과 시스템 GMM을 사용하여 분석한 결과, 지적재산권 보호의 변화는 미국 다국적기업으로부터의 해외직접투자를 유입에 있어서 긍정적인 영향을 미치는 반면에, 지적재산권 보호의 정도는 유의적인 영향을 제공하지 않았다. 소득수준을 기준으로 고소득국가와 저소득국가로 나누어 실시한 추가 분석결과에서 역시 지적재산권 보호의 변화만이 저소득국가에서의 미국 다국적기업의 투자에 긍정적인 영향을 미치는 것으로 나타났다. 패널자료의 특성상 오차항의 이분산성(heteroscedasticity)을 고려하여 전체 투자대상국을 상대로 FGLS와 PCSE 분석을 실시한 결과에서도 지적재산권 보호의 변화만이 해외직접투자의 유입에 긍정적인 영향을 미치고 있음을 알 수 있으며, 동일한 방법으로 고소득국가와 저소득국가로 나누어 추가분석을 실시한 결과에서는, 저소득국가에서만 미국 다국적기업의 해외직접투자 유입에 유의적으로 긍정적인 영향을 제공하고 있음을 보여주었다. 이러한 결과는 투자대상국의 지적재산권 보호의 수준보다는 변화가 해외직접투자의 유입에 영향을 제공하는 것으로써, 특히 저소득국가가 미국 다국적 기업의 해외직접투자를 유입하기 위하여 지적재산권 보호의 변화에 대한 중요성을 시사한다.

  • PDF

가우시안 배경혼합모델을 이용한 Tracking기반 사고검지 알고리즘의 적용 및 평가 (Measuring of Effectiveness of Tracking Based Accident Detection Algorithm Using Gaussian Mixture Model)

  • 오주택;민준영
    • 한국도로학회논문집
    • /
    • 제14권3호
    • /
    • pp.77-85
    • /
    • 2012
  • 자동사고검지 알고리즘의 대부분은 사고가 발생했을 때 사고로 검지하지 못하고, 혼잡으로 검지하는 경우가 많다는 문제점을 가지고 있다. 또한 교통정보센터 운영자들은 교통사고검지시스템을 운영하면서 대부분 CCTV 육안감시 또는 운전자들의 신고에 의존하여 사고처리를 하고 있는 실정이다. 그 이유는 현재 운영되고 있는 교통사고검지시스템에서는 실제 사고가 아닌데도 불구하고, 사고라는 오검지 경고가 많이 발생되어 시스템 전체의 신뢰도가 떨어진다는 문제점이 있기 때문이다. 다시 말해 교통사고검지시스템의 알고리즘은 검지율(Detection probability)이 높아야 함과 동시에, 오검지율(False alarm probability)은 낮아야 하고, 정확한 사고지점과 시간을 검지해 낼 수 있어야 한다. 이에 본 연구는 검지율을 높이고 동시에, 오검지율을 낮추는 방법으로 기 개발된 가우시안 혼합모델(Gaussian Mixture Model)과 개별차량 Tracking을 이용하여 개발한 사고검지 알고리즘을 교통정보센터 관리시스템(Center Management System)에 적용하고, 실제 교통상황에서 사고검지율과 오검지의 빈도를 측정하여 그 효과를 검증 및 평가하고자 한다.

가우시안 혼합모델 기반 3차원 차량 모델을 이용한 복잡한 도시환경에서의 정확한 주차 차량 검출 방법 (Accurate Parked Vehicle Detection using GMM-based 3D Vehicle Model in Complex Urban Environments)

  • 조영근;노현철;정명진
    • 로봇학회논문지
    • /
    • 제10권1호
    • /
    • pp.33-41
    • /
    • 2015
  • Recent developments in robotics and intelligent vehicle area, bring interests of people in an autonomous driving ability and advanced driving assistance system. Especially fully automatic parking ability is one of the key issues of intelligent vehicles, and accurate parked vehicles detection is essential for this issue. In previous researches, many types of sensors are used for detecting vehicles, 2D LiDAR is popular since it offers accurate range information without preprocessing. The L shape feature is most popular 2D feature for vehicle detection, however it has an ambiguity on different objects such as building, bushes and this occurs misdetection problem. Therefore we propose the accurate vehicle detection method by using a 3D complete vehicle model in 3D point clouds acquired from front inclined 2D LiDAR. The proposed method is decomposed into two steps: vehicle candidate extraction, vehicle detection. By combination of L shape feature and point clouds segmentation, we extract the objects which are highly related to vehicles and apply 3D model to detect vehicles accurately. The method guarantees high detection performance and gives plentiful information for autonomous parking. To evaluate the method, we use various parking situation in complex urban scene data. Experimental results shows the qualitative and quantitative performance efficiently.

지식재산권 강화가 기술혁신과 경영성과에 미치는 영향의 산업별 비교연구: 한국의 제약, 반도체, 조선 산업 (A sectoral comparison of the influence of the intellectual property rights system on technological innovation and financial performance: Korean pharmaceutical, semiconductor and shipbuilding industries)

  • 조경철;김창석;신준석
    • 기술혁신연구
    • /
    • 제21권2호
    • /
    • pp.169-197
    • /
    • 2013
  • 다수의 이론적, 실증적 연구에도 불구하고 지식재산권 제도와 기업의 기술혁신 및 경영성과간의 일반적 인과관계는 명확하지 않다. 본 연구는 산업별 기업 경영성과의 핵심 요인이 상이하다는 점에 주목한다. 이를 바탕으로 (1)지식재산권 강화${\rightarrow}$연구개발의 투입/산출 증가${\rightarrow}$매출증가로 이어지는 기본 성과창출경로가 작용하는 제약 산업, (2)지식재산권 강화와 연구개발 투입/산출간 관계가 약한 반도체산업, (3)연구개발과 매출 간 관계가 약한 조선 산업까지 세 산업을 대상으로 지식재산권 제도가 기술혁신과 경영성과에 미치는 영향을 분석했다. 한국의 특허제도가 선진국 수준에 이른 TRIPs 이후 15년간의 대기업 패널 데이터를 사용했으며, 고정효과모형을 차분 GMM으로 추정해 동태적 인과관계를 분석했다. 결과적으로, 지식재산권 강화가 제약 산업에서는 연구개발의 투입/산출 및 경영성과를 모두 증가시켰지만, 반도체-조선 산업에서는 영향을 미치지 못하는 것으로 나타났다. 즉, 지식재산권 강화를 위한 제도 구축과 정책은 산업별로 맞춤화될 필요가 있으며, 획일적인 강화/약화는 특정 산업의 경영성과 제고에 유의미한 영향을 미치지 못한다.

  • PDF

HMM-UBM의 주 상태 정보를 이용한 음성 기반 문맥 독립 화자 검증 (Text Independent Speaker Verficiation Using Dominant State Information of HMM-UBM)

  • 손수원;노진상;김성수;이재원;고한석
    • 한국음향학회지
    • /
    • 제34권2호
    • /
    • pp.171-176
    • /
    • 2015
  • 본 논문에서는 Hidden Markov Model(HMM) - Universal Background Model(UBM)의 주 상태 정보 기반의 i-vector 추출 기술을 제안한다. Ergodic HMM이 UBM을 추정하는데 쓰였으며, 이를 통해 동일 화자 음성에도 다양하게 존재하는 특성을 HMM states로 분류할 수 있다. 제안한 방법을 이용하면 HMM의 state 개수에 따라 i-vector 들이 추출되는데, 주 상태 정보 방법을 통해 이들 중 하나를 선택한다. 제안한 방법을 검증하기 위해 National Institute of Standards and Technology(NIST) Speaker Recognition Evaluation(SRE) database를 이용하여 실험을 하였으며, Equal Error Rate(EER) 성능 수치에서 12 %의 성능 향상을 확인할 수 있었다.

구개열 환자 발음 판별을 위한 특징 추출 방법 분석 (Analysis of Feature Extraction Methods for Distinguishing the Speech of Cleft Palate Patients)

  • 김성민;김우일;권택균;성명훈;성미영
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1372-1379
    • /
    • 2015
  • 본 논문에서는 구개열 환자의 장애 발음과 정상인의 발음을 자동으로 구분하여 판별하는데 사용될 수 있는 특징 추출 방법들의 성능을 분석하는 실험에 대하여 소개한다. 이 연구는 발성 장애인의 복지 향상을 추구하며 수행하고 있는 장애 음성 자동 인식 및 복원 소프트웨어 시스템 개발의 기초과정이다. 실험에 사용된 음성 데이터는 정상인의 발음, 구개열 환자의 발음, 그리고 모의 환자의 발음의 세 그룹으로부터 수집된 한국어 단음절로서 14개의 기본 자음과 5개의 복합 자음, 7개 모음이다. 발음의 특징 추출은 LPCC, MFCC, PLP의 세 가지 방법으로 각각 수행하였고, GMM 음향 모델로 인식 훈련을 한 후, 수집된 단음절 데이터를 대상으로 하여 인식 실험을 실시하였다. 실험 결과, 정상인과 구개열 환자의 장애 발음을 구별하기 위하여 특징을 추출함에 있어서 MFCC 방법이 전반적으로 가장 우수하였다. 본 연구의 결과는 구개열 환자의 부정확한 발음을 자동으로 인식하고 복원하는 연구와 구개열 장애 발음의 정도를 측정할 수 있는 도구에 대한 연구에 도움이 될 것으로 기대된다.

Text-to-speech 시스템에서의 화자 변환 기능 구현 (Implementation of the Voice Conversion in the Text-to-speech System)

  • 황철규;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.33-36
    • /
    • 1999
  • 본 논문에서는 기존의 text-to-speech(TTS) 합성방식이 미리 정해진 화자에 의한 단조로운 합성음을 가지는 문제를 극복하기 위하여, 임의의 화자의 음색을 표현할 수 있는 화자 변환(Voice Conversion) 기능을 구현하였다. 구현된 방식은 화자의 음향공간을 Gaussian Mixture Model(GMM)로 모델링하여 연속 확률 분포에 따른 화자 변환을 가능케 했다. 원시화자(source)와 목적화자(target)간의 특징 벡터의 joint density function을 이용하여 목적화자의 음향공간 특징벡터와 변환된 벡터간의 제곱오류를 최소화하는 변환 함수를 구하였으며, 구해진 변환 함수로 벡터 mapping에 의한 스펙트럼 포락선을 변환했다. 운율 변환은 음성 신호를 정현파 모델에 의해서 모델링하고, 분석된 운율 정보(피치, 지속 시간)는 평균값을 고려해서 변환했다. 성능 평가를 위해서 VQ mapping 방법을 함께 구현하여 각각의 정규화된 켑스트럼 거리를 구해서 성능을 비교 평가하였다. 합성시에는 ABS-OLA 기반의 정현파 모델링 방식을 채택함으로써 자연스러운 합성음을 생성할 수 있었다.

  • PDF

이동물체들의 Optical flow와 EMD 알고리즘을 이용한 식별과 Kalman 필터를 이용한 추적 (Detection using Optical Flow and EMD Algorithm and Tracking using Kalman Filter of Moving Objects)

  • 이정식;주영훈
    • 전기학회논문지
    • /
    • 제64권7호
    • /
    • pp.1047-1055
    • /
    • 2015
  • We proposes a method for improving the identification and tracking of the moving objects in intelligent video surveillance system. The proposed method consists of 3 parts: object detection, object recognition, and object tracking. First of all, we use a GMM(Gaussian Mixture Model) to eliminate the background, and extract the moving object. Next, we propose a labeling technique forrecognition of the moving object. and the method for identifying the recognized object by using the optical flow and EMD algorithm. Lastly, we proposes method to track the location of the identified moving object regions by using location information of moving objects and Kalman filter. Finally, we demonstrate the feasibility and applicability of the proposed algorithms through some experiments.