• 제목/요약/키워드: 불일치율

검색결과 112건 처리시간 0.026초

스테레오 데이터에 기반한 차원별 가중 보상에 의한 음성 인식 성능 향상 (Performance Improvement of Speech Recognition based on Stereo Data with Dimensionally Weighted Bias Compensation)

  • 김종현;송화전;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.139-142
    • /
    • 2004
  • 훈련 과정과 인식 과정사이의 주변 잡음과 채널 특성으로 인한 환경의 불일치는 음성 인식 성능을 급격히 저하시킨다. 이러한 차이를 극복하기 위해 다양한 전처리 방법이 제안되어 왔으며, 최근에는 스테레오 데이터와 잡음 음성의 Gaussian Mixture Model(GMM)을 이용하여 보상벡터를 구하는 SPLICE 방법이 좋은 성능을 보여주고 있다. 하지만 차원별로 특징벡터를 보상해주는 추정된 보상벡터는 underestimation되는 경향이 있으며, 그 정도가 각각의 차원마다 달라짐이 관찰되었다. 본 논문에서는 SPLICE 방법에 기반하여 추정된 보상벡터와 실제 보상벡터 사이의 관계를 관찰하여 차원별로 다른 가중치를 적용하는 차원별 가중 보상 방법을 제안하였다. 제안한 방법은 Aurora2 Clean-condition인 경우 baseline 실험 결과에 비해 $68\%$의 높은 상대적인 인식 향상율을 얻었다.

  • PDF

화자인식 성능 향상을 위한 채널 보상 알고리즘에 관한 연구 (A Study on Channel Compensation Algorithm for Robust Speaker Recognition)

  • 김정호;정희석;강철호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.131-134
    • /
    • 2002
  • 화자 확인시스템에서 화자 변이, 잡음환경, 그리고 학습환경과 인식환경의 불일치등이 화자확인에 어려움을 가져다 준다. 본 논문에서는 유무선 전화망에서 화자 확인의 성능을 개선하기 위한 채널 보상 알고리즘을 제안한다. 화자 확인시스템에서 유무선 전화망의 채널 왜곡을 보상하기 위한 방법으로 RBF(Radial Basis Function) 신경망을 이용하여 특징 벡터를 사상하는 알고리즘을 이용하며 유선과 무선의 채널 왜곡을 감소시킨다. 동일한 화자의 유무선의 벡터 영역이 서로 다르므로 등록단계에서 RBF 신경망을 사용하여 화자의 특징 벡터를 유선과 무선의 비슷한 벡터 영역으로 사상하고, 인식단계에서는 유무선의 우도비를 비교하여 결정규칙에 의해 판별한다. 켑스트럼 평균 차감법(CMS) 보다 제안한 채널 보상 알고리즘이 인식율이 향상을 실험에 의해 확인하였다.

  • PDF

잡음 환경에서의 복수 화자 음성인식 (Multi-Speaker Speech Recognition in Noisy Environments)

  • 오윤학;허호영;송명규;김형순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.41-44
    • /
    • 2000
  • 본 논문에서는 잡음 환경에서 복수 화자 음성인식 시스템의 인식 성능 향상에 관한 실험을 하였다. 복수화자 음성인식 방식은 훈련에 참여한 복수의 사용자에 대한 등록 단어 모델을 가지므로, 인식 단계에서 등록화자의 모든 단어 모델들을 테스트 음성과 비교하여 인식 단어를 결정한다 그러나, 이 경우 훈련 환경과 테스트 환경의 불일치에 기인한 인식 성능 저하가 등록 화자수가 많아짐에 따라 더욱 심해지는 문제가 발생한다. 본 논문에서는 이 문제의 해결을 위해 등록 화자들의 모든 단어 모델들을 테스트 음성과 비교하는 대신 화자인식 시스템을 사용해서 발성 화자와 유사한 후보 화자들의 단어 모델들에 대해서만 테스트 음성과 비교하는 방식을 적용함으로써 기존의 방법보다 높은 단어 인식 율을 얻을 수 있었다

  • PDF

운송 컨테이너 영상의 식별자 인식을 위한 개선된 퍼지 ART 알고리즘 (An Enhanced Fuzzy ART Algorithm for The Identifier Recognition from Shipping Container Image)

  • 류재욱;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.365-369
    • /
    • 2002
  • 퍼지 ART 알고리즘에서 경계 변수는 패턴들을 클러스터링하는데 있어서 반지름 값이 되며 임의의 패턴과 저장된 패턴과의 불일치(mismatch) 허용도를 결정한다. 이 경계 변수가 크면 입력 벡터와 기대 벡터 사이에 약간의 차이가 있어도 새로운 카테고리(category)로 분류하게 핀다. 반대로 경계 변수가 작으면 입력 벡터와 기대 벡터 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 벡터들을 대략적으로 분류한다. 따라서 영상 인식에 적용하기 위해서는 경험적으로 경계 변수를 설정해야 단점이 있다. 그리고 연결 가중치를 조정하는 과정에서 저장된 패턴들의 정보들이 손실되는 경우가 발생하여 인식율을 저하시킨다. 된 논문에서는 퍼지 ART 알고리즘의 문제점을 개선하기 위하여 퍼지 논리 접속 연산자를 이용하여 경계 변수를 동적으로 조정하고 저장 패턴들과 학습 패턴간의 실제적인 왜곡 정도를 충분히 고려하여 승자 노드로 선택된 빈도수를 가중치 조정에 적용한 개선된 퍼지 ART 알고리즘을 제안하였다. 제안된 방법의 성능을 확인하기 위해서 실제 운송 컨테이너 영상들을 대상으로 실험한 결과, 기존의 ART2 알고리즘이나 퍼지 ART 알고리즘보다 클러스터의 수가 적게 생성되었고 인식 성능도 기존의 방법들보다 우수한 성능이 있음을 확인하였다.

동영상에서 이미지와 음성신호를 이용한 검색 알고리즘 구현 (Search Algorithm Embodiment which uses the Image and Speech Signal from the Vido)

  • 신인경;이상범
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.88-91
    • /
    • 2010
  • 정보통신망 및 멀티미디어 기술의 발전으로 인해 정보의 형태는 단순한 텍스트 데이터에서 멀티미디어 데이터로 전환되고 있다. 멀티미디어 기술은 저장, 재생, 압축 등 관련 기술의 빠른 발전과 미디어의 사회, 문화적 역할이 계속 증가함에 따라 우리 사회 전반에 걸쳐 매우 광범위하게 사용되고 있으며, 이로 인해 동영상 검색등의 많은 검색을 요구 하고 있으나, 동영상 검색의 문제점은 생산되는 컨텐츠에서 동영상이 가지고 있는 비중은 계속해서 높아지지만 쌓아진 데이터를 검색하기엔 몇 가지 문제점이 있다. 첫 번째는 데이터의 중복성이고 두 번째는 제목, 내용 그리고 Keyword가 일치하지 않으며, 세 번째는 저자권 침해 등이 있다. 본 연구에서는 본 논문에서는 빠르게 변화되고 있는 정보화 시대에 맞게 동영상에서 음성과 얼굴영역을 검출하여, 검색 시 효율적이고 정확한 데이터의 검색이 이루어 질 수 있도록 검색 알고리즘을 제안하고 소개하며, 이중 두 번째의 문제점인 제목, 내용 그리고 Keyword의 불일치한 점에 두어 검색 시 영상의 이미지 검색과 음성을 통하여 keyword를 찾아 효율적이고 검색율의 높일 방법을 연구한다.

  • PDF

행정구역 위계정보와 편집거리를 이용한 오류입력에 강한 도로명주소 변환 (Error tolerant Korean Roadname Address Conversion using Hierarchical Administrative Division and Edit Distance)

  • 송재용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1182-1185
    • /
    • 2013
  • 도로명주소가 법적 주소체계로 지정되고 2014년도부터 전면 시행을 앞두고 있는 상황에서 기존의 지번주소를 도로명주소로 변경하려는 수요가 늘고 있으며 그에 따라 주소 전환 서비스를 제공하는 솔루션들이 증가하고 있다. 행정구역 체계에 따라 단계별로 입력된 지번주소의 도로명주소로의 변환은 크게 어렵지 않고 변환 성공율도 상당히 높지만 자유롭게 입력하여 정제되지 않은 형태의 주소는 전환에 실패하는 경우가 많다. 본 논문에서는 전산입력된 지번주소를 도로명주소로 변환시 주소형태가 정제되지 않은 상황에서도 변환 성공률을 높이기 위해 행정구역 줄임, 일부 주소정보 누락, 오타 등 여러 가지 변형 케이스에 대해서도 유연하게 변환을 수행하는 방안을 연구하였다. 이를 통해 기존 지번 주소의 표준 형태로의 정제는 최대 두 배까지 변환효율을 높일 수 있었다. 그러나 변환시 사용하는 도로명주소 매칭 테이블에 자료의 누락, 건물명의 불일치, 지번과 건물의 1:1 매칭이 되지 않는 경우가 존재하여 원활한 주소 전환을 위해서는 데이터의 정비가 필요하다.

좌심실기능이상을 동반한 심근경색 병력이 있는 환자에서 TI-201 재분포 SPECT와 휴식기 N-13 Ammonia PET: 분절 비교 및 불일치 분석 (TI-201 Redistribution SPECT and N-13 Ammonia PET Images in Patients with Old Myocardial Infarction and Left Ventricular Dysfunction: Segmental Comparison and Discordance Analysis)

  • 최준영;이경한;김영환;이은정;정현우;이수진;이상훈;김병태
    • 대한핵의학회지
    • /
    • 제38권3호
    • /
    • pp.218-224
    • /
    • 2004
  • 목적: 이 연구에서는 좌심실기능이상을 동반한 심근경색 병력이 있는 환자에서 생존 가능한 심근을 평가하기 위하여 시행한 휴식기 N-13 ammonia PET과 TI-201 재분포 SPECT를 분절단위로 비교해 보고, PET/SPECT 불일치를 일으키는 기전을 알아 보았다. 대상 및 방법 : 심근경색 병력과 좌심실기능이상, 그리고 약물 부하-휴식 TI-201 SPECT 상 1분절 이상의 고정관류결손이 있는 18명(남 17, 여 1; 나이 $59.7{\pm}8.9$세)을 대상으로 N-13 ammonia/F-18 FDG 심근 PET을 시행하였다. 좌심실을 5분절로 나누어 분절별로 혈류와 대사를 육안 및 정량분석으로 평가하였다. 결과: 재분포 TI-201 SPECT와 N-13 ammonia PET은 전체 90분절 중 80분절에서 일치하는 섭취양상을 보여 88.9%의 높은 일치율과 정량분석상의 높은 상관관계 (R=0.81, p<0.001)를 보였다. 전체 환자 중 9명에서는 재분포 TI-201 SPECT와 N-13 ammonia PET이 모든 분절에서 일치하였으며(환자군 1), 나머지 9명의 10분절(하벽 9, 심첨부 1)에서는 TI-201 SPECT상 관류결손을 보이면서 N-13 ammonia PET상 섭취가 거의 정상을 보였다(환자군 2). 환자군 1과 2사이에 좌심실수혈율의 유의한 차이는 없었지만, 환자군 2에서 수축기 및 이완기 좌심실내경이 환자군 1보다 유의하게 커져있었다. 환자군2에서 감쇠보정이 안 된 N-13 ammonia PET 영상을 재구성해서 TI-201 재분포 SPECT 영상과 비교하였을 때, 두 영상 모두 하벽에 비슷한 양상의 관류결손이 발견되었다. 결론: 좌심실기능이상을 동반한 심근경색 병력이 있는 환자에서 생존 가능한 심근을 찾기 위한 혈류/대사 PET에서 TI-201 재분포 SPECT와 N-13 ammonia PET은 높은 판독 일치율과 높은 상관관계를 보인다. PET/SPECT 불일치 소견은 주로 좌심실 확장이 심한 환자에서의 거의 정상인 관류 PET을 보이면서 TI-201 SPECT 상 하벽의 고정 관류 결손이며, 이의 기전은 확장된 심실 내부의 혈액과 횡격막에 의한 감쇠로 생각된다.

3차원 물체의 심상회전이 만성 편마비 뇌졸중 환자의 반응시간에 미치는 영향 (Changes in Reaction Time during Mental Rotation of Three-Dimensional Objects for Chronic Hemiparetic Stroke)

  • 이정원;안시내;황수진
    • 한국산학기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.1114-1121
    • /
    • 2012
  • 심상회전은 어떤 대상이나 형태를 심상으로 하나의 각도에서 다른 각도로 회전시키는 활동으로, 일상생활동작을 수행할 때 환경과 자신에 대한 위치 및 움직임을 계획하는 단계에서 필요한 기능 중 하나이다. 본 연구는 정상인과 만성 편마비환자를 대상으로 반응시간(reaction time)과 정답율(precision)에 심상회전과제가 미치는 영향을 알아보고, 임상에서 편마비 환자를 치료할 때 심상회전능력의 변화가 과제수행에 장애요인이 될 수 있는지를 알아보기 위함이다. 본 연구는 만성 편마비 환자 31명과 정상성인 20명이 참여하였다. 연구대상자는 거울상(mirror image)을 이용한 대조과제(comparison task)와 각도불일치상(angular disparity image)을 이용한 회전과제(rotation task) 등의 2 가지 유형의 심상회전과제를 수행하였다. 검사자는 대상자에게 한 쌍의 상에 대하여 동일한 상인지 아닌지를 '예'와 '아니오'로 가능한 한 빠르게 대답하라고 요구하였고, 상을 노출한 시간부터 대상자가 대답한 시간까지의 반응시간과 정답률을 측정하였다. 대조과제 및 회전과제에 대한 반응시간은 편마비 환자에서 정상인에 비하여 유의하게 느리게 나타났다. 그러나 편마비 환자와 정상인은 심상회전과제에 대한 정답율에서 유의한 차이를 보이지 않았다. 본 연구에서 편마비 환자군과 정상군 모두에서 쌍을 이룬 상의 각이 불일치할 때 반응시간이 느리게 나타났지만, 정상군보다 편마비 환자군에서 심상회전에 오랜 시간이 걸렸다. 따라서 재활과정에서 편마비 환자를 대상으로 치료계획을 수립하고 치료를 할 때, 회전각도를 이용한 난이도 조절이 가능할 것으로 사료된다. 또한 본 연구결과는 정상인에 비하여 편마비 환자의 심상회전에 차이가 있다는 것을 재활과정에서 치료사는 염두 해 두어야 한다고 제안한다.

Development of a parking control system that improves the accuracy and reliability of vehicle entry and exit based on LIDAR sensing detection

  • Park, Jeong-In
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.9-21
    • /
    • 2022
  • 이 논문에서 우리는 제4차 산업혁명의 핵심기술의 하나인 LiDAR 센서를 기반으로 기존 검지 카메라의 검지율을 개선하여 입출차 차량에 대해 100% 검지가능한 시스템을 개발하였다. 현재 운영 중인 주차장은 98% 정도의 차량번호 인식율에만 의존하고 있으므로 입출차 카운트의 불일치, 부정확한 정보 제공 등으로 사전 예약불가, 실시간 주차정보 불일치 등 여러 가지 문제를 안고 있다. 주차현황정보는 정확도 100% 수준으로 관리되어야 하며 이를 위해 우리는 LIDAR를 이용하여 주차장의 입출차 검지 체계를 구축하였다. 주로 자율주행 자동차의 차량 및 사물검지를 위해 필수적으로 사용되고 있는 LIDAR 센서를 응용하여 주차시스템을 개발하는 경우, 검지된 센싱 정보로 차량 입출차 정보의 정확성과 입출차 카운트의 신뢰도를 개선할 수 있다. LIDAR의 분해능은 100%로 보장이 되었고 주차장의 입차(+), 출차(-) 차량의 합계가 0이 되도록 구현할 수 있었다. 우리는 3,000대의 실제 주차장 출입 차량으로 테스트해 본 결과 주차 차량 입출차 정확도를 100%로 결과를 도출하였다.

혈액배양에서 VITEK MS와 VITEK 2 System을 이용한 신속 항생제 감수성 시험의 유용성 평가 (An Evaluation of the Rapid Antimicrobial Susceptibility Test by VITEK MS and VITEK 2 Systems in Blood Culture)

  • 박강균;유영빈;육근돌;김상하;김성현;김영권
    • 대한임상검사과학회지
    • /
    • 제49권3호
    • /
    • pp.279-284
    • /
    • 2017
  • 본 연구에서는 혈액배양에서 신속한 세균 동정과 항생제 감수성 시험(antibiotic susceptibility test, AST) 결과를 얻기 위해 혈액배양 양성배지에서 계대배양 없이 세균을 VITEK MS와 VITEK 2 시스템에 직접 접종하였으며, 도출된 결과를 표준방법과 비교하여, 그 신뢰도와 정확도를 평가하였다. 혈액배양 양성시료에서 직접 결과는 표준방법 AST 결과와 비교하였을 때, 97.9% (1,936/1,978)의 전체적인 일치율을 보였다. 그람양성 세균은 97.2% (1,051/1,081)의 일치율을 나타냈으며, 매우 중대한 오차율은 0.5% (5/1081), 중대한 오차율은 0.1% (1/1,081), 사소한 오차율은 2.2% (24/1,081)의 결과를 나타냈다. 두 방법 간 불일치의 주요 원인균은 Staphylococcus epidermidis이었고, 그 중 gentamicin (N=9)과 fusidic acid (N=8)에서 높은 오류를 나타냈다. 그람음성 세균 중 전체적인 일치율은 98.6%(885/897)였고, 사소한 오류는 1.4% (12/897)였다. 그람음성세균의 불일치 주요 원인균은 Escherichia coli와 Pseudomonas aeruginosa였으며, 그 중 amoxicillin/clavulanic acid(N=3)에서 높은 오류를 나타냈다. 직접법에 의한 AST 방법은 CLSI 기준을 충족하였고, 결과 보고 시간을 24시간 단축할 수 있었지만, 매우 큰 오류가 있는 항생제에 대해서는 디스크확산법으로 추가적인 검사를 시행한 후 보고해야 한다는 것을 알 수 있었다. 이러한 연구 결과들을 토대로 혈액배양 시료에서 직접 AST를 실시하는 방법은 정확하고 결과를 보고하는데 까지 소요되는 시간을 크게 감소시킬 수 있기 때문에 환자의 정확하고 효율적인 치료에 유용하게 활용될 수 있을 것으로 사료된다.