• 제목/요약/키워드: Speech detection

검색결과 471건 처리시간 0.023초

샷의 타입을 이용한 뉴스 아카이브 시스템의 설계 및 구현 (Design and Implementation of a news Archive System using Shot Types)

  • 한근주;낭종호;하명환;정병희;김경수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.416-428
    • /
    • 2001
  • 뉴스 아카이브 시스템을 구축하기 위하여서는 먼저 뉴스 비디오 스트림을 기사 단위로 인덱싱하고, 사용자가 기사 비디오를 모두 시청하지 않아도 그 내용을 이해할 수 있도록 하는 추상화 방법이 필요하다. 본 논문에서는 뉴스 비디오 스트림에 대하여 샷 타입을 이용하여 기사 단위로 인덱싱할 수 있는 새로운 기사 경계 검출 방법 및 기사 추상화 방법을 제안하다. 제안한 인덱싱 방법에서는 뉴스 비디오의 샷들을 앵커 샷, 인터뷰 샷, 연설 샷, 보도 샷, 그래픽 자료 샷 등으로 나눈다. 모든 기사는 앵커 샷으로 시작하고, 앵커 샷은 다른 샷에 비하여 길이가 길고 특별한 화면 구조를 가지고 있기 때문에 이를 이용하여 기사 단위의 인덱싱을 수행한다. 또한 각 기사에 대한 효과적인 추상화를 위하여 앵커 샷의 오른쪽 위에 있는 그래픽 데이타와 기사를 이루는 다른 샷들의 키 프레임들을 이용한 기사 포스터를 구성하는 방법을 제안하였다. 여러 종류의 뉴스 비디오 스트림에 대한 실험 결과에 의하면 본 논문에서 제안한 기사 경계 검출 알고리즘의 검출율(recall) 및 정확도 (precision)값이 각각 0.92 및 0.96 이상 됨을 알 수 있다. 또한 본 논문에서는 WWW상에서 수행되는 뉴스 아카이브 시스템의 프로토타입 시스템의 설계 및 구현에 대하여서도 설명한다.

  • PDF

딥뉴럴네트워크에서의 적대적 샘플에 관한 앙상블 방어 연구 (Detecting Adversarial Example Using Ensemble Method on Deep Neural Network)

  • 권현;윤준혁;김준섭;박상준;김용철
    • 융합보안논문지
    • /
    • 제21권2호
    • /
    • pp.57-66
    • /
    • 2021
  • 딥뉴럴네트워크는 이미지 인식, 음성 인식, 패턴 인식 등에 좋은 성능을 보여주고 있는 대표적인 딥러닝모델 중에 하나이다. 하지만 이러한 딥뉴럴네트워크는 적대적 샘플을 오인식하는 취약점이 있다. 적대적 샘플은 원본 데이터에 최소한의 노이즈를 추가하여 사람이 보기에는 이상이 없지만 딥뉴럴네트워크가 잘못 인식 하게 하는 샘플을 의미한다. 이러한 적대적 샘플은 딥뉴럴네트워크를 활용하는 자율주행차량이나 의료사업에서 차량 표지판 오인식이나 환자 진단의 오인식을 일으키면 큰 사고가 일어나기 때문에 적대적 샘플 공격에 대한 방어연구가 요구된다. 본 논문에서는 여러 가지 파라미터를 조절하여 적대적 샘플에 대한 앙상블 방어방법을 실험적으로 분석하였다. 적대적 샘플의 생성방법으로 fast gradient sign method, DeepFool method, Carlini & Wanger method을 이용하여 앙상블 방어방법의 성능을 분석하였다. 실험 데이터로 MNIST 데이터셋을 사용하였으며, 머신러닝 라이브러리로는 텐서플로우를 사용하였다. 실험방법의 각 파라미터들로 3가지 적대적 샘플 공격방법, 적정기준선, 모델 수, 랜덤노이즈에 따른 성능을 분석하였다. 실험결과로 앙상블 방어방법은 모델수가 7이고 적정기준선이 1일 때, 적대적 샘플에 대한 탐지 성공률 98.3%이고 원본샘플의 99.2% 정확도를 유지하는 성능을 보였다.

입 모양 인식 시스템 전처리를 위한 관심 영역 추출과 이중 선형 보간법 적용 (Region of Interest Extraction and Bilinear Interpolation Application for Preprocessing of Lipreading Systems)

  • 한재혁;김용기;김미혜
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.189-198
    • /
    • 2024
  • 입 모양 인식은 음성 인식의 중요 부분 중 하나로 음성 인식을 위한 입 모양 인식 시스템에서 입 모양 인식 성능을 개선하기 위한 여러 연구가 진행됐다. 최근의 연구에서는 인식 성능을 개선하기 위해 입 모양 인식 시스템의 모델 구조를 수정하는 방법이 사용됐다. 본 연구에서는 모델 구조를 수정하는 것으로 인식 성능을 개선하는 기존의 연구와 달리 모델 구조의 변화 없이 인식 성능을 개선하는 것을 목표로 한다. 모델 구조의 수정 없이 인식 성능을 개선하기 위해, 사람이 하는 입 모양 인식에서 사용되는 단서를 참고해 입 모양 인식 시스템의 기존 관심 영역인 입술 영역과 함께 턱, 뺨과 같은 다른 영역을 관심 영역으로 설정하고 각 관심 영역의 인식률을 비교해 가장 높은 성능의 관심 영역을 제안한다. 또한, 관심 영역 크기를 정규화하는 과정에서 보간법의 차이로 인해 발생하는 정규화 결과의 차이가 인식 성능에 영향을 준다고 가정하고 최근접 이웃 보간법, 이중 선형 보간법, 이중 삼차 보간법을 사용해 동일한 관심 영역을 보간하고 각 보간법에 따른 입 모양 인식률을 비교해 가장 높은 성능의 보간법을 제안한다. 각 관심 영역은 객체 탐지 인공신경망을 학습시켜 검출하고, 각 관심 영역을 정규화하고 특징을 추출하고 결합한 뒤, 결합된 특징들을 차원 축소한 결과를 저차원 공간으로 매핑하는 것으로 동적 정합 템플릿을 생성했다. 생성된 동적 정합 템플릿들과 저차원 공간으로 매핑된 데이터의 거리를 비교하는 것으로 인식률을 평가했다. 실험 결과 관심 영역의 비교에서는 입술 영역만을 포함하는 관심 영역의 결과가 이전 연구의 93.92%의 평균 인식률보다 3.44% 높은 97.36%의 평균 인식률을 보였으며, 보간법의 비교에서는 이중 선형 보간법이 97.36%로 최근접 이웃 보간법에 비해 14.65%, 이중 삼차 보간법에 비해 5.55% 높은 성능을 나타내었다. 본 연구에 사용된 코드는 https://github.com/haraisi2/Lipreading-Systems에서 확인할 수 있다.

양이 보청효과에 관한 연구 (A Clinical Study on Binaural Hearing Aid)

  • 김기령;김영명;심윤주
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 1978년도 제12차 학술대회연제 순서 및 초록
    • /
    • pp.9.2-9
    • /
    • 1978
  • 연세대학교 청각언어센타에서는 1571년 5월부터 보청기처방검사를 시행하여 오던중, 양이에 보청기를 착용할 때와 편측에만 착용했을 때 있을 차이점을 평가할 필요가 있음을 절감하고, 3세 내지 7세의 선천성 난청아 9명과, 8세 내지 76세의 후천성 난청자 10명등 총19명을 대상으로 편측이 보청기착용과 양측이 보청기착용에 의한 보청효과를 비교하는 실험을 시행하며 아래와 같은 결과를 얻었기에 보고하는 바이다. 실험방법은, 각 대상자에게 어음탐지역치, 어음청취역치 및 어음판별치등을 소음이 있는 조건과 없는 조건의 두가지 상태하에서 편측착용시와 양측착용시의 score를 각각 구하였다. 얻어진 score를 (1) 난청의 정도 (2) 자동음량조절장치(automatic gain control)에 대한 영향 (3) 두 귀의 난청곡선의 균형(symmetry)등에 따라서 비교하고, (4) 어음판별력이 거의 없는 경우와 (5)보충현상(recruitment)이 심한 경우의 요인면에서 관찰하여 다음과 같이 모든면에서 양이보청기착용이 유리함을 발견하였다. 1. 음성탐지역치에 있어서는 stereo type의 danavox 747pp는, did측착용시에는 편측착용시보다 평균 4.25dB의 상승이 있었고 두개의 별개의 보청기를 착용시켰을 경우에는 4.12dB의 상승이 있었다. 2. 어음청취역치는 소음이 없는 상태에서는 양측착용시에 편측착용시보다 평균 3.56dB(최고 6dB)의 상승이 있었고, 소음이 있는 상태에서는 평균 5.56dB(최고 18dB)의 상승이 있어 소음중에서 더욱 효과적이었다. 3. 어음판별치도 소음이 없을 때는 평균 17.09%(최고 42%)의 차이가 있었고, 소음중에서는 19.63%(최고 46%)의 상승이 양측착용시에 있어 역시 소음중에서 양이 보청기의 착용효과가 더 우수하게 나타났다. 4. 난청의 정도별로 관찰하면, 어음청취역치나 어음판별 score의 신장도(伸長度)가 공히 중등고도(moder-ately-severe)난청에서 가장 우수하였고 경도(mild)난청에서 가장 저조하였으며, 중등고도, 고도, 중등도, 경도의 순으로 나타났다. 5. 자동음량조절장치의 유무에 의한 영향을 보면 같은 모델의 AGC장치보청기를 양측에 사용했을 때는 극히 저조하였고, AGC장치보청기와 보통의 보청기를 같이 사용하거나 보통의 보청기끼리만 착용할 때가 보다 우수하였다. 6. 두개의 난청곡선의 균형이 맞지않고 정도차가 심한 경우에도 양이보청기를 착용하면 어음청취역치와 판별능력이 신장되었다. 7. 어음판별력이 거의 없는 고도난청자에게도 양이에 보청기를 착용할 때가 보다 우수한 성적을 보였다. 8. 보충현상(recuruitment)이 심한 고도난청자에게도 양이보청기착용이 보다 우수하였고, AGC장치보청기끼리만 착용했을 때 보다 AGC장치보청기와 보통의 보청기를 병용했을 때가 더 효과적이었다. 이상의 결과는 보청훈련을 하지 않은 단기간의 효과이므로 앞으로 양이보청에 의한 장기사용효과에 대한 연구를 계속하고자 한다.

  • PDF

신생아 집중치료실 퇴원아의 청성뇌간반응(ABR) 결과에 미치는 위험인자 및 경과 (Auditory brainstem response (ABR) results in NICU graduates)

  • 최희정;이태호;오기원;김행미
    • Clinical and Experimental Pediatrics
    • /
    • 제49권12호
    • /
    • pp.1301-1307
    • /
    • 2006
  • 목 적 : 신생아기의 청력 소실은 그 빈도가 높으며 조기 발견 및 조기 치료가 예후를 결정하는데 중요하다. 신생아 집중치료실에 입원했던 신생아들은 일반 신생아에 비해 청력 소실의 빈도가 더 높은 것으로 알려지고 있다. 이에 저자들은 신생아 집중치료실에 입원했던 신생아를 대상으로 청력 소실의 발생 빈도와 위험 인자 및 청력 소실의 양상을 조사하기 위해 이 연구를 시행하였다. 방 법 : 2002년 7월부터 2005년 6월까지 3년간 경북대학교병원 신생아 집중치료실에 입원한 환아를 대상으로 ABR 검사를 시행하여 이들의 청력 소실 정도와 이와 관련된 임상 소견을 조사하고 추적 관찰을 시행하였다. 결 과 : 연구 기간 동안 ABR 검사를 받은 환아는 474명으로 총 입원아의 54.0%였고, 검사를 받은 신생아의 13.5%인 64명이 ABR 검사에 이상 소견을 보였다. 이들 64명의 귀 128례의 청력 소실의 양상은 편측 정상이 37례(28.9%)이고 경증, 중등도, 중증 및 초중증 청력 소실이 각각 43례(33.6%), 36례(28.1%), 2례(1.6%) 및 10례(7.8%)로 중증 이상의 청력 소실 빈도는 9.5%였다. 미숙아, 저출생 체중아 및 극소 저출생 체중아, 신생아 가사, 두부 안면 기형 및 amikacin의 15일 이상 사용이 ABR 비정상군에서 유의하게 많았다(P<0.05). 고빌리루빈혈증 환아에서 최고 빌리루빈 수치, 광선치료의 기간과 교환수혈의 시행 여부 모두 ABR 정상군과 비정상군 사이에 유의한 차이를 보이지 않았다. ABR 비정상군 중 15명에서 생후 $8.8{\pm}4.4$개월에 시행한 추적 ABR 검사는 80.0%에서 호전 혹은 정상화되었다. 결 론 : 신생아 집중치료실에 입원했던 신생아는 청력 소실의 위험이 높으므로 이에 대한 체계적이고 효과적인 청력 평가와 관리가 필요하다.

화자식별을 위한 강인한 주성분 분석 가우시안 혼합 모델 (RPCA-GMM for Speaker Identification)

  • 이윤정;서창우;강상기;이기용
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.519-527
    • /
    • 2003
  • 음성신호는 주변 잡음과 화자의 발성 패턴 변화, 음성 검출 오류에서 생기는 이상치(outlier)에 많은 영향을 받고 있다. 이러한 음성 신호를 이용하여 화자인식에 이용할 경우 인식률이 저하된다. 본 논문에서는 화자식별 (speaker identification)에서 학습 특징 벡터의 이상치와 고차원 문제를 해결하기 위하여 M-추정을 이용한 강인한 주성분 분석 가우시안 혼합모델 (Robust Principal Component Analysis-Gaussian Mixture Model)방법을 제안하였다. 제안된 방법은 먼저, 특징 벡터에 이상치가 존재할 경우 M-추정에 의하여 강인한 공분산 행렬을 재추정하여 얻어진 고유벡터로부터 변환 행렬을 구하여 감소된 차원을 갖는 새로운 특징벡터를 구한다. 여기에서 얻은 선형변환된 특징벡터로부터 화자의 가우시안 혼합 모델을 구한다. 제안된 방법의 성능을 검증하기 위하여 화자식별 실험을 하였다. 실험은 전형적인 가우시안 혼합 모델 방법과 주성분 분석법, 제안된 방법을 비교 분석하였다. 이상치가 2%씩 증가할 때마다 가우시안 혼합모델 방법과 주성분 분석법은 각각 0.65%, 0.55%씩 화자식별 성능이 저하되었지만, 제안된 방법은 0.03%정도 감소하였으므로 이상치에 더욱 강인함을 알 수 있다.

한국 의사 소통 장애 아동의 기질 특성 (TEMPERAMENTAL CHARACTERISTICS OF KOREAN CHILDREN WITH COMMUNICATION DISORDERS)

  • 정유숙;홍성도;김이영;이수근
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제10권1호
    • /
    • pp.43-49
    • /
    • 1999
  • 연구 목적:소아를 다루는 임상의들에게 관찰되는 가장 흔한 발달상의 문제 중 하나는 언어 지연이다. 언어 발달은 주변 환경의 자극에 영향을 받게 되는데, 환경과의 상호 작용에는 아동 자신의 기질 또한 중요한 요소로 작용한다. 기질 연구의 가설에 의하면 아동의 고유한 행동 양식은 상당 부분 타고난 것이며, 이것이 향후 발달에 큰 영향을 미친다고 알려져 있는데, 아동의 기질과 언어 지연과의 관계에 대한 연구는 활발치 않아, 본 연구는 한국에서 의사 소통 장애를 가진 아동에서 어떤 기질 특성이 있는지를 밝히고자 했다. 방 법:환자군은 DSM-IV 진단 기준에 의해 의사 소통 장애라고 진단되고, 전반적 발달 장애, 정신 지체, 언어 운동 장애 혹은 감각 장애를 갖지 않은 세 살에서 일곱 살 사이의 아동 20명을 대상으로 하고 정상대조군은 상기 장애를 갖지 않는 50명을 대상으로 하여 어머니에게 한국판 '부모 기질 설문(Parental Temperamental Questionnaire)'을 완성하도록 하여 기질을 측정하였다. 기질의 9가지 범주 및 요인 A점수를 비교하기 위하여 비모수적 통계법을 사용하였으며, 아동들의 기질 진단을 비교하기 위하여 Chi-square통계법을 사용하였다. 결 과:의사 소통 장애를 가진 아동들에서 정상 아동들에 비해 기분의 범주는 통계적으로 유의하게 낮았고, 반응의 강도의 범주는 통계적으로 유의하게 높았다. 기질 진단 면에서는 두 집단은 통계적으로 유의한 차이를 보이지 않았지만 의사 소통 장애를 가진 아동들이 양육 곤란형에 가까운 집단에 더 많이 포함되었다. 결 론:이와 같은 결과는 의사 소통 장애를 가진 아동들에 특징적인 기질 양상이 있음을 시사한다. 기질양상의 조기 발견은 부모들에게 의사 소통 장애 아동들의 발달학적 특성을 이해하고 이들에게 적절한 양육을 제공하는데 도움을 줄 것이다.

  • PDF

XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지 (Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation)

  • 최민석;김창현;박호민;천민아;윤호;남궁영;김재균;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.221-228
    • /
    • 2020
  • 품사부착말뭉치는 품사정보를 부착한 말뭉치를 말하며 자연언어처리 분야에서 다양한 학습말뭉치로 사용된다. 학습말뭉치는 일반적으로 오류가 없다고 가정하지만, 실상은 다양한 오류를 포함하고 있으며, 이러한 오류들은 학습된 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제를 다소 완화시키기 위해서 본 논문에서는 XGBoost와 교차 검증을 이용하여 이미 구축된 품사부착말뭉치로부터 오류를 탐지하는 방법을 제안한다. 제안된 방법은 먼저 오류가 포함된 품사부착말뭉치와 XGBoost를 사용해서 품사부착기를 학습하고, 교차검증을 이용해서 품사오류를 검출한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로 일반적인 분류기로서 오류를 검출할 수 없다. 따라서 본 논문에서는 매개변수를 조절하면서 학습된 품사부착기의 출력을 비교함으로써 오류를 검출한다. 매개변수를 조절하기 위해서 본 논문에서는 작은 규모의 오류부착말뭉치를 이용한다. 이 말뭉치는 오류 검출 대상의 전체 말뭉치로부터 임의로 추출된 것을 전문가에 의해서 오류가 부착된 것이다. 본 논문에서는 성능 평가의 척도로 정보검색에서 널리 사용되는 정밀도와 재현율을 사용하였다. 또한 모집단의 모든 오류 후보를 수작업으로 확인할 수 없으므로 표본 집단과 모집단의 오류 분포를 비교하여 본 논문의 타당성을 보였다. 앞으로 의존구조부착 말뭉치와 의미역 부착말뭉치에서 적용할 계획이다.

신생아 선별검사를 통해 진단된 1형 타이로신혈증의 NTBC 치료 사례 보고 (Case Report on NTBC Treatment of Type 1 Tyrosinemia Diagnosed through Newborn Screening)

  • 정지은;김화영;고정민
    • 대한유전성대사질환학회지
    • /
    • 제23권2호
    • /
    • pp.39-44
    • /
    • 2023
  • HT-1은 FAH 유전자의 돌연변이에 의해 타이로신 대사의 중간산물이 축적되어 발생하는 유전성 대사 질환이다. 치료하지 않으면 치명적인 결과를 초래할 수 있으며, 간 기능 및 신세뇨관 기능 장애와 더불어 Fanconi 증후군, 포르피린증과 유사한 증상, 지능지수 감소, 인지기능 저하 등을 초래할 수 있다. 국내에서는 탠덤매스 스크리닝을 이용한 신생아 대사이상 선별검사를 통한 조기 진단과 함께 NTBC 약물 치료의 도입으로 치료 성적이 향상되었다. 본 증례는 생후 1개월에 급성 HT-1으로 진단 후 4년 7개월째 NTBC 치료 중인 증례로, 환아는 현재까지 단백 제한식이와 NTBC 복용을 유지하면서 언어지연 외에 특별한 합병증 없이 추적 관찰 중이다. NTBC의 복용이 간 및 신장 기능의 보존과 신경학적 예후에 미치는 영향에 대해서는 장기적인 추적 연구가 필요하다.

  • PDF

변조 이음향방사(DPOAE)를 이용한 고위험군 신생아 청각선별검사 (Neonatal hearing screening in a neonatal intensive care unit using distortion product otoacoustic emissions)

  • 김도영;김성신;김창휘;김시찬
    • Clinical and Experimental Pediatrics
    • /
    • 제49권5호
    • /
    • pp.507-512
    • /
    • 2006
  • 목 적 : 신생아 난청은 신생아 1,000명당 1-3명에서 발생하며 조기에 발견하여 중재하지 않으면 유소아의 언어 습득과 발달 지연에 영향을 미친다. 저자들은 신생아 고위험군을 대상으로 청각 선별검사로서 DPOAE를 이용하여 난청의 유병률과 위험 인자와의 관련성에 대해 조사하였다. 방 법 : 2001년 5월부터 2004년 12월까지 순천향대학교 부천 병원 신생아 집중치료실에 입원하여 청각 선별검사로 변조 이음향방사를 시행받은 871명을 대상으로 의무기록을 후향적으로 검토하였다. 변조 이음향방사에서 통과된 경우 Pass 군으로, 통과되지 못한 경우를 Refer 군으로 나누어 출생 체중, 재태 기간, 산모의 위험 인자, 가족력, 인공호흡기 사용, 빌리루빈 수치, 이독성 약물의 사용 등 청각에 영향을 미치는 인자에 대해 연구하였다. 결 과 : 총 871명 중 106명(12.1%)이 Refer 군으로 우측 이상이 36명(4.1%), 좌측 이상이 23명(2.6%), 양측 이상이 47명(5.4%)이었다. Refer군 106명 중 20명(18.9%)이 3개월 후 변조 이음향방사를 재시행 하였으며 40명(37.7%)에서 ABR를 시행하였다. 총 871명 중 Pass 군과 Refer 군 사이에 성별, 출생 장소(본원 및 외부병원), 청각장애의 가족력, 재태 연령에 따른 출생 체중(부당 경량아, 부당 중량아, 적정 체중아), 산모의 위험 인자(임신성 고혈압, 임신성 당뇨, 조기 양막 파수), 빌리루빈 수치 및 gentamicin 사용 등의 인자와는 유의한 차이가 없었다. 총 871명 중 Pass 군과 Refer 군 사이에 출생 체중 1,500 g 미만, 재태 연령 37주 이하, 심폐 소생술 시행, 낮은 Apgar 점수(1분에 5점 이하, 5분에 6점 이하), 두경부 이상(구개순, 구개열, 이개 앞 피부 돌출), 인공호흡기 사용, 패혈증, vancomycin 사용 등의 인자에서 유의한 차이(P<0.05)를 보였다. 결 론 : 60 dB 이상의 난청이 18명(2%)에서 관찰되었으며 이는 전체 신생아 유병률(1-3명/1,000명)보다 높은 수치이다. 그러므로 신생아 집중치료실 입원 환자에게는 청각 선별검사를 반드시 시행하여야 하며 변조 이음향방사가 선별검사의 방법으로 이용될 수 있다. 또한 이번 연구를 기초로 하여 전체 신생아를 대상으로 한 신생아 청각 선별검사의 보편화 할 것을 추천하며 이상이 있는 경우 더욱 적극적인 추적 관찰이 필요할 것으로 사료된다.