통합 검색 | Korea Science

음성인식 자동시험장치 개발 (Implementation of Automatic Test System for Voice Recognition)

김희경
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
- /
- pp.219-222
- /
- 1998
음성인식시험은 다양한 사용자의 음성을 입력으로 음성인식을 수행하고 그 결과를 이용하여 시스팀의 성능을 평가하거나, 음성의 특징을 파악하기 위한 중요한 기능으로 음성인식 서비스의 질을 향상시키기 위한 필수적인 요소이다. 본 논문에서 제시하는 음성인식 자동시험장치는 음성인식의 결과를 DTMF 신호로 처리하도록 하여 사람의 개입 없이 빠르고 정확한 결과를 통해 인식율, 인식속도 등 인식기술과 관련된 중요한 정보를 얻을 수 있도록 하였다. 본 논문에서는 한국통신의 기업체 음성다이얼서비스의 음성인식시험을 중심으로 음성인식 자동시험장치의 구성 및 기능에 대해서 설명한다.
PDF

피쳐 퓨전 모듈을 이용한 콘포머 기반의 노인 음성 인식 (Conformer-based Elderly Speech Recognition using Feature Fusion Module)

이민식;김지희
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
- /
- pp.39-43
- /
- 2023
자동 음성 인식(Automatic Speech Recognition, ASR)은 컴퓨터가 인간의 음성을 텍스트로 변환하는 기술이다. 자동 음성 인식 시스템은 다양한 응용 분야에서 사용되며, 음성 명령 및 제어, 음성 검색, 텍스트 트랜스크립션, 자동 음성 번역 등 다양한 작업을 목적으로 한다. 자동 음성 인식의 노력에도 불구하고 노인 음성 인식(Elderly Speech Recognition, ESR)에 대한 어려움은 줄어들지 않고 있다. 본 연구는 노인 음성 인식에 콘포머(Conformer)와 피쳐 퓨전 모듈(Features Fusion Module, FFM)기반 노인 음성 인식 모델을 제안한다. 학습, 평가는 VOTE400(Voide Of The Elderly 400 Hours) 데이터셋으로 한다. 본 연구는 그동안 잘 이뤄지지 않았던 콘포머와 퓨전피쳐를 사용해 노인 음성 인식을 위한 딥러닝 모델을 제시하였다는데 큰 의미가 있다. 또한 콘포머 모델보다 높은 수준의 정확도를 보임으로써 노인 음성 인식을 위한 딥러닝 모델 연구에 기여했다.
PDF

수직, 수평 성분을 이용한 한국 자동차 번호판 인식 (An approach to Korean License Plate Recognition Based on Vertical, Horizontal Edge Matching)

서동훈;정해권;이원돈
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
- /
- pp.610-612
- /
- 2003
일상 생활에서 자동차의 수가 증가함에 따라 최근 자동차 번호판을 자동으로 인식하는 시스템이 다양한 곳에서 이용되고 있다. 일례로 공항이나 아파트 단지에서 자동으로 문을 개폐해주는 시스템을 도입하고 있다. 기존에 주차권을 통한 개폐기와의 차이점 달려오던 자동차가 일정 속도만 유지하면 자동으로 번호를 인식하는 점이다. 또한 번호판을 통해 정확한 자동차에 대한 정확한 정보를 관리할 수 있다. 이러한 시스템을 위해서 자동차 번호판 영역의 정확한 추출이 필요하다. 본 논문은 자동차 번호판 영역을 RGB영역으로 인식하던 시스템에 수직, 수평 선분을 포함하여 기존에 RGB영역으로 인식하던 시스템의 단점을 보완하고 더 나은 인식시스템 구현하고 실험 하였다.
PDF

목적물 인식 및 자동 선택이 가능한 모바일 폰 용 자동초점 알고리즘 (Enhanced Auto-focus algorithm detecting target object with multi-window and fuzzy reasoning for the mobile phone)

이상용;오승훈;김수원
- 대한전자공학회논문지SD
- /
- 제44권3호
- /
- pp.12-19
- /
- 2007
본 논문에서는 피사체 인식 및 자동 선택이 가능한 모바일 폰 용 자동초점 알고리즘을 제안하였다. 제안된 알고리즘은 피사체 인식 단계와 목적물 자동 선택 단계로 구성된다. 피사체 인식 단계에서는 화면 전체에 배치된 다중 소형 측거점과 초점값 연산자를 사용하여 복수개의 피사체를 모바일 폰에 내장된 이미지 센서만을 사용하여 인식함으로써 기존의 적외선이나 초음파와 같은 외부 장치를 사용하는 방식과 달리 모바일 폰에서의 피사체 인식을 가능케 하고자 하였다 목적물 자동 선택 단계에서는 퍼지 멤버십 변수와 퍼지 추론을 통해 사용자가 촬영하고자 하는 목적물을 자동 선택하는데 이는 사진 기술이 없는 사용자라도 선명한 화질의 디지털 이미지를 획득할 수 있도록 하기 위함이다. 제안된 알고리즘은 프로그램 언어로 구현되었으며, 초점 거리 제어가 가능한 CCD 카메라와 PC를 사용하여 실시간으로 이미지를 분석, 검증하였다.
PDF KSCI

자동학습에 기반한 디자인 패턴 인식 (Design Pattern Discovery based on Machine Learning)

황성욱;윤현상;이은석
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2006년도 학술대회 1부
- /
- pp.760-765
- /
- 2006
디자인 패턴의 사용은 시스템을 좀 더 유연하고, 이해하기 쉽고, 재사용 가능하게 만든다. 개발이 완료된 시스템이 명확하게 문서화가 되어 있으면, 시스템의 내부 구조를 이해하기 쉽고, 향후 유지 보수의 비용이 적게 든다. 하지만, 대부분 시스템의 경우 개발된 시스템의 문서화가 잘 되어 있지 않기 때문에, 시스템에 문제가 생겨 수정 하고자 하거나, 새로운 모듈을 추가하여 시스템의 기능을 확장하고자 할 때, 전체 소스코드를 분석하여 시스템을 이해해야 하는 어려움이 있다. 이러한 문제점을 해결하기 위해서 소스코드에서 자동적으로 디자인 패턴을 인식하여 문서화를 증진시킬 수 있다. 따라서 신뢰할 만한 디자인 패턴 인식 시스템이 중요하다. 지금까지 디자인 패턴 인식 방법은 시스템의 구조적인 특징만을 이용하여 패턴을 인식하여 왔다. 그래서 본 논문은 구조적인 특징뿐만 아니라 동적인 분석, 그리고 자동학습(machine learning)에 기반하여 소스코드로부터 디자인 패턴을 인식하는 방법을 제안하고자 한다. 그리고 전 작업에서 만든 자바로 쓰여진 에이전트 개발 툴을 대상으로 실시하여 인식한 디자인 패턴에 대한 평가를 하였다.
PDF

자동 교환 시스템을 위한 실시간 음성 인식 구현 (An Implementation of the Real Time Speech Recognition for the Automatic Switching System)

박익현;이재성;김현아;함정표;유승균;강해익;박성현
- 한국음향학회지
- /
- 제19권4호
- /
- pp.31-36
- /
- 2000
본 논문에서는 음성 인식을 이용한 자동 교환 시스템을 구현하고, 성능을 평가하였다. 이 시스템은 다수의 구성원과 조직 체계를 가지는 관공서나 일반 기업, 학교 등의 교환 서비스를 음성 인식을 통하여 자동으로 제공한다. 본 시스템에 사용된 음성 인식기는 SCHMM(Semi-Continuous Hidden Markov Model) 기반으로 한 전화망에서의 화자 독립 고립 단어 가변 어휘인식기(Speaker-Independent, Isolated-Word, Flexible-Vocabulary Recognizer)이며, 실시간 구현을 위해 사용한 DSP(Digital Signal Processor)는 Texas Instrument 사의 TMS320C32이다. 자동 교환 서비스를 위하여 음성 인식 기능 외에도 음성 인식 DSP 진단 기능과 인식 대상 어휘의 추가 및 변경을 위한 운용 단말을 구현하여 운용의 편의성을 추구하였다. 본 시스템의 인식 실험은 음성 인식 구내 자동 교환 시스템용 1300여 어휘(부서명, 인명 등)에 대해서 8명의 화자가 유선 전화망에서 수행하였으며 인식률은 91.5%이다.
PDF

n-best 리랭킹을 이용한 한-영 통계적 음성 번역 (Korean-English statistical speech translation Using n-best re-ranking)

이동현;이종훈;이근배
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
- /
- pp.171-176
- /
- 2006
본 논문에서는 n-best 리랭킹을 이용한 한-영 통계적 음성 번역 시스템에 대해 논하고 있다. 보통의 음성 번역 시스템은 음성 인식 시스템, 자동 번역 시스템, 음성 합성 시스템이 순차적으로 결합되어 있다. 하지만 본 시스템은 음성 인식 오류에 보다 강인한 시스템을 만들기 위해 음성 인식 시스템으로부터 n-best 인식 문장을 추출하여 번역 결과와 함께 리랭킹의 과정을 거친다. 자동 번역 시스템으로 구절기반 통계적 자동 번역 모델을 사용하여, 음성 인식기의 발음 모델에서 기본 단어 단위와 맞추어 번역 모델과 언어 모델을 훈련시킴으로써 음성 번역 시스템에서 형태소 분석기를 제거할 수 있다. 또한 음성 인식 시스템에서 상황 별로 언어 모델을 분리하여 처리함으로써 자동 번역 시스템에 비해 부족한 음성 인식 시스템의 처리 범위를 보완할 수 있었다.
PDF

GS1-128기반 생물자원 바코드체계 설계 (A Design of the Biological Resources Code based on GS1-128)

주민석;김대승;한복기
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2006년도 추계학술발표대회
- /
- pp.725-728
- /
- 2006
현대 사회의 자동인식의 기술은 매우 발전해 있음에도 보건의료와 관련한 자동인식 기술의 접목은 아직까지 다른 산업기술 전반에 미치지 못하고 있는 실정이다. 특히 보건의료분야 연구에 기반요소로 사용되는 생물자원은 정확성에 대한 중요도가 매우 높음에도 적합한 코드체계와 자동인식기술 연구가 미비한 실정이다. 생물자원의 신뢰성과 정확성은 국제적인 유통물류 바코드 표준인 GS1-128을 적용 확장하여 바코드체계를 설계하고 자동인식기술을 연계하여 발전된 정보환경을 만들 수 있다. 본 연구에서는 생물자원 자동인식 기반을 제공하기 위하여 필요한 바코드 요구사항을 정의하고 GS1-128을 기반으로한 생물자원 바코드체계를 제시하였으며, 동일한 바코드문자의 표현영역에 보다 많은 정보를 기록하면서도 작은 면적에 표현 가능한 바코드체계를 설계한 것이다.
PDF

OCR을 위한 문서 영상의 자동평가 (Automatic Evaluation of Document Image for OCR)

윤병훈;하진영
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
- /
- pp.412-416
- /
- 2007
본 논문에서는 OCR(Optical Character Recognition)의 정확도를 위해 인쇄체 한글 문서 영상에 대한 자동 평가방법을 제안한다. 자동 평가방법은 문서가 스캔된 상태에 따라 낮은 해상도, 영상 자체의 기울어짐, 많은 잡음 등을 판단하여 인식하지 않고도 인식률을 추측할 수 있다. 평가방법은 영상 자체의 밝기, 기울기, 영역의 특징, 문자의 상태 등을 특징 항목으로 만들어 점수를 산출한다. 각 항목의 점수는 가장 높은 인식률을 가지는 영상의 특징 값을 기준으로 삼는다. 각각의 특징에 대해 점수가 산출되면 인식률에 높은 비중을 차지하는 특징에 높은 가중치를 적용하여 최종 점수를 산출한다. 영상 평가방법을 통해 높은 점수를 얻은 영상은 상용 인식기를 통해 인식한 결과 높은 인식률을 나타냈고, 평가방법에서 낮은 점수를 받은 영상은 상대적으로 낮은 인식률을 나타냈다. 본 논문에서 제안하는 문서영상을 위한 자동 평가방법은 인식기를 사용하지 않고 영상의 품질을 측정하기 때문에 빠른 시간에 인식률을 추측할 수 있고, 낮은 인식률을 보일 수 있는 영상에 대해서는 항목별 점수를 피드백으로 사용할 수 있어 인식하기전 문서 영상의 전처리에 과정에 도움을 줄 수 있다.
PDF

청각장애인을 위한 음성-자막 자동 변환 시스템 개발 및 음성 인식률 고도화 (Development and Enhancement of Automatic Caption Generation System based on Speech-to-Text for the Hearing Impaired)

최미애;김승현;조민애;박동영;김용호;윤종후
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 하계학술대회
- /
- pp.465-468
- /
- 2020
인터넷 미디어, OTT, VOD 등 신규미디어가 비장애인의 정보제공 매체로 널리 확대되나, 자막 서비스를 제공하지 않아 청각장애인의 정보 격차가 더욱 심화되고 있다. 청각장애인의 미디어 접근성 제고를 위해 음성인식 서버 및 스마트 폰·태블릿 앱 간 연계를 통해 음성을 인식하여 자동으로 자막을 생성하고 표시하는 음성-자막 자동 변환 시스템을 개발하였고 음성인식률을 높이기 위해 뉴스/시사/다큐 장르 영상 콘텐츠의 음성에 대해 학습용 데이터를 제작하여 음성인식 성능을 고도화 시켰다. 본 논문에서는 청각장애인을 위한 음성-자막 자동 변환시스템 구성과 음성인식률 비교 평가 결과를 보여준다.
PDF

검색결과 2,018건 처리시간 0.04초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)