통합 검색 | Korea Science

CM 알고리즘을 이용한 핵심어 검출 시스템의 인식률 향상에 관한 연구 (A Study on the Recognition-Rate Improvement by the Keyword Spotting System using CM Algorithm)

원종문;이정숙;김순협
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
- /
- pp.81-84
- /
- 2001
본 논문은 중규모 단어급의 핵심어 검출 시스템에서 인식률 향상을 위해 미등록어 거절(Out-of-Vocabulary rejection) 기능을 제어하기 위한 연구이다. 이것은 핵심어 검출기에서 인식된 결과를 확인하는 과정으로 검증시스템이 구현되기 위해서는 매 음소마다 검증 기능이 필요하고, 이를 위해서 반음소(anti-phoneme model) 모델을 사용하였다. 검증의 역할은 인식기에서 인식된 단어가 등록어인지 미등록어인지 판별하는 것이다. 단어인식기는 비터비 탐색을 하므로, 기본적으로 단어단위로 인식을 하지만 그 인식된 단어는 내부적으로 음소단위로 인식된다. 따라서, 최소 검증 오류를 갖는 반음소 모델을 사용하고, 이를 이용하여 인식된 음소 단위들을 각각의 반음소 모델과 비교하여 통계적인 방법에 의해 신뢰도를 구한다 이 음소단위의 신뢰도를 단어 단위의 신뢰도로 환산하기 위해서 음소단위를 평균 내는 방식 을 취한다. 이렇게 함으로서, 등록어와 미등록어 사이의 분별력을 크게 하여 향상된 인식 성능을 얻었다.
PDF

음성인식 등의 복합기능을 가진 지능형 장난감의 소프트웨어 개발 (Software Development of an Intelligent Toy with Various Functions Including Speech Recognition)

박상훈;한상훈;조형제
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
- /
- pp.589-591
- /
- 2001
음성인식은 여러 분야에 적용될 수 있지만 지능형 장난감에 적용된 사례를 보면 다른 시스템에서 적용된 경우와 같이 높은 인식률이 요구된다. 하지만 음성인식의 기능만으로 지능형 장난감의 기능이 다양성을 가지지 못한다. 음성인식기능 뿐만 아니라 다른 여러 가지의 기능을 가진 지능형 장난감의 소프트웨어를 개발하는 것이 다른 시스템과의 차별성을 두는 것이 된다. 본 논문에서는 이 Intelligent Toy에 내장될 음성인식 등의 여러 가지의 기능을 가진 Software를 구현하는 방법 및 결과를 제시한다. 대표적 기능인 음성인식은 화자종속이고 그 인식률은 99%의 높은 인식률을 얻었다. 그외에도 음성합성, 음악합성, 음성녹음 및 재생 등의 기능구현을 하였다. 음성인식을 가진 Intelligent Toy 계열의 시스템과 같은 잡음 환경 하에서 인식률을 비교해 볼 때 그 결과가 우수함을 확인하였다.
PDF

입 모양 인식 기술이 비교 연구 (A study on lip-motion recognition algorithms)

박한무;정진우
- 한국지능시스템학회:학술대회논문집
- /
- 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
- /
- pp.268-270
- /
- 2008
얼굴 인식은 영상 처리 분야 중 대표적인 분야의 하나로, 지금까지 다양한 응용시스템이 개발됐다. 얼굴 인식은 눈, 코, 입 같은 얼굴의 특징들을 값으로 변환하고 각 특징 값들의 상관관계를 분석하는 방식으로 이루어지는데, 이 중에서 입은 형태 변화가 심하기 때문에 얼굴 인식에서는 특징 값으로 잘 이용되지 않는다. 반면, 표정 인식이나 화자 인식과 같은 특정 응용 시스템에서는 중요한 특징의 하나로 사용되고 있다. 입 모양을 인식한다는 것은 입술의 형태와 그 변화를 인식한다는 것을 의미하며, 이에 대한 연구가 많이 이루어지기는 했지만 음성 인식의 보조 수단으로 사용된 것이 대부분이다. 본 논문에서는 현재까지 제안된 입 움직임 인식 기술에 대해서 정리하고, 새로이 적용 가능한 응용 시스템에 대해 고찰해보고자 한다.
PDF

실시간 글자 인식을 위한 안드로이드 기반의 글자 영역 추출 기술 (A text region extraction algorithm based on Android for real-time text recognition)

이규철;이상용;유지상
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2016년도 추계학술대회
- /
- pp.194-196
- /
- 2016
본 논문에서는 안드로이드 환경에서 글자 인식을 위한 전처리 과정으로 입력 영상에서 글자 영역만을 추출하는 기법을 제안한다. 대부분의 글자 인식 어플리케이션에서 글자를 인식하는 방법은 RoI(Region of Interest)에 인식하려는 글자를 위치시켜 놓고 사용자가 촬영함으로써 진행된다. 하지만 촬영된 영상 그대로를 인식에 사용하기 때문에 잡음 및 글자가 아닌 영역들을 글자로 인식하는 문제 등으로 인하여 인식률이 현저히 떨어진다. 제안하는 기법에서는 MSER(Maximally Stable Extremal Regions) 기법을 통해 각각의 글자를 추출한 후, 글자의 특성을 이용하여 글자 영역만을 추출한다. 기법의 성능 평가는 무료 OCR(Optical Character Recognition) 엔진인 Tesseract-OCR을 통해 글자 인식률을 비교하였으며, 제안하는 기법을 적용한 글자 인식 시스템이 적용하지 않은 시스템보다 글자의 인식률이 향상되는 것을 확인하였다.
PDF

ISO/IEC 18000-3 ASK 모드와 PJM 모드의 성능 비교 (Performance Comparison of ISO / IEC 18000-3 ASK and PJM Mode)

김재림;양훈기
- 한국ITS학회 논문지
- /
- 제7권6호
- /
- pp.70-80
- /
- 2008
본 논문에서는 18000-3 RFID 표준인 ASK 모드와 PJM 모드 RFID 시스템을 인식속도의 관점에서 비교하였다. ASK 모드와 PJM 모드 리더/태그간 통신 과정을 표현 할 수 있는 대표 블록들의 조합을 구성하여 블록이 발생한 횟수를 이용하여 인식속도를 비교하였다. FS-Aloha 기반 프로토콜을 적용시키기 위한 Q알고리즘으로 표준 기고서에서 예시로 제안한 알고리즘, Q값 고정 알고리즘, 최소 Q 알고리즘 그리고 남은 태그 수에 연동한 Q값 설정 알고리즘을 이용하였다. 시뮬레이션 과정을 통해서 Q알고리즘에 따른 ASK 모드와 PJM 모드 속도 비교뿐만 아니라 Q알고리즘을 고정시킨 후 ASK 모드와 PJM 모드의 인식속도를 비교하였고 속도에 영향을 미치는 파라메타들을 도출하였다.
PDF

한글 단어의 음성 인식 처리에 관한 연구 (A Study on Processing of Speech Recognition Korean Words)

남기훈
- 문화기술의 융합
- /
- 제5권4호
- /
- pp.407-412
- /
- 2019
본 논문에서는 한글 단어 단위의 음성 인식 처리 기술을 제안한다. 음성 인식은 마이크와 같은 센서를 사용하여 얻은 음향학적 신호를 단어나 문장으로 변환시키는 기술이다. 대부분의 외국어들은 음성 인식에 있어서 어려움이 적은 편이다. 그에 반면, 한글의 모음과 받침 자음 구성이어서 음성 합성 시스템으로부터 얻은 문자를 그대로 사용하기에는 부적절하다. 기존 구조의 음성 인식 기술을 개선해야만 보다 정확하게 단어를 인식할 수 있다. 이러한 문제를 해결하기 위해 기존 방식의 음성 인식구조에 새로운 알고리즘을 추가하여 음성 인식률을 높이게 하였다. 먼저 입력된 단어를 전처리 과정을 수행한 후 결과를 토큰 처리한다. 레벤스테인 거리 알고리즘과 해싱 알고리즘에서 처리된 결과 값을 조합한 후 자음 비교 알고리즘을 거쳐 표준 단어를 출력한다. 최종 결과 단어를 표준화 테이블과 비교하여 존재하면 출력하고 존재하지 않으면 테이블에 등록하도록 하였다. 실험 환경은 스마트폰 응용 프로그램을 개발하여 사용하였다. 본 논문에서 제안된 구조는 기존 방식에 비해 인식률의 성능이 표준어는 2%, 방언은 7% 정도 향상되었음을 보였다.
https://doi.org/10.17703/JCCT.2019.5.4.407 인용 PDF KSCI

자율 주행 UGV를 위한 정지선과 횡단보도 인식 알고리즘 설계 및 구현 (Design and Implementation of the Stop line and Crosswalk Recognition Algorithm for Autonomous UGV)

이재환;윤희병
- 한국지능시스템학회논문지
- /
- 제24권3호
- /
- pp.271-278
- /
- 2014
정지선과 횡단보도는 자율 주행에서 가장 기본적으로 인식해야 하는 인식대상임에도 불구하고 추출할 수 있는 특징이 매우 제한적이고 영상기반의 인식기술을 제외한 레이저나 RF, GPS/INS 인식기술로는 인식이 어려운 분야다. 이러한 이유로 이 분야에 대한 연구는 매우 제한적으로 수행되어왔다. 본 논문에서는 비전센서를 통해 입력된 정지선과 횡단보도 영상을 영상기반으로 인식할 수 있는 알고리즘을 설계하고 구현한다. 제안한 알고리즘은 3개 부분으로 구성된다. 즉 특징추출에 필요한 영역을 사전에 선정하여 처리속도를 향상시키는 관심영역 설정 부분, 일정비율 이상의 백색이 검출된 영상만 인식되도록 하여 불필요한 연산을 제거하는 색상패턴 검사 부분, 에지특징을 추출하고 추출된 에지특징을 사전에 모델링한 특징모델과 비교하여 정지선과 횡단보도 여부를 식별하는 특징 추출과 인식 부분이다. 특징추출과 인식 부분에는 유형별 특징비교 알고리즘을 적용하여 정지선과 횡단보도가 병행하여 존재하거나 각각 존재하는 경우에 대해 모두 식별되도록 한다. 또한 제안한 알고리즘은 기존연구를 발전시키기 위해 카메라의 차량내부 설치의 효과, 역광 및 그림자와 같은 다양한 제약조건에 대한 인식률 변화와 거리에 따른 적정 인식률 평가를 비교 분석하였다.
https://doi.org/10.5391/JKIIS.2014.24.3.271 인용 PDF KSCI

주파수 분석을 이용한 반복적인 손동작 인식 (Repetitive hand gesture recognition based on frequency analysis)

김지예;박종일
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2017년도 하계학술대회
- /
- pp.166-167
- /
- 2017
가상 현실에 대한 관심이 높아지면서, 가상 물체와 사람 사이의 보다 자연스러운 상호작용이 중요하게 되었다. 그 중 가장 많이 사용되는 방식 중 하나가 바로 손동작이다. 사람들은 손동작을 통해 자신의 감정을 전달하거나 자신의 의견을 표현할 수 있기 때문에 손동작은 Natural User Interface(NUI)의 중요한 위치를 차지하고 있다. 본 논문에서는 사람들의 손동작 중 비교적 큰 비중을 차지하는 반복적인 궤적을 그리는 손동작 인식을 위한 방법을 제안한다. 손이 움직이는 방향과 거리의 3 차원 좌표 값을 이용하여 벡터화를 한 후, 이 데이터를 Fast Fourier transform(FFT)와 Support Vector Machine(SVM)을 통해 반복적인 손동작을 인식함으로써 자연스러운 손동작을 비교적 정확히 인식할 수 있다.
PDF

의생명 분야의 개체명 인식에서 순환형 신경망과 조건적 임의 필드의 성능 비교 (Performance Comparison of Recurrent Neural Networks and Conditional Random Fields in Biomedical Named Entity Recognition)

조병철;김유섭
- 한국어정보학회:학술대회논문집
- /
- 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
- /
- pp.321-323
- /
- 2016
최근 연구에서 기계학습 중 지도학습 방법으로 개체명 인식을 하고 있다. 그러나 지도 학습 방법은 데이터를 만드는 비용과 시간이 많이 필요로 한다. 본 연구에서는 주석 된 말뭉치를 사용하여 지도 학습 방법을 사용 한다. 의생명 개체명 인식은 Protein, RNA, DNA, Cell type, Cell line 등을 포함한 텍스트 처리에 중요한 기초 작업입니다. 그리고 의생명 지식 검색에서 가장 기본과 핵심 작업 중 하나이다. 본 연구에서는 순환형 신경망과 워드 임베딩을 자질로 사용한 조건적 임의 필드에 대한 성능을 비교한다. 조건적 임의 필드에 N_Gram만을 자질로 사용한 것을 기준점으로 설정 하였고, 기준점의 결과는 70.09% F1 Score이다. RNN의 jordan type은 60.75% F1 Score, elman type은 58.80% F1 Score의 성능을 보여준다. 조건적 임의 필드에 CCA, GLOVE, WORD2VEC을 사용 한 결과는 각각 72.73% F1 Score, 72.74% F1 Score, 72.82% F1 Score의 성능을 얻을 수 있다.
PDF

모바일 환경 영상인식을 위한 신경망기반 Speeded Up Robust Features 차원 감소 (Dimensionality Reduction of Speeded Up Robust Features Using Neural Networks for Object Recognition in Mobile Environments)

윤두밈;김경중
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
- /
- pp.421-424
- /
- 2011
최근에 스마트폰이 발달하고 대부분의 모바일 기기에 카메라가 달리면서 카메라를 이용한 애플리케이션 또한 늘어나고 있는데 기존의 PC상에서 로고 인식등을 위해 사용되는 SURF를 이용한 이미지 매칭에는 유클리드 거리 계산을 사용하고 있다. 그러나 이 방법으로는 PC보다는 사양이 낮은 모바일 기기에 적용하기에는 기존에 사용하고 있는 방법이 인식할 이미지마다 모든 특징점을 비교하는 방법을 사용하기 때문에 연산량이 높은 편이다. 본 논문에서는 미리 인식할 이미지를 뉴럴넷에 학습시킨 뒤, 뉴럴넷을 필터링으로 사용하여 일부의 특징점만을 비교해 연산량을 줄여서 속도를 향상시키는 방법을 제안하였으며 이를 이용하여 대략 30%가량의 성능 향상이 나타난 것을 알 수 있었다.

검색결과 6,325건 처리시간 0.032초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)