통합 검색 | Korea Science

상태레벨 공유를 이용한 MLLR 적응화의 회귀클래스 생성에 관한 연구 (A Study on Regression Class Generation of MLLR Adaptation Using State Level Sharing)

오세진;성우창;김광동;노덕규;송민규;정현열
- 한국음향학회지
- /
- 제22권8호
- /
- pp.727-739
- /
- 2003
본 논문에서는 HM-Net (Hidden Markov Network)을 다양한 태스크에의 적용과 화자의 특성을 효과적으로 나타내기 위해 HM-Net 음성인식 시스템에 MLLR (Maximum Likelihood Linear Regression) 적응방법을 도입하였으며, HM-Net 학습 알고리즘을 개량하여 회귀클래스 생성방법을 제안한다. 제안방법은 PDT-SSS (Phonetic Decision Tree-based Successive State Splitting)알고리즘의 문맥방향 상태분할에 의한 상태레벨 공유를 이용한 방법이다. 즉, 문맥방향의 각 상태에 적응화자 음성데이터에 포함된 문맥정보를 분할하여 적응화될 음소환경을 결정하는 것이다. 따라서 제안방법은 새로운 화자로부터 문맥정보와 적응화 데이터의 발성 양에 의존하여 결정된 많은 적응 파라미터들을 (평균, 분산) 자유롭게 제어할 수 있게 된다. 제안방법의 유효성을 확인하기 위해 국어공학센터 (KLE) 452 데이터와 항공편 예약관련 (YNU200) 연속음성을 대상으로 인식실험을 수행한 결과, 음소인식, 단어인식, 연속음성인식에 대해서, 평균 34∼37%, 평균 9%, 평균 20%의 성능 향상을 각각 보였다. 또한 적응화 데이터의 양에 따른 인식성능 비교에서 제안방법을 적용한 인식 시스템이 적응 데이터의 양이 적은 경우에도 향상된 인식률을 보여 MLLR 적응방법의 특성을 만족하였다. 따라서 MLLR 적응방법을 도입한 HM-Net 음성인식 시스템에 제안한 회귀클래스 생성방법이 유효함을 확인할 수 있었다.
PDF KSCI

동작 상상 EEG 분류를 위한 필터 뱅크 기반 정규화 공통 공간 패턴 (Filter-Bank Based Regularized Common Spatial Pattern for Classification of Motor Imagery EEG)

박상훈;김하영;이다빛;이상국
- 정보과학회 논문지
- /
- 제44권6호
- /
- pp.587-594
- /
- 2017
최근, 동작 상상(Motor Imagery) Electroencephalogram(EEG)를 기반으로 한 Brain-Computer Interface(BCI) 시스템은 의학, 공학 등 다양한 분야에서 많은 관심을 받고 있다. Common Spatial Pattern(CSP) 알고리즘은 동작 상상 EEG의 특징을 추출하기 위한 가장 유용한 방법이다. 그러나 CSP 알고리즘은 공분산 행렬에 의존하기 때문에 Small-Sample Setting(SSS) 상황에서 성능에 한계가 있다. 또한 사용하는 주파수 대역에 따라 큰 성능 차이를 보인다. 이러한 문제를 동시에 해결하기 위해, 4-40Hz 대역 EEG 신호를 9개의 필터 뱅크를 이용하여 분할하고 각 밴드에 Regularized CSP(R-CSP)를 적용한다. 이후 Mutual Information-Based Individual Feature(MIBIF) 알고리즘은 R-CSP의 차별적인 특징을 선택하기 위해 사용된다. 본 연구에서는 대뇌 피질의 운동영역 부근 18개 채널을 사용하여 BCI CompetitionIII DatasetIVa의 피험자 다섯 명(aa, al, av, aw 및 ay)에 대해 각각 87.5%, 100%, 63.78%, 82.14% 및 86.11%의 정확도를 도출하였다. 제안된 방법은 CSP, R-CSP 및 FBCSP 방법보다 16.21%, 10.77% 및 3.32%의 평균 분류 정확도 향상이 있었다. 특히, 본 논문에서 제안한 방법은 SSS 상황에서 우수한 성능을 보였다.
https://doi.org/10.5626/JOK.2017.44.6.587 인용 KSCI

LTE 신호의 CRS를 이용한 TOA 기반 거리 측정 방법 (TOA-Based Ranging Method using CRS in LTE Signals)

강태원;이하림;서지원
- 한국항행학회논문지
- /
- 제23권5호
- /
- pp.437-443
- /
- 2019
본 논문에서는 LTE 기지국 (BS; base station)과 단말기 (UE; user equipment) 간의 거리를 신호 도달 시간 (TOA; time-of-arrival)을 이용해 계산하는 알고리즘을 소개하였다. 먼저, 수신된 신호를 발신한 기지국을 판별하기 위해 primary synchronization signal (PSS)와 secondary synchronization signal (SSS)를 이용하여 셀 아이디를 취득하였다. 제시된 알고리즘에서는 상용 LTE 신호에 포함된 기준 시퀀스인 cell-specific reference signal (CRS)를 구축된 자원 그리드에서의 2차원 상호 상관을 통해 지연 시간을 계산하였다. 지연 시간의 변화는 신호 도달 시간의 변화로 계산되어 알려진 BS의 위치로부터 UE와의 거리를 계산하는 과정에 사용할 수 있다. 제시된 알고리즘의 성능은 실제 환경에서의 상용 LTE 신호를 이용한 거리 계산 실험에 사용되어 평가되었다.
https://doi.org/10.12673/jant.2019.23.5.437 인용 PDF KSCI

음소결정트리 상태분할을 이용한 한국어 연속음성인식에 관한 연구 (A Study on the Korean Continuous Speech Recognition using Phonetic Decision Tree-based State Splitting)

오세진;황철준;김범국;정호열;정현열
- 융합신호처리학회 학술대회논문집
- /
- 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
- /
- pp.277-280
- /
- 2001
본 연구에서는 연속음성인식 시스템의 성능개선을 위한 기초 연구로서 음소결정트리 상태분할과 한국어 음성학적 지식을 이용하여 문맥의존 음향모델의 작성방법을 검토하고. 한국어 연속음성인식에 적용을 소개한다. 음소결정트리 상태분할 알고리즘은 각 노드에서 한국어 음성학적 지식으로 구성된 음소 질의어 집합에 따라 2진 트리로 SSS(Successive State Splitting) 알고리즘에 의해 상태분할 하는 방법으로서 상태분할 후 각 상태를 네트워크로 연결한 구조를 HM-Net(Hidden Markow Network)이라 하며 문맥의존 음향모델로 표현된다. 작성한 문맥의존 음향모델의 유효성을 확인하기 위해 본 연구실의 항공편 예약 문장(YNU200)에 대해 연속음성인식 실험을 수행하였다. 인식실험 결과, 문맥의존 음향모델에 대한 화자독립 연속음성인식률이 기존의 단일 HMM 모델보다 평균적으로 1-pass의 경우 9.9%, 2-pass의 경우 4.1% 향상된 인식률을 보였다. 따라서 문맥의존 음향모델을 작성하는데 음소결정트리 상태분할과 한국어 음성학적 지식이 유효함을 확인하였다.
PDF

GOCI-II 기반 저염분수 산출과 태풍 힌남노에 의한 시간별 염분 변화 (GOCI-II Based Low Sea Surface Salinity and Hourly Variation by Typhoon Hinnamnor)

김소현;김대원;조영헌
- 대한원격탐사학회지
- /
- 제39권6_2호
- /
- pp.1605-1613
- /
- 2023
해양 내의 다양한 물리적 변화는 수온과 염분의 지속적인 변동에 의해 결정된다. 수온과 더불어 넓은 영역의 염분 변화를 파악하기 위해서는 인공위성 자료에 의존할 수밖에 없다. 그럼에도 불구하고 염분을 관측하는 위성인 Soil Moisture Active Passive (SMAP)는 낮은 시·공간 해상도로 인해 연안 근처에서 빠르게 변화하는 해양환경을 관측하기에는 어렵다는 한계가 존재한다. 이러한 한계를 극복하기 위해 본 연구에서는 천리안 해양 관측 위성의 정지궤도 해색 센서인 Geostationary Ocean Color Imager-II (GOCI-II) 원격반사도 자료를 입력자료로 하여 고해상도 표층 염분을 산출하는 Multi-layer Perceptron Neural Network (MPNN) 기반의 알고리즘을 개발하였다. SMAP과 비교한 결과 coefficient of determination (R²)는 0.94, root mean square error (RMSE)는 0.58 psu 그리고 relative root mean square error (RRMSE)는 1.87%였으며, 공간적인 분포 또한 매우 유사한 결과를 나타냈다. R²의 공간 분포는 0.8 이상을 보여주었으며 RMSE는 전반적으로 1 psu 이하의 낮은 값을 보여주었다. 이어도 과학기지에서의 실측 염분값과도 비교하였지만 상대적으로 조금 낮은 결과를 보여주었다. 이에 대한 원인을 분석하였으며, 산출된 GOCI-II 기반 고해상도 염분 자료를 활용하여 2022년 11호 태풍 힌남노에 의한 하루 동안의 동중국해 표층 염분 변화를 표준편차로 계산하였다. 그 결과 SMAP에서 관측할 수 없는 시공간의 염분 변화를 고해상도의 GOCI-II 기반 염분 산출물을 통해 확인할 수 있었다. 따라서 본 연구를 통해 시간 단위로 변화하는 해양환경 모니터링에 큰 기여를 할 것으로 기대된다.
https://doi.org/10.7780/kjrs.2023.39.6.2.8 인용 PDF HTML

상태레벨 공유를 이용한 HM-Net 적응화 시스템의 성능평가에 관한 연구 (A Study on Performance Evaluation of HM-Net Adaptation System Using the State Level Sharing)

오세진;김광동;노덕규;황철준;김범국;김광수;성우창;정현열
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
- /
- pp.397-400
- /
- 2003
본 연구에서는 KM-Net(Hidden Markov Network)을 다양한 태스크에의 적용과 화자의 특성을 효과적으로 나타내기 위해 HM-Net 음성인식 시스템에 MLLR(Maximum Likelihood Linear Regression) 적응방법을 도입하였으며, HM-Net 학습 알고리즘을 개량하여 회귀클래스 생성방법을 제안한다. 제안방법은 PDT-SSS(Phonetic Decision Tree-based Successive State Splitting) 알고리즘의 문맥방향 상태분할에 의한 상태레벨 공유를 이용한 방법으로 새로운 화자로부터 문맥정보와 적응화 데이터의 발성 양에 의존하여 결정된 많은 적응 파라미터들을(평균, 분산) 자유롭게 제어할 수 있게 된다. 제안방법의 유효성을 확인하기 위해 국어공학센터(KLE) 452 음성 데이터와 항공편 예약관련 연속음성을 대상으로 인식실험을 수행한 결과, 전체적으로 음소인식의 경우 평균 34-37％, 단어인식의 경우 평균 9％, 연속음성인식의 경우 평균 7-8％의 인식성능 향상을 각각 보였다. 또한 적응화 데이터의 양에 따른 인식성능 비교에서, 제안방법을 적용한 인식 시스템이 적응 데이터의 양이 적은 경우에도 향상된 인식률을 보였으며. 잡음을 부가한 음성에 대한 적응화 실험에서도 향상된 인식성능을 보여 MLLR 적응방법의 특성을 만족하였다. 따라서 MLLR 적응방법을 도입한 HM-Net 음성인식 시스템에 제안한 회귀클래스 생성방법이 유효함을 확인한 수 있었다.
PDF

IEEE 802.16 기반의 무선 메쉬 네트워크에서 지향성 안테나를 사용하는 중앙 집중형 하향링크 스케줄링 (Centralized Downlink Scheduling using Directional Antennas in IEEE 802.16 based Wireless Mesh Networks)

이상준;이형우;조충호
- 한국통신학회논문지
- /
- 제35권2A호
- /
- pp.134-141
- /
- 2010
본 논문에서는 지향성 안테나를 사용하는 IEEE 802.16 기반 무선 메쉬 네트워크(wireless mesh networks)의 성능 향상을 위한 스케줄링 알고리즘을 제안한다. 성능은 사용자 수에 따른 시스템의 수율과 각 노드 간의 지연으로 나타낸다. 분석 결과를 통해 제안된 알고리즘이 메쉬 네트워크 시스템의 지연을 줄여 시스템의 성능을 향상시킬 수 있음을 보인다. 본 논문의 결과는 향후 메쉬 네트워크, 멀티 홉 중계기 등의 다중 홉 시스템에서 각 SS(subscribe station)들의 공정성을 고려한 지향성 안테나 도입 시에 참고할 만한 가이드라인을 제시할 수 있을 것이다.
PDF KSCI

음성인식에서 문맥의존 음향모델의 성능향상을 위한 유사음소단위에 관한 연구 (A Study on Phoneme Likely Units to Improve the Performance of Context-dependent Acoustic Models in Speech Recognition)

임영춘;오세진;김광동;노덕규;송민규;정현열
- 한국음향학회지
- /
- 제22권5호
- /
- pp.388-402
- /
- 2003
In this paper, we carried out the word, 4 continuous digits. continuous, and task-independent word recognition experiments to verify the effectiveness of the re-defined phoneme-likely units (PLUs) for the phonetic decision tree based HM-Net (Hidden Markov Network) context-dependent (CD) acoustic modeling in Korean appropriately. In case of the 48 PLUs, the phonemes /ㅂ/, /ㄷ/, /ㄱ/ are separated by initial sound, medial vowel, final consonant, and the consonants /ㄹ/, /ㅈ/, /ㅎ/ are also separated by initial sound, final consonant according to the position of syllable, word, and sentence, respectively. In this paper. therefore, we re-define the 39 PLUs by unifying the one phoneme in the separated initial sound, medial vowel, and final consonant of the 48 PLUs to construct the CD acoustic models effectively. Through the experimental results using the re-defined 39 PLUs, in word recognition experiments with the context-independent (CI) acoustic models, the 48 PLUs has an average of 7.06%, higher recognition accuracy than the 39 PLUs used. But in the speaker-independent word recognition experiments with the CD acoustic models, the 39 PLUs has an average of 0.61% better recognition accuracy than the 48 PLUs used. In the 4 continuous digits recognition experiments with the liaison phenomena. the 39 PLUs has also an average of 6.55% higher recognition accuracy. And then, in continuous speech recognition experiments, the 39 PLUs has an average of 15.08% better recognition accuracy than the 48 PLUs used too. Finally, though the 48, 39 PLUs have the lower recognition accuracy, the 39 PLUs has an average of 1.17% higher recognition characteristic than the 48 PLUs used in the task-independent word recognition experiments according to the unknown contextual factor. Through the above experiments, we verified the effectiveness of the re-defined 39 PLUs compared to the 48PLUs to construct the CD acoustic models in this paper.
PDF KSCI

한국어 대어휘 음성DB를 이용한 HM-Net 음성인식 시스템의 성능평가 (Performance Evaluation of HM-Net Speech Recognition System using Korea Large Vocabulary Speech DB)

오세진;김광동;노덕규;송민규;김범국;황철준;정현열
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
- /
- pp.2443-2446
- /
- 2003
본 논문에서는 한국전자통신연구원에서 제공된 대어휘 음성DB를 이용하여 HM-Net(Hidden Markov Network) 음성인식 시스템의 성능평가를 수행하였다. 음향모델 작성은 음성인식에서 널리 사용되고 있는 통계적인 모델링 방법인 HMM(Hidden Markov Model)을 개량한 HM-Net을 도입하였다 HM-Net은 PDT-SSS 알고리즘에 의해 문맥방향과 시간방향의 상태분할을 수행하여 생성되는데, 특히 문맥방향 상태분할의 경우 학습 음성데이터에 출현하지 않는 문맥정보를 효과적으로 표현하기 위해 음소결정트리를 채용하고 있으며, 시간방향 상태분할의 경우 학습 음성데이터에서 각 음소별 지속시간 정보를 효과적으로 표현하기 위한 상태분할을 수행한다. 이러한 상태분할을 수행하여 파라미터를 공유하게 되며 최적인 모델 네트워크를 작성하게 된다. 대어휘 음성데이터를 이용하여 음향모델을 작성하고 인식실험을 수행한 결과, 100명의 100단어와 60문장에 대해 평균 97.5％, 96.7％의 인식률을 보였다.
PDF

다중홉 릴레이 시스템에서 간섭의 영향과 비용의 효과를 고려한 셀 커버리지 확장 방법에 관한 연구 (Interference Aware Cost Effective Coverage Extension in Multihop Relay Networks)

김용철;임원택;조성환
- 한국통신학회논문지
- /
- 제37B권12호
- /
- pp.1138-1147
- /
- 2012
케이블과 DSL의 대안으로서 라스트 마일(last mile)의 광역 접근을 무선으로 가능하게 해주며 고속 인터넷 서비스를 제공할 수 있는 표준 기술로 알려진 WiMAX에 셀 용량의 증대와 셀 커버리지를 확장하기 위하여 Mobile Multihop Relay 기술이 추가적으로 제안 되면서 많은 관심을 모으고 있다. 본 논문에서는 셀 커버리지를 확장하기 위하여 릴레이 노드(RS)를 운용하는 방법에 초점을 맞추고 사용자 노드(SS)들에 대한 형평성을 고려한 자원할당 알고리즘을 사용하여 다중홉 릴레이 네트워크의 성능을 분석하였으며, 특히 주파수 재사용 기법을 적용할 때에 릴레이 노드들 간의 간섭 현상이 셀 용량에 미치는 영향을 구체적으로 분석하여 비용 효과를 고려한 셀 커버리지 확장 방법을 제안한다.
https://doi.org/10.7840/kics.2012.37B.12.1138 인용 PDF KSCI

검색결과 22건 처리시간 0.02초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)