통합 검색 | Korea Science

한국어 연속음성인식을 위한 발음사전 구축 (Pronunciation Dictionary For Continuous Speech Recognition)

이경님;정민화
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
- /
- pp.197-199
- /
- 2000
연속음성인식을 수행하기 위해서는 발음사전과 언어모델이 필요하다. 이 둘 사이에는 디코딩 단위가 일치하여야 하므로 발음사전 구축시 디코딩 단위로 표제어 단위를 선정하며 표제어 사이의 음운변화 현상을 반영한 발음사전을 구축하여야 한다. 한국어에 부합하는 음운변화현상을 분석하여 학습용 자동 발음열을 생성하고, 이를 통하여 발음사전을 구축한다. 전처리 단계로 기호, 단위, 숫자 등 전처리 과정 및 형태소 분석 과정을 수행하며, 디코딩 단위인 의사 형태소 단위를 생성하기 위해 규칙을 이용한 태깅 과정을 거친다. 이를 통해 나온 결과를 발음열 생성기 입력으로 하며, 결과는 학습용 발음열 또는 발음사전 구성을 위한 형태로 출력한다. 표제어간 음운변화 현상이 반영된 상태의 표제어 단위이므로 실제 음운변화가 반영되지 않은 상태의 표제어와는 그 형태가 상이하다. 이는 연속 발음시 생기는 현상으로 실제 인식에는 이 음운변화 현상이 반영된 사전이 필요하게 된다. 생성된 발음사전의 효용성을 확인하기 위해 다음과 같은 실험을 통해 성능을 평가하였다. 음향학습을 위하여 PBS(Phonetically Balanced Sentence) 낭독체 17200문장을 녹음하고 그 전사파일을 사용하여 학습을 수행하였고, 발음사전의 평가를 위하여 이 중 각각 3100문장을 사용하여 다음과 같은 실험을 수행하였다. 형태소 태그정보를 이용하여 표제어간 음운변화 현상을 반영한 최적의 발음사전과 다중 발음사전, 언어학적 기준에 의한 수작업으로 생성한 표준 발음사전, 그리고 표제어간의 음운변화 현상을 고려하지 않고 독립된 단어로 생성한 발음사전과의 비교 실험을 수행하였다. 실험결과 표제어간 음운변화 현상을 반영하지 않은 경우 단어 인식률이 43.21%인 반면 표제어간 음운변화 현상을 반영한 1-Best 사전의 경우 48.99%, Multi 사전의 경우 50.19%로 인식률이 5~6%정도 향상되었음을 볼 수 있었고, 수작업에 의한 표준발음사전의 단어 인식률 45.90% 보다도 약 3~4% 좋은 성능을 보였다.
PDF

JND 모델을 사용한 코딩 유닛 레벨 멀티-루프 인코딩 기반의 비디오 압축 방법 (Coding Unit-level Multi-loop Encoding Method based on JND for Perceptual Coding)

임웅;심동규
- 전자공학회논문지
- /
- 제52권5호
- /
- pp.147-154
- /
- 2015
본 논문에서는 주변의 밝기에 대한 HVS의 민감도를 모델링한 JND (Just Noticeable Difference)를 비디오 코딩에 적용함으로써, JND 모델에 따른 임계치를 기준으로 현재 코딩 유닛에 적용 가능한 최대 양자화 파라미터를 결정하여 유사한 주관적 화질에서 비트율을 절감시키는 방법을 제안한다. 제안하는 방법은 입력된 현재 코딩 유닛에 대하여 기준이 되는 양자화 파라미터가 적용된 복원 신호 대비 더 높은 양자화 파라미터를 적용한 복원 신호가 JND 관점에서 유사하게 인지되는 경우에 더 높은 양자화 파라미터를 선택함으로써 비트율을 절감시킨다. 제안하는 알고리즘의 성능 검증을 위하여 최신 비디오 압축 표준인 HEVC (High Efficiency Video Coding)의 참조 소프트웨어인 HM16.0에 본 알고리즘을 적용하였으며, HM16.0을 통해 압축된 영상 대비 유사한 화질에서 최대 20.21%, 평균적으로 약 6.18%의 비트율 절감을 달성하였다.
https://doi.org/10.5573/ieie.2015.52.5.147 인용 PDF KSCI

H.264 인터모드 결정 방법 개선에 관한 연구 (A Study on an Improved H.264 Inter mode decision method)

공재웅;정재진;황의성;김태형;김두영
- 융합신호처리학회논문지
- /
- 제9권4호
- /
- pp.245-252
- /
- 2008
본 논문에서는 H 264 인코딩 과정 중 모드 결정 및 움직임 예측 부분의 개선을 위한 새로운 방법을 제안한다. 제안한 방법은 H 264 모드 결정 과정 중 참조 프레임의 선택 과정 생략과 모드 결정 기준의 하나인 SAD 연산과정의 개선을 사용하여 인코딩 과정에서 수행되는 연산량을 감소시켜 인코딩 수행시간을 절감하는 방법이다. 제안하는 방법의 성능 평가를 위하여 H 264 표준에서 제공되는 QCIF 사이즈, YUV 4:2:0 포맷의 영상을 이용하여 실험 영상을 만들어 적용하였다. 본 논문에서 제안한 방법을 적용한 결과 알고리즘 1은 약간의 화질 열화를 보이며 수행시간은 10프레임씩 인코딩 하였을 때 평균 4.7% 감소하였으며, 알고리즘 2는 약 0.98dB정도의 화질 열화를 보이지만 인코딩 수행시간은 평균 9.6% 감소하였다.
PDF

네트워크 코딩 기능을 갖춘 협력통신용 MAC 프로토콜에 관한 연구 (A study on the network coding enabled cooperative MAC protocol at Ad Hoc networks)

장재신
- 한국정보통신학회논문지
- /
- 제13권9호
- /
- pp.1819-1828
- /
- 2009
최근에는 Ad Hoc 네트워크에서 시스템 성능을 더욱 향상시키기 위해 협력통신에 대한 연구가 많이 진행되었다. 본 논문에서는 시스템 성능을 더욱 개선하기 위하여 협력통신을 지원하는 망구조에서 네트워크 코딩을 지원하는 NC-MAC 프로토콜을 제안하고 확률을 이용한 수학적인 접근방법을 사용하여 성능평가를 수행하였다. 도출된 성능평가 결과를 통해 IEEE 802.11 표준인 DCF 기법에 비해 시스템 처리량이 월등히 개선되며, 기존 연구에서 제안된 rDCF 기법 및 CO-MAC 기법보다도 최대 48%까지 시스템 처리량 성능이 증가함을 확인할 수 있었다.
https://doi.org/10.6109/JKIICE.2009.13.9.1819 인용 PDF KSCI

임펄스 UWB 네트워크에서의 일정진폭 다중접속 채널코팅 (Constant Amplitude Multiple Access Channel Coding for Impulse Radio UWB Networks)

김동석;김용철
- 전자공학회논문지SC
- /
- 제45권6호
- /
- pp.42-47
- /
- 2008
이 논문은 임펄스 UWB 시스템을 위한 새로운 일정진폭 프리코딩을 제안한다. IEEE 802.15.4a 표준에 따르면 임펄스 UWB는 실내측위와 센서 데이터 전달에 사용될 수 있다. 대부분의 USN(ubiquitous sensor network)은 다중접속을 필요로 한다. 그러나 UWB 시스템은 다중접속으로 야기되는 중첩신호를 검출하는데 있어 제약성이 있다. 이를 극복하기 위하여 Wada 및 Kim의 CAMC(constant amplitude multi-code) 개념을 응용하였다. 제안하는 시스템은 체계적 일정진폭 프리코딩과 LDPC 디코딩으로 구성된다. 또한 컴퓨터 시뮬레이션을 통하여 BER성능이 우수함을 확인하였다.
PDF KSCI

VC-1용 고속 역양자화 및 역변환 모듈 구현 (Implementation of Fast Inverse Quantization and Inverse Transform Module for VC-1)

김경현;송형돈;손승일
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
- /
- pp.837-841
- /
- 2007
최근 영상을 중심으로 여러 형태의 정보를 결합하여 저장하거나 전송하는 멀티미디어가 많은 관심을 받고 있다. 현재 카메라와 관련된 동영상 캡처기술은 Motion JPEG이 주류를 이루고 있으며, 텔레비전, DMB 등의 방송 분야 및 DVD, VCR 분야에서는 MPEG-2, MPEG-4, H.264 및 WMV9 등의 압축 코덱이 채용되고 사용되고 있다. 그러나 이러한 다양한 영상 표준방식은 디코딩시 호환성 문제가 발생하게 되고 이에 따라 통합 코덱 연구가 필요하다. 이에 본 논문은 일반적 스텝 양자화외에 데드존 양자화를 사용하고 "$4{\times}4$", "$4{\times}8$", "$8{\times}4$", "$8{\times}8$"의 다양한 블록크기의 변환을 지원하는 VC-1을 기반으로 한 ITIQ C언어를 통해 시뮬레이션하고 최적화된 결과를 VHDL로 구현하여 향후 통합코덱 연구에 응용 가능하도록 연구 및 분석평가 하였다. 설계결과 4:2:0의 YCbCr포맷의 최초 $16{\times}16$블록을 복원하는데 483~510클록이 소요되었고 Xilinx XCVPC100 FF1696-6 환경에서 93,128개의 게이트 수와 71.469MHz의 동작속도를 나타내었다. 이는 640*480 크기의 컬러영상을 디코딩 하는데 프레임 당 최대 0.0074초가 소요됨을 의미하며 초당 30프레임의 영상에서도 0.222초면 디코딩이 가능한 결과이다.
PDF

LCD 시스템을 위한 Modified LVDS 인터페이스 회로 및 코딩기법 (A Modified LVDS Interface Circuit and Coding Method for the LCD Driving System)

김희철;은진화;최명렬;이상선
- 한국멀티미디어학회논문지
- /
- 제3권4호
- /
- pp.424-432
- /
- 2000
본 논문에서는 LCD 시스템에서 호스트와 LCD 컨트롤러사이의 인터페이스를 위한 새로운 데이터 코딩기법과 회로를 제안한다. 제안한 회로는 기존의 국제 표준으로 사용되고 있는 LVDS(Low Power Differential Signaling)를 수정한 회로와 데이터 천이 최소화를 위한 추가적인 직렬 데이터 코딩 기법으로 한 클럭에 2비트의 신호를 동시에 전송할 수 있다. 이에 따라 동작 주파수를 절반으로 줄일 수 있으며 differential signaling으로 전자파 장애와 전력소비 문제를 동시에 해결할 수 있다. 제안한 회로의 성능평가를 위하여 기존의 signaling기법과 전력 소비와 데이터 전송 속도 측면에서 비교 분석하였으며, 컴퓨터 시뮬레이션 결과를 통해 향상된 데이터 천이 감소율을 보임을 확인하였다.
PDF

한국어사전 인코딩체계의 확장에 관한 연구: MARTIF와 TEI를 중심으로 (Extending the MARTIF and TEI for Korean Lexical Entities)

백지원;최석두
- 정보관리학회지
- /
- 제18권2호
- /
- pp.295-322
- /
- 2001
본 연구는 사전이 가지는 특징과 구조를 분석하고, 모든 한국어 사전항목을 손실 없이 인코딩 할 수 있는 마크업체계를 제안하는 데 목적이 있다. 이를 위하여 국제표준인 MARTIF와 용어데이터의 상세한 인코딩형식을 제공하는 TEI를 분석하였다. TEI는 용어데이터베이스용 형식과 인쇄사전용 형식은 확연히 다른 형식이었다. 그리고 실제 사전 및 용어 관련 자료를 분석하여 한국어사전의 종합적인 미시구조를 파악하고, 그 미시구조를 MARTIF와 인쇄사전용 TEI에 대응시켜 적용가능성을 시험하였다. 그 결과, 두 형식 모두 한국어사전의 미시구조와 정확하게 매핑되지 않았으나 확장에 따라 두 형식 모두 사용가능 하다는 결론을 얻게 되었으며, 한국어사전의 특징을 살릴 수 있도록 하기 위하여 파악된 한국어사전의 미시구조 내용을 포함시켜서 새로운 두 가지 확장형식을 제안하였다.
PDF

중복 승인을 사용하지 않는 TCP의 코드화된 무선 메쉬 망에서의 효과 (Effectiveness of DUPACK-independent TCP in Coded Wireless Mesh Networks)

임찬숙
- 한국인터넷방송통신학회논문지
- /
- 제11권1호
- /
- pp.7-13
- /
- 2011
네트워크 코딩이 사용되는 무선 메쉬 망에서의 TCP 처리량 저하 문제가 잘 알려져 있는 것에 비하면 효과적인 해결방안은 아직 많이 제안되지 않은 편이다. 지금까지 제안된 대부분의 방안들은 네트워크 코딩의 부작용으로 나타나는 패킷 바뀜 현상을 완화하기 위해 하위 계층에서 패킷 순서를 맞추도록 하거나 코딩 기회의 희소성 문제를 해결하기 위해 네트워크 내부에서의 패킷 전송률을 조정하려고 한다. 본 논문에서는 기존의 표준 TCP들에 대한 모의실험을 통해, TCP 승인 패킷의 손실과 복제 또한 TCP의 처리량에 상당한 영향을 미칠 수 있음을 보여주고 코드화된 무선 메쉬 망에서의 TCP 처리량 문제의 해소를 위해서는 중복 승인에 의존하지 않는 TCP가 더 적합함을 보여준다.
https://doi.org/10.7236/JIWIT.2011.11.1.007 인용 PDF KSCI

H.263 인코딩 속도향상연구 (H.263 Encoding Speed up Research)

유환종;강의선;강석찬;김영환;김진구;임영환
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
- /
- pp.392-394
- /
- 1999
PSTN(Public Switch Telephone Network)에서 동영상을 전송하기 위해 H.263이라는 표준이 발표되었다. 저속의 전송률을 가지는 PSTN을 이용해서 영상회의나 영상전화 등을 구현하기 위해서는 기존의 코딩방식으로는 데이터를 전송하는데 문제점이 많았다. 이를 위해서 개발된 것이 H.263이다. H.263은 H.261에 기반을 두고 있으며 .261에 비해서 동일화질을 제공하는데 반정도의 데이터 양으로도 가능하게 해준다. 영상 압축 Encoder는 일반적으로 Decoder에 비하여 영상을 처리하는데 많은 시간이 소요된다. 그러나 VOD등과 같은 실시간으로 압축할 필요가 없는 경우에 대해서는 인코더가 많은 시간을 소비하더라고 큰 문제가 없는 반면에, 영상 회의나 영상 전화 등은 실시간 영상 Encoding, Decoding을 수행해야 한다. 그러기 위해서 고가의 하드웨어를 사용하게 된다. 이와 같은 이유에서 본 연구에서는 H.263을 소프트웨어만으로 Encoding 속도향상을 꾀하고자 하는 것이 이 논문의 목표이다.
PDF

검색결과 360건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)