• 제목/요약/키워드: word decoding

검색결과 57건 처리시간 0.026초

다중 언어로 작성된 문서 파일에 적용된 문자 인코딩 자동 인식 기법 (A Method for Automatic Detection of Character Encoding of Multi Language Document File)

  • 서민지;김명호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권4호
    • /
    • pp.170-177
    • /
    • 2016
  • 문자 인코딩은 문서를 컴퓨터에서 이용할 수 있도록 문자 코드 테이블을 이용하여 이진화하는 방법이다. 이진화된 문서를 읽기 위해서는, 문서에 적용된 문자 코드를 이용하여 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 각 언어별 자주 사용하는 단어를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 자주 사용하는 단어를 이용한 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 다국어 문서에서 기존의 방법보다 높은 문자 인코딩 인식률을 보인다. 주로 표현하는 언어의 비중이 20% 미만일 경우, 기존의 방법은 약 50%의 문자 인코딩 인식률을 보였으나, 제안하는 방법은 문자 인코딩에서 표현하는 언어의 비중과는 상관없이 96% 이상의 문자 인코딩 인식률을 보였다.

가변 LDPC 부호의 성능과 반복횟수 통계 (Performance and Iteration Number Statistics of Flexible Low Density Parity Check Codes)

  • 서영동;공민한;송문규
    • 한국정보통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.189-195
    • /
    • 2008
  • WiMAX 표준인 IEEE 802.16e의 OFDMA 물리 계층에서는 채널 환경과 다양한 전송 성능의 요구에 부응하기 위해서 다양한 부호율과 부호 길이를 갖는 총 114가지의 가변 LDPC 부호를 정의하고 있다. 본 논문에서는 AWGN 채널에서 Min-Sum 복호 알고리즘을 사용한 시뮬레이션을 통해 부호율 및 부호 길이에 따른 LDPC 부호들의 성능을 평가한다. 부호율은 감소하고 부호의 길이는 증가할수록 우수한 성능을 보임을 확인할 수 있었다. 특히 각각 동일한 부호율에 대해 2가지의 LDPC 부호가 정 의 되 어 있는 2/3과 3/4의 부호율의 경우는 2/3A와 3/4B이 2/3B와 3/4A보다 우수한 성능을 보임을 확인하였다. 또한 반복횟수의 통계적 분석을 통한 반복횟수의 확률밀도함수를 통해 복호 복잡도를 파악하고, WER 성능을 추정하였다. 이상의 결과는 LDPC 복호기의 설계에서 부호의 성능과 복호 복잡도간의 절충을 위해 사용될 수 있다.

언어 모델 네트워크에 기반한 대어휘 연속 음성 인식 (Large Vocabulary Continuous Speech Recognition Based on Language Model Network)

  • 안동훈;정민화
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.543-551
    • /
    • 2002
  • 이 논문에서는 20,000 단어급의 대어휘를 대상으로 실시간 연속음성 인식을 수행할 수 있는 탐색 방법을 제안한다. 기본적인 탐색 방법은 토큰 전파 방식의 비터비 (Viterbi) 디코딩 알고리듬을 이용한 1 패스로 구성된다. 언어 모델 네트워크를 도입하여 다양한 언어 모델들을 일관된 탐색 공간으로 구성하도록 하였으며, 프루닝(pruning) 단계에서 살아남은 토큰들로부터 동적으로 탐색 공간을 재구성하였다. 용이한 후처리를 위해 워드그래프 및 N개의 최적 문장을 출력할 수 있도록 비터비 알고리듬을 수정하였다. 이렇게 구성된 디코더는 20,000 단어급 데이터 베이스에 대해 테스트하였으며 인식률 및 RTF측면에서 평가되었다.

영양유전체학(Nutrigenomics)의 최근 경향 (Current Trends in Nutrigenomics)

  • 최봉혁;김종배;도명술
    • 한국식품영양과학회지
    • /
    • 제34권10호
    • /
    • pp.1642-1654
    • /
    • 2005
  • With the decoding of human genome in 2004 and the recent development in nutritional science there has been an integration of molecular biology and nutrition. As a consequenc a now word ' molecular nutrition ' has been formed and recently the word 'nutrigenomics' is coined and widely being used. The field of science that showed the most positive result from grafting the science of nutrition and nutrigenomics is obesity. In 1994, Jeffrey Friedman from Rockeffeler University announced that ob gene and obesity has a close relationship and since then there's been a huge research done on genes related to obesity from the molecular nutrition's Point of view. Even now there are many genes presented which are supposed to be related to obesity and big efforts are put into finding what exactly those genes do. Moreover studying only in the context of genes was not enough so functional genomics, which is the study of the functions of cells and the functions and effects between genes and Protein Products, is being studied. This review article discusses the relationship between nutrition and genes and the general idea of nutrigenomics. The article also discusses about the current research status on these subjects.

PVDHMM을 이용한 음소열 기반의 SDR 응용 (Spoken Document Retrieval Based on Phone Sequence Strings Decoded by PVDHMM)

  • 최대림;김봉완;김종교;이용주
    • 대한음성학회지:말소리
    • /
    • 제62호
    • /
    • pp.133-147
    • /
    • 2007
  • In this paper, we introduce a phone vector discrete HMM(PVDHMM) that decodes a phone sequence string, and demonstrates the applicability to spoken document retrieval. The PVDHMM treats a phone recognizer or large vocabulary continuous speech recognizer (LVCSR) as a vector quantizer whose codebook size is equal to the size of its phone set. We apply the PVDHMM to decode the phone sequence strings and compare the outputs with those of a continuous speech recognizer(CSR). Also we carry out spoken document retrieval experiment through PVDHMM word spotter on the phone sequence strings which are generated by phone recognizer or LVCSR and compare its results with those of retrieval through the phone-based vector space model.

  • PDF

Energy-efficient Reconfigurable FEC Processor for Multi-standard Wireless Communication Systems

  • Li, Meng;der Perre, Liesbet Van;van Thillo, Wim;Lee, Youngjoo
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제17권3호
    • /
    • pp.333-340
    • /
    • 2017
  • In this paper, we describe HW/SW co-optimizations for reconfigurable application specific instruction-set processors (ASIPs). Based on our previous very long instruction word (VLIW) ASIP, the proposed framework realizes various forward error-correction (FEC) algorithms for wireless communication systems. In order to enhance the energy efficiency, we newly introduce several design methodologies including high-radix algorithms, task-level out-of-order executions, and intensive resource allocations with loop-level rescheduling. The case study on the radix-4 turbo decoding shows that the proposed techniques improve the energy efficiency by 3.7 times compared to the previous architecture.

Discriminative Training of Stochastic Segment Model Based on HMM Segmentation for Continuous Speech Recognition

  • Chung, Yong-Joo;Un, Chong-Kwan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권4E호
    • /
    • pp.21-27
    • /
    • 1996
  • In this paper, we propose a discriminative training algorithm for the stochastic segment model (SSM) in continuous speech recognition. As the SSM is usually trained by maximum likelihood estimation (MLE), a discriminative training algorithm is required to improve the recognition performance. Since the SSM does not assume the conditional independence of observation sequence as is done in hidden Markov models (HMMs), the search space for decoding an unknown input utterance is increased considerably. To reduce the computational complexity and starch space amount in an iterative training algorithm for discriminative SSMs, a hybrid architecture of SSMs and HMMs is programming using HMMs. Given the segment boundaries, the parameters of the SSM are discriminatively trained by the minimum error classification criterion based on a generalized probabilistic descent (GPD) method. With the discriminative training of the SSM, the word error rate is reduced by 17% compared with the MLE-trained SSM in speaker-independent continuous speech recognition.

  • PDF

최대 비트슬립 정정범위를 가지는 복합 버스트 동기/에러 검출 시스템 (Combined burst synchronization/error detection systems maximizing bit slip correction ranges)

  • 최양호
    • 한국통신학회논문지
    • /
    • 제22권7호
    • /
    • pp.1477-1486
    • /
    • 1997
  • Conventioally the decoding methods and the design of coset codes for burst synchronization and error detection have been based on the concept that slips occuring to the right or to the left with respect to a reference timing are corrected. In this paper we newly approach to the design of coset codes relying on the condition that only a single code word can exists in an observation interval, which provides an extentended view on the conventional approach. A theorem concerning the condition is presented. A combined burst synchronization and error detection system with maximum slip correction capability have been devised based on the theorem and a detection method is falsely accepted in the presented of channel errors. The false acceptance probabilities of the system are derived and its performance is analyzed through computer computation using the derived results.

  • PDF

가중치가 부과된 Bit-flipping 기법을 이용한 LDPC 코딩 (A Low Density Parity Check Coding using the Weighted Bit-flipping Method)

  • 조경현;나극환
    • 전자공학회논문지 IE
    • /
    • 제43권4호
    • /
    • pp.115-121
    • /
    • 2006
  • 본 논문에서는 통신 시스템에서 채널 전송에 의한 데이터의 오류 체크와 정정문제에 대해서 제안하였다. 제안된 LDPC 코드는 VDSL 시스템에서의 AWGN 채널 모델링에 의해 최소화된 채널 에러를 위해 사용된다. LDPC 코드는 낮은 밀도 패리티비트를 사용하기 때문에, 수학적인 복잡도가 낮고 처리 시간이 짧다. 또한 LDPC 코드의 성능은 반복 복호 알고리즘에서 긴 코드 워드에 대해 터보 코드보다 더 나은 성능을 가지고 있다. 제안된 시스템의 송신기에서 발생 행렬에 의해서 부호어가 발생되고, 수신기에서 사용된 에러 정정 알고리즘은 가중치를 갖는 Bit-flipping 방식이다. 이 방식은 기존의 Bit-flipping 방식과 달리 더 정확한 에러를 검출하고, 정정하기 위해 발생된 패리티 비트에 대해서 가중치를 주어 에러 정정을 하는 방식이다. 제안된 가중치를 갖는 Bit-flipping 알고리즘은 기존의 Bit-flipping 알고리즘에 비해서 1 dB 이상의 이득 개선을 확인할 수 있었다.

Reed-Solomon부호의 복호를 위한 수정 유클리드 알고리즘의 효율적인 반복 셀 구조 (An Efficient Recursive Cell Architecture for Modified Euclidean Algorithm to Decode Reed-Solomon Code)

  • 김우현;이상설;송문규
    • 전자공학회논문지C
    • /
    • 제36C권1호
    • /
    • pp.34-40
    • /
    • 1999
  • Reed-Solomon(RS) 부호는 CD-ROM, HDTV, ATM 그리고 디지털 VCR 등 여러 분야에서 연집(burst) 오류를 정정하기 위해 적용되어 왔다. RS 부호를 복호하기 위해서는 Berlekamp-Massey 알고리즘, 유클리드 알고리즘 그리고 수정 유클리드 알고리즘(MEA)이 개발되었다. 최근에는 이들 중에서도 MEA가 가장 자주 사용되었다. 본 논문은 부호의 복호에 사용되는 MEA을 위한 효율적인 반복 셀 구조를 제안한다. 제안된 구조의 두 가지 주된 특징은 다음과 같다. 첫째, MEA의 수행에 있어 기존의 방법[1] 보다 약 25% 적은 수의 클럭 사이클을 이용한다. 둘째, MEA 수행에 소비되는 클럭 사이클의 수가 부호의 길이 n보다 큰 경우 MEA 셀의 개수를 줄일 수 있었으며, 수신된 워드를 위한 버퍼 요구량 또한 줄일 수 있었다. 예로써 (128,124) RS 부호에 대한 MEA 회로가 VHDL을 통하여 기술되고 검증된다.

  • PDF