통합 검색 | Korea Science

오류가 발생한 멀티바이트 인코딩 데이터의 인코딩 기법 판별 알고리즘 개선 (Improvement of Encoding Detection Algorithm for Multi-byte Encoded Data with Errors)

배준우;김선범;박희진
- 한국차세대컴퓨팅학회논문지
- /
- 제13권2호
- /
- pp.18-25
- /
- 2017
인코딩(encoding)은 컴퓨터에서 사용되는 음성, 영상 및 텍스트 문자를 부호화하는 방법을 가리킨다. 그러므로 특정 데이터를 열람하기 위해서는 해당 인코딩 정보를 알아야하며, 데이터마다 인코딩을 판별해주는 알고리즘들이 존재한다. 하지만 실제 음원이나 문서를 송수신하는 과정에서 패킷 손실이 발생할 수 있으며, 특히 무선 통신망에서 패킷 스니핑으로 정보를 가로챌 경우 손실률은 더욱 증가되어 인코딩 기법 판별에 어려움이 발생한다. 본 논문에서는 이러한 오류가 발생한 데이터의 인코딩 기법 판별율을 향상시키기 위해 기존의 문자 인코딩 기법 판별 프로그램인 'uchardet'에 Bit-shift 알고리즘을 적용하여 성능 향상을 이루었다. 알고리즘의 성능 평가를 위해 임의의 한글 및 일본어 텍스트 파일에 손실률(loss rate)을 적용하여 부분적으로 데이터가 소실된 인코딩 파일을 생성하여 결과를 비교하였다. 그 결과, 패킷이 손실된 데이터에서 Bit-shift 알고리즘을 적용한 'uchardet-bitshift' 경우 기존의 알고리즘보다 더 나은 성능을 보였다. 한국어 인코딩의 경우 기존의 uchardet는 0.005% 손실률까지 100%의 정확도를 보이고 1%보다 높은 손실률에서는 인코딩을 전혀 판별해 내지 못한데 비해, Bit-shift 알고리즘을 적용할 경우 0.05%의 손실률에도 100%의 정확도를 보였으며 그보다 큰 손실률에서도 해당 인코딩을 판별해냈다. 또한 한자어를 많이 포함하는 일본어의 경우 손실률이 높아질수록 중국어 인코딩으로 잘못 판별하는 경향을 보였다. 시뮬레이션 분석 결과, Bit shift 알고리즘을 추가하여 기존 인코딩 기법 판별 알고리즘의 개선이 가능하였다.

64kbit/s(7 kHz) Codec을 경유한 연속음성의 인식 (Recognition of Continuous speech via 64kbit/s(7 kHz) Codec)

정현열
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
- /
- pp.125-127
- /
- 1993
오디오 혹은 비디오화의, 방송 고품질전화 등의 음성신호의 전송을 위해 마련된 CCITT Recommendation G.722에 의거 Codec을 구성하고 이를 통과한 연속음성을 CMU의 불특정 화자 연속음성인식 시스템인 SPHINX에 입력하여 인식률을 조사 한 후 CODING전의 인식결과와 비교하였다. 이때 CODEC은 크게 네 부분(Trans Quarature Mirror Filter, Encoder, Decoder, Receive QMF)으로 구성하고 입력음성 데이터는 150화자에 의한 1018문장을 훈련용으로, 140문장을 테스트용으로 하였을 때의 단어 인식률을 인식률로 하였다. 또 이때 특징벡터로는 12차 Melcepstrum 계수를 사용하였다. 인식결과 코딩전(close talk Mic를 이용하여 직접입력)의 단어 인식률이 86.7%인데 비해 코딩후의 인식률은 85.6%로 나타나 약 1%의 인식률 저하를 가져와 코딩으로 인한 Error에 비해 비교적 양호한 결과를 얻을 수 있었다. 인식률 저하의 원인으로서는 코딩시의 BER(Bit Error Rate)에 의한 것으로 생각된다.
PDF

6G URLLC를 지향한 교차 상관 관계 중첩 코딩을 사용하는 비직교 다중 접속의 향상된 총 전송률에 관한 연구 (A Study on Improved Sum Rate of Cross-Correlated SC NOMA toward 6G URLLC)

정규혁
- 융합정보논문지
- /
- 제11권9호
- /
- pp.1-7
- /
- 2021
최근 비직교 다중 접속에 대해, 단지 자체 상관 중첩 코딩 기법만 고찰되었기 때문에, 본 논문은 비직교 다중 접속에 대한 교차 상관 관계 중첩 코딩 기법을 제한한다. 먼저, 제안된 교차 상관 관계 중첩 코딩 기법의 총 전송률의 폐쇄형 수식을 유도한다. 다음 수치 해석을 기반으로 하여, 제안된 교차 상관 관계 중첩 코딩 기법의 총 전송률이 기존의 자체 상관 관계 중첩 코딩 기법의 총 전송률보다 향상된 것을 입증한다. 또한, 강 채널 사용자에 대해, 기존의 자체 상관 관계 중첩 코딩 기법과 비교하여, 제안된 교차 상관 관계 중첩 코딩 기법의 SNR 이득이 대략 15 임을 보여준다. 결론적으로, 제안된 교차 상관 관계 중첩 코딩 기법은 6G URLLC를 위한 유망한 기술로 고려될 수 있다.
https://doi.org/10.22156/CS4SMB.2021.11.09.001 인용 PDF KSCI

다중 언어로 작성된 문서 파일에 적용된 문자 인코딩 자동 인식 기법 (A Method for Automatic Detection of Character Encoding of Multi Language Document File)

서민지;김명호
- 정보과학회 컴퓨팅의 실제 논문지
- /
- 제22권4호
- /
- pp.170-177
- /
- 2016
문자 인코딩은 문서를 컴퓨터에서 이용할 수 있도록 문자 코드 테이블을 이용하여 이진화하는 방법이다. 이진화된 문서를 읽기 위해서는, 문서에 적용된 문자 코드를 이용하여 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 각 언어별 자주 사용하는 단어를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 자주 사용하는 단어를 이용한 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 다국어 문서에서 기존의 방법보다 높은 문자 인코딩 인식률을 보인다. 주로 표현하는 언어의 비중이 20% 미만일 경우, 기존의 방법은 약 50%의 문자 인코딩 인식률을 보였으나, 제안하는 방법은 문자 인코딩에서 표현하는 언어의 비중과는 상관없이 96% 이상의 문자 인코딩 인식률을 보였다.
https://doi.org/10.5626/KTCP.2016.22.4.170 인용 PDF KSCI

문서 파일의 문자 인코딩 자동 인식 기법의 설계 및 구현 (Design and Implementation Automatic Character Set Encoding Recognition Method for Document File)

서민지;김명호
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2015년도 추계학술발표대회
- /
- pp.95-98
- /
- 2015
문자 인코딩은 컴퓨터에 저장하거나 네트워크상에서 전송하기 위해 문서를 이진화 하는 방법이다. 문자 인코딩은 고유의 문자 코드 테이블을 이용하여 문서를 이진화 하기 때문에, 문서에 적용된 문자 인코딩과 다른 문자 인코딩을 이용하여 디코딩 하면 원본과 다른 문서가 출력되어 문서를 읽을 수 없게 된다. 따라서 문서를 읽기 위해서는 문서에 적용된 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 단어 데이터베이스를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 제안하는 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 높은 문자 인코딩 인식률을 보인다.
https://doi.org/10.3745/PKIPS.y2015m10a.95 인용 PDF

NS2를 이용한 향상된 네트워크 코딩 기법의 성능평가 (Performance Evaluation of a Enhanced Network Coding Scheme using NS2)

김관웅;김용갑;김변곤
- 한국정보통신학회논문지
- /
- 제17권10호
- /
- pp.2281-2287
- /
- 2013
네트워크 코딩은 통신의 새로운 패러다임이다. 네트워크 코딩에서 중간 노드는 입력 패킷을 조합하여 새로운 패킷을 생성하여 이웃 노드에게 방송한다. 네트워크 코딩은 실제 네트워크에 폭넓게 적용될 수 있기 때문에 정보 이론의 주요 연구 분야로 빠르게 떠오르고 있다. 네트워크 코딩은 무선 멀티홉 네트워크에서 처리량과 채널 효율을 향상시킬 것으로 예상된다. 관련 선행연구들이 무선 Ad-hoc 네트워크 분야에서 활발히 이루어지고 있다. 우리의 연구에서 중간노드는 네트워크 코딩을 하기위해서 단일홉 양방향 패킷을 식별한다. 우리는 제안된 기법이 네트워크 패킷의 디코딩 성공률을 증가시킬 수 있을 것으로 기대한다. 컴퓨터 시뮬레이션에서 제안된 네트워크 코딩기법은 코딩 이득과 패킷 전송률에서 기존의 네트워크 코딩기법보다 나은 성능을 얻을 수 있었다.
https://doi.org/10.6109/jkiice.2013.17.10.2281 인용 PDF KSCI

통계정보 분류의 자동코딩 성능 실험 연구 (An Experimental Study on the Automatic Coding System for Statistical Information Classification in Korea)

남영준;안동언
- 정보관리학회지
- /
- 제17권4호
- /
- pp.27-45
- /
- 2000
인구센서스와 같은 국가 통계정보는 국가의 미래 투자계획과 정책수립을 위한 중요한 기초데이터이다. 그러나 데이터의 코딩과정이 모두 수작업으로 이루어지기 때문에 결과의 일관성 결여와 시간과 인력이 너무 많이 소요된다는 것 등이 문제점으로 지적되고 있다. 따라서 본 연구에서는 한국 산업표준 분류표에 근거한 자동코딩시스템을 개발하여 코딩과정을 수작업으로 처리할 때 발생하는 문제점을 해결하였다. 시스템의 지식베이스로는 학습이론을 사용하여 저자가 새로이 개발한 복수의 전거어 사전들을 활용하였다. 실험한 결과, 생성률은 99.5%를, 정확률은 83.3%라는 결과를 얻었다. 따라서 이 시스템은 실제 통계데이터의 자동코딩과정에 사용될 수 있으며, 국가 통계정보의 효율적 분석에 매우 유용하게 사용될 수 있을 것이다.
PDF

우리나라 도로명주소를 활용한 지오코딩 및 역 지오코딩 기법 개발 (Development of Geocoding and Reverse Geocoding Method Implemented for Street-based Addresses in Korea)

석상묵;이지영
- 한국측량학회지
- /
- 제34권1호
- /
- pp.33-42
- /
- 2016
현재 국내 포털사이트 및 기타 공공기관에서 제공하는 지오코딩 서비스는 어드레스-포인트 지오코딩 기법을 활용한다. 이 기법은 매우 높은 위치 정확도를 가지는 반면, 데이터의 품질이 지오코딩 결과물에 큰 영향을 미치며, 3차원 주소에 대한 지오코딩 및 역 지오코딩에 활용될 수 없다는 한계점이 있다. 이에 본 연구에서는 미국 센서스 국에서 개발한 도로 기반 지오코딩 기법에 기반 하여, 우리나라 도로명주소를 활용한 지오코딩 기법을 제시한다. 이때, 본 연구에서 제안하는 지오코딩 기법은 (1) 단일 건물을 표현하는 2차원 주소뿐만 아니라 지하 건축물 또는 실내 공간까지 포함하는 3차원 주소의 지오코딩을 지원하는 지오코딩 기법과, (2) 특정 지점을 주소로 반환하는 역지오코딩 기법으로 구분된다. 실제 연구 대상지역을 대상으로 제안한 지오코딩 기법을 적용한 결과, 도로명주소의 지오코딩 시 82.63% 매칭률, 역 지오코딩 시 98.5% 매칭률을 가지는 것으로 나타났으며, 평균 위치 오차가 1.7미터로 나타남에 따라 제안한 지오코딩 기법을 활용한 위치 기반 서비스가 가능함을 보였다. 지오코딩 기법 개발에 있어, 본 연구에서는 주소 정규화를 위한 파싱 알고리즘 및 농촌지역, 도로종속 구간 등의 일부 지역을 고려하지 않고 수행하였다. 이에 향후 연구에서는 이와 같은 사항을 고려한 개선된 지오코딩 기법이 제시될 필요가 있다.
https://doi.org/10.7848/ksgpc.2016.34.1.33 인용 PDF KSCI KPUBS HTML

Intra 코딩 기반의 위상 홀로그램 압축 (Intra coding based phase hologram compression)

김진겸;오관정;김진웅;김동욱;서영호
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 하계학술대회
- /
- pp.321-322
- /
- 2020
본 논문에서는 Intra 코딩 기반의 위상 홀로그램 압축 방법을 제안한다. 제안하는 방법은 다음과 같다. 홀로그램을 Intra 코딩의 블록 단위로 세그먼트를 나누는 과정, Intra 코딩의 예측을 고려한 위상 펼침 과정, H.265/HEVC 입력을 고려한 양자화 과정, 마지막으로 H.265/HEVC를 이용한 압축과정으로 구성된다. 제안한 알고리즘은 위상정보에 아무런 전후처리를 하지않고 H.265/HEVC를 압축한 결과보다 100:1 이상의 고압축률 구간에서 압축효율이 향상되었다.
PDF

니블 런 랭스 코드를 이용한 허프만 코딩 (Huffman Coding using Nibble Run Length Code)

백승수
- 한국컴퓨터정보학회논문지
- /
- 제4권1호
- /
- pp.1-6
- /
- 1999
본 연구는 정지 영상을 무손실 압축하기 위해 영상 각 화소의 값 상위 4비트의 중복성을 이용하여 런랭스 코딩 전처리로 1차 압축을 수행한 후 허프만 코딩으로 무손실 압축률을 향상시키는 새로운 방법을 제시한다. 본 연구에서 제안된 방법은 영상의 종류에 따라 자동적으로 허프만 코딩과 전처리 허프만 코딩을 선택하도록 하고, 전처리는 상위 4비트와 하위 4비트를 분리하여 상위 4비트의 중복성을 이용하여 런 랭스 코딩을 하여 기존의 일반적인 허프만 방법보다 더 나은 결과를 나타내었다.
PDF

검색결과 219건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)