• 제목/요약/키워드: 코드 압축

검색결과 349건 처리시간 0.022초

명령어 주소 엔트로피 값을 이용한 실행 압축 해제 방법 연구 (A Study on Generic Unpacking using Entropy of Opcode Address)

  • 이원래;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권3호
    • /
    • pp.373-380
    • /
    • 2014
  • 악성코드는 분석가가 탐지 및 분석을 어렵게 하기 위하여 실행 압축 기술을 이용하고 있다. 최근에는 실행 압축 기술이 적용된 코드에 대응하기 위하여 실행 압축 기술에 대한 연구가 진행되고 있다. 실행 압축 기술은 압축된 실행코드를 해제해야 동작이 가능하여 실행 코드를 압축하는 과정에서 반복되는 코드를 이용한다. 따라서 일반 코드와 비교하여 반복되는 코드가 많아서 동일한 코드가 유사한 주소 값을 가지고 수행되는 특성이 있다. 코드영역을 일정한 영역으로 구분하면 실행 압축이 해제되는 코드는 원래의 코드와 비교하여 낮은 엔트로피값을 갖는다. 이를 이용하면 실행 압축 알고리즘을 알지 못한 상태에서 실행 압축 여부를 판단할 수 있으며 실행 압축코드를 해제할 수 있다. 본 논문에서는 압축이 해제되는 코드에서 명령어의 주소 값이 작은 엔트로피값을 갖는다는 것을 이용하여 실행압축을 해제하는 방법을 제안한다.

거리 벡터(Distance-Vector)를 이용한 ARM Thumb 코드 압축 (ARM Thumb Code Compression using Distance-Vector)

  • 안영훈;문성림;위영철;김동윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.400-402
    • /
    • 2006
  • 임베디드 시스템에서의 코드 압축은 효율성 제고를 위한 필수적인 기법이다. ARM, MIPS등 많은 프로그램 코드에서 현재 시도되고 있으나 한계를 나타내고 있다. 특히, Arm Thumb 코드는 다른 코드 압축과 달리, 아직까지 15%-20%정도의 압축 효율을 보이고 있다. 본 논문은 다양한 값을 갖는 코드의 데이터이지만, 일정 부분에서 특정 값의 발생빈도가 높은 Thumb 코드의 분포를 분석, 그 특성을 활용하였다. 즉, 현재 압축하고자 하는 필드의 값을 코드의 앞부분과 비교해 나가면서, 유사도를 분석 및 압축하고, 거리 정보를 기록하는 방식의 거리 벡터 기법의 압축방법을 고안, 적용하였고, 그 결과 압축효율이 20-25%로 기존의 방법에 비하여 약 5%정도의 효율 향상을 가져 왔다.

  • PDF

AMR 음성 압축기를 위한 효율적인 코드북 검색 방법 (Efficient Codebook Search Method for AMR Speech Codec)

  • 이도윤;박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.93-96
    • /
    • 2001
  • ACELP 구조의 음성 압축기는 우수한 음질을 제공하지만 최적의 코드 벡터를 구하기 위한 계산량이 상당히 많은 단점이 있다. 이를 해결하기 위해서 본 논문에서는 AMR 음성 압축기의 코드북을 매우 효율적으로 검색하는 새로운 방법을 제안한다. 제안하는 코드북 검색 방법은 완전 순차적인 검색 방법을 사용하여 대략적인 코드 벡터를 구하고, 코드 벡터의 각 펄스들의 중요도를 계산하여 중요도가 낮은 펄스를 새로운 펄스로 교환하는 펄스 교환 과정을 수행하여 코드 벡터의 성능을 향상시키는 방법을 사용한다. 또한, AMR 음성 압축기의 구조에 맞도록 트랙별로 이동하면서 순차적으로 코드북을 검색하여 다수의 대략적인 코드벡터를 찾은 후, 각 코드 벡터에 대하여 펄스 교환 과정을 수행하여 최적의 코드 벡터를 구한다. 제안한 코드북 검색 방법을 AMR 음성 압축기의 모든 모드에 적용하여 코드북 검색을 위한 계산량과 성능을 측정하였으며, 모든 모드에 대하여 매우 적은 계산량으로 동등한 성능을 가지는 것을 확인하였다

  • PDF

내장형 자바를 위한 클래스 파일의 바이트 코드 압축 (Bytecode Compression Method for Embedded Java System)

  • 이영민;맹혜선;강두진;김신덕;한탁돈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.424-426
    • /
    • 1999
  • 본 논문에서는 추후 여러 내장형 기기들을 대체하게 될 내장형 자바가상머신에서 효율적으로 메모리를 사용하기 위해 바이트코드 압축 방법을 제시하고 있다. 이 압축 방법은 기본 코드 블록을 내장형 자바가상머신에서 사용하지 않는 명령어군과 한 바이트의 인덱스를 이용하여 사전을 구축하고, 사전에 등록되어 있는 반복되는 기본 코드 블록들을 이 두 바이트로 대체함으로써 압축하는 것이다. 그러나, 압축하는데 있어서 압축효율 뿐만 아니라 바이트 코드의 수행 속도도 고려하여야 하므로 압축으로 인한 수행 오버헤드를 최소화하여 수행시간에 영향을 적게 주도록 압축 방법을 단순화하여 설계하였다. 본 논문에서 제시하고 있는 압축 방법을 사용하여 실제 사용되는 자바 API(Application Programming Interface)들을 압축함으로써 메모리에 적재되는 바이트 코드를 최대 36%까지 줄이는 결과를 얻어낼 수 있다.

  • PDF

메쉬의 계층 및 연산코드 기반 3차원 메쉬 압축 (3D Mesh Compression Based on Layer of Mesh and Operation Code)

  • 이민정;권용무;김창헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.415-417
    • /
    • 2002
  • 날로 커져가는 3D 모델을 효율적으로 사용하기 위한 노력으로 압축처리 방법들이 연구되고 있다. 본 논문에서는 3D 모델의 메쉬를 Layer로 분할하여 Vertex Layer와 Triangle Layer를 생성 후, 삼각형들을 몇가지 연산코드로 분류하여 압축(compression)하는 방법을 제안한다. Triangle Layer는 기본 정점으로부터 연결된 선분의 정점들로 이루어진 Vertex Layer의 쌍을 이용하여 만들어진다. 이 Triangle Layer에 해당 되는 삼각형들의 연결 정보를 제안한 연산코드로 분류하고, 이것을 엔트로피 코딩하여 3D 모델을 압축한다. 이 기법은 삼각형의 형태를 기준으로 한 개나 두 개의 삼각형을 하나의 연산코드로 분류하거나 삼각형의 연결 상황에 따라 하나의 연산코드로 분류하여 연결정보를 표현한다. 복원(decompression)시에는 연산 코드를 이용하여 삼각형의 연결정보를 뽑아내면 원 상태의 3D 모델을 획득할 수 있다. 이 방법은 연결 정보를 무손실 압축하는 방법으로, 지금까지 제안된 압축기법과 비교할 때, 간단하면서도 월등한 압축 효과를 볼 수 있다.

  • PDF

허프만 부호화를 이용한 영문 텍스트 압축 (English Text Compression using Huffman Coding)

  • 구자룡;최현호;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.69-71
    • /
    • 2016
  • 본 논문에서는 JPEG, MPEG 등 표준압축 기술에 사용되고 있는 무손실 압축 기법 중 Huffman coding 을 통해 영문 텍스트를 압축하고 압축률을 구해보았다. 각 글자를 Huffman coding 의 원리에 기초하여 빈도수에 따라 코드를 결정한다. 결정된 코드에 따라 영문 텍스트를 변환하여 압축을 진행한다. 본 연구에서는 MATLAB을 이용하여 영문 텍스트의 각 글자 빈도수를 구하였고 Huffman coding 과정을 수행하였다. 또한 영문 텍스트를 코드로 변환과정을 수행하여 아스키코드와 압축률을 비교하였다. Huffman coding 은 아스키코드만으로 이용하는 것보다 1.89:1 의 압축률을 나타내었다.

  • PDF

엔트로피 값 변화 분석을 이용한 실행 압축 해제 방법 연구 (A Study on Generic Unpacking using Entropy Variation Analysis)

  • 이영훈;정만현;정현철;손태식;문종섭
    • 정보보호학회논문지
    • /
    • 제22권2호
    • /
    • pp.179-188
    • /
    • 2012
  • 악성코드의 탐지 및 분석 회피 기술 중 실행 압축 기술은 악성코드의 용량을 줄이고 분석가가 코드를 분석할 때 혼란을 주도록 코드를 변형하고 있다. 따라서 악성코드의 확산이 용이해지고 분석하는데 시간이 오래 걸려 신속한 대응이 어렵게 만들고 있다. 최근에는 이러한 실행 압축된 악성코드에 대응하기 위하여 실행 압축 해제 관련 연구가 진행되고 있다. 실행 압축 프로그램은 실행되면 실행 압축을 해제하게 된다. 실행 압축 해제 때 압축되어 있던 데이터가 해제 되면서 실행 압축 파일의 데이터가 변경되거나 추가되어 데이터의 변화가 생기게 된다. 이때 이러한 변화 때문에 실행 압축 파일의 엔트로피 값이 변화하게 된다. 실행 압축 해제가 끝나게 되면 이러한 데이터 변화가 끝나고 실제적인 프로그램이 수행되므로 엔트로피 값이 변화하지 않게 된다. 그러므로 이러한 성질을 이용하여 실행 압축 해제되는 시점을 찾게 되면 실행 압축 알고리즘에 상관없이 실행 압축을 해제 할 수 있게 된다. 본 논문에서는 실행 압축 파일의 압축 해제 때의 엔트로피 값 변화량을 보고 실행 압축 해제가 끝나는 시점을 판단하여 실행 압축을 해제하는 방법을 제안한다.

스위칭 동작 최소화를 이용한 저전력 데이터 압축 알고리즘 (Low Power Data Compresson Algorithm by Minimizing Switching Activity)

  • 전성식;조준동
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권6호
    • /
    • pp.722-728
    • /
    • 1999
  • 본 논문의 내용은 데이터 전송시 코드의 변화량을 줄여서 시스템이 소비하는 전략량을 감축하기 위한 효율적인 데이터 압축 알고리즘에 관한 것이다. 기존의 압축방법은 코드의 길이를 줄이는 것만을 목적으로 하였고 전송시 스위칭 동작량은 고려하지 않았다. 연속된 문자 코드의 서로 다른 비트 수를 해밍거리로 표시하는데 본 논문에서는 허프만 부호화 알고리즘에 의하여 발생된 압축률을 유지하면서 허프만코드를 재구성하여 스위칭 동작 횟수를 줄여 소비전력량을 줄이는 알고리즘을 제안한다. 실험결과 제안된 알고리즘은 아스키코드에 비하여 평균 15% , 허프만코드에 비하여 평균 4.6% 의 전력감축효과를 보였다.제안된 알고리즘은 압축률 개선에도 응용가능하다.

휴대장치를 위한 고속복원의 프로그램 코드 압축기법 (A Program Code Compression Method with Very Fast Decoding for Mobile Devices)

  • 김용관;위영철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.851-858
    • /
    • 2010
  • 대부분의 휴대기기는 보조 기억장치로 NAND flash 메모리를 사용하고 있다. 또한, firmware의 크기를 줄이고 NAND flash로부터 주기억장치로 로딩하는 시간을 줄이기 위해서 압축된 코드를 NAND flash에 저장한다. 특히, 압축된 코드는 매우 빠르게 해제가 되어야 demand paging 이 적용 가능하게 된다. 본 논문에서는 이를 위하여 새로운 사전식 압축 알고리즘을 제안한다. 이 압축방식은 기존의 LZ형식과는 다르게 현재 압축하고자 하는 명령어(instruction)가 참조된 명령어와 같지 않을 경우, 프로그램 코드의 명령어의 특성을 이용하여 두 명령어의 배타 논리합(exclusive or) 값을 저장하는 방식이다. 또한, 압축 해제 속도를 빠르게 하기 위해서, 비트 단위의 연산을 최소화한 압축형식을 제공한다. 실험결과 zlib과 비교해서 최대 5배의 압축해제 속도와 4%의 압축률 향상이 있었으며, 이와 같이 매우 빠른 압축해제 속도에 따라 부팅 (booting) 시간이 10~20% 단축되었다.

악성코드 실행과 은닉을 위한 다중 압축 연구 (A Study of Multiple Compression for Malicious Code Execution and Concealment)

  • 이정훈;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.299-302
    • /
    • 2010
  • 최근의 악성코드는 백신에 쉽게 탐지 되지 않기 위해 바이러스를 압축파일로 변조시켜 악성코드 패턴을 지연하는 추세이다. 시중에 나와 있는 수많은 백신엔진 중에서는 압축파일로 변조된 악성코드 패턴 및 검사가 가능한지 알아 봐야한다. 본 논문은 다중 압축 파일로 위장 변조된 은닉된 악성코드의 패턴을 검사하여 검출되는지를 검사 엔진을 통해 모의실험을 한다. 은닉된 악성코드의 행위를 분석하며, 호스트 파일 변조와 시스템 드라이버 파일 감염 및 레지스트리 등록이 되는가를 분석한다. 본 연구를 통해 은닉형 악성코드의 검사와 백신 치료 효과를 강화시켜 악성코드로 인한 피해를 감소하는데 기여할 것이다.

  • PDF