• 제목/요약/키워드: 이진코드

검색결과 255건 처리시간 0.027초

다중 언어로 작성된 문서 파일에 적용된 문자 인코딩 자동 인식 기법 (A Method for Automatic Detection of Character Encoding of Multi Language Document File)

  • 서민지;김명호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권4호
    • /
    • pp.170-177
    • /
    • 2016
  • 문자 인코딩은 문서를 컴퓨터에서 이용할 수 있도록 문자 코드 테이블을 이용하여 이진화하는 방법이다. 이진화된 문서를 읽기 위해서는, 문서에 적용된 문자 코드를 이용하여 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 각 언어별 자주 사용하는 단어를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 자주 사용하는 단어를 이용한 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 다국어 문서에서 기존의 방법보다 높은 문자 인코딩 인식률을 보인다. 주로 표현하는 언어의 비중이 20% 미만일 경우, 기존의 방법은 약 50%의 문자 인코딩 인식률을 보였으나, 제안하는 방법은 문자 인코딩에서 표현하는 언어의 비중과는 상관없이 96% 이상의 문자 인코딩 인식률을 보였다.

확장된 비선형 이진수열의 상호상관관계 분석 (Analysis of Cross-Correlation of Extended Non-Linear Binary Sequences)

  • 최언숙;조성진;권숙희
    • 한국전자통신학회논문지
    • /
    • 제7권2호
    • /
    • pp.263-269
    • /
    • 2012
  • CDMA는 여러 사용자가 시간과 주파수를 공유하면서 각 사용자에게 확산코드라고 하는 서로 다른 의사잡음수열(pseudonoise sequence)을 할당한다. 각 사용자는 할당된 확산코드를 이용하여 송신할 신호를 변조한다. 신호를 변조하는데 사용하는 코드를 선택하는 것은 CDMA 시스템의 수행능력을 결정하는 데 있어 매우 중요하다. 왜냐하면 품질이 좋은 수열은 사용자들 사이의 신호들의 간섭을 줄이고 신호를 잘 복호할 수 있도록 하기 때문이다. 수신자는 데이터를 복호하기 위해 수신된 부호를 동기화한다. 서로 독립인 코드를 사용하는 것은 동시 다중접속을 가능하게 한다. 본 논문에서는 확산 스펙트럼 통신에서 다중접속 충돌을 최소화하고, 시스템의 보안을 증가시키고 사용자의 수를 늘이는데 도움을 주는 비선형 수열을 생성하고 상호상관관계를 분석한다.

OLE File Analysis and Malware Detection using Machine Learning

  • Choi, Hyeong Kyu;Kang, Ah Reum
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.149-156
    • /
    • 2022
  • 최근 전 세계적으로 사용되는 Microsoft Office 파일에 악성코드를 삽입하는 문서형 악성코드 사례가 증가하고 있다. 문서형 악성코드는 문서 내에 악성코드를 인코딩하여 숨기는 경우가 많기 때문에 백신 프로그램을 쉽게 우회할 수 있다. 이러한 문서형 악성코드를 탐지하기 위해 먼저 Microsoft Office 파일의 형식인 OLE(Object Linking and Embedding) 파일의 구조를 분석했다. Microsoft Office에서 지원하는 기능인 VBA(Visual Basic for Applications) 매크로에 외부 프로그램을 실행시키는 쉘코드, 외부 URL에서 파일을 다운받는 URL 관련 코드 등 다수의 악성코드가 삽입된 것을 확인했다. 문서형 악성코드에서 반복적으로 등장하는 키워드 354개를 선정하였고, 각 키워드가 본문에 등장하는 횟수를 feature 로 정의했다. SVM, naïve Bayes, logistic regression, random forest 알고리즘으로 머신러닝을 수행하였으며, 각각 0.994, 0.659, 0.995, 0.998의 정확도를 보였다.

HSI 정보와 퍼지 이진화 및 ART2 알고리즘을 이용한 신차량 번호판의 인식 (Recognition of a New Car License Plate Using HSI Information, Fuzzy Binarization and ART2 Algorithm)

  • 김광백;우영운;박충식
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.1004-1012
    • /
    • 2007
  • 본 논문에서는 HSI 정보와 신경 망의 비지도 학습 방법인 ART2 알고리즘을 이용하여 신 차량 번호판을 인식하는 방법을 제안한다. 제안된 방법은 차량의 영상에서 번호판 영역을 추출하는 부분과 추출된 번호판 영역의 문자를 인식하는 부분으로 구성된다. 본 논문에서는 차량 번호판 영역을 추출하기 위해 HSI 컬러 모형의 Hue 정보를 이용하여 차량 번호판 영역을 추출하고 개선된 퍼지 이진화 방법을 적용하여 추출된 차량 번호판 영역으로부터 문자를 포함한 특징영역을 이진화한 후에 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한다. 추출된 개별 코드를 인식하기 위해 잡음과 훼손에 비교적 강한 ART2 알고리즘을 적용한다. 제안된 방법의 차량 번호판 추출 및 인식성능을 평가하기 위하여 실제 비영업용 차량 번호판에 적용한 결과, 기존의 차량 번호판의 추출 방법보다 번호판 영역의 추출률이 개선되었다. 또한 ART2 알고리즘을 적용하여 신 차량 번호판을 인식하는 것이 효율적임을 확인하였다.

알려지지 않은 악성 암호화 스크립트에 대한 분석 기법 (An Analysis Technique for Encrypted Unknown Malicious Scripts)

  • 이성욱;홍만표
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권5호
    • /
    • pp.473-481
    • /
    • 2002
  • 악성 코드의 감지 및 분석에 있어 암호화된 악성코드의 해독은 필수적인 요소이다. 그러나, 기존의 엑스-레잉 또는 에뮬레이션에 의한 해독 기법들은 이진 형태의 악성 코드를 대상으로 개발되었으므로 스크립트 형태의 악성 코드에는 적합하지 않으며, 특정한 암호화 패턴을 기반으로 하는 접근 방식은 알려지지 않은 악성 스크립트가 암호화되어 있을 경우 대응하기 어렵다. 따라서 본 논문에서는 스크립트 암호화 기법에 대한 분석적인 접근을 통하여, 새로운 암호화 기법의 출현에 유연하게 대처하는 새로운 암호 해독 기법을 제시하고 그 구현에 관해 기술한다.

안전하고 효율적인 Code Reuse Attack 탐지를 위한 ARM 프로세서의 두 가지 명령어 세트를 고려한 Meta-data 생성 기술 (A Meta-data Generation Technique for Efficient and Secure Code Reuse Attack Detection with a Consideration on Two Types of Instruction Set)

  • 허인구;한상준;이진용;백윤흥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.443-446
    • /
    • 2014
  • Code reuse attack (CRA)는 기존의 코드 내에서 필요한 코드 조각들 (gadgets)을 모아 indirect branch 명령어들로 잇는 방식으로 공격자가 원하는 악성 프로그램을 구성할 수 있는 강력한 공격 방법이다. 공격자는 자신의 코드를 대상 시스템에 심는 대신 기존의 코드를 이용하기 때문에, 대부분의 범용 운영체제 (OS)가 강제하는 W^X protection 을 무력화할 수 있다. 이러한 CRA 에 대응하기 위하여 다수의 연구들에서 branch 의 trace 를 분석하여 CRA 고유의 특성을 찾아내는 Signature 기반 탐지 기술을 제안하였다. 본 논문에서는 ARM 프로세서 상에서의 CRA 를 대응하기 위한 Signature 기반 탐지 기술을 효율적으로 도울 수 있는 binary 분석 및 meta-data 생성 기술을 제안한다. 특히, 본 논문은 우리의 이전 논문에서 고려 되지 못했던 ARM 의 두 가지 명령어 세트의 특성을 고려하여, 공격자가 어느 명령어 세트를 이용하여 CRA 를 시도하더라도 막아낼 수 있도록 meta-data 를 두 가지 mode 에 대해서 생성하였다. 실험 결과, meta-data 는 본래 바이너리 코드 대비 20.8% 정도의 크기 증가를 일으키는 것으로 나타났다.

비동기 W-CDMA 시스템을 위한 코드블럭 내의 코드위치변조를 이용한 고속 셀 탐색 알고리즘 (A Fast Cell Search Algorithm using Code Position Modulation within code block in Asynchronous W-CDMA System)

  • 최정현;김낙명
    • 한국통신학회논문지
    • /
    • 제25권5A호
    • /
    • pp.611-617
    • /
    • 2000
  • 비동기 방식 W-CDMA 시스템은 동기식 방식보다 복합적인 셀 구조를 갖는 차세대 이동통신 시스템에 적합하다는 장점이 있다. 그러나, 이 경우 각 기지국마다 서로 다른 코드를 부여하기 때문에 단말기가 통화가능한 셀을 찾고 코드 동기를 이루는 데에 오랜 시간이 걸린다. 셀 획득의 지연은 통화 실패로 이어질 수 있으므로, 비동기 방식 W-CDMA 시스템을 구현하기 위해서는 고속 셀 탐색 알고리즘이 필수적인 기술이다. 본 논문에서는 도약 코드 시퀀스에 의하여 셀을 구분하고, 코드 블록 내의 이진코드이 위치를 도약코드를 사용하여 변화시킴으로써 기지국의 셀을 찾아내는 코드블럭 내의 코드 위치변조를 이용한 고속 셀 탐색 알고리즘을 제안한다. 제안된 방식은 기존의 방식에 비하여 보다 빠른 시간내에 셀을 찾을 수 있으며, 수신기도 더 간단하게 구현될 수 있다는 장점이 있다.

  • PDF

PDF417 이차원 바코드 디코딩 알고리즘의 구현 (Implementation of PDF417 2-dimensional Barcode Decoder)

  • 정정구;한희일
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.289-292
    • /
    • 2001
  • 종래에 사용되어 왔던 1차원 바코드가 정보를 포함하고 있는 데이터베이스에 접근하는 데이터 키 역할을 주로 해온 것에 비해, 2차원 바코드는 다량의 데이터를 포함할 수 있고 고밀도의 데이터 표현이 가능하여, 호스트 컴퓨터의 데이터 베이스에 온라인 연결할 필요없이 확인하고자 하는 사람이나 대상물에 대한 정보를 얻을 수 있다. 본 논문에서는 가장 널리 사용되는 2차원 바코드 체계인 PDF417 을 중심으로 디지털 카메라를 통하여 입력한 영상을 이진화하여 시작 심볼 또는 정지 심볼을 검색함으로써 2차원 바코드 영역을 추출한 다음, 추출된 영역으로부터 바코드의 행과 열의 수, 오류수정 정도 등의 헤더정보를 검출하고 이를 바탕으로 코드워드를 추출하는 알고리즘을 제안한다. 얻어진 코드워드는 데이터를 효율적으로 저장하기위해 정보가 숫자인지, ASCII코드인지 혹은 바이트 정보인지에 따라 다른 방식으로 인코딩 되어 있는데, 그에 따른 디코딩 알고리즘을 제안한다.

  • PDF

코드 가시화의 서비스 모듈화 (Service Modulization of the Code Visualization)

  • 이진협;이근상;서채연;김영철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.629-632
    • /
    • 2017
  • 국내 대기업들은 충분한 SW테스팅으로 SW의 품질과 안정성을 점검하고 있다. 반면, 중소기업들은 부족한 인력과 비싼 상용 테스팅 도구 등으로 테스팅 환경이 어려운 실정이다. 이로 인한 테스트 부족 속에서 SW제품을 출시한다. 이 논문에서는 이런 문제의 해결방안 중 하나로 개발자가 코드 내부의 복잡도를 측정하여 잠재적인 오류를 줄이는데 초점을 둔다. 이를 위해 공개 소스프트웨어 기반의 도구 개선 제안 및 가시화 구현을 하였다. 즉, 벤처/중소 기업의 개발자들에게 각각 품질 요소들의 가시화 서비스가 가능하다. 이는 코드 내부의 결합력/응집력/복잡도/재사용 등의 가시적 모듈화로 SW품질 개선이 가능하다.

정적 분석을 이용한 다형성 스크립트 바이러스의 탐지기법 설계 (The Design for a Method of Detecting Polymorphic Script Virus Using Static Analysis)

  • 이형준;김철민;이성욱;홍만표
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.407-409
    • /
    • 2003
  • 매크로 바이러스를 비롯한 악성 스크립트 바이러스는 이진 코드와는 달리 텍스트 형식으로 코드가 저장되기 때문에 많은 수의 변종이 가능하고 다형성을 지닌 형태로의 제작이 쉬워 새로운 형태의 출현이 빈번하다[1]. 이에 따라 시그니처 기반의 감지 기법을 탈피한 다양한 기법들이 제안되고 있으나 세밀한 수준의 분석으로 인한 시간 지연과 높은 긍정 오류의 문제로 현실적으로 적용되지 못하는 실정이다. 이를 개선하여 비교적 짧은 시간에 정적 분석을 끝내고 코드 삽입 기법을 병행하여 긍정 오류 문제를 해결한 기법이 제안 되었다[2]. 그러나 이 기법에서 사용하는 정적 분석은 다형성 스크립트 바이러스에 대하여 고려하고 있지 않다. 본 논문에서는 제안된 정적 분석 기법을 확장 하여 다형성 스크립트 바이러스를 탐지할 수 있는 기법을 제시 한다.

  • PDF