• 제목/요약/키워드: 문자특징 추출

검색결과 252건 처리시간 0.027초

Clairaut의 <대수학 원론>에 나타난 대수 지도 원리에 대한 분석 (Analysis on the Principles for Teaching Algebra Revealed in Clairaut's )

  • 장혜원
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제17권3호
    • /
    • pp.253-270
    • /
    • 2007
  • 18세기 프랑스의 수학자 A.C. Clairaut는 역사발생적 원리에 근거하여 기하 교재에 이어 대수 교재 <대수학 원론>을 집필하였다. 본 논문은 <대수학 원론>을 분석함으로써 대수 지도를 위해 Clairaut가 의도한 원리 및 구체적인 방식의 특징들을 고찰하고, 학교 수학에서 대수 영역의 교수-학습과 비교, 논의함으로써 적용 가능한 교수학적 시사점을 찾는 것을 목표로 한다. 이를 위해 <대수학 원론>의 구성 및 내용에 대해 개관하고 초보자의 정신에 자연스럽게 전개한다는 Clairaut의 의도에서 비롯된 대수 지도 원리의 여섯 가지 특징을 추출한다. 이 중에는 <기하학 원론>에서의 특징과 공통적인 것도 있고 대수라는 내용 영역상의 구별에서 비롯되는 독특한 것도 있다. 그리고 학교 수학의 대수 영역 중 특정 주제-방정식 세우기, 문자식의 계산과 문자의 부호, 곱셈의 부호 규칙, 이차방정식의 해법, 근과 계수와의 일반적 관계-와 관련하여 논의하고 시사점을 찾는다.

  • PDF

문자열 정보를 활용한 텍스트 마이닝 기반 악성코드 분석 기술 연구 (Research on text mining based malware analysis technology using string information)

  • 하지희;이태진
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.45-55
    • /
    • 2020
  • 정보 통신 기술의 발달로 인해 매년 신종/변종 악성코드가 급격히 증가하고 있으며 최근 사물 인터넷과 클라우드 컴퓨팅 기술의 발전으로 다양한 형태의 악성코드가 확산되고 있는 추세이다. 본 논문에서는 운영체제 환경에 관계없이 활용 가능하며 악성행위와 관련된 라이브러리 호출 정보를 나타내는 문자열 정보를 기반으로 한 악성코드 분석 기법을 제안한다. 공격자는 기존 코드를 활용하거나 자동화된 제작 도구를 사용하여 악성코드를 손쉽게 제작할 수 있으며 생성된 악성코드는 기존 악성코드와 유사한 방식으로 동작하게 된다. 악성 코드에서 추출 할 수 있는 대부분의 문자열은 악성 동작과 밀접한 관련이 있는 정보로 구성되어 있기 때문에 텍스트 마이닝 기반 방식을 활용하여 데이터 특징에 가중치를 부여해 악성코드 분석을 위한 효과적인 Feature로 가공한다. 가공된 데이터를 기반으로 악성여부 탐지와 악성 그룹분류에 대한 실험을 수행하기 위해 다양한 Machine Learning 알고리즘을 이용해 모델을 구축한다. 데이터는 Windows 및 Linux 운영체제에 사용되는 파일 모두에 대해 비교 및 검증하였으며 악성탐지에서는 약93.5%의 정확도와 그룹분류에서는 약 90%의 정확도를 도출하였다. 제안된 기법은 악성 그룹을 분류시 각 그룹에 대한 모델을 구축할 필요가 없기 때문에 단일 모델로서 비교적 간단하고 빠르며 운영체제와 독립적이므로 광범위한 응용 분야를 가진다. 또한 문자열 정보는 정적분석을 통해 추출되므로 코드를 직접 실행하는 분석 방법에 비해 신속하게 처리가능하다.

공간의존행렬과 신경망을 이용한 문서영상의 효과적인 블록분할과 유형분류 (An Efficient Block Segmentation and Classification Method for Document Image Analysis Using SGLDM and BP)

  • 김중수;이정환;최흥문
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.937-946
    • /
    • 1995
  • 본 논문에서는 공간의존행렬과 신경망을 이용하여 문서영상에서 인식대상 문자가 포함되어 있는 블록들을 좀더 세분해 낼 수 있는 효과적인 방법을 제시 하였다. 제안 된 방법은 명암도 문서블록에서 공간의존행렬을 구하고 7가지 질감 특징을 추출한 뒤 신경망을 이용해 문서블록을 9가지 유형으로 분류할 수 있도록 하였다. 특히 기존에는 비문자영역으로 분류되던 수식, 도표, 순서도 등 주로 문자가 포함되어 있는 블록들을 세분해 낼 수 있도록 하였다. 또한 신경망 학습알고리즘인 BP 를 사용함으로써 기존의 선형분류시에 요구되던 유형별 임계값과 선형면결정지수를 찾는 어려움을 해소하였다. 명암도영상을 이진화하기 전에 먼저 Sobel연산을 적용함으로써 문서 뒷면에 의한 배경 잡음의 영향을 줄일 수 있도록 하였고, 교차 문지르기 후 분할함으로써 블록이 작은 조각으로 나누어지는 것을 방지하도록 하였다. 실험결과 제안한 방법에서는 문자가 포 함되어 있는 블록은 큰 문자, 중간문자, 작은 문자블록 및 수식, 순서도, 도표블록의 6가지로, 그리고 비문자블록은 인물사진, 그래프 등 3가지 유형으로 상세하게 분류 할수 堞있었으며 전체적인 분류성능도 우수함을 확인할 수 있었다.

  • PDF

복도환경에서의 이동로봇 주행을 위한 3차원 특징추출을 통한 장애물 인식 (Obstacle Recognition by 3D Feature Extraction for Mobile Robot Navigation in an Indoor Environment)

  • 진태석
    • 한국정보통신학회논문지
    • /
    • 제14권9호
    • /
    • pp.1987-1992
    • /
    • 2010
  • 본 논문에서는 이동로봇에 장착된 CCD 카메라를 통해 입력되는 영상에서 3차원 물체가 가지는 특징정보를 분석 및 추출하여하여 주행전방의 환경을 구분하는데 적용하게 된다. 복도 내에서 주행하는 로봇에 탑재된 카메라로 입력된 영상은 3차원 특징정보에 의해 장애물과 복도의 코너, 문으로 검출되어진다. 바닥의 장애물 정보 인식을 통한 이동로봇의 주행경로를 구하는데 있어 이들 세 가지는 최적의 경로 생성과 장애물 회피를 위한 매우 중요한 정보로 사용될 수 있다. 따라서, 본 논문에서는 입력영상을 전처리 후에 제안된 알고리즘을 기반으로한 이동로봇의 주행방향결정과, 입력 영상에서 신경망을 통하여 장애물 인식 및 특징정보 검출을 통한 이동로봇의 주행을 위한 선행 실험결과를 제시하였다.

안면근 신호를 이용한 최소 자판 문자 입력 시스템의 개발 (Development of Character Input System using Facial Muscle Signal and Minimum List Keyboard)

  • 김홍현;김응수
    • 한국정보통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1338-1344
    • /
    • 2010
  • 사람은 주로 언어를 통해 서로간의 의사를 표현한다. 하지만, 말을 할 수 없는 중증 장애인, 특히 전신마비 증세가 있는 중증 장애인의 경우에는 글을 쓰거나 몸짓을 통한 방법으로도 자신의 의사를 효과적으로 전달하지 못한다는 문제점이 있다. 따라서 본 논문에서는 이러한 중증 장애인이 의사소통을 할 수 있도록 안면근 신호를 이용한 의사 전달기를 구현하였다. 특히, 안면근 신호가 포함된 뇌파의 특징을 추출하여 이를 일반적인 제어 신호로써 변환한 다음, 이 제어 신호와 최소한의 자판을 연동시켜 문자를 선택하도록 함으로써, 중증 장애인이 효과적으로 의사를 전달할 수 있도록 하였다.

개선된 SOG 기반 고속 세선화 알고리즘($SOG^*$) (Fast Thinning Algorithm based on Improved SOG($SOG^*$))

  • 이찬희;정순호
    • 정보처리학회논문지B
    • /
    • 제8B권6호
    • /
    • pp.651-656
    • /
    • 2001
  • 본 논문은 기존의 신경망을 이용한 세선화 방법 중에서 자기 구성 그래프(Self-Organized Graph:SOG) 세선화 기법의 우수한 세선화 결과를 유지하면서, 수행 속도를 향상시키기 위하여 Kohonen Features Map의 새로운 점증 기법을 변형된 SOG에 적용한 개선된 SOG(Improved SOG:$SOG^*$) 세선화 기법을 제안한다. 실험 결과로써 숫자와 문자 모두 기존의 SOG와 같은 우수한 세선화 결과를 나타내며, O((logM)3)의 시간 복잡도를 가지는 속도 향상을 이루었다. 따라서 본 논문에서 제안한 방법은 숫자 또는 문자 인식에 있어 특징 추출의 빠른 전처리 과정으로 사용할 수 있다.

  • PDF

영화 비디오 자막 추출 및 추출된 자막 이미지 향상 방법 (Methods for Video Caption Extraction and Extracted Caption Image Enhancement)

  • 김소명;곽상신;최영우;정규식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.235-247
    • /
    • 2002
  • 디지털 비디오 영상을 효과적으로 색인하고 검색하기 위해서 비디오의 내용을 함축적으로 표현하고 있는 비디오 자막을 추출하여 인식하는 연구가 필요하다. 본 논문에서는 압축되지 않은 비디오 영화 영상에 인위적으로 삽입한 한글 및 영어 자막을 대상으로 자막 영역을 추출하고, 추출된 자막 이미지를 향상시키는 방법을 제안한다. 제안한 방법의 특징은 동일한 내용의 자막을 갖는 프레임들의 위치를 자동으로 찾아서 동일 자막 프레임들을 다중 결합하여 배경에 포함되어 있는 잡영의 일부 또는 전부를 우선 제거한다. 또한, 이 결과 이미지에 해상도 중대, 히스토그램 평활화, 획 기반 이진화, 스무딩의 이미지 향상 방법을 단계적으로 적용하여 인식 가능한 수준의 이미지로 향상시킨다. 제안한 방법을 비디오 영상에 적용하여 동일한 내용의 자막 그룹 단위로 자막 이미지를 추출하는 것이 가능해졌으며, 잡영이 제거되고 복잡한 자소의 획이 보존된 자막 이미지를 추출할 수 있었다. 동일한 내용의 자막 프레임의 시작 및 글위치를 파악하는 것은 비디오 영상의 색인과 검색에 유용하게 활용될 수 있다. 한글 및 영어 비디오 영화 자막에 제안한 방법을 적용하여 향상된 문자 인식 결과를 얻었다.

지화 인식을 위한 동영상 처리에 관한 연구 (The Study on Dynamic Images Processing for Finger Languages)

  • 강민지;최은숙;손영선
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.184-189
    • /
    • 2004
  • 본 논문에서는 흑백 CCD 카메라를 이용하여 청각 장애인의 의사전달 수단인 지화 동작을 동영상으로 입력받아 인식하여, 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다. 일련의 입력 영상들 중에서 흐린 영상과 선명한 영상의 구분은 영상의 잔상을 이용하였고, 촬영된 연속 영상들의 배열로부터 문자 자소를 구하고, 오토마타를 적용하여 완성된 문자를 문서 편집기에 출력시켰다. 획득된 선명한 영상 데이터 중 변화가 심한 손목 부분을 제거한 후, 최대 원형 이동법을 이용하여 손의 무게 중심점을 구하고, 원형 패턴 벡터 알고리즘을 적용하여 지화 해석에 필요한 손을 인식하였다. 손 중심으로부터 거리 스펙트럼을 이용하여 지화 인식에 사용되는 손 모양의 특징 벡터를 추출하고, 퍼지 추론을 적용하여 표준 패턴과 입력 패턴의 특징벡터를 비교, 지화 동작을 인식하였다.

의존관계에 기초한 일본어 키워드 추출방법 (The Method of Deriving Japanese Keyword Using Dependence)

  • 이태헌;정규철;박기홍
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.41-46
    • /
    • 2003
  • 본 논문에서 일본어 키워드 추출을 목적으로 요약문서 중에 떨어진 문자열을 합성하고, 그 문장에 나타난 규칙을 가지고 단어 정보(표기, 품사)와 구문 정보를 이용하여 복합명사고로 된 키워드 추출 방법을 제안한다. 저자 자신이 부여한 학술 논문의 키워드 중에서 문서 중에 그대로 존재하지 않는 키워드의 특징을 분석한 결과로 의존 관계에 의한 복합명사 생성 규칙을 구축한다. 또 문장의 내용과 다른 키워드의 추출을 억제하기 위해 생성규칙에 대한 제약과 중복 단어를 고려한 중요도 결정법을 제안한다. 자연ㆍ 음성언어처리에 관한 일본어 논문 65파일의 타이틀과 초록부분을 이용하여 추출된 키워드의 타당성에 대한 실험을 한 결과 추출 정밀도는 중요도의 상위 1개를 출력한 경우 63%가 되어 추출 방법의 유효성을 확인 할 수가 있었다.

내용기반의 인쇄체 영문 문서 영상 검색을 위한 특징 기반 단어 검색 (A Feature -Based Word Spotting for Content-Based Retrieval of Machine-Printed English Document Images)

  • 정규식;권희웅
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1204-1218
    • /
    • 1999
  • 문서영상 검색을 위한 디지털도서관의 대부분은 논문제목과/또는 논문요약으로부터 만들어진 색인에 근거한 제한적인 검색기능을 제공하고 있다. 본 논문에서는 영문 문서영상전체에 대한 검색을 위한 단어 영상 형태 특징기반의 단어검색시스템을 제안한다. 본 논문에서는 검색의 효율성과 정확도를 높이기 위해 1) 기존의 단어검색시스템에서 사용된 특징들을 조합하여 사용하며, 2) 특징의 개수 및 위치뿐만 아니라 특징들의 순서를 포함하여 매칭하는 방법을 사용하며, 3) 특징비교에 의해 검색결과를 얻은 후에 여과목적으로 문자인식을 부분적으로 적용하는 2단계의 검색방법을 사용한다. 제안된 시스템의 동작은 다음과 같다. 문서 영상이 주어지면, 문서 영상 구조가 분석되고 단어 영역들의 조합으로 분할된다. 단어 영상의 특징들이 추출되어 저장된다. 사용자의 텍스트 질의가 주어지면 이에 대응되는 단어 영상이 만들어지며 이로부터 영상특징이 추출된다. 이 참조 특징과 저장된 특징들과 비교하여 유사한 단어를 검색하게 된다. 제안된 시스템은 IBM-PC를 이용한 웹 환경에서 구축되었으며, 영문 문서영상을 이용하여 실험이 수행되었다. 실험결과는 본 논문에서 제안하는 방법들의 유효성을 보여주고 있다. Abstract Most existing digital libraries for document image retrieval provide a limited retrieval service due to their indexing from document titles and/or the content of document abstracts. This paper proposes a word spotting system for full English document image retrieval based on word image shape features. In order to improve not only the efficiency but also the precision of a retrieval system, we develop the system by 1) using a combination of the holistic features which have been used in the existing word spotting systems, 2) performing image matching by comparing the order of features in a word in addition to the number of features and their positions, and 3) adopting 2 stage retrieval strategies by obtaining retrieval results by image feature matching and applying OCR(Optical Charater Recognition) partly to the results for filtering purpose. The proposed system operates as follows: given a document image, its structure is analyzed and is segmented into a set of word regions. Then, word shape features are extracted and stored. Given a user's query with text, features are extracted after its corresponding word image is generated. This reference model is compared with the stored features to find out similar words. The proposed system is implemented with IBM-PC in a web environment and its experiments are performed with English document images. Experimental results show the effectiveness of the proposed methods.