• Title/Summary/Keyword: 자동 코딩

Search Result 112, Processing Time 0.025 seconds

Automatic Code Grader for Programming Learning (코딩 교육에서의 자동 평가 시스템 활용)

  • Sun, Dongeun;Kim, Hyeoncheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.405-406
    • /
    • 2017
  • Everycoding은 인텔리전트 코딩 교육 시스템으로, 코딩 교육을 위한 다양한 콘텐츠 및 코딩 보조 도구를 제공한다. 특히, 코드 자동 평가 기능을 교육적 목적으로 활용함으로써, 비전공자들이 쉽게 코딩을 익힐 수 있게 도움을 주고 있다. 본 논문에서는 Everycoding에서 제공하는 코드 자동 평가 기능에 대하여 소개한다.

Design and Implementation Automatic Character Set Encoding Recognition Method for Document File (문서 파일의 문자 인코딩 자동 인식 기법의 설계 및 구현)

  • Seo, Min-Ji;Kim, Myung-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.95-98
    • /
    • 2015
  • 문자 인코딩은 컴퓨터에 저장하거나 네트워크상에서 전송하기 위해 문서를 이진화 하는 방법이다. 문자 인코딩은 고유의 문자 코드 테이블을 이용하여 문서를 이진화 하기 때문에, 문서에 적용된 문자 인코딩과 다른 문자 인코딩을 이용하여 디코딩 하면 원본과 다른 문서가 출력되어 문서를 읽을 수 없게 된다. 따라서 문서를 읽기 위해서는 문서에 적용된 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 단어 데이터베이스를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 제안하는 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 높은 문자 인코딩 인식률을 보인다.

An Experimental Study on the Automatic Coding System for Statistical Information Classification in Korea (통계정보 분류의 자동코딩 성능 실험 연구)

  • Nam, Young-Jun;Ahn, Dong-Ein
    • Journal of the Korean Society for information Management
    • /
    • v.17 no.4
    • /
    • pp.27-45
    • /
    • 2000
  • National statistical data such as Korean Census is fundamental data for national administration. In this paper, we present an automatic coding system utilizing morphological analyser and knowledge dictionaries. Knowledge bases are constructed based on an authority dictionaries which were developed by authors utilizing a newly learning theory. Test data indicates 99.5% of productivity and 83.3% of accuracy. The presented methods can be effectively applied to analyze statistical information.

  • PDF

A Method for Automatic Detection of Character Encoding of Multi Language Document File (다중 언어로 작성된 문서 파일에 적용된 문자 인코딩 자동 인식 기법)

  • Seo, Min Ji;Kim, Myung Ho
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.4
    • /
    • pp.170-177
    • /
    • 2016
  • Character encoding is a method for changing a document to a binary document file using the code table for storage in a computer. When people decode a binary document file in a computer to be read, they must know the code table applied to the file at the encoding stage in order to get the original document. Identifying the code table used for encoding the file is thus an essential part of decoding. In this paper, we propose a method for detecting the character code of the given binary document file automatically. The method uses many techniques to increase the detection rate, such as a character code range detection, escape character detection, character code characteristic detection, and commonly used word detection. The commonly used word detection method uses multiple word database, which means this method can achieve a much higher detection rate for multi-language files as compared with other methods. If the proportion of language is 20% less than in the document, the conventional method has about 50% encoding recognition. In the case of the proposed method, regardless of the proportion of language, there is up to 96% encoding recognition.

A Study on the Evaluation of Coding Pattern Quality Using Source Code Analysis (소스 코드 분석을 통한 코딩 패턴의 특성 평가에 관한 연구)

  • Kim, Young-Tae;Lim, Jae-Hyun;Kong, Heon-Tag;Kim, Chi-Su
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.11a
    • /
    • pp.402-405
    • /
    • 2010
  • 본 논문에서는 소스 코드에 자주 나타나는 코딩 패턴을 자동으로 추출하기 위하여 소스 코드를 분석하고 특성을 평가한다. 기존에 소스 코드에 대한 패턴 마이닝을 이용한 코딩 패턴 감지 방법이 제안되었지만, 수동으로 조사 가능한 코딩 패턴의 수는 한정되어 있기 때문에 대규모 소프트웨어 등에 대한 충분한 분석은 할 수 없었다. 따라서 본 논문에서는 개발자가 분석하고자 하는 코딩 패턴에 대한 자동 추출을 목표로 코딩 패턴의 특성 평가 지표를 선정하여 소스 코드에 대한 분석을 수행한다.

  • PDF

An Automatic Coding System of Korean Standard Industry/Occupation Code Using Example-based Learning (예제기반의 학습을 이용한 한국어 표준 산업/직업 자동 코딩 시스템)

  • Lim Heui-Seok
    • The Journal of the Korea Contents Association
    • /
    • v.5 no.4
    • /
    • pp.169-179
    • /
    • 2005
  • Standard industry and occupation code are usually assigned manually in Korean census. The manual coding is very labor intensive and expensive task. Furthermore, inconsistent coding is resulted from the ability of human experts and their working environments. This paper proposes an automatic code classification system which converts natural language responses on survey questionnaires into corresponding numeric codes by using manually constructed rule base and example-based machine learning. The system was trained with 400,000 records of which standard codes was assigned. It was evaluated with 10-fold cross validation and was tested with three code sets: population occupation set, industry set, and industry survey set. The proposed system showed 76.63%, 82.24 and 99.68% accuracy for each code set.

  • PDF

산업/직업 분류 자동코딩 시스템

  • 강유경
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2001.11a
    • /
    • pp.33-45
    • /
    • 2001
  • Korean standard industrial/occupational classification has been the basis of producing accurate statistical data related with our industrial structure and distribution of industry and occupation since 1960. But coding over several million records not only requires high cost in the aspects of time and manpower but also has many problems in accuracy and consistency. Therefore, we got to develop the automatic coding system in order to work out these problems of manual coding. This paper shows the structure of our system and the result of experiment over survey data of 2,000 Census.

  • PDF

A Comparative of TEI Independent Header and MARC (TEI Independent Header와 MARC의 비교연구)

  • 엄혜련;김성혁
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1996.08a
    • /
    • pp.75-78
    • /
    • 1996
  • 본 연구는 TEI를 기반으로 한 전자문헌의 서지정보를 수록한 TEI Independent Header를 MARC으로 변환시켜 주기 위하여 전자문헌의 인코딩, 인코딩언어인 SGML, 인코딩 포맷인 TEI를 연구하였다. 나아가 TEI를 기반으로 한 전자문헌의 자동 목록작성의 가능성을 살펴보기 위하여 TEI Independent Header와 MARC을 비교분석하였다.

  • PDF

A DNA Coding Method for Evolution of Developmental Model (발생모델의 진화를 위한 DNA 코딩방법)

  • 이동욱
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.9 no.4
    • /
    • pp.389-395
    • /
    • 1999
  • 최근 몇 년간 생물학적 발생에 대한 구조 및 둥작원리의 모델링에 대한 빠른 진전이 일어나고 있다. 세포자동자(cellular automata CA)와 린드마이어-시스템(L-system)은 다세포의 대표적인 발생/발달 모델이다. L-시스템은 식물의 그래픽 표현에 적용되어 오고 있으며 CA는 인고생명의 연구모델과 인공두뇌의 건축 등의 분야에 적용되어 오고 있다, 현재까지 CA와 L-시스템의 발생규칙은 설계자의 설계에 의존하고 있다. 그러나 진화연사방법을 도입하면 CA와 L-시스템을 자동으로 설계할수 있다. 발생규칙의 진화를 위해서는염색체의 코트화가 필요하다. DNA 코딩방법은 유전자의 중복과 여분을 가지고 있으며 규칙의 표현에 적합한 코딩방법이다. 본 논문에서는 CA와 L-시스템의 규칙을 진화시키기 위한 DNA 코딩 방법을 제안한다.

  • PDF

An Automated Industry and Occupation Coding System using Deep Learning (딥러닝 기법을 활용한 산업/직업 자동코딩 시스템)

  • Lim, Jungwoo;Moon, Hyeonseok;Lee, Chanhee;Woo, Chankyun;Lim, Heuiseok
    • Journal of the Korea Convergence Society
    • /
    • v.12 no.4
    • /
    • pp.23-30
    • /
    • 2021
  • An Automated Industry and Occupation Coding System assigns statistical classification code to the enormous amount of natural language data collected from people who write about their industry and occupation. Unlike previous studies that applied information retrieval, we propose a system that does not need an index database and gives proper code regardless of the level of classification. Also, we show our model, which utilized KoBERT that achieves high performance in natural language downstream tasks with deep learning, outperforms baseline. Our method achieves 95.65%, 91.51%, and 97.66% in Occupation/Industry Code Classification of Population and Housing Census, and Industry Code Classification of Census on Basic Characteristics of Establishments. Moreover, we also demonstrate future improvements through error analysis in the respect of data and modeling.