• 제목/요약/키워드: 자동 코딩

검색결과 112건 처리시간 0.024초

코딩 교육에서의 자동 평가 시스템 활용 (Automatic Code Grader for Programming Learning)

  • 선동언;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.405-406
    • /
    • 2017
  • Everycoding은 인텔리전트 코딩 교육 시스템으로, 코딩 교육을 위한 다양한 콘텐츠 및 코딩 보조 도구를 제공한다. 특히, 코드 자동 평가 기능을 교육적 목적으로 활용함으로써, 비전공자들이 쉽게 코딩을 익힐 수 있게 도움을 주고 있다. 본 논문에서는 Everycoding에서 제공하는 코드 자동 평가 기능에 대하여 소개한다.

문서 파일의 문자 인코딩 자동 인식 기법의 설계 및 구현 (Design and Implementation Automatic Character Set Encoding Recognition Method for Document File)

  • 서민지;김명호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.95-98
    • /
    • 2015
  • 문자 인코딩은 컴퓨터에 저장하거나 네트워크상에서 전송하기 위해 문서를 이진화 하는 방법이다. 문자 인코딩은 고유의 문자 코드 테이블을 이용하여 문서를 이진화 하기 때문에, 문서에 적용된 문자 인코딩과 다른 문자 인코딩을 이용하여 디코딩 하면 원본과 다른 문서가 출력되어 문서를 읽을 수 없게 된다. 따라서 문서를 읽기 위해서는 문서에 적용된 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 단어 데이터베이스를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 제안하는 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 높은 문자 인코딩 인식률을 보인다.

통계정보 분류의 자동코딩 성능 실험 연구 (An Experimental Study on the Automatic Coding System for Statistical Information Classification in Korea)

  • 남영준;안동언
    • 정보관리학회지
    • /
    • 제17권4호
    • /
    • pp.27-45
    • /
    • 2000
  • 인구센서스와 같은 국가 통계정보는 국가의 미래 투자계획과 정책수립을 위한 중요한 기초데이터이다. 그러나 데이터의 코딩과정이 모두 수작업으로 이루어지기 때문에 결과의 일관성 결여와 시간과 인력이 너무 많이 소요된다는 것 등이 문제점으로 지적되고 있다. 따라서 본 연구에서는 한국 산업표준 분류표에 근거한 자동코딩시스템을 개발하여 코딩과정을 수작업으로 처리할 때 발생하는 문제점을 해결하였다. 시스템의 지식베이스로는 학습이론을 사용하여 저자가 새로이 개발한 복수의 전거어 사전들을 활용하였다. 실험한 결과, 생성률은 99.5%를, 정확률은 83.3%라는 결과를 얻었다. 따라서 이 시스템은 실제 통계데이터의 자동코딩과정에 사용될 수 있으며, 국가 통계정보의 효율적 분석에 매우 유용하게 사용될 수 있을 것이다.

  • PDF

다중 언어로 작성된 문서 파일에 적용된 문자 인코딩 자동 인식 기법 (A Method for Automatic Detection of Character Encoding of Multi Language Document File)

  • 서민지;김명호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권4호
    • /
    • pp.170-177
    • /
    • 2016
  • 문자 인코딩은 문서를 컴퓨터에서 이용할 수 있도록 문자 코드 테이블을 이용하여 이진화하는 방법이다. 이진화된 문서를 읽기 위해서는, 문서에 적용된 문자 코드를 이용하여 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 각 언어별 자주 사용하는 단어를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 자주 사용하는 단어를 이용한 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 다국어 문서에서 기존의 방법보다 높은 문자 인코딩 인식률을 보인다. 주로 표현하는 언어의 비중이 20% 미만일 경우, 기존의 방법은 약 50%의 문자 인코딩 인식률을 보였으나, 제안하는 방법은 문자 인코딩에서 표현하는 언어의 비중과는 상관없이 96% 이상의 문자 인코딩 인식률을 보였다.

소스 코드 분석을 통한 코딩 패턴의 특성 평가에 관한 연구 (A Study on the Evaluation of Coding Pattern Quality Using Source Code Analysis)

  • 김영태;임재현;공헌택;김치수
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 추계학술발표논문집 1부
    • /
    • pp.402-405
    • /
    • 2010
  • 본 논문에서는 소스 코드에 자주 나타나는 코딩 패턴을 자동으로 추출하기 위하여 소스 코드를 분석하고 특성을 평가한다. 기존에 소스 코드에 대한 패턴 마이닝을 이용한 코딩 패턴 감지 방법이 제안되었지만, 수동으로 조사 가능한 코딩 패턴의 수는 한정되어 있기 때문에 대규모 소프트웨어 등에 대한 충분한 분석은 할 수 없었다. 따라서 본 논문에서는 개발자가 분석하고자 하는 코딩 패턴에 대한 자동 추출을 목표로 코딩 패턴의 특성 평가 지표를 선정하여 소스 코드에 대한 분석을 수행한다.

  • PDF

예제기반의 학습을 이용한 한국어 표준 산업/직업 자동 코딩 시스템 (An Automatic Coding System of Korean Standard Industry/Occupation Code Using Example-based Learning)

  • 임희석
    • 한국콘텐츠학회논문지
    • /
    • 제5권4호
    • /
    • pp.169-179
    • /
    • 2005
  • 통계청에서 실시하는 사업체 기초 조사와 인구주택총조사 과정에 업체와 개인에 대한 정보를 기술한 자연어를 표준 산업/직업 코드를 할당하는 수동 코딩 작업이 필요하다. 수동 코딩 작업은 막대한 인건비와 비용을 초래하고 수동 코딩 전문가의 능력과 기분에 따른 작업 결과의 비일관성이 매우 큰 문제로 지적되고 있다. 본 논문은 수작업으로 구축한 규칙베이스를 사용하는 규칙 기반 방법과 수작업으로 분류한 데이터를 이용하는 자동 학습 방법을 통합한 한국어 산업/직업 표준 코드 자동 생성 시스템을 제안한다. 제안하는 시스템은 인구주택총조사 40만 레코드, 사업체기초조사 40만 레코드를 이용하여 학습되었고, 실험데이터를 이용하여 평가되었다. 10-best 성능 평가 결과 제안된 시스템은 인구주택총조사 직업분류 데이터에 대해서 76.63%, 인구주택총조사 산업분류 데이터에 대해서 82.249%의 성능을 보였으며, 사업체기초 조사 산업분류 데이터에 대해서는 99.68%의 정확도를 보였다.

  • PDF

산업/직업 분류 자동코딩 시스템

  • 강유경
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2001년도 추계학술대회 발표논문집
    • /
    • pp.33-45
    • /
    • 2001
  • 많은 통계조사에서 사용되고 있는 산업/직업분류코드가 기존에는 사람에 의해 수동으로 부호화되어 왔는데, 이러한 작업은 시간과 인력면에서 고비용을 요구할 뿐 아니라 개인별 시각, 이해도의 차이 등으로 정확성에 많은 문제가 제기되어 왔다. 본 논문에서는 이러한 수동코딩 작업의 문제점을 해결하기 위하여 자동코딩 시스템을 개발, 이를 인구 주택총조사와 사업체기초통계조사에 시험 적용하여 본 바를 바탕으로 향후 자동시스템으로의 전환 방향 등을 제시하고 있다.

  • PDF

TEI Independent Header와 MARC의 비교연구 (A Comparative of TEI Independent Header and MARC)

  • 엄혜련;김성혁
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.75-78
    • /
    • 1996
  • 본 연구는 TEI를 기반으로 한 전자문헌의 서지정보를 수록한 TEI Independent Header를 MARC으로 변환시켜 주기 위하여 전자문헌의 인코딩, 인코딩언어인 SGML, 인코딩 포맷인 TEI를 연구하였다. 나아가 TEI를 기반으로 한 전자문헌의 자동 목록작성의 가능성을 살펴보기 위하여 TEI Independent Header와 MARC을 비교분석하였다.

  • PDF

발생모델의 진화를 위한 DNA 코딩방법 (A DNA Coding Method for Evolution of Developmental Model)

  • 이동욱
    • 한국지능시스템학회논문지
    • /
    • 제9권4호
    • /
    • pp.389-395
    • /
    • 1999
  • 최근 몇 년간 생물학적 발생에 대한 구조 및 둥작원리의 모델링에 대한 빠른 진전이 일어나고 있다. 세포자동자(cellular automata CA)와 린드마이어-시스템(L-system)은 다세포의 대표적인 발생/발달 모델이다. L-시스템은 식물의 그래픽 표현에 적용되어 오고 있으며 CA는 인고생명의 연구모델과 인공두뇌의 건축 등의 분야에 적용되어 오고 있다, 현재까지 CA와 L-시스템의 발생규칙은 설계자의 설계에 의존하고 있다. 그러나 진화연사방법을 도입하면 CA와 L-시스템을 자동으로 설계할수 있다. 발생규칙의 진화를 위해서는염색체의 코트화가 필요하다. DNA 코딩방법은 유전자의 중복과 여분을 가지고 있으며 규칙의 표현에 적합한 코딩방법이다. 본 논문에서는 CA와 L-시스템의 규칙을 진화시키기 위한 DNA 코딩 방법을 제안한다.

  • PDF

딥러닝 기법을 활용한 산업/직업 자동코딩 시스템 (An Automated Industry and Occupation Coding System using Deep Learning)

  • 임정우;문현석;이찬희;우찬균;임희석
    • 한국융합학회논문지
    • /
    • 제12권4호
    • /
    • pp.23-30
    • /
    • 2021
  • 본 산업/직업 자동코딩 시스템은 조사 대상자들이 응답한 방대한 양의 산업/직업을 설명하는 자연어 데이터에 통계 분류 코드를 자동으로 부여하는 시스템이다. 본 연구는 기존의 정보검색 기반의 산업/직업 자동코딩시스템과 다르게 딥러닝을 이용하여 색인 DB가 필요하지 않고 분류 수준에 상관없이 코드를 부여할 수 있는 시스템을 제안한다. 또한, 자연어 처리에 특화된 딥러닝 기법인 KoBERT를 적용한 제안 모델은 인구주택총조사 산업/직업 코드 분류, 그리고 사업체기초조사 산업 코드 분류에서 각각 95.65%, 91.45%, 97.66%의 Top 10 정확도를 보인다. 제안한 모델 실험 후 향후 개선 가능성을 데이터/모델링 관점으로 분석한다.