• 제목/요약/키워드: Learning module

검색결과 553건 처리시간 0.018초

단일 카테고리 문서의 다중 카테고리 자동확장 방법론 (A Methodology for Automatic Multi-Categorization of Single-Categorized Documents)

  • 홍진성;김남규;이상원
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.77-92
    • /
    • 2014
  • 텍스트에 대한 사용자의 접근성을 향상시키기 위해, 이들 문서는 정해진 기준에 따라 카테고리로 분류되어 제공되고 있다. 과거에는 카테고리 분류 작업이 수작업으로 수행되었지만, 문서 작성자에게 분류를 맡기는 경우 분류 정확성을 보장할 수 없고 관리자가 모든 분류를 담당하는 경우 많은 시간과 비용이 소요된다는 어려움이 있었다. 이러한 한계를 극복하기 위해 카테고리를 자동으로 식별할 수 있는 문서 분류 기법에 대한 연구가 활발하게 수행되었다. 하지만 대부분의 문서 분류 기법은 각 문서가 하나의 카테고리에만 속하는 경우를 가정하고 있기 때문에, 하나의 문서가 다양한 주제를 갖는 실제 상황과 부합하지 않는다는 한계를 갖는다. 이를 보완하기 위해 최근 문서의 다중 카테고리 식별을 위한 연구가 일부 수행되었으나, 이들 연구는 대부분 이미 다중 카테고리가 부여되어 있는 문서에 대한 학습을 통해 분류 규칙을 생성하므로 단일 카테고리만 부여되어 있는 기존 문서의 다중 카테고리 식별에는 적용할 수 없다는 제약을 갖는다. 따라서 본 연구에서는 이러한 제약을 극복하기 위해, 카테고리, 토픽, 문서간 관계 분석을 통해 단일 카테고리를 갖는 문서로부터 추가 주제를 발굴하여 이를 다중 카테고리로 자동 확장시킬 수 있는 방법론을 제안하였다. 실험 결과 원 카테고리가 식별된 총 24,000건의 문서 중 23,089건에 대해 카테고리를 확장시킬 수 있었다. 또한 정확도 분석에서 카테고리의 특성에 따라 카테고리 분류 정확도가 상이하게 나타나는 현상을 발견하였다. 본 연구는 단일 카테고리로 분류된 문서에 대해 다중 카테고리를 추가로 식별하여 부여함으로써, 규칙 학습 과정에서 다중 카테고리가 부여된 문서를 필요로 하는 기존 다중 카테고리 문서 분류 알고리즘의 활용성을 매우 향상시킬 수 있을 것으로 기대한다.

중등교사 임용후보자선정경쟁시험 표시과목인 전기·전자·통신의 평가영역 및 내용요소 개발·보완 연구 (Development and Complementation of Evaluation Area and Content Elements in Electrical, Electronics and Communications Subject)

  • 송영직;강윤국;조한욱;김성득;임승각;이혁수
    • 대한공업교육학회지
    • /
    • 제44권1호
    • /
    • pp.52-71
    • /
    • 2019
  • 학교 교육의 질은 국가 교육발전의 핵심 요소이다. 이러한 학교 교육의 질을 결정짓는 중요한 요소는 교육을 실제로 담당하고 있는 교사의 자질이다. 그러므로 교사를 선발하기 위한 중등학교 교사 임용후보자 선정경쟁시험에서 유능한 교원을 임용하려는 노력이 필요하다. 특히, 특성화고등학교 및 산업수요 맞춤형고등학교는 NCS 기반 2015 개정 교육과정의 도입으로 기존의 전기 전자 통신 3과목이 각각 분리됨에 따라 임용시험의 출제 기준이 변화하여 새로운 평가영역 및 내용요소가 필요하다. 이에 본 연구에서는 전기, 전자, 통신의 교원 양성기관에 대한 교육과정과 NCS 기반 2015 개정 교육과정의 분석 및 2009학년도 개편 중등교사 임용후보자선정경쟁시험 표시과목 전기 전자 통신의 교사 자격 기준 과 평가영역 상세화 및 수업능력 평가연구(김성열, 2018)를 분석하였다. 분석된 결과를 기초로 전기, 전자, 통신 과목의 평가영역 및 내용요소를 추출하였다. 추출된 내용은 전문가 협의를 통해 검증한 후 다음과 같이 제시하였다. 첫째, "전기" 과목의 평가영역 및 내용요소는 "전기전자실습"의 기본이수과목에 NCS 학습 모듈을 평가영역 및 내용요소로 제시하여 NCS 기반의 2015 개정 교육과정을 평가할 수 있도록 구성하였다. 둘째, "전자" 과목의 평가영역 및 내용요소는 "전자회로"의 기본이수과목에서 NCS 기초과목인 전자회로를 활용하여 평가영역 및 내용요소를 제시하였으며 "전자파응용"과목에서 "전자기학"을 평가할 수 있도록 구성하였다. 셋째, "통신" 과목의 평가영역 및 내용요소는 기존의 "전기 전자" 기반에서 시작된 통신 관련 실습을 "통신"과목의 특성에 맞게 구성 하였으며 "전기전자실습"에서 NCS 실무과목인 네트워크 구축 실습과 통신 관련 실습 평가영역 및 내용요소에 제시하여 통신관련 실무능력을 평가할 수 있도록 구성하였다.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.