• 제목/요약/키워드: 알고리즘 분류체계

검색결과 126건 처리시간 0.024초

초중등학생 대상 알고리즘 교육을 위한 분류체계 모형 설계 (Classification System Model Design for Algorithm Education for Elementary and Secondary Students)

  • 이영호;구덕회
    • 정보교육학회논문지
    • /
    • 제21권3호
    • /
    • pp.297-307
    • /
    • 2017
  • 본 연구의 목적은 초중등학생 대상 알고리즘 교육을 위한 알고리즘 분류체계를 제안하는 것이다. 연구자는 알고리즘의 구성요소를 정의하고, 분석합성식 방법으로 알고리즘 분류체계를 표현하였다. 연구의 내용은 다음과 같다. 첫째, 분류의 목적과 분류의 종류에 대한 이론적인 탐색을 실시하였다. 둘째, 기존에 제안된 알고리즘 내용에 대한 분류체계의 내용과 그 한계에 대해 살펴보았다. 이와 더불어 알고리즘 교육 연구에서 사용되었던 알고리즘 교육 내용 및 선정 기준에 대해 살펴보았다. 셋째, 알고리즘의 분류를 위해 알고리즘 구성요소를 NRC에서 제시한 핵심 아이디어와 관통 개념을 사용하여 재정의하였다. 그리고 알고리즘 관통 개념을 디자인 구조와 자료구조로 세분화하여 그 내용을 제시하였으며, 이 내용을 분석합성식 분류체계를 사용하여 표현하였다. 마지막으로 전문가 집단의 검토를 통해 제안한 내용에 대한 타당도를 검증하였다. 알고리즘 분류체계에 대한 연구는 알고리즘 교육에 있어 내용 선정 및 교육 방법에 많은 시사점을 제공할 것으로 기대한다.

계층적 분류체계를 위한 자동분류 기법에 관한 연구 (An Experimental Study on Text Categorization for Hierarchical Classification)

  • 이영숙;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.173-176
    • /
    • 2001
  • 이 연구는 계층적 분류체계를 기반으로 자동분류를 수행할 HiCat 알고리즘을 제안한다. HiCat 알고리즘은 DDC 지식베이스의 주제어와 기계학습을 거친 정보를 동시에 이용하고, 각 계층별로 주제적합성가중치를 구해 최종 주제범주를 결정한다. 이 알고리즘이 최적의 성능을 보이는 조건을 알아보고, 일반 분류기와의 성능 비교를 통해 HiCat 알고리즘을 평가해 보았다.

  • PDF

구매이력 데이터에서 상품 분류 체계를 고려한 시퀀스 유사도 측정 기법 (A Sequence Similarity Measure Considering the Product Taxonomy in Transaction Data)

  • 양유정;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.367-370
    • /
    • 2019
  • 본 논문은 구매이력 데이터에서 상품간의 분류 체계를 고려하여 시퀀스 간의 유사도를 계산하는 새로운 방법을 제안한다. 시퀀스란 두 항목간의 순서가 존재하는 데이터를 의미한다. 항목 간의 선후관계가 중요한 시퀀스 데이터에서는 두 시퀀스 간의 유사도를 정확히 정의하는 것이 중요하다. 본 논문에서는 대표적인 시퀀스 유사도 측정 알고리즘인 편집 거리 알고리즘을 활용하여 구매이력 데이터에서 시퀀스 간의 유사도를 정의한다. 상품은 상품의 특성에 따라 항목 분류 체계에서 여러 범주로 분류된다. 이 경우 기존의 편집 거리 알고리즘에서 문자의 일치유무에 따라 단순히 0 또는 1을 부여하는 것은 부정확하다. 따라서 본 논문은 편집 거리 알고리즘의 수정 연산 중 대체 연산 비용 계산 시 항목 분류 트리를 사용하여 연산 비용이 0 에서 1 사이의 값을 가지도록 세분화하였다. 실험 결과 제안 방법은 대체 연산 비용 계산 시 두 문자가 다르면 단순히 1 을 부여하는 기존의 편집 거리 알고리즘에 비해 시퀀스 간의 유사도를 더 정확하게 계산함을 확인하였다.

사용자 요구에 기반한 맞춤형 분류체계 생성기법 구현 (Implementation of an User-guided Classification Tailoring System)

  • 장두석;전종훈
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.193-210
    • /
    • 2007
  • 분류체계가 현업에 유용하게 사용되기 위해서는, 다양한 특성을 가진 기업체나 조직의 사용목적에 적합하도록 만들어져야 한다. 분류체계 생성과정을 자동화함으로써 분류체계 시스템의 운용의 효율성과 편의성은 향상될 수 있으나, 실질적으로 업무에 적용하기 위해서는 분류체계 생성 단계에서부터 사용자가 적극적으로 개입하여 요구사항을 반영할 수 있어야한다. 본 연구에서 제안하는 분류체계 생성 알고리즘은 사용자가 원하는 분류단계를 입력받아 이에 맞는 분류체계를 맞춤형으로 생성한다. 또한, 일차적으로 생성한 분류체계를 사용자가 원하는 형태로 변환할 수 있도록 분류항목을 조작하는 연산자를 제안하고 구현한다.

  • PDF

상품 속성정보를 이용한 분류체계 자동생성 (Automated Classification Scheme Generation using Product Attribute Information)

  • 장두석;전종훈
    • 정보처리학회논문지D
    • /
    • 제14D권5호
    • /
    • pp.491-500
    • /
    • 2007
  • 온라인상에서 거래되는 상품들을 분류하고 관리하기 위해서는 많은 시간과 비용을 들여 상품분류체계를 유지하여야 한다. 일반적으로 상품을 다루는 모든 분야에서 분류체계는 분류전문가에 의하여 수동으로 관리되고 있으며 이는 경제적인 측면, 시간적인 측면에서 많은 낭비를 초래하게 된다. 현대사회에서는 산업의 급속한 발전으로 상품의 다양화 융합화 등이 활발하게 이루어져 상품을 효율적으로 관리하기 위한 분류체계의 필요성은 더더욱 증가하고 있다. 따라서 상품분류체계를 자동화 하고자 하는 연구들이 많이 진행되어 왔으며 이런 연구의 일환으로 본 논문에서는 분류체계를 자동으로 생성하는 방안을 제안한다. 각각의 상품은 속성의 집합이다 라는 관점에서 출발하여 각 상품, 즉 속성집합 간 존재하는 포함관계를 활용하여 계층 트리구조의 분류체계를 자동으로 생성하는 알고리즘을 제시하고 구현하였으며, 실험을 통하여 제안한 알고리즘의 실효성을 입증하였다.

위키피디아 카테고리 구조를 이용한 상하위 관계 추출 (ISA Relation Extraction from Wikipedia Category Structure)

  • 최동현;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.1-5
    • /
    • 2009
  • 상하위 관계 자동 추출은 분류체계를 자동 구축하는 데 있어서 핵심적인 내용이며, 이렇게 자동으로 구축된 분류 체계는 정보 추출과 같은 여러 가지 분야에 있어서 중요하게 사용된다. 본 논문에서는 위키피디아 카테고리 구조로부터 상하위 관계를 추출하는 방식에 대하여 제안한다. 본 논문에서는 판별하고자하는 위키피디아 카테고리 구조뿐만이 아닌, 그와 관련된 다른 위키피디아 카테고리 구조까지 고려하여 카테고리 이름에 나타난 토큰들간의 수식 그래프를 구축한 후, 그래프 분석 알고리즘을 통하여 각 카테고리 구조가 상하위 관계일 가능성에 대한 점수를 매긴다. 실험 결과, 본 알고리즘은 기존의 연구로 상하위 관계임을 판별할 수 없었던 일부 카테고리 구조에 대하여 성공적으로 상하위 관계인지를 판별하였다.

  • PDF

융선 기울기의 변화량을 이용한 앙상블 지문분류 시스템 (An Ensemble Fingerprint Classification System Using Changes of Gradient of Ridge)

  • 윤경배;박창희
    • 한국지능시스템학회논문지
    • /
    • 제13권5호
    • /
    • pp.545-551
    • /
    • 2003
  • 본 논문은 전통적인 지문분류 모델인 헨리식 분류방법으로는 적용이 어려운 현대의 자동화된 지문인식 시스템에서 대용량 데이터베이스 운용시 정합속도를 향상시키기 위한 융선 기울기의 변화량을 이용한 앙상블 지문분류 알고리즘을 적용한다. 기존의 분류체계인 헨리분류체계는 중심점과 삼각점을 모두 획득하는 회전낙인의 경우에 사용 가능한 분류방법이나 현대의 자동화된 지문인식 시스템에서는 입력센서의 크기 및 입력방법의 문제로 인하여, 헨리식 분류방법을 적용할 수 없다. 본 논문에서 제안하는 앙상블 지문분류 시스템 알고리즘은 융선 기울기의 변화량을 이용하여 삼각점을 획득하지 못한 영상에서도 기존의 헨리식 분류체계에 의해 분류된 5개의 문양을 분류할 수 있다. 이와 같은 방법으로 지문분류론 수행한 후 정합을 실행하면 정합 대상이 되는 데이터의 양이 줄어들게 되어 인식 시스템의 정합속도를 향상시킬 수 있다.

그래프 구조를 이용한 카테고리 구조로부터 상하위 관계 추출 (Graph-based ISA/instanceOf Relation Extraction from Category Structure)

  • 최동현;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.464-469
    • /
    • 2010
  • 상하위 관계 자동 추출은 분류체계를 자동 구축하는 데 있어서 핵심적인 내용이며, 이렇게 자동으로 구축된 분류 체계는 정보 추출과 같은 여러 가지 분야에 있어서 중요하게 사용된다. 본 논문에서는 카테고리 구조로부터 상하위 관계를 추출하는 방식에 대하여 제안한다. 본 논문에서는 판별하고자 하는 카테고리 구조뿐만이 아닌, 그와 관련된 다른 카테고리 구조까지 고려하여 카테고리 이름에 나타난 토큰들간의 수식 그래프를 구축한 후, 그래프 분석 알고리즘을 통하여 각 카테고리 구조가 상하위 관계일 가능성에 대한 점수를 매긴다. 실험 결과, 본 알고리즘은 기존의 연구로 상하위 관계임을 판별할 수 없었던 일부 카테고리 구조에 대하여 성공적으로 상하위 관계인지를 판별하였다.

경계범주 자동탐색에 의한 확장된 학습체계 구성방법 (Construction Scheme of Training Data using Automated Exploring of Boundary Categories)

  • 최윤정;지정규;박승수
    • 정보처리학회논문지B
    • /
    • 제16B권6호
    • /
    • pp.479-488
    • /
    • 2009
  • 본 논문은 기존의 목표항목만을 위주로 한 학습체계에서 발생하는 오분류 문제의 해결을 위해 기존의 학습체계에 경계항목을 자동으로 탐 색하여 포함시켜 확대시키는 방법을 제안하고 있다. 여러 주제에 걸쳐 다양한 내용을 다루는 복잡한 문서들은 확실히 어느 범주로 분류해야 할 지 판가름하기 어려운 성질인 모호성이 강하다. 이러한 경우 모든 경우들을 정확히 구분할 수 있는 최적의 경계를 찾는 일은 더욱 어려운 일이 다. 복잡하고 불확실성이 높은 데이터들의 특징은 대부분 분류 경계영역에 위치하므로 이러한 분류경계의 데이터들을 새로운 학습 항목으로 인 식시키도록 하는 것이 필요하다. 본 연구에서는 주어진 목표항목 사이의 경계항목을 자동으로 탐색하여 학습체계에 추가하는 학습 체계 확장 알고리즘을 제시하고, 의도적인 학습오류를 발생시킨 후 기존방법과의 비교실험을 수행함으로써 제안방법의 정확성과 안정성을 비교하였다. 실 험결과 경계범주를 포함하여 학습 체계를 확장시켰을 때의 예측력은 기존 0.70에서 0.86으로 약 24% 향상 되었고, 오류를 포함시켰을 때의 예 측력은 기존 0.52에서 0.79로 약 49% 향상되었다.

CC기반 통합제품 평가업무량 모델과 정보보호제품 분류체계 (Composite Product Evaluation Effort Model for CC Evaluation and Classification System of Information Security Product)

  • 최승;최상수;이강수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.328-330
    • /
    • 2004
  • 현재 CC는 하나의 제품으로 이루어진 단일 TOE(Target of Evaluation)를 기준으로 작성된 것이며, 여러 제품으로 이루어진 시스템에 대해서는 다루고 있지 않다. 또한 국ㆍ내외적으로 정보보호제품 분류체계가 서로 달라 표준화가 이루어져야 한다. 이에 본 논문에서는 CC기반 통합제품의 산출 모델 및 평가업무량 알고리즘을 제시하고, 환경에 따른 표준화된 정보보호제품 분류체계를 제시한다.

  • PDF