• 제목/요약/키워드: 분류각

검색결과 5,750건 처리시간 0.032초

Encoder Layer를 이용한 의도 분류 성능 비교 (Comparing the Performances of Intent Classifications by Encoder Layer)

  • 안혁주;김혜영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.410-413
    • /
    • 2021
  • 본 논문에서는 분류 모델의 주류로 사용되고 있는 Encoder 기반 사전학습 모델(BERT, ALBERT, ELECTRA)의 내부 Encoder Layer가 하부 Layer에서는 Syntactic한 분석을 진행하고 상부 Layer로 갈수록 Semantic 한 분석을 진행하는 점, Layer가 구성됨에 따라 Semantic 정보가 Syntactic 정보를 개선해 나간다 점에 기반한 기존 연구 결과를 바탕으로 Encoder Layer를 구성함에 따라 어떻게 성능이 변화하는지 측정한다. 그리고 의도 분류를 위한 학습 데이터 셋도 분류하고자 하는 성격에 따라 Syntactic한 구성과 Semantic한 구성을 보인다는 점에 착안하여 ALBERT 및 ELECTRA를 이용한 의도 분류 모델을 구축하고 각 데이터 셋에 맞는 최적의 Encoder Layer 구성을 가지는 모델을 비교한 결과, 두 데이터 셋 간에 다른 Layer 구성을 보이는 점과 기존 모델보다 성능이 향상됨을 확인하였다.

  • PDF

ResNet-50 모델을 이용한 손글씨 데이터 세트의 분류 성능 분석 및 비교 (Analysis and Comparison of Classification Performance on Handwritten Datasets using ResNet-50 Model)

  • 송제용;시종욱;김성영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.19-20
    • /
    • 2023
  • 본 논문은 손글씨 인식 분야에서 가장 기본적이고 중요한 주제인 손글씨 데이터 세트에 대한 분류 성능을 분석하고 비교하는 것을 목표로 한다. 이를 위해 ResNet-50 모델을 사용하여 MNIST, EMNIST, KMNIST라는 세 가지 대표적인 손글씨 데이터 세트에 대한 분류 작업을 수행한다. 각 데이터 세트의 특징과 도메인, 그리고 데이터 세트 간의 차이와 특징에 대해 다루며, ResNet-50 모델을 학습하고 평가한 분류 성능을 비교하고 결과에 대해 분석한 결과를 제시한다.

  • PDF

글자 단위 텍스트 인식 기반의 이미지 내 한글 글꼴 분류 시스템 개발 (Development of a Korean Font Classification System for Images Based on Syllable-Level Text Recognition)

  • 유사라;김윤주;송지효;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.718-721
    • /
    • 2023
  • 이미지 내 글꼴을 파악하는 것은 디자인 자료 제작, 저작권 확인 등 다양한 곳에서 중요한 문제이다. 하지만 이미지 내 한글 글꼴을 자동으로 식별하는 시스템은 아직 존재하지 않으며, 수동으로 한글 글꼴을 파악하는 것은 시간과 정확도 측면에서 매우 비효율적이다. 따라서 본 논문에서는 이미지 내 한글 글꼴을 자동으로 인식하는 시스템을 개발한다. 본 논문에서 개발한 시스템은 크게 두 가지 기법을 사용한다: (1) 한글의 기하학적인 특성을 활용하여 글자 단위로 텍스트를 인식하며, (2) 단어가 아닌 글자 단위로 글꼴을 분류하고 각 글자에 대한 글꼴 분류 결과를 종합하여 최종적인 글꼴 분류 결과를 얻는다. 10가지 한글 글꼴이 나타나는 직접 제작한 이미지를 사용하여 시스템의 성능을 평가한 결과 제안 방법은 비교 방법에 비해 더욱 정확히 한글 글꼴을 분류함을 확인하였다.

센서 어레이의 신호패턴 분류를 위한 각도 변이 기반 상태 천이 모델링 기법 (Angle Difference Based State Transition Modeling Technique for the Classification of Signal Pattern from the Sensor Array)

  • 김아람;이승재;김상경;박수현;김창화
    • 한국시뮬레이션학회논문지
    • /
    • 제15권3호
    • /
    • pp.49-60
    • /
    • 2006
  • 센서 어레이로부터 감지된 신호 패턴을 분류함으로써 감지 대상체를 구별하기 위해 본 연구에서는 상태 천이 모델을 이용하는 방법을 제안하였다. 센서 어레이의 신호 데이터를 패턴 모양의 특성을 나타낼 수 있는 상태 천이 모델로 변환하여 감지 대상체의 구별이 보다 정확하게 이루어 질 수 있도록 모델을 설계하는데 초점을 두면서, 모델링 요소인 '상태'는 각도 $(-\frac{\pi}{2},\frac{\pi}{2})$을 n개의 일정한 크기의 구간으로 나누어 각 구간을 하나의 상태로 정의하고, '천이' 관계는 일정한 시간 간격으로 샘플링된 신호 데이터 간의 각도 변화로 각각 정의하여 각도변이 기반 상태천이 모델링을 고안하였으며 모델의 유효성을 실험을 통하여 검증하였다.

  • PDF

초등학교도서관을 위한 한국십진분류법 간략판 개발에 관한 연구 (A Study on the Development of Abridged KDC for Elementary School Libraries)

  • 김정현
    • 한국도서관정보학회지
    • /
    • 제37권2호
    • /
    • pp.5-23
    • /
    • 2006
  • 이 연구는 우리나라의 표준분류표인 KDC를 대상으로 분류체계는 그대로 따르면서 초등학교도서관 이용에 적합한 KDC 간략판을 개발하는데 있다. 이를 위해 국내 초등학교도서관을 대상으로 실제로 소장된 문헌의 KDC 유별 현황을 분석하여 각 분류항목의 실제적인 문헌의 유별 분포도를 분석하였으며, 이를 바탕으로 한국십진분류법해설에서 제시하고 있는 장서량에 따른 분류표의 활용지침을 보다 구체적으로 적용할 수 있는 근거를 마련하였다. 이러한 근거를 바탕으로 2만권 전후의 초등학교도서관을 위한 KDC 간략판의 방안을 제시하였다.

  • PDF

분류체계 일치를 통한 과학기술정보 상호 교환 방법에 관한 기초 연구 (A Preliminary Study on Interchange of Science and Technology Information through Harmonization of Classification Schemes)

  • 홍성화;서태설
    • 정보관리연구
    • /
    • 제35권3호
    • /
    • pp.109-123
    • /
    • 2004
  • 과학기술정보의 의미적 상호운용성 문제는 빈번하게 발생한다. 잘 만들어진 분류체계는 상이한 데이터베이스 간에 의미상 불일치 없이 정보를 교환하기 위한 도구로 사용될 것이다. 하지만 각 데이터베이스가 취하고 있는 분류체계가 상이함으로 인해서 여전히 현실적인 장벽이 존재한다. 따라서 분류체계간의 일치 및 조화는 매우 시급한 문제이다. 본 논문의 목표는 다른 분류체계('국가과학기술표준분류'와 'KISTI 표준 분류')를 갖는 데이터베이스간의 정보 교환 시에 발생할 수 있는 의미적 불일치를 해결하는 것이다. 이를 위해서 과학기술의 개념적 체계 분석을 수행하였고 다섯가지의 일치/불일치 유형을 사례에 기반하여 분석하였다.

한국산 부추속(Allium, Alliaceae)의 분류학적 재검토 (A taxonomic review of Korean Allium (Alliaceae))

  • 최혁재;장창기;고성철;오병운
    • 식물분류학회지
    • /
    • 제34권2호
    • /
    • pp.119-152
    • /
    • 2004
  • 한국산 부추속 식물을 분류학적으로 재검토하였으며, 3아속, 10절, 17종, 3변종으로 정리하였다. 이 중 한국 특산종은 돌부추(A. koreanum), 한라부추(A. taquetii), 세모부추(A. deltoide-fistulosum), 선부추(A. linearifolium), 세모산부추(A. thunbergii var. deltoides), 등 근산부추(A. thunbergii var. teretifolium) 등의 6분류군이었으며, 노랑부추(A. condensatum), 가는산부추(A. splendens), 산파(A. maximowiczii) 등은 북한에만 분포하는 것으로 밝혀졌다. 정확한 종 동정을 위해 아속, 절, 종 및 종하분류군에 대한 검색표와 각 분류군의 기재문을 제시하였다.

KDC 제5판의 주기분석에 관한 연구 (A Study on the Notes Analysis of KDC 5th Edition)

  • 정옥경
    • 한국비블리아학회지
    • /
    • 제22권3호
    • /
    • pp.207-228
    • /
    • 2011
  • 분류표에서 주기는 분류항목과 기호에 대한 유용한 정보를 제공하여 분류의 정확성과 일관성을 향상시켜 준다. KDC에서도 여러 가지 유형의 주기를 사용하고 있으나, 급변하는 학문의 진전과 확대를 따르기에는 주기의 이용이 상당히 미흡하다. 따라서 본 연구의 목적은 KDC에 적합한 주기유형과 개선방안을 제시하는 것이다. 이 목적을 위하여 KDC의 주기유형의 변천과 DDC23판, NDC신정9판, KDC5판의 서문에 제시하고 있는 주기를 분석하고, 각 분류표에서 실제로 사용되고 있는 주기의 유형을 비교 분석하여 KDC5판의 주기의 문제점과 개선방안을 제시하였다.

DCT와 정보 화소 밀도를 이용한 PDA로 획득한 명함 영상에서의 영역 해석 (Region Analysis of Business Card Images Acquired in PDA Using DCT and Information Pixel Density)

  • 김종흔;장익훈;김남철
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1159-1174
    • /
    • 2004
  • 본 논문에서는 PDA에 장착된 카메라를 사용하여 획득한 명함 영상에 대한 효율적인 영역 해석 알고리듬을 제안한다. 제안된 방법은 크게 영역 분할, 정보 영역 분류, 문자 영역 분류의 3개 과정으로 구성된다. 영역 분할에서는 입력 명함 영상을 8${\times}$8 크기의 블록으로 나누고 각 블록을 저주파 대역에서의 정규화 된 DCT 계수의 에너지를 이용하여 정보 블록과 배경 블록으로 분류한 다음, 블록에 대한 영역 라벨링을 통하여 정보 영역과 배경 영역으로 분할한다. 정보 영역 분류에서는 각 정보 영역을 블록 신호의 수평, 수직 방향 에지 성분과 저주파 대역에서의 DCT 계수의 에너지 비와 이진화 된 정보 영역 내에서의 흑화소인 정보 화소의 밀도를 이용하여 문자 영역과 배경 영역으로 분류한다. 문자 영역 분류에서는 분류된 문자 영역을 정보 화소의 밀도와 평균 런 길이를 이용하여 다시 큰 문자와 작은 문자 영역으로 분류한다. 실험결과 제안된 영역 해석 방법은 여러 종류의 명함을 다양한 주변 여건에서 PDA로 획득한 시험 영상에 대하여 정보 영역과 배경 영역을 잘 분할하고, 정보 영역을 문자 영역과 그림 영역으로 잘 분류하며, 다시 문자 영역을 큰 문자와 작은 문자 영역으로 잘 분류함을 보였다 그리고 제안된 영역 분할 방법과 정보 영역 분류 방법은 기존의 방법들보다 각각 약 2.2-10.1%와 7.7%의 에러율 향상을 보였다.

국가토지피복도와 무감독분류를 이용한 초기 훈련자료 자동추출과 토지피복지도 갱신 (Automatic Extraction of Initial Training Data Using National Land Cover Map and Unsupervised Classification and Updating Land Cover Map)

  • 이승기;최석근;노신택;임노열;최주원
    • 한국측량학회지
    • /
    • 제33권4호
    • /
    • pp.267-275
    • /
    • 2015
  • 토지피복지도는 환경, 군사, 의사결정 등 다양한 분야에서 널리 사용되고 있다. 본 연구에서는 단일 위성영상과 환경부에서 제공하는 국가토지피복도를 이용하여 훈련자료를 자동으로 추출하고, 이를 활용하여 피복을 분류하는 방법을 제안하였다. 이를 위하여 초기 훈련자료는 무감독분류인 ISODATA와 기존 토지피복도를 이용하였으며, 무감독 분류 사용시 각 클래스별 분류 선정과 클래스 명명, 감독분류에서 훈련자료 선정 등의 문제점을 해결하기 위하여 기존 토지피복도의 클래스 정보를 활용하여 자동으로 클래스를 분류하고 명명하였다. 추출된 초기 훈련자료는 대상 위성영상의 토지피복분류를 위하여 MLC의 훈련자료를 활용하였고, 피복분류의 정확도 향상을 위하여 반복방법을 적용하여 훈련자료를 갱신하였으며 최종적으로 토지피복지도를 추출하였다. 또한, 화소분류방법에서 발생하는 salt and pepper를 감소시키기 위하여 각 반복단계별 MRF를 적용하여 분류정확도를 향상시켰다. 본 연구에서 제안된 방법을 대상지역에 적용한 결과 효과적으로 토지피복지도를 생성할 수 있음을 정량적, 시각적으로 확인하였다.