• 제목/요약/키워드: Question Classification

검색결과 157건 처리시간 0.024초

키워드 패턴을 이용한 질의유형 분류 시스템 구현 (Implementation of a Question Type Classification System using Keyword Patterns)

  • 안혁주;김민경;김학수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.813-815
    • /
    • 2015
  • 질의응답 시스템에서 정답선택의 정확률을 향상시키기 위해 본 논문은 패턴과 휴리스틱을 기반으로 하는 질의유형 추출 시스템을 구현하는 방법을 제안한다. 질의유형은 DBPedia에서 사용하는 클래스타입을 기반으로 추출되며 질의유형에 포함하는 키워드패턴들을 수집하여 키워드패턴 데이터를 생성한다. 그 후 한국어 질의에서 많이 발생하는 유형을 분석하여 휴리스틱을 이용해 사용자가 의도한 질의 유형을 출력한다. 제안시스템은 기존 연구에 비해 구축과 수정이 쉽다는 장점이 있다.

KorBERT 기반 빈칸채우기 문제를 이용한 텍스트 분류 (Text Classification using Cloze Question based on KorBERT)

  • 허정;이형직;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.486-489
    • /
    • 2021
  • 본 논문에서는 KorBERT 한국어 언어모델에 기반하여 텍스트 분류문제를 빈칸채우기 문제로 변환하고 빈칸에 적합한 어휘를 예측하는 방식의 프롬프트기반 분류모델에 대해서 소개한다. [CLS] 토큰을 이용한 헤드기반 분류와 프롬프트기반 분류는 사전학습의 NSP모델과 MLM모델의 특성을 반영한 것으로, 텍스트의 의미/구조적 분석과 의미적 추론으로 구분되는 텍스트 분류 태스크에서의 성능을 비교 평가하였다. 의미/구조적 분석 실험을 위해 KLUE의 의미유사도와 토픽분류 데이터셋을 이용하였고, 의미적 추론 실험을 위해서 KLUE의 자연어추론 데이터셋을 이용하였다. 실험을 통해, MLM모델의 특성을 반영한 프롬프트기반 텍스트 분류에서는 의미유사도와 토픽분류 태스크에서 우수한 성능을 보였고, NSP모델의 특성을 반영한 헤드기반 텍스트 분류에서는 자연어추론 태스크에서 우수한 성능을 보였다.

  • PDF

오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구 (A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries)

  • 안애림;이서진;최동현;김응균;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

나이브 베이지안 분류기를 이용한 게시물 자동 분류를 위한 eCRM 에이전트 시스템 (eCRM Agent System for Articles Automatic Classification System based on Naive Bayesian Classifier)

  • 최정민;이병수
    • 전기전자학회논문지
    • /
    • 제8권2호
    • /
    • pp.216-223
    • /
    • 2004
  • 최근 전자 상거래에서 사용하고 있는 게시판은 고객의 능동적인 참여로 운영되며, 게시물은 고객의 직접적인 의사를 들을 수 있는 인 바운드(Inbound)정보로서 다른 eCRM을 위한 고객 접점 채널 과는 성격이 다른 도구이다. 또한 게시판의 효과적인 운영은 게시판 자체의 신뢰도를 향상 시키고 나아가 전자 상거래 전체의 신뢰도를 높여 줄 수 있는 중요한 eCRM 도구이다. 그러나 현재 대부분의 전자상거래에서 운영하는 게시판은 기 분류된 카테고리를 고객이 직접 수동으로 선정하도록 되어 있고, 이렇게 임의로 분류되는 게시물에 대하여 체계적인 처리 과정 없이 답변이 이루어지기 때문에 답변을 하는데 많은 시간이 소요 되고 있으며, 정확한 답변이 이루어지지 않고 있는 실정이다. 따라서, 본 논문에서는 여러 가지 종류의 게시물에 대하여 나이브 베이지안 분류기를 이용하여 게시판의 기존 문제점의 해결과 효과적인 운영 그리고 게시물의 체계적인 분류 관리를 할 수 있는 게시물 자동 분류기를 설계하고 구현하였다. 아울러 문서 분류 학습 기법 중 대표적인 TFIDF. k-NN, 나이브 베이지안 기법들의 게시물 분류 성능을 측정하여 채택한 나이브 베이지안 분류기의 우수성을 확인 하였다.

  • PDF

대한 정형외과 전공의 평가시험에서 족부-족관절 분야 문항 분석 (An Analysis of the Foot and Ankle-related Questions on the Korean Orthopedic In-Training Examination)

  • 김현수;김동희;신성진;강병률
    • 대한족부족관절학회지
    • /
    • 제21권3호
    • /
    • pp.104-107
    • /
    • 2017
  • Purpose: The purpose of this study was to evaluate the questions pertaining to the foot and ankle on the Korean Orthopedic In-Training Examination (KOITE) between 2012 and 2016. Materials and Methods: Questions regarding the foot and ankle on KOITE during the five-year period (2012~2016) were analyzed. Number of foot and ankle questions, topics, taxonomic classification, imaging modalities, and cited references related to each question were analyzed. Results: The average number of foot and ankle questions was 35, accounting for 7.0% (35/500) of all KOITE questions. All questions were categorized into three topic areas: disease (51.4%, 18/35), trauma (31.4%, 11/35), and basics (17.1%, 6/35). Taxonomy 3 (decision-making type questions) was the most common (42.9%, 15/35). References that are commonly used for each question were Campbell's Operative Orthopedics (100%, 35/35) and the textbook of The Korean Orthopaedic Association (74.3%, 26/35). Conclusion: This analysis can be valuable to not only orthopaedic surgery residents to improve their knowledge of orthopedics, but also to instructors for optimizing their education programs.

2015 개정 교육과정 초등 실과 교과서 소프트웨어와 로봇 단원 발문 분석 및 CT마중발문 개발 (Study of Types of Questions Presented in Software and Robot Units of 2015 Revised Elementary School Practical Curriculum and Development of CT Trigger Questioning)

  • 오정철;진영지;김봉철;김종훈
    • 정보교육학회논문지
    • /
    • 제24권3호
    • /
    • pp.215-223
    • /
    • 2020
  • 2015 개정 교육과정 초등학교 6종 실과 교과서 소프트웨어 단원과 로봇 차시에 제시된 523개 발문 유형을 분석한 결과, SW 단원에서는 폐쇄적 발문이 77.1%, 개방적 발문이 22.9%로 나타났고 로봇 단원에서는 폐쇄적 발문이 74.8%, 개방적 발문이 25.2%로 나타났다. 폐쇄적 발문 중심인 SW 교과서 발문의 한계를 보완하고 교사들이 교육 목적과 활동 내용에 따라 컴퓨팅 사고력 신장을 위한 다양한 컴퓨터 교육에 활용할 수 있는 CT마중발문을 개발하였다.

전자장비 고장진단 질의응답을 위한 인과관계 정의 및 추출 (Definition and Extraction of Causal Relations for Question-Answering on Fault-Diagnosis of Electronic Devices)

  • 이신목;신지애
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권5호
    • /
    • pp.335-346
    • /
    • 2008
  • 온톨로지의 인과관계는 특정 응용을 위한 추론에서 중요한 역할을 하므로, 인과관계는 응용에서 쓰이는 추론의 형태에 근거하여 정의되어야 한다. 본 논문에서는, 전자장비의 고장진단 질의응답을 위한 온톨로지에서의 인과관계를 정의하고 추출하는 모델을 제시한다. 질의응답의 패턴을 분석하여 인과범주를 정의하고, 질의응답에서 나타나는 개념들 사이의 관계들 중 인과범주에 속하는 경우를 인과관계로 정의한다. 인과관계 인스턴스는 응용분야의 정의문으로부터 어휘 패턴을 이용하여 추출되고 시소러스 정보를 이용하여 점진적으로 확장된다. 분야 전문가들의 평가 결과, 본 모델은 관계분류에 있어서 92.3%의 평균 정확률과 추출 단계의 인과관계 인식에 있어서 80.7%의 정확률을 보인다.

체육 중등교사 임용시험의 교과교육학 하위영역에 대한 출제경향 분석 (Trend Analysis of Sport Pedagogy Sub-Domain in Secondary Teacher Certification Examination)

  • 조기범;김승용
    • 디지털융복합연구
    • /
    • 제19권4호
    • /
    • pp.339-347
    • /
    • 2021
  • 본 연구는 객관식 문항이 폐지된 이후인 2014년부터 2020년까지 7년간 체육 중등교사 임용시험의 교과교육학 문항을 한국교육과정평가원에서 제시한 평가내용요소를 근거로 분석하였다. 연구결과로 교과교육학 문항은 7년간 48문항이 출제되었으며, 83개의 하위질문이 발견되었다. 시사점으로는 첫째, 하위질문 개수의 빈도가 높아지면서 통합형 문제가 출제되고 있다. 둘째, 출제 문항 영역의 심각한 불균형 문제가 드러났다. 셋째, 체육교수학습 및 평가, 체육교육과정 영역에 지나친 출제 의존도를 보이고 있었다. 넷째, 교과내용학과 중복되는 평가 영역이 존재함에 따라 혼란이 가중되었다. 그러므로 한국교육과정평가원의 기존 평가 영역별 분류표를 기반으로 평가 내용 요소에 대한 정의가 명확하게 내려져야 하며 신뢰로운 교사시험을 위해 특정 학자와 이론에 의존에서 벗어나 학교현장에서 도움이 될 수 있는 문항들이 개발될 필요가 있다.

웹 이용행태에 따른 사용자분류 가능성에 관한 연구 (A Study on the Possibility of User Classification by Web-Using Types)

  • 신목영;김병욱
    • 디자인학연구
    • /
    • 제19권1호
    • /
    • pp.317-328
    • /
    • 2006
  • 지금까지 사용성과 관련된 웹 이용행위에 대한 예측이나 분석은 사용자의 인구통계학적 특성이나 사용정황의 특성만으로 주로 설명되어 왔다. 그러나 그러한 특성만이 행위를 유발하늑 요인으로 볼 수 있는지, 그렇지 않다면 어떠한 요인이 있으며 또한 그러한 요인들은 행위에 어떠한 특성을 유발할 것인지에 대한 의문으로 본 연구를 진행하였다. 이는 사용자 중심의 사용자인터페이스(UI)디자인에서 사용자 특성을 정의하는데 중요한 요소로 활용되었던 사용자정보(User Profile)를 사용에 있어서의 특정유형과의 상관관계를 포함하는 사용자정보(User Profile)로 확장시킴으로써 구체적인 사용자인터페이스(UI)디자인에 적용될 수 있도록 하기 위함이다. 연구내용은 첫째, 다양한 미디어에 따른 사용자를 이해하고 기존의 사용자 분류 방법을 고찰한다. 둘째, 웹 이용행태에 따른 사용자 분류를 위한 사용자 분류변수 및 변수 측정 척도를 마련하고 사례 연구를 통해 사용자 행위 특성을 추출하여 특성에 따른 사용자를 분류한다. 셋째, 실험을 통해 수집된 데이터를 바탕으로 분류된 사용자 집단의 사용자정보(User Profile)의 특성을 밝혀 사용자정보(User Profile)의 특성이 유발하는 행위의 요인을 규명하기 위해 행위 특성과 사용자정보(User Profile)의 특성을 맵핑시켰다. 이를 통해 사용자의 이용행태에 따른 특성이 사용자정보(User Profile)특성 중 사용자의 일반 정보와 사용정황 뿐 아니라 개인성향이나 매체 사용태도와 성격유형 등도 영향을 끼칠 수 있다는 가능성을 발견할 수 있었다. 실험 설계상의 몇 가지의 문제점들이 발견되었으나 이를 개선하고 보완한다면 좀 더 명확한 사용행위에 따른 사용자정보(User Profile)특성을 추출할 수 있을 것이다. 따라서 사용자정보(User Profile) 특성으로도 사용자의 행위 유형을 예측할 수 있어 사용자 분류를 활용한 사용자인터페이스(UI)디자인의 가능성을 확대시킬 수 있을 것이다.

  • PDF

목적 지향 대화를 위한 효율적 질의 의도 분석에 관한 연구 (Effective Text Question Analysis for Goal-oriented Dialogue)

  • 김학동;고명현;임헌영;이유림;지민규;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.48-57
    • /
    • 2019
  • 본 연구는 목적 지향 대화 시스템 내에서 단일 한국어 텍스트 형식의 질문으로부터 질의자의 의도를 파악하는 것을 목적으로 한다. 목적 지향 대화 시스템은 텍스트 또는 음성을 통한 사용자의 특수한 요구를 만족시켜주는 대화 시스템을 의미한다. 의도 분석 과정은 답변 생성에 앞서 사용자의 질의 의도를 파악하는 단계로, 목적 지향 대화 시스템 전체의 성능에 큰 영향을 준다. 생활화학제품이라는 특정 분야에 제안 모델을 사용하였고, 해당 분야와 관련된 한국어 텍스트 데이터를 이용하였다. 특정 분야에 독립적이며 범용적인 의도를 의미하는 화행과, 특정 분야에 종속적인 의도를 의미하는 개념열로 나누어 분석한다. 화행과 개념열을 분석하기 위하여 단어 임베딩 모델, 합성곱 신경망을 이용한 분류 방법을 제안한다. 단어 임베딩 모델을 통하여 단어의 의미정보를 추상화하고, 추상화된 단어의 의미정보를 기반으로 합성곱 신경망을 통하여 개념열 및 화행 분류를 수행한다.