• 제목/요약/키워드: Question Classification

검색결과 157건 처리시간 0.026초

자동문서분류를 위한 텐서공간모델 기반 심층 신경망 (A Tensor Space Model based Deep Neural Network for Automated Text Classification)

  • 임푸름;김한준
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.3-13
    • /
    • 2018
  • 자동문서분류(Text Classification)는 주어진 텍스트 문서를 이에 적합한 카테고리로 분류하는 텍스트 마이닝 기술 중의 하나로서 스팸메일 탐지, 뉴스분류, 자동응답, 감성분석, 쳇봇 등 다양한 분야에 활용되고 있다. 일반적으로 자동문서분류 시스템은 기계학습 알고리즘을 활용하며, 이 중에서 텍스트 데이터에 적합한 알고리즘인 나이브베이즈(Naive Bayes), 지지벡터머신(Support Vector Machine) 등이 합리적 수준의 성능을 보이는 것으로 알려져 있다. 최근 딥러닝 기술의 발전에 따라 자동문서분류 시스템의 성능을 개선하기 위해 순환신경망(Recurrent Neural Network)과 콘볼루션 신경망(Convolutional Neural Network)을 적용하는 연구가 소개되고 있다. 그러나 이러한 최신 기법들이 아직 완벽한 수준의 문서분류에는 미치지 못하고 있다. 본 논문은 그 이유가 텍스트 데이터가 단어 차원 중심의 벡터로 표현되어 텍스트에 내재한 의미 정보를 훼손하는데 주목하고, 선행 연구에서 그 효능이 검증된 시멘틱 텐서공간모델에 기반하여 심층 신경망 아키텍처를 제안하고 이를 활용한 문서분류기의 성능이 대폭 상승함을 보인다.

협동 디지털참고서비스의 질문 분석: 국립중앙 도서관의 '사서에게 물어보세요'를 중심으로 (Question Analysis of the Collaborative Digital Reference Service at the National Library of Korea)

  • 장혜란;이경숙
    • 정보관리학회지
    • /
    • 제31권4호
    • /
    • pp.7-28
    • /
    • 2014
  • 협동 디지털참고서비스의 이용자 정보요구를 파악하기 위하여, 국립중앙도서관의 '사서에게 물어보세요'에 2014년 전반기에 실제로 접수된 질문엔트리(N=661)를 대상으로, 질문의 수와 본질, 주제, 정보요구 발생정황, 이용자가 원하는 최종산물, 사서의 활동, 답변에 사용된 정보원 등을 분석하였다. 엔트리에 포함된 평균 질문 수는 1.17건이며 순수참고질문은 77.82%로 나타났다. 주제별로는 총류가 45.68%를 차지하고, 요구정황은 부과된 질문이 주를 이루었으며(84.17%), 이용자가 원하는 최종산물은 서지에(60.48%) 집중되었다. 사서의 활동은 문헌탐색(37.67%), 연구조사(19.67%), 사실탐색(18.67%) 순서이다. 답변제공에 사용된 정보원은 이차자료가 지배적이었으며(73.62%), 각종 웹사이트도 14.75%를 차지하고 있다. 부문별 세부항목별 내용을 분석하였으며, 결과에 기초하여 디지털참고서비스 진흥을 위한 도서관계의 노력을 제언하였다.

Automatic Categorization of Islamic Jurisprudential Legal Questions using Hierarchical Deep Learning Text Classifier

  • AlSabban, Wesam H.;Alotaibi, Saud S.;Farag, Abdullah Tarek;Rakha, Omar Essam;Al Sallab, Ahmad A.;Alotaibi, Majid
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.281-291
    • /
    • 2021
  • The Islamic jurisprudential legal system represents an essential component of the Islamic religion, that governs many aspects of Muslims' daily lives. This creates many questions that require interpretations by qualified specialists, or Muftis according to the main sources of legislation in Islam. The Islamic jurisprudence is usually classified into branches, according to which the questions can be categorized and classified. Such categorization has many applications in automated question-answering systems, and in manual systems in routing the questions to a specialized Mufti to answer specific topics. In this work we tackle the problem of automatic categorisation of Islamic jurisprudential legal questions using deep learning techniques. In this paper, we build a hierarchical deep learning model that first extracts the question text features at two levels: word and sentence representation, followed by a text classifier that acts upon the question representation. To evaluate our model, we build and release the largest publicly available dataset of Islamic questions and answers, along with their topics, for 52 topic categories. We evaluate different state-of-the art deep learning models, both for word and sentence embeddings, comparing recurrent and transformer-based techniques, and performing extensive ablation studies to show the effect of each model choice. Our hierarchical model is based on pre-trained models, taking advantage of the recent advancement of transfer learning techniques, focused on Arabic language.

생물 예비교사의 과학수업모형을 적용한 수업 시연에 나타난 질문 유형 분석 (Analysis of Question Patterns Appearing in Teaching Demonstrations Which Applied Science Teachings Model Prepared by a Pre-service Biology Teacher)

  • 조인희;손연아;김동렬
    • 과학교육연구지
    • /
    • 제36권2호
    • /
    • pp.167-185
    • /
    • 2012
  • 본 연구는 생물 예비교사의 과학수업모형을 적용한 수업시연에 나타난 질문 유형을 분석하여 수업 전문성 향상을 위한 개선점을 찾는데 목적이 있다. 질문 유형을 분석하기 위한 질문 분석틀은 크게 범주1(인지적 영역질문, 탐구기능질문, 정의적 영역 질문), 범주2(반복질문, 범위를 좁히는 질문, 연습 질문), 범주3(학생활동 진행 질문, 기억 질문, 사고 질문) 질문 유형으로 구분되었다. 5가지 과학수업 모형을 적용한 생물 예비교사의 질문 유형을 분석한 결과, 인지적 영역질문과 기억질문이 가장 높은 빈도를 나타냈다. 순환학습모형에서는 인지적 영역 질문이 가장 많이 나타났고, 특히, 학생활동 진행형 질문은 순환학습모형의 '1차 개념도입단계'와 실험을 수행한 '2차 탐색단계'에서 많이 사용되어 단계의 특징을 나타내고자 하였다. 발견학습모형은 관찰과 측정, 분류, 일반화 과정이 통합되어 있으나 수업시연에서는 기억질문이 많았고, 탐구기능 질문의 비중이 낮게 나타났다. 탐구학습모형에서도 기억질문이 많았고, 다른 수업모형에 비해 탐구기능 질문이 탐구학습모형의 '실험설계단계'와 '실험단계'에서 많이 나타났다. STS수업모형에서는 정의적 영역질문과 사고질문이 다른 수업모형에 비해 많이 나타났다. 개념변화학습모형에서는 기억질문을 많이 사용하여 개념변화학습모형의 모든 단계에서 학생들의 오개념을 자극하고 과학적 개념의 수정에 많은 도움을 주었다.

  • PDF

분류 활동을 통한 직각삼각형 개념 지도에 관한 연구 (A Study on the Teaching the Concept of the Right Triangle through Classification Activity)

  • 노은환;김정훈;강미정;신한영;장송이
    • East Asian mathematical journal
    • /
    • 제34권4호
    • /
    • pp.371-402
    • /
    • 2018
  • The researchers set up a research question to find out how to teach the concept of a right triangle through classification activities after listening to the conversations of fellow teachers about the recently revised textbooks. First, a questionnaire was created to confirm the objectivity of the research problem, data were collected through online and offline, and interviews were conducted with some of the respondents. As a result, it confirmed that there was a considerable difference in the perception of the research study about the direction of revising the curriculum called 'student participation centered' and 'the possibility of achieving the learning objective'. Then, we analyzed the critical interpretations used in the third grade math textbook Lesson 2. 'Plane Figure' part 4 and 5. Finally, by analyzing the results of the recognition analysis and textbook analysis, we proposed two learning methods which can link the triangle classification activity and the right triangle concept. Based on the results of the research, we obtained suggestions that a teaching should be made regarding that the classification process may be changed according to the student's prior knowledge and the process of classification activities may be different according to the viewpoint and classification criteria.

도서관$\cdot$정보학에서의 인공지능의 응용에 관한 고찰 (Artificial Intelligence Applications in Library and Information Science)

  • 정영미
    • 한국문헌정보학회지
    • /
    • 제14권
    • /
    • pp.67-92
    • /
    • 1987
  • In this paper, artificial intelligence applications in library and information science are reviewed. Especially, natural language processing and expert systems are represented as the two major application areas. In natural language processing, natural language interface systems and .question-answering systems are discussed in detail with some specific examples. In the second part of the paper, online search intermidiary systems, reference expert systems, classification and cataloging expert systems are described as possible expert systems to be developed in libraries and information systems. As a conclusion, implications of the artificial intelligence applications for librarians and information scientists are suggested.

  • PDF

자연어 질의 유형판별과 응답 추출을 위한 어휘 의미체계에 관한 연구 (A Study on Word Semantic Categories for Natural Language Question Type Classification and Answer Extraction)

  • 윤성희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2004년도 추계학술대회
    • /
    • pp.141-144
    • /
    • 2004
  • 질의응답 시스템이 정보검색 시스템과 다른 중요한 점은 질의 처리 과정이며, 자연어 질의 문장에서 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 것이다. 본 논문에서는 질의 주-형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의 문장에서 의문사에 해당하는 어휘들을 추출하고 주변에 나타나는 명사들의 의미 정보를 이용하여 세부적인 정답 유형을 결정할 수 있는 질의 유형 분류 방법을 제안한다. 의문사가 생략된 경우의 처리 방법과 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

The Concept and Application Methods of Intelligent Content

  • Yoon Yong-Bae;Chae Song-Hwa;Kim Won-Il
    • International Journal of Contents
    • /
    • 제2권3호
    • /
    • pp.1-5
    • /
    • 2006
  • Intelligent Content is defined as detailed information or fragment of content which contains a semantic data structure. This semantic structure makes possible to do various intelligent operations. There are wide range of content-oriented applications such as classification, retrieval, extraction, translation, presentation and question-answering. The concept of Intelligent Content is applied to various fields like MPEG and Semantic Web. In this paper, we discuss the several important researches of Intelligent Content and how to apply this conception to these fields.

  • PDF

Blastability Quality System (BQS) for using it, in bedrock excavation

  • Christaras, B.;Chatziangelou, M.
    • Structural Engineering and Mechanics
    • /
    • 제51권5호
    • /
    • pp.823-845
    • /
    • 2014
  • Success in the excavation of foundations is commonly known as being very important in asserting stability. Furthermore, when the subjected formation is rocky and the use of explores is required, the demands of successful blasting are multiplied. The quick and correct estimation of excavation's characteristics may help the design of building structures, increasing their safety. The present paper proposes a new classification system which connects blastability and rock mass quality. This new system primarily concerns poor and friable rock mass, heavily broken with mixture of angular and rounded rock pieces. However, it should concern medium and good quality rock mass. The Blastability Quality System (BQS) can be an easy and widely - used tool as it is a quick calculator for blastability index (BI) and rock mass quality. Taking into account the research calculations and the parameters of BQS, what has been at question in this paper is the effect of BI magnitude on a geological structure.

Predicting Discharge Rate of After-care patient using Hierarchy Analysis

  • Jung, Yong Gyu;Kim, Hee-Wan;Kang, Min Soo
    • International Journal of Advanced Culture Technology
    • /
    • 제4권2호
    • /
    • pp.38-42
    • /
    • 2016
  • In the growing data saturated world, the question of "whether data can be used" has shifted to "can it be utilized effectively?" More data is being generated and utilized than ever before. As the collection of data increases, data mining techniques also must become more and more accurate. Thus, to ensure this data is effectively utilized, the analysis of the data must be efficient. Interpretation of results from the analysis of the data set presented, have their own on the basis it is possible to obtain the desired data. In the data mining method a decision tree, clustering, there is such a relationship has not yet been fully developed algorithm actually still impact of various factors. In this experiment, the classification method of data mining techniques is used with easy decision tree. Also, it is used special technology of one R and J48 classification technique in the decision tree. After selecting a rule that a small error in the "one rule" in one R classification, to create one of the rules of the prediction data, it is simple and accurate classification algorithm. To create a rule for the prediction, we make up a frequency table of each prediction of the goal. This is then displayed by creating rules with one R, state-of-the-art, classification algorithm while creating a simple rule to be interpreted by the researcher. While the following can be correctly classified the pattern specified in the classification J48, using the concept of a simple decision tree information theory for configuring information theory. To compare the one R algorithm, it can be analyzed error rate and accuracy. One R and J48 are generally frequently used two classifications${\ldots}$