• 제목/요약/키워드: natural language question

검색결과 85건 처리시간 0.025초

Ontology-lexicon-based question answering over linked data

  • Jabalameli, Mehdi;Nematbakhsh, Mohammadali;Zaeri, Ahmad
    • ETRI Journal
    • /
    • 제42권2호
    • /
    • pp.239-246
    • /
    • 2020
  • Recently, Linked Open Data has become a large set of knowledge bases. Therefore, the need to query Linked Data using question answering (QA) techniques has attracted the attention of many researchers. A QA system translates natural language questions into structured queries, such as SPARQL queries, to be executed over Linked Data. The two main challenges in such systems are lexical and semantic gaps. A lexical gap refers to the difference between the vocabularies used in an input question and those used in the knowledge base. A semantic gap refers to the difference between expressed information needs and the representation of the knowledge base. In this paper, we present a novel method using an ontology lexicon and dependency parse trees to overcome lexical and semantic gaps. The proposed technique is evaluated on the QALD-5 benchmark and exhibits promising results.

What Makes Negative Imperative So Natural for Korean [psych-adjective +-e ha-] Constructions?

  • Kim, Il-Kyu
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.210-222
    • /
    • 2007
  • Regarding Korean psych-adjectives and their -e ha- counterparts, e.i., [psych-adjective + -e ha-] constructions, what is at issue is how to capture the semantic difference and similarity between the two. Concerning this issue, one of the most controversial and difficult problems is whether the psych-construction has Action (Agency) as part of its meaning. The purpose of this paper is to solve this problem by answering the question why psych-constructions are much more natural when they are used as negative imperative than when they are used as positive imperative. First, in order to figure out why positive imperative is not allowed, we show that.e ha- adds the meaning of non-volitional action to psych-adjectives, using Jackendoff's Conceptual Semantics. Secondly, in accounting for why negative imperative is so natural, we show, with Talmy's Force Dynamics theory, what the speaker requires from the hearer is internal volitional action.

  • PDF

다중 작업, 다중 홉 질문 응답을 위한 그래프 추론 및 맥락 융합 (Graph Reasoning and Context Fusion for Multi-Task, Multi-Hop Question Answering)

  • 이상의;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권8호
    • /
    • pp.319-330
    • /
    • 2021
  • 최근 오픈 도메인 자연어 질문 응답 분야에서는 다중 작업, 다중 홉 질문 응답에 관한 연구들이 활발히 진행되어 오고 있다. 본 논문에서는 이러한 다중 작업, 다중 홉 질문들에 효과적으로 응답하기 위해, 계층적 그래프 기반의 새로운 심층 신경망 모델을 제안한다. 제안 모델에서는 계층적 그래프와 그래프 신경망을 이용해 여러 문단들로부터 서로 다른 수준의 맥락 정보를 얻어낸 후, 이들을 활용하여 답변 유형, 뒷받침 문장들과 답변 영역 등을 동시에 예측해낸다. 본 논문에서는 오픈 도메인 자연어 질문 응답 데이터 집합인 HotpotQA를 이용한 실험들을 통해, 제안 모델의 높은 성능과 긍정적 효과를 입증한다.

금융권에 적용 가능한 금융특화언어모델 구축방안에 관한 연구 (A Study on the Construction of Financial-Specific Language Model Applicable to the Financial Institutions)

  • 배재권
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.79-87
    • /
    • 2024
  • 최근 텍스트분류, 감성분석, 질의응답 등의 자연어 처리를 위해서 사전학습언어모델(Pre-trained Language Model, PLM)의 중요성은 날로 강조되고 있다. 한국어 PLM은 범용적인 도메인의 자연어 처리에서 높은 성능을 보이나 금융, 제조, 법률, 의료 등의 특화된 도메인에서는 성능이 미약하다. 본 연구는 금융도메인 뿐만 아니라 범용도메인에서도 우수한 성능을 보이는 금융특화 언어모델의 구축을 위해 언어모델의 학습과정과 미세조정 방법을 제안하는 것이 주요 목표이다. 금융도메인 특화언어모델을 구축하는 과정은 (1) 금융데이터 수집 및 전처리, (2) PLM 또는 파운데이션 모델 등 모델 아키텍처 선정, (3) 도메인 데이터 학습과 인스트럭션 튜닝, (4) 모델 검증 및 평가, (5) 모델 배포 및 활용 등으로 구성된다. 이를 통해 금융도메인의 특성을 살린 사전학습 데이터 구축방안과 효율적인 LLM 훈련방법인 적응학습과 인스트럭션 튜닝기법을 제안하였다.

What can be learned from borrowed words\ulcorner -The case of Japanese language borrowing words ending with a closed syllables-

  • Claude Roberge;Norico Hoki
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.245-245
    • /
    • 1996
  • When language A borrows words, it borrows them according to its own phonetic rules. In other words, language B, where borrowed words coming from, has to comply with the phonetic requirements of language A. It may be added that language A only borrows the elements, the types of syllables and accentuation that already exist in its own phonetic struture and rejects all the rest that are not compatible. It operates exactly like a sieve. That is why borrowed words offer an excellent observation post to notice how react in phonetic contexts. The Japanese language has borrowed and is borrowing extensively from other languages and cultures, mainly from the English ones in the fields of sports, medicine, industry, commerce, and natural sciences. Relatively very few new words are created using the ancient Chinese or native backgrounds. This presentation will look for the rules of borrowing and try to show that this way of borrowing represents an organized system of its own. Three levels would be particularly studied : - the phonemic level - the syllable level and - the accentual level. This last point would be specially targeted with the question of syllable tension-relaxation. Such a study of languages in phonetics contacts could shed some new light on the phonetic charaCteristics of Japanese language and will confirm or weaken some conclusion already demonstated otherwise. We will be aming specially at the endings of the borrowed words where, it seems, Japanese language manifests itself very strongly.

  • PDF

Automatic Categorization of Islamic Jurisprudential Legal Questions using Hierarchical Deep Learning Text Classifier

  • AlSabban, Wesam H.;Alotaibi, Saud S.;Farag, Abdullah Tarek;Rakha, Omar Essam;Al Sallab, Ahmad A.;Alotaibi, Majid
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.281-291
    • /
    • 2021
  • The Islamic jurisprudential legal system represents an essential component of the Islamic religion, that governs many aspects of Muslims' daily lives. This creates many questions that require interpretations by qualified specialists, or Muftis according to the main sources of legislation in Islam. The Islamic jurisprudence is usually classified into branches, according to which the questions can be categorized and classified. Such categorization has many applications in automated question-answering systems, and in manual systems in routing the questions to a specialized Mufti to answer specific topics. In this work we tackle the problem of automatic categorisation of Islamic jurisprudential legal questions using deep learning techniques. In this paper, we build a hierarchical deep learning model that first extracts the question text features at two levels: word and sentence representation, followed by a text classifier that acts upon the question representation. To evaluate our model, we build and release the largest publicly available dataset of Islamic questions and answers, along with their topics, for 52 topic categories. We evaluate different state-of-the art deep learning models, both for word and sentence embeddings, comparing recurrent and transformer-based techniques, and performing extensive ablation studies to show the effect of each model choice. Our hierarchical model is based on pre-trained models, taking advantage of the recent advancement of transfer learning techniques, focused on Arabic language.

의문의 초점을 고려한 자연어 기반의 정보검색 시스템 (Natural language based Information Retrieval System considering the focus of the question)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF

자연어 질의 유형판별과 응답 추출을 위한 어휘 의미체계에 관한 연구 (A Study on Word Semantic Categories for Natural Language Question Type Classification and Answer Extraction)

  • 윤성희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2004년도 추계학술대회
    • /
    • pp.141-144
    • /
    • 2004
  • 질의응답 시스템이 정보검색 시스템과 다른 중요한 점은 질의 처리 과정이며, 자연어 질의 문장에서 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 것이다. 본 논문에서는 질의 주-형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의 문장에서 의문사에 해당하는 어휘들을 추출하고 주변에 나타나는 명사들의 의미 정보를 이용하여 세부적인 정답 유형을 결정할 수 있는 질의 유형 분류 방법을 제안한다. 의문사가 생략된 경우의 처리 방법과 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

언어상대성 원칙의 역사 인식론적 토대 -문화 언어학을 위한 서설- (Epistemologico-Historic Foundations of Linguistic Relativity)

  • 김성도
    • 인문언어
    • /
    • 제2권1호
    • /
    • pp.7-42
    • /
    • 2002
  • This paper reexamines ideas about linguistic relativity in the light of new interest in the theoretical climate. The original idea is based on the incommensurability of the semantic structures of different languages. On this view, language, thought, culture are deeply interconnected, so that each language might be associated with it a distinctive world view. Throughout this work I utilize the historico-epistemological standpoint to dissect the conceptual structure of this principle. In the introduction I will of for a justification of choice of the theme. Section 1 will address some essential definition of the linguistic principle and insist on the necessity to elaborate a typological spectrum of relativism and universalism. In the second section some important landmarks of linguistic relativity were marked from Plato to Humboldt via Condillac and Herder. 1 will subdivide the relativity hypothesis into 3 theses which are interlated. In the final section the epistemological structure of the linguistic principle will be analysed in some detail by providing my exposition of Sapir-Whorf hypothesis. By way of conclusion I will present the works of Wierzbicka who demonstrated the lexicons of different languages suggest different conceptual universes. By rejecting analytical tools derived from the English language she proposed instead a natural semantic metalanguage based on lexical universals, which is made up of universal semantic primitives. In this paper we attempted to construct a general problematics of linguistic relativity, focolizing on the Sapir-Whorf hypothesis. We devided this very problematic question into its ontological and epistemological dimensions. In particular the ambivalance of Whorf's relativity is discussed in some detail. Also, an archeological survey of this subtle question on the relation between language, thinking and culture was provided. (from Aristotle to Humboldt, via Condillac and Nitzche). In conclusion this investigation underlines the necessity of preparing the cultural linguistics to enlarge the scope of contempory linguistics.

  • PDF

의미 기반의 질의 분석 및 확장 (Question Analysis and Expansion based on Semantics)

  • 신승은;박희근;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.50-59
    • /
    • 2007
  • 본 논문에서는 효율적인 정보검색을 위한 의미 기반의 질의 분석 및 확장을 제안한다. 기존의 정보검색 시스템들은 사용자 질의로 자연언어 질의를 허용하고 있지만 단순히 명사 단어의 색인어를 사용자 질의로부터 추출하여 정보검색에 활용하기 때문에 사용자의 질의 의도를 반영한 정보검색을 하지 못한다. 이러한 문제점을 해결하기 위해서 의미 기반 질의 분석 및 확장은 사용자의 질의를 의미적으로 분석하여, 질의유형을 결정하고 의미 자질들을 추출한다. 추출된 의미 자질들과 정답을 표현하기 위해 사용되는 구문구조를 이용하여 사용자 질의를 확장한다. 또한 확장된 질의를 이용하여 정답을 포함하는 관련문서들을 정보검색 결과의 상위에 랭크시킬 수 있는 방법을 제시한다. 비교적 짧지만 사용자의 질의 의도를 충분히 표현하고 있는 자연언어 질의에 대한 의미 기반의 질의 분석 및 확장을 통해 정보검색의 정확률을 향상시킬 수 있음을 보였다.