• 제목/요약/키워드: 질의 분석

검색결과 10,029건 처리시간 0.034초

한국어 질의 응답 시스템을 위한 초점단어 기반 질의분석 (Question Analysis based on Focus-words for Korean Question-Answering System)

  • 김원남;신승은;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.476-482
    • /
    • 2004
  • 질의 응답 시스템은 사용자의 질의를 분석하여 제한된 길이의 정답을 제시해 주는 시스템이다. 질의 응답 시스템은 정확한 정답을 추출하기 위해 사용자의 질의를 분석하는 과정을 필요로 한다. 본 논문에서는 초점단어(focus-word)를 이용한 질의분석을 제안한다. 초점단어란 정답유형을 결정하는데 단서가 되는 단어로써, 추출된 초점단어에 의해 75개의 하위정답유형 중 하나가 결정된다. 실험에는 학습 데이터의 일부와 일반 Web에서 수집한 테스트 데이터가 사용되었다. 실험결과 상위범주는 97.18%, 하위범주는 95.31%의 정확도를 보였다.

  • PDF

시소러스범주정보를 이용한 질의응답시스템 (A Question Answering System Using the Information of the Category Information of Thesaurus)

  • 김수민;백대호;김상범;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-183
    • /
    • 2000
  • 정보검색시스템은 사용자의 질의를 입력받아 사용자가 원하는 정보를 검색해주는 시스템을 의미한다. 그러나, 대부분의 정보검색시스템은 단어와 연산자의 조합으로 이루어진 질의를 입력받아 문서를 검색해 주고, 사용자는 그 문서들 중에서 원하는 정보를 다시 찾아내야 한다. 본 논문에서는 영어 자연어질의를 입력받아 사용자가 원하는 정보에 좀 더 근접한 형태의 답으로서 제한된 길이의 짧은 답을 제시하는 시스템을 구현한다. 시스템은 크게 질의분석단계, 문서검색 및 분석단계, 정보추출단계의 세 단계로 나눌 수 있다. 사용자 질의분석단계에서는 의문사 정보와 오토마타, 시소러스 범주정보를 이용하여 질의에 대한 정답이 될 수 있는 단어의 속성을 예측하였다. 문서분석단계에서는 정답이 될 수 있는 단어의 후보를 선정하기 위해서 시소러스의 범주정보를 사용하였고, 선정된 정답후보 중에서 정답을 추출하기 위해 각 후보단어의 질의어단어와의 평균거리가중치, 범주간유사도, 공기질의어비율을 사용하였다. 실험을 통해 평균거리가중치만을 이용하는 것 보다 범주간유사도와 공기질의어비율을 함께 이용한 것이 성능의 향상을 보였다.

  • PDF

갑상선암 수술환자의 삶의 질에 영향을 미치는 요인 (Factors Influencing the quality of life in thyroid cancer patients after thyroidectomy)

  • 정정숙;김인숙;이은선
    • 한국산학기술학회논문지
    • /
    • 제16권8호
    • /
    • pp.5442-5451
    • /
    • 2015
  • 본 연구는 갑상선암 수술환자의 삶의 질 영향요인을 확인하고, 변인간의 관계를 규명하여 갑상선 암 환자의 삶의 질 향상 프로그램 개발의 기초 자료를 제공하고자 한다. 연구 대상자는 광주지역에 소재한 종합병원에서 갑상선절제수술을 받은 갑상선암 환자 125명을 대상으로 하였다. 자료분석은 spss 21.0 프로그램을 이용하여, 일반적 및 질병관련 특성, 피로, 우울, 삶의 질 정도는 기술통계, 일반적 특성에 따른 삶의 질 차이검증은 t-test, one-way ANOVA와 사후분석으로 산출하였고 피로, 우울, 삶의 질의 관련성은 피어슨상관분석, 삶의 질에 영향을 미치는 요인은 단계적 회귀분석을 실시였다. 이를 분석한 결과 학력, 암 진단 전 체중변화, 암 진단 전 피로, 암 진단 전 사회활동, 현재 건강상태에서 삶의 질과 유의한 차이를 보였으며, 상관관계에서는 피로(r=-.70, p<.001), 우울(r=-.68, p<.001)이 삶의 질과 부적상관관계를 보였다. 삶의 질의 유의한 영향 요인은 우울(${\beta}=-0.39$, p<.001), 영적 피로(${\beta}=-0.30$, p<.001), 신체적 피로(${\beta}=-0.24$, p<.001)이었으며, 전체 설명력은 57.2%이었다. 따라서 이들의 삶의 질을 향상시키기 위해서는 갑상선 암 수술 후 우울과 피로를 감소시킬 수 있는 간호중재가 필요하다.

iSTORM에서의 2D/3D 공간질의어 및 질의 최적화 기법 (2D/3D Spatial Query Language and Query Optimization on iSTORM)

  • 김영삼;임헌기;남광우;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.27-29
    • /
    • 2000
  • 지리정보시스템은 지리적으로 관련된 정보를 효율적으로 저장, 변경, 관리 및 분석을 위한 시스템으로서 하드웨어, 소프트웨어, 지리 데이터 등으로 구성되어 있다. 지리정보시스템은 일반적인 데이터베이스의 연산과 공간정보를 이용한 분석 기능을 통합한 시스템으로서 응용 범위 또한 매우 다양하다. 이 논문에서는 지리정보시스템의 2차원 및 3차원 질의 처리를 위한 2차원 및 3차원 공간 질의어, 그 질의처리 및 최적화에 대해 보인다.

  • PDF

오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구 (A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries)

  • 안애림;이서진;최동현;김응균;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

근거중심의학과 체계적 고찰 (Evidence-based Medicine and Systematic Review)

  • 김수영
    • 한국의료질향상학회지
    • /
    • 제12권2호
    • /
    • pp.35-40
    • /
    • 2006
  • 체계적 고찰은 명확히 정의된 문헌검색에 기반하고, 결정된 기준(criteria)을 이용하여 선택된 문헌의 질을 평가하며, 타당성이 입증된 방법으로 분석을 시행하는 리뷰의 한 형태이다. 체계적 고찰은 (1)답을 얻고자 하는 질문을 공식화 하고 이에 대한 프로토콜을 작성하고, (2)해당 질문에 대한 일차 연구를 찾아서 포함시키고 (3)자료의 질을 평가하고, (4)자료를 추출하여 뽑고, (5)자료를 분석하며, (6)결과를 해석하고 보고서를 작성하는 순서로 이루어진다 하지만 체계적 고찰 혹은 메타분석이 모든 문제에 대한 해결책은 아니다. 메타분석이 수행되었다고 하더라도 질이 나쁜 연구가 포함되거나 질 문제를 무시한 경우, 이질성에 대해 적절한 주의를 기울이지 못할 때, 무차별적인 자료 병합으로 결론이 정확하지 않은 경우, 출판 비뚤림, 시간 지체 비뚤림, 이중 출판 비뚤림, 언어 비뚤림, 결과 보고 비뚤림과 같은 보고 비뚤림이 문제가 되는 경우에는 메타분석 혹은 체계적 고찰이 잘못된 결론으로 도달하도록 할 수 있다. 따라서 올바른 방법론에 기초한 체계적 고찰만이 현존하는 모든 근거를 결합하여 올바른 결론으로 이끌 수 있다.

  • PDF

의문의 초점을 고려한 자연어 기반의 정보검색 시스템 (Natural language based Information Retrieval System considering the focus of the question)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF

사회참여노인의 활동수준과 삶의 질 - 성별과 연령 차이를 중심으로 - (Activity Level of Social Participation and Quality of Life among the Elderly in Korea -Focusing on gender and age differences-)

  • 주경희
    • 사회복지연구
    • /
    • 제42권2호
    • /
    • pp.5-39
    • /
    • 2011
  • 본 연구는 사회참여노인의 활동수준에 따른 삶의 질의 차이를 살펴보고 성별 및 연령 차이를 검증하는데 목적이 있다. 따라서 복합적이고 다양한 노인의 사회참여와 삶의 질의 관계성을 분석하기 위해 활동의 양적 수준과 질적 수준을 포함한 총체적인 활동수준과 삶의 질 모형을 제시하고 분석을 통해 성별 및 연령에 따른 차이를 분석하였다. 분석대상은 수도권지역에 거주하고 있는 60대 이상 사회참여노인 총 586명을 대상으로 구조방정식 모형을 활용하여 다집단분석을 하였다. 분석 결과를 살펴보면 첫째, 각 사회참여의 활동수준과 삶의 질에 대한 가설검증 결과에서는 경제참여활동의 몰입경험, 사교친교참여활동의 몰입경험, 자기개발참여활동의 몰입경험이 삶의 질에 정적으로 유의미한 영향을 미치는 것으로 나타났다. 둘째, 사회참여의 활동수준과 삶의 질 간의 관계에 대한 성별 차이에 대한 다집단 분석 결과, 사교친교참여활동의 활동량과 삶의 질의 경로에서 차이가 있음을 확인하였다. 셋째, 연령에 대한 다집단분석 결과는 경제참여활동 몰입경험과 삶의 질의 경로에서 차이가 있는 것으로 나타났다. 이러한 연구결과를 토대로 이론적 및 실천적 함의를 논의하였다.

건강 관련 삶의 질의 사회인구학적 상관요인에 대한 공간분석

  • 조동기
    • 한국인구학
    • /
    • 제32권3호
    • /
    • pp.1-20
    • /
    • 2009
  • 본 연구는 지리정보시스템(GIS)과 지리적 가중 회귀(GWR)를 이용하여 건강 관련 삶의 질(HRQoL)의 사회인구학적 상관요인에 대한 공간분석을 시도한다. 관찰의 독립성과 오차의 동분산성을 가정하는 전통적 회귀분석과 달리, 지리적 가중 회귀분석은 속성정보뿐만 아니라 공간정보를 활용하는 공간분석 기법이다. 분석모형은 건강 관련 삶의 질을 종합적으로 측정하는 EQ-5D를 종속변수로 하고 지역의 사회인구학적 특성인 노령인구비율, 조이혼율, 병상수, 재정자주도를 독립변수로 하여 구성하였다. 종속변수는 질병관리본부에서 실시한 <지역사회건강조사>의 자료를 이용하였고, 독립변수는 통계청 온라인 DB에 수록된 지역별 자료를 이용하였다. 모형을 추정해 본 결과 전반적으로 사회적 특성보다는 노령인구비율이나 조이혼율과 같은 인구학적 특성이 건강 관련 삶의 질에 더 많은 영향을 미치는 것으로 나타났다. 공간적 변이를 고려하는 지역모형은 전역모형에서 드러나지 않았던 중요한 유형을 보여주는데, 노령인구비율 변수와 조이혼율 변수의 지역별 추정치를 지도상으로 살펴본 결과 변수들의 효과가 공간적 위치에 따라 차이를 보인다는 점이 확인되었다. 분석 결과는 또한 지리적 가중 회귀분석이 전통적 회귀분석에 비해 공간적 자기상관의 문제를 극복하고 모형의 부합도를 증가시킨다는 것을 보여준다.

지식기반 질의응답을 위한 질문분석 방법 (Question Analysis for Knowledge based Question/Answering)

  • 허정;황이규;최미란;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.308-314
    • /
    • 2004
  • AnyQuestion 1.0은 (주)두산의 '두산세계대백과 엔싸이버'의 인물분야만을 대상으로 한 질의응답형 정보검색 시스템이다. 본 시스템에서는 지식기반 질의응답, Logical Form 기반 질의응답, 단락 기반 질의응답을 통합한 3단계 정답 추출 방법을 제안하고 있다. 지식기반 질의응답은 본문의 구조화된 정보와 비구조화 된 정보로부터 정보추출 기술을 이용하여 구축한 지식베이스에 대한 질의응답을 목적으로 한다. "사용자의 질문에 대한 정답을 지식베이스에서 제시할 수 있는가?"와 "지식베이스에서 어떤 정보를 정답으로 제시해야 하는가?"는 3단계 정답 추출 방법에서는 상당히 중요하다 이를 위해서 질문 분석에서는 수동으로 구축한 지식베이스 속성 자질 정보와 다양한 규칙을 기반으로 질문 분석을 수행하였고, 이를 이용하여 지식기반 질의응답을 하였다. 실험결과, 지식기반 질의응답 할당 재현율은 65.4%, 지식기반 질의응답의 정확률은 81.25%였다. 백과사전 인물분야에 대한 지식기반 질의응답은 기존의 데이터베이스 분야에서 연구되어온 자연어 DB인터페이스를 활용한 질의응답으로 속도가 빠르며, 상대적으로 높은 정확률을 보였다.

  • PDF