• 제목/요약/키워드: Similar Question Search

검색결과 12건 처리시간 0.023초

온라인가나다를 위한 주제 분류 기반 유사 질문 검색 시스템 (Similar Question Search System for online Q&A for the Korean Language Based on Topic Classification)

  • 문정민;송영호;진지환;이현섭;이현아
    • 인지과학
    • /
    • 제26권3호
    • /
    • pp.263-278
    • /
    • 2015
  • 국립국어원의 온라인가나다 서비스는 한국어에 대한 질문을 등록하면 전문가가 답변을 작성하는 인터넷 서비스이다. 이러한 서비스는 유사한 질문이 자주 등록되는 문제점이 있다, 만일 새롭게 등록되는 질문과 유사한 질문을 자동으로 찾아 그 질문에 대한 답변을 등록 즉시 제공한다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 온라인가나다의 특성을 분석하여 자주 질문되는 다섯 개의 주제 분류를 설정하고, 주제 분류 유사도와 함께 음소와 음절단위 수열유사도와 벡터 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용하여 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 Mean Reciprocal Rank(MRR)가 0.756, 정답이 1위와 5위내에 검색될 확률은 각각 68.31%, 87.32%를 보였다.

질의응답시스템에서 정답 특징에 관한 실험적 분석 (Experimental Analysis of Correct Answer Characteristics in Question Answering Systems)

  • 한경수
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.927-933
    • /
    • 2018
  • 자연어 질문에 대해 답변을 찾아 제공하는 질의응답시스템의 오류에 가장 큰 영향을 미치는 요소 중 하나가 질문으로 정답을 포함하고 있을 만한 문서나 단락을 검색하는 단계이다. 검색의 성능 향상을 위해서는 정답 포함 문서 및 단락의 특징을 잘 이해해야 한다. 본 논문은 질문, 정답 포함 문서, 정답 미포함 문서로 구성된 말뭉치를 사용하여 정답 문서에는 질문 단어가 얼마나 많이 출현하는지, 출현 위치는 어떻게 분포하는지, 질문과 정답 문서의 주제는 얼마나 유사한지 등을 실험적으로 분석한다. 이를 통해 질의응답시스템을 위한 기존의 검색 연구 결과들에 대한 원인을 설명하고 효과적인 검색 단계의 필요 요소에 관해 논의한다.

선행기술 조사를 통한 한의학 논문의 특허성 연구 (A Study of Patentability on the paper in Traditional Korea Medicine by using technology information search to detect all existing similar patents)

  • 송미영;이정화;안상우
    • 한국한의학연구원논문집
    • /
    • 제11권2호
    • /
    • pp.53-66
    • /
    • 2005
  • This study is concerned with the patentability and protection of intellectual property rights in Traditional Korea Medicine Paper. The results analyzed significance of patentability by investigated for many kinds of Traditional Korea Medicine Paper. It provide extension of intellectual property rights protection and further research region of TKM field by analysing information of patentability. Recently, In the protection of intellectual property rights, the importance of traditional knowledge resource in many country is increased. It will predict the number of apply for the patent increased annually This study will be provide judging guideline and strategy of intellectual property rights protection by search to detect all existing similar patents in Patent Office (Korea, Japan, U.S.A. EPO) about Traditional Korea Medicine Paper. As a result, It can not be investigated about 33% because of paper research or theoretical study or question investigation etc. But the case of 'The Korea Association of Herbology' and 'The Korean Oriental Medical Ophthalmology & Otolaryngology & Dematology Society' have about 10% rate. If it will be constructed DB system, they will be protected by national treatment.

  • PDF

주제 분류를 활용한 국립국어원 질의응답 게시판 유사 질문 검색 시스템 (Similar Question Search System for Q&A board of The National Institute of the Korean Language using Topic Classification)

  • 문정민;송영호;진지환;이현섭;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-205
    • /
    • 2014
  • 국립국어원의 온라인 가나다 서비스는 한국어에 대한 다양한 질문과 정확한 답변을 제공한다. 만일 새롭게 등록되는 질문에 대해 유사한 질문을 자동으로 찾을 수 있다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 국립국어원 질의응답게시판의 특성을 분석하여 질문의 주제를 6가지로 분류하고, 주제 분류 정보와 벡터 유사도, 수열 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용한 결과 1위 정답 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 MRR이 0.62, 정답이 1위, 5위내에 검색될 확률은 각각 54.2%, 78.2%를 보였다.

  • PDF

RI-Biomics 기술정보 제공을 위한 웹 프로그램 개발 연구 (The Development of Web Program for Providing RI-Biomics Technical Information)

  • 김나경;김주연;장솔아;박태진
    • 방사선산업학회지
    • /
    • 제8권3호
    • /
    • pp.169-176
    • /
    • 2014
  • For designing the model of the web program, the demand survey for the technology and information has been performed for the students of the related departments, industrialists and researchers. And, the survey, such as advantages and disadvantages, for the current situations has been examined through comparison and analysis by the establishment type and operational process for the present operating web programs having the similar functions in Korea. The contents and web program for the technology and information system have been also developed by the question investigation and the expert opinions. This system for RI-Biomics has been developed by focusing the convenience for the information provision and the information search as the first constructing direction. Information has been collected by the operator in our institute and making contract with Global Trend Briefing of KISTI in Korea. The information collection in the web program has been designed as the direction regularly provided with RSS. Information has been then analyzed by constructing the expert pool provided from the advisory committee for the technology and information, and using them. The publicity for this web program has been performed by webzines and then it is noted that the publicity programs such as some events should be regularly developed when expanded and advanced to a community in future.

여성 카지노 시큐리티 종사원에 관한 연구 (A Study on Women's Casino Security Employees)

  • 김형석
    • 시큐리티연구
    • /
    • 제62호
    • /
    • pp.135-158
    • /
    • 2020
  • 카지노에서는 고객과 종사원의 안전을 관리하는 시큐리티 종사원들이 매우 중요한 역할을 수행하고 있다. 특히 카지노에는 여성 종사원들의 비율이 높으며, 고객들 또한 여성과 남성의 비율이 비슷하기 때문에 여성 고객 혹은 여성 종사원이 사건 사고를 경험할 확률이 남성과 비슷하거나 높을 수도 있는 상황이다. 여성의 사건사고를 처리하는 여성 시큐리티 종사원은 여성 고객과 일반 여성 종사원들에게는 여성만이 할 수 있는 시큐리티 서비스를 제공할 수 있다. 하지만 카지노에서 시큐리티 업무를 수행하는 종사원들은 대부분 남성이며, 여성의 비율은 매우 낮다. 따라서 본 연구는 현재 카지노에서 여성으로서 시큐리티 업무를 수행하고 있는 종사원들에 관한 연구로서 이들이 카지노에서 시큐리티 업무를 수행하며 경험한 다양한 내용에 대해서 알아보기 위해 질적연구를 진행하였다. 총 5명의 연구 참여자들에게 총 3회에 걸쳐 인터뷰를 실시하여 수집된 자료를 분석하고 범주화 하였다. 첫 번째 질문인 카지노 시큐리티 업무의 시작 동기에 대한 요인은 교수님의 추천, 개인의 정보검색, 지인의 추천이다. 두 번째 질문인 업무 시 필요 능력에 대한 요인은 다양한 운동 능력, 좋은 신체조건, 외국어 능력이다. 세 번째 질문에서 업무의 만족요인은 업무의 희소성, 급여의 만족, 개인의 적성과 일치, 미래에 대한 기대감이며, 업무의 불만족 요인은 업무의 위험성, 고객에 대한 스트레스, 성별에 대한 차별, 주변의 시선, 교대 근무의 피곤함이다. 네 번째 질문에서 여성 카지노 시큐리티 종사원들의 필요성에 대한 요인은 여성 고객에게 차별화된 서비스 제공, 여성 종사원의 보호, 관련 전공 여성에게 기회 제공이다. 이렇게 나온 연구결과에 대해 카지노 시큐리티업무 20년 이상의 전문가와 인터뷰를 실시하였고, 여성 카지노 시큐리티 종사원은 필요요건이기 때문에 제도적, 인식적인 개선을 통해 발전 방향을 모색해야 한다고 하였다.

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

수학교과에서 관계적 이해의 인식에 대한 실태 분석 및 수학교육의 개선 방향 탐색 (The difference in the Relational understanding of the mathematics curriculum and the search for a better direction in mathematics education.)

  • 류근행
    • 한국학교수학회논문집
    • /
    • 제6권1호
    • /
    • pp.135-161
    • /
    • 2003
  • 본 연구는 수학과 교수.학습에서 고등학교 학생들의 이해와 관련된 여러 가지 상황과 고등학교 교사들의 이해 관을 조사 분석하여 현재 수학과 교수.학습에서 문제점을 찾아보고 그 결과를 바랑으로 미래의 수학교육에서 학생들이 수학을 학습할 때 이해를 보다 잘 하도록 지도 방향을 탐색하는데 목적을 두었다. 충청남도 및 대전광역시에 있는 일부 고등학생 1107명과 고등학교 교사 105명의 응답을 분석한 결과를 연구문제 별로 다음과 같이 요약할 수 있다. 1. 응답 학생의 77%(852명)가 '관계적 이해'를 '수학학습에서의 이해'로 인식하고 있었다. 2. 수학학습에서의 이해에 대한 물음에 응답 교사의 85.7%가 '왜 그런지 기본적인 원리를 알고 있으면서 문제해결에 적용할 수 있는 경우(관계적 이해)'라고 응답하였다. 3. 학생들이 얻은 학교수학의 성취도와 모의수학능력고사 성취도 사이에 차이가 큰 이유에 대하여 학생들은 '학교수학은 유사한 문제 유형에 적용하거나 외우면 되나 모의고사는 그렇지 않아서'라고 응답하여 본 연구에서는 현재 수학과 교수.학습에서 제일 큰 문제점으로 지적된다. 4. 연구문제 1, 2, 3의 결론을 토대로 수학학습에서 학생들이 보다 더 이해를 잘 하도록 하기 위한 교수.학습은 다음에 역점을 두고 개선되어야 한다. 1) 교사는 수학과 교수.학습에서 가급적 학생들 스스로가 기본적인 원리가 왜 그런지 알뿐만 아니라 새로운 문제에 적용해 나갈 수 있도록 학습의 안내자가 되어야 한다. 2) 매시간의 학습에서 학생들이 관계적 이해를 했는지 쉽게 확인 할 수 있는 방법을 연구해야 한다. 3) 학생들의 흥미유발을 위하여 '재미있는 수업의 진행'에 보다 더 힘써야 한다. 4) 평가 방법 개선에 힘써야 한다.

  • PDF

Anesthetic efficacy of primary and supplemental buccal/lingual infiltration in patients with irreversible pulpitis in human mandibular molars: a systematic review and meta-analysis

  • Gupta, Alpa;Sahai, Aarushi;Aggarwal, Vivek;Mehta, Namrata;Abraham, Dax;Jala, Sucheta;Singh, Arundeep
    • Journal of Dental Anesthesia and Pain Medicine
    • /
    • 제21권4호
    • /
    • pp.283-309
    • /
    • 2021
  • Achieving profound anesthesia in mandibular molars with irreversible pulpitis is a tedious task. This review aimed at evaluating the success of buccal/lingual infiltrations administered with a primary inferior alveolar nerve block (IANB) injection or as a supplemental injection after the failure of the primary injection in symptomatic and asymptomatic patients with irreversible pulpitis in human mandibular molars. The review question was "What will be the success of primary and supplemental infiltration injection in the endodontic treatment of patients with irreversible pulpitis in human mandibular molars?" We searched electronic databases, including Pubmed, Scopus, and Ebsco host and we did a comprehensive manual search. The review protocol was framed according to the Preferred Reporting Items for Systematic Reviews and Meta-Analysis (PRISMA) checklist. We included clinical studies that evaluated and compared the anesthetic outcomes of primary IANB with primary and/or supplementary infiltration injections. Standard evaluation of the included studies was performed and suitable data and inferences were assessed. Twenty-six studies were included, of which 13 were selected for the meta-analysis. In the forest plot representation of the studies evaluating infiltrations, the combined risk ratio (RR) was 1.88 (95% CI: 1.49, 2.37), in favor of the secondary infiltrations with a statistical heterogeneity of 77%. The forest plot analysis for studies comparing primary IANB + infiltration versus primary IANB alone showed a low heterogeneity (0%). The included studies had similar RRs and the combined RR was 1.84 (95% CI: 1.44, 2.34). These findings suggest that supplemental infiltrations given along with a primary IANB provide a better success rate. L'Abbe plots were generated to measure the statistical heterogeneity among the studies. Trial sequential analysis suggested that the number of patients included in the analysis was adequate. Based on the qualitative and quantitative analyses, we concluded that the infiltration technique, either as a primary injection or as a supplementary injection, given after the failure of primary IANB, increases the overall anesthetic efficacy.

LLM 애플리케이션 아키텍처를 활용한 생성형 AI 서비스 구현: RAG모델과 LangChain 프레임워크 기반 (Generative AI service implementation using LLM application architecture: based on RAG model and LangChain framework)

  • 정천수
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.129-164
    • /
    • 2023
  • 최근 생성형 AI 기술의 발전으로 인해 대형 언어 모델(Large Language Model, LLM)의 활용 및 도입이 확대되고 있는 상황에서 기존 연구들은 기업내부 데이터의 활용에 대한 실제 적용사례나 구현방법을 찾아보기 힘들다. 이에 따라 본 연구에서는 가장 많이 이용되고 있는 LangChain 프레임워크를 이용한 LLM 애플리케이션 아키텍처를 활용하여 생성형 AI 서비스를 구현하는 방법을 제시한다. 이를 위해 LLM의 활용을 중심으로, 정보 부족 문제를 극복하는 다양한 방법을 검토하고 구체적인 해결책을 제시하였다. 이를 위해 파인튜닝이나 직접 문서 정보를 활용하는 방법을 분석하며, 이러한 문제를 해결하기 위한 RAG 모델을 활용한 정보 저장 및 검색 방법에 대해 주요단계에 대해 자세하게 살펴본다. 특히, RAG 모델을 활용하여 정보를 벡터저장소에 저장하고 검색하기 위한 방법으로 유사문맥 추천 및 QA시스템을 활용하였다. 또한 구체적인 작동 방식과 주요한 구현 단계 및 사례를 구현소스 및 사용자 인터페이스까지 제시하여 생성형 AI 기술에 대한 이해를 높였다. 이를 통해 LLM을 활용한 기업내 서비스 구현에 적극적으로 활용할 수 있도록 하는데 의미와 가치가 있다.