• Title/Summary/Keyword: 단락

검색결과 1,414건 처리시간 0.038초

Word2Vec의 IN-OUT Vector를 이용한 기계독해용 단락 검색 모델 (Paragraph Retrieval Model for Machine Reading Comprehension using IN-OUT Vector of Word2Vec)

  • 김시형;박성식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.326-329
    • /
    • 2019
  • 기계독해를 실용화하기 위해 단락을 검색하는 검색 모델은 최근 기계독해 모델이 우수한 성능을 보임에 따라 그 필요성이 더 부각되고 있다. 그러나 기존 검색 모델은 질의와 단락의 어휘 일치도나 유사도만을 계산하므로, 기계독해에 필요한 질의 어휘의 문맥에 해당하는 단락 검색을 하지 못하는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 Word2vec의 입력 단어열의 벡터에 해당하는 IN Weight Matrix와 출력 단어열의 벡터에 해당하는 OUT Weight Matrix를 사용한 단락 검색 모델을 제안한다. 제안 방법은 기존 검색 모델에 비해 정확도를 측정하는 Precision@k에서 좋은 성능을 보였다.

  • PDF

기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가 (Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment)

  • 임준호;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

질의 응답 시스템을 위한 가변 길이 단락 검색 (Variable Length Passage Retrieval for Q&A System)

  • 이영신;황영숙;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.259-266
    • /
    • 2002
  • 질의 응답 시스템에서 보다 정확하게 정답을 판별하기 위해서는 구문분석 혹은 의미분석 등과 같은 복잡도가 높은 분석작업이 요구되며, 이러한 질의 응답 시스템 성능의 상한을 결정하는 검색 시스템은 가급적 적은 양의 검색 결과를 내주어서 질의 응답 시스템이 처리해야 할 작업량에 대한 부담을 덜어주어야 한다. 본 논문에서는 이러한 요구를 만족시키는 검색 시스템으로 가변 길이 단락 검색 시스템(variable length passage retrieval system)을 제안한다. 제안하는 검색 시스템은 질의에 대한 정답을 포함하고 있을 가능성이 있는 텍스트 영역은 질의에 따라 그 크기가 다를 것이라는 가정으로부터 출발한다. 그러므로 문서 전체를 검색하거나 고정 길이 단락으로 나누어져 색인되어 있는 부분 문서들을 검색하는 기존의 검색 방법과 달리, 제안된 시스템은 문서에서 임의의 길이로 이루어진 단락을 대상으로 동적인 단락 검객을 수행한다. TREC QA track의 질의집합 중 1번부터 100번까지의 질의에 대해 실험을 수행한 견과, 문서 검색 시스템이나 고정 길이 단락 검색 시스템은 상위 1000개의 문장까지 검색을 하였을 때 각각 96%, 98%의 재현율을 보인 반면, 가변 길이 단락 검색 시스템은 800개의 문장만으로도 98%의 재현율을 보이고, 900개의 문장을 검색하였을 경우 100%의 재현율을 보였다.

  • PDF

단락에 대한 이산 추론을 요구하는 한국어 기계 독해 (Reading Comprehension requiring Discrete Reasoning Over Paragraphs for Korean)

  • 김경민;서재형;이수민;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.439-443
    • /
    • 2021
  • 기계 독해는 단락과 질의가 주어졌을 때 단락 내 정답을 찾는 자연어 처리 태스크이다. 최근 벤치마킹 데이터셋에서 사전학습 언어모델을 기반으로 빠른 발전을 보이며 특정 데이터셋에서 인간의 성능을 뛰어넘는 성과를 거두고 있다. 그러나 이는 단락 내 범위(span)에서 추출된 정보에 관한 것으로, 실제 연산을 요구하는 질의에 대한 응답에는 한계가 있다. 본 논문에서는 기존 범위 내에서 응답이 가능할 뿐만이 아니라, 연산에 관한 이산 추론을 요구하는 단락 및 질의에 대해서도 응답이 가능한 기계 독해 모델의 효과성을 검증하고자 한다. 이를 위해 영어 DROP (Discrete Reasoning Over the content of Paragraphs, DROP) 데이터셋으로부터 1,794개의 질의응답 쌍을 Google Translator API v2를 사용하여 한국어로 번역 및 정제하여 KoDROP (Korean DROP, KoDROP) 데이터셋을 구축하였다. 단락 및 질의를 참조하여 연산을 수행하기 위한 의미 태그를 한국어 KoBERT 및 KoELECTRA에 접목하여, 숫자 인식이 가능한 KoNABERT, KoNAELECTRA 모델을 생성하였다. 실험 결과, KoDROP 데이터셋은 기존 기계 독해 데이터셋과 비교하여 단락에 대한 더욱 포괄적인 이해와 연산 정보를 요구하였으며, 가장 높은 성능을 기록한 KoNAELECTRA는 KoBERT과 비교하여 F1, EM에서 모두 19.20의 월등한 성능 향상을 보였다.

  • PDF

초고압 변압기의 단락강도시험

  • 변승봉;박종화;김중한
    • 전기의세계
    • /
    • 제33권10호
    • /
    • pp.618-624
    • /
    • 1984
  • 한국전기통신연구소는 연구활동의 일환으로 각종 전력기기에 대한 연구개발시험을 실시해 오고 있으며, 특히 전력용 변압기에 대해서도 상당한 양의 단락강도시험을 실시한 바 있다. 이 보고서는 국내 전력계통에 이미 설치 사용되고 있는 154KV전력용 변압기와 동일한 45/60MVA변압기에 대하여 우리나라에서는 처음으로 직접 단락강도시험을 실시하고, 단락시 변압기가 받는 전자력에 대한 검토와 함께 시험내용을 상세히 소개하는 글이다.

  • PDF

위험관리정보 - 9V 배터리의 단락회로 분석

  • 한국화재보험협회
    • 방재와보험
    • /
    • 통권137호
    • /
    • pp.38-43
    • /
    • 2010
  • 트랜지스터 또는 "트랜지스터 라디오" 배터리라고 부르고 어디에서나 흔히 볼 수 있는 9V PP3 건전지는 일반적으로 작은 크기로 인한 내부위험 또는 소각하여 폐기할 때에 발생하는 폭발 위험 이외의 중대한 위험을 내포하지 않는 것으로 알려져 있다. 후자의 위험은 모든 다른 배터리에도 적용된다. 그러나 약간 높은 에너지 밀도와 PP3 배터리 단자의 구조는 일부 사례에서 배터리의 낮은 내부 임피던스와 결합하여 단락 물질에 충분한 열을 발생시켜서 그것과 접촉하고 있는 가연물을 손상시키거나 점화시킬 수 있는 단락위험을 발생시킬 수 있다. 이 현상을 증명하기 위해 이 논문은 PP3 건전지의 단락시험에서 기록된 자료와 관찰사항을 기술한 것이다. 이 시험에는 2개 세트의 배터리, 완전 충전된 새 배터리와 완전 방전되지 않은 배터리(이 문서에서 "일부 사용된 배터리"라고 한다)를 사용하였다.

  • PDF

선박용 전기추진시스템의 단락상정사례의 전력특성 분석 (Power Characteristic Analysis of Assumed Short Circuit Instance of Electric Ship Propulsion System)

  • 전원;왕용필;한성진;정상용
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.140-141
    • /
    • 2007
  • 본 논문에서는 선박용 전기추진시스템의 전력특성을 분석하고자, 항해 시와 정박 시에 대하여 전력조류해석을 하여 전력의 흐름을 관찰하고, 서비스전원부하 측의 Bus를 3상 단락시켜 단락회로해석을 수행하여 단락전류의 흐름을 관찰한다.

  • PDF

소아 환자에서의 뇌실-복강 단락 감염의 역학적 고찰: 15년 간의 단일 기관 연구 (A Fifteen-year Epidemiological Study of Ventriculoperitoneal Shunt Infections in Pediatric Patients: A Single Center Experience)

  • 김연경;신형진;김예진
    • Pediatric Infection and Vaccine
    • /
    • 제19권3호
    • /
    • pp.141-148
    • /
    • 2012
  • 목 적 : 뇌실-복강 단락 수술은 수두증이 있는 소아 환자에서 중요한 치료 방법 중 하나이다. 뇌실-복강 단락에서 단락 감염은 중요한 합병증이며 수술의 예후를 결정하는 중요한 요인이다. 이 연구는 소아 환자에서의 뇌실-복강 단락 감염의 역학적 특성과 임상 증상, 치료와 예후를 파악하고 진단 및 치료에 도움이 되고자 하였다. 방 법 : 1995년 4월부터 2010년 6월까지 뇌실-복강 단락 수술을 시행 받은 18세 이하의 환자를 대상으로 하였으며 후향적으로 의무 기록을 분석하였다. 결 과 : 총 190명(여자 82명, 남자 107명)의 환자에서 327건의 뇌실-복강 단락 수술을 시행하였다. 중위 연령은 2.4세이며(0.02-17.9세) 뇌실-복강 단락 수술의 가장 흔한 원인은 악성 뇌종양이었다. 수술 1건 당 감염률은 6.7% (22/327건), 환자 1명 당 감염률은 9.5% (18/190명)이며 100건의 수술-년 당 감염은 0.45건 이었다. 가장 흔한 원인 균은 coagulase-negative staphylococcus (7건) 이며 methicillin resistant Staphylococcus aureus에 의한 감염은 1건 이었다. 10건의 감염에서 vancomycin과 beta-lactam antibiotics (cephalosporin or carbapenem)의 복합 정주 치료를 시행하였으며 7건의 감염에서 vancomycin 단독 정주 치료를 시행하였다. 치료 기간의 중앙값은 26일(7-58일)이었으며 수술적 치료는 18건에서 시행하였다(18/22건, 81.8%). 결 론 : 본 연구는 단일 기관에서 15년 동안의 뇌실-복강 단락 감염의 역학을 요약한 연구로 소아 환자에서의 뇌실-복강 단락 감염의 역학적 정보는 적절한 치료를 시행하는데 큰 도움이 될 것이다. 향후 단락 감염의 발생과 관련한 위험 인자에 대한 추가적인 연구가 필요할 것으로 사료된다.

  • PDF

뇌실 복강간 단락 부전의 기여인자 (The Contributory Factors of CSF Shunt Failure)

  • 김영돈;황성규;황정현;성주경;함인석;박연묵;김승래
    • Journal of Korean Neurosurgical Society
    • /
    • 제30권sup1호
    • /
    • pp.79-84
    • /
    • 2001
  • 목 적 : 뇌실 복강간 단락술 부전의 기여인자를 조사 및 분석하여 뇌실 복강간 단락술의 합병증 및 재수술의 가능성을 줄이는 데에 목적이 있다. 대상 및 방법 : 1995년 1월부터 1998년 12월까지 본원에서 뇌실 복강간 단락술을 시행 받은 237명의 수두증 환자를 후향적 방법으로 고찰하여 뇌실 복강간 단락 부전의 기여인자 및 단락기 생존율을 통계학적으로 분석하였다. 결 과 : 수두증의 원인은 종양, 출혈, 감염, 선천성 기형, 정상 뇌압 수두증, 외상 등이었다. 68명의 환자에서 109회의 재수술이 이루어졌다. 재수술의 이유는 폐색, 근위부 카세타의 위치이상, 감염 등이었다. 단락기 생존율은 1년, 2년, 3년에 각각 77.1%, 75.4%, 74.1%이었다. 10세 이하의 환자에서 재수술의 빈도가 통계학적으로 의의 있게 높았다. 그리고 수두증의 원인에 따라서 통계학적으로 의의 있게 재수술의 빈도 차이가 있었다. 결 론 : 대부분의 뇌실 복강간 단락 부전은 술후 1년내에 발생하였다. 환자의 나이 및 수두증의 원인이 뇌실 복 강간 단락 부전의 주요 기여인자였다.

  • PDF

단락된 가우스 광이 광학 디스크 재생 신호에 미치는 영향 (Influence of truncated gaussian beam on read-out signal in optical disc)

  • 박성종;정창섭
    • 한국광학회지
    • /
    • 제7권4호
    • /
    • pp.434-439
    • /
    • 1996
  • 본 연구에서는 가우스 진폭을 갖는 입사광의 단락된 정도와 광학 디스크 상의 bump의 형태가 재생신호에 미치는 영향과 디스크 bump에 맺히는 회절광 PSF(point spread function)와의 관계를 알아보기 위해 스칼라 회절 이론을 사용하였다. 단락된 가우스 진폭으로 .sigma.=0, 0.5, 1.5, 2.5인 경우를 고려하였으며 bump의 높이는 n.DELTA.$_{o}$ =.lambda./4로서 이는 위상 높이 .PHI.$_{o}$ =.pi.가 된다. 또한 본 연구에서 고려한 bump 형태 즉 직사각형(.DELTA.p$_{o}$ =0)과 준 원추형(.DELTA.p$_{o}$ /2) 그리고 원추형(.DELTA.p$_{o}$ =p$_{o}$ )의 세 가지 경우이다. 본 연구에서 고려한 입사광의 단락된 정도가 작을 수록 bump에 맺는 중심 회절상의 반경이 작게 나타났으며 이때 재생 신호의 극대치는 입사광의 단락된 정도가 작을수록 bump에 맺는 중심 회절상의 반경이 작계 나타났으며 이때 재생 신호의 극대치는 입사광의 단락된 정도가 큰 경우보다 크게 나타났고 bump의 크기도 작게 나타났다. 이러한 결과들로부터 입사광의 단락된 정도가 작을수록 광학 디스크로부터 큰 재생 신호를 얻을 수 있으며 cross-talk가 줄어듬을 알 수 있었다. 그러므로 실제 광학 디스크에 가능한 단락된 정도가 작은 가우스 진폭을 갖는 레이저 광을 입사광으로 사용하면 유용하리라 생각된다.

  • PDF