• 제목/요약/키워드: 경계 단락

검색결과 18건 처리시간 0.03초

다중 지문 기계독해를 위한 단락 재순위화 및 세부 단락 선별 기법 (Paragraph Re-Ranking and Paragraph Selection Method for Multi-Paragraph Machine Reading Comprehension)

  • 조상현;김민호;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-187
    • /
    • 2020
  • 다중 지문 기계독해는 질문과 여러 개의 지문을 입력받고 입력된 지문들에서 추출된 정답 중에 하나의 정답을 출력하는 문제이다. 다중 지문 기계독해에서는 정답이 있을 단락을 선택하는 순위화 방법에 따라서 성능이 크게 달라질 수 있다. 본 논문에서는 단락 안에 정답이 있을 확률을 예측하는 단락 재순위화 모델과 선택된 단락에서 서술형 정답을 위한 세부적인 정답의 경계를 예측하는 세부 단락 선별 기법을 제안한다. 단락 순위화 모델 학습의 경우 모델 학습을 위해 각 단락의 출력에 softmax와 cross-entroy를 이용한 손실 값과 sigmoid와 평균 제곱 오차의 손실 값을 함께 학습하고 키워드 매칭을 함께 적용했을 때 KorQuAD 2.0의 개발셋에서 상위 1개 단락, 3개 단락, 5개 단락에서 각각 82.3%, 94.5%, 97.0%의 재현율을 보였다. 세부 단락 선별 모델의 경우 입력된 두 단락을 비교하는 duoBERT를 이용했을 때 KorQuAD 2.0의 개발셋에서 F1 83.0%의 성능을 보였다.

  • PDF

화제 출현.계속.전환 처리를 이용한 한국어 문서의 단락분할 (Passage Segmentation based on Topic Appearance, Continuity, and Transition)

  • 임수정;이원휘;이상곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.737-740
    • /
    • 2005
  • 복수의 화제가 혼합되어 있는 문서에서 각 화제의 경계부분을 구분하여 결정하는 단락분할 시스템을 개발한다. 이 기술은 정보검색의 분야에만 한정되지 않고 다양한 분야 예를 들면, 문서분류 및 요약 등의 기초연구에서 중요한 역할을 담당할 기술이다. 본 논문에서는 화제의 출현, 계속, 전환 시점을 고려하여 출현하는 각 화제의 단락구분 방법에 대하여 제안한다. 단락 구분 시 문서의 의미적인 실마리가 끊어지지 않도록 단락을 추출하는 방법을 제안한다.

  • PDF

기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가 (Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment)

  • 임준호;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

비탄성 유한요소해석을 이용한 주철근 단락을 갖는 철근콘크리트 교각의 손상지수 평가 (Evaluation of Damage Indices for RC Bridge Piers with Premature Termination of Main Reinforcement Using Inelastic FE Analysis)

  • 김태훈;신현목
    • 한국지진공학회논문집
    • /
    • 제5권4호
    • /
    • pp.39-49
    • /
    • 2001
  • 이 논문에서는 주철근 단락을 갖는 철근콘크리트 교각의 내진성능평가를 위한 비탄성 해석 기법을 제시하였다. 하중의 단계에 따라 수반하게 되는 콘크리트의 균열 및 철근의 항복, 이로 인한 부착효과와 골재의 맞물림 현상 및 강도의 감소 등과 같은 재료적 비선형성을 고려하였다. 이에 대한 콘크리트의 균열모델로서는 분산균열 모델을 사용하였다. 두께가 서로 다른 부재간의 접합부에서 단면강성이 급변하기 때문에 생기는 국소적인 불연속변형을 고려하기 위한 경계면 요소를 도입하였다. 또한, 횡방향 구속철근으로 인한 강도의 증가 효과를 고려하였다. 이 연구에서는 주철근 단락을 갖는 철근콘크리트 교각의 내진성능평가를 위해 제안한 해석기법을 신뢰성 있는 연구자의 실험결과와 비교하여 그 타당성을 검증하였다.

  • PDF

분야연상어를 이용한 화제의 계속성과 전환성을 추적하는 단락분할 방법 (Passage Retrieval based on Tracing Topic Continuity and Transition by Using Field-Associated Term)

  • 이상곤
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.57-66
    • /
    • 2003
  • 복수의 화제가 혼합되어 있는 문서에서 각 화제의 경계부분을 구분하여 결정하는 기술을 단락분할이라 한다. 이 기술은 정보검색의 분야에만 한정되지 않고 다양한 분야에서 중요한 역할을 담당할 기술이다. 잘 정의된 분야체계에 따라 구축된 분야연상어를 이용하여 단락분할을 시도한다. 분야연상어란 특정한 분야를 정확하게 연상할 수 있는 단어로서 잘 분류된 문서 컬렉션에서 구축할 수 있다. 이 분야연상어를 이용하여 문서를 관련된 분야별로 추출하여 의미기반 단락추출 방법을 제안한다. 화제의 계속성에 주목하여 분야연상어의 수준(범위)이나 연속출현성에 의해 계산된 계속도에 의해 화제의 실마리를 추적하고, 화제의 전환성을 고려한 방법을 제안한다. 문서 내 각 화제의 단락구분을 명확히 하여, 단락을 화제분야별로 추출하는 방법을 제안한다. 일본어 50문서를 실험한 결과 82%의 정확율과 63%의 재현율을 얻어 실용성을 기대할 수 있었고, 한국어에 적용하여도 좋을 것으로 예상한다.

정상성인 여성 화자와 음성장애 성인 여성 화자의 문단 낭독 시 휴지 및 호흡단락 특성의 비교 (A comparison study of the characteristics of pauses and breath groups during paragraph reading for normal female adults with and without voice disorders)

  • 표화영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.109-116
    • /
    • 2019
  • 본 연구는 정상군과 음성장애 환자군의 문단낭독 시 휴지 및 호흡단락 특성을 파악해보고자 시행되었다. 정상군 40명과 기능적 음성장애 환자군 40명을 대상으로 PAS(Phonatory Aerodynamic System) 중 Running Speech를 이용하여 '가을' 문단을 낭독하게 하였다. 이를 통해 흡기 동반 및 미동반, 어절간 및 어절내 휴지와 호흡단락을 구분하고 이에 대한 기술통계 및 집단간 통계적 유의성을 검증하였다. 그 결과 흡기를 동반한 휴지횟수는 환자군이 더 높았으나 흡기를 동반하지 않은 휴지횟수는 정상군이 더 높은 수치를 보였다. 어절경계 중 휴지가 동반된 비율은 환자군이 더 높았고 호흡단락당 음절수는 정상군이 유의하게 더 높았다. 음성장애 화자군은 성대폐쇄부전으로 인한 호흡지지가 정상군보다 부족하므로 휴지 시 흡기를 동반하는 경우나 호흡단락의 수가 더 많은 것으로 사료된다. 이는 일상대화의 자연스러움을 저해할 수 있으므로 음성장애 화자의 중재 시 휴지와 호흡단락의 빈도를 적절히 조절하는 것도 평가 및 중재에 포함해야 할 것이다.

HIT 태양전지 결정 실리콘 기판 및 비정질 실리콘 층의 최적조건 (The optimization of HIT solar cells on crystalline silicon substrates and amorphous silicon layers)

  • 유종훈
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2011년도 춘계학술대회 초록집
    • /
    • pp.110.2-110.2
    • /
    • 2011
  • 일본 Sanyo 사에 의해서 획기적으로 HIT 태양전지가 개발된 바 있다. 이러한 HIT 태양전지는 기존의 확산-접합 Si 태양전지에 비해서 저비용 고효율의 장점을 갖는다: 22% 이상의 변환효율, $200^{\circ}C$ 이하의 공정온도, 낮은 태양전지 온도 의존도, 높은 개방전압. 한편 Sanyo사의 HIT 태양전지는 n-형 Si 웨이퍼를 이용한 반면에, 최근 미국 National Renewable Energy Laboratory는 p-형 Si 웨이퍼를 이용해서 변환효율 19% 대의 HIT 태양전지를 개발한 바 있다. 그 동안 지속적으로 p-형 Si HIT 태양전지를 고효율화하기(< 22%) 위해서 많은 노력이 진행되어 왔지만 이와 같은 노력에도 불구하고 아직 p-형 HIT는 n-형 HIT 태양전지에 비해서 다소 성능면에서 떨어져 있다. 본 연구는 n- 및 p-형 실리콘 웨이퍼로 구성된 HIT 태양전지의 물리적인 차이점에 초점을 맞추고, 결정 및 비정질 실리콘 층의 역할에 대해서 연구하였다. 특히 태양전지 효율을 향상시키는 요소들로서 결정 실리콘의 불순물 준위(n- 및 p-형) 또는 비저항, 비정질 실리콘으로 구성된 emitter 층, intrinsic 층, 경계면이 고려되었다. 그리고 이러한 요소들이 HIT 태양전지에 미치는 영향을 조사하기 위해서 AMPS-1D 컴퓨터 프로그램을 사용하였고, 이를 통해서 HIT 태양전지의 결정 및 비정질 실리콘 층의 역할을 물리적 정량적으로 분석하였다. 본 연구에 적용되는 HIT는 ITO/a-Si:H(p+)/a-Si:H(i)/c-Si(n)/a-Si:H(i)/a-Si:H(n+) 및 ITO/a-Si:H(n+)/a-Si:H(i)/c-Si(p)/a-Si:H(i)/a-Si:H(p+)의 구조로서 다음과 같은 태양전지 특성을 갖는다: n-형 HIT의 경우, fill factor ~ 0.78, 단락전류밀도 ~ 38.1 $mA/cm^2$, 개방전압 0.74 V, 변환효율 22.3 % (그리고 p-형 HIT의 경우, fill factor ~ 0.76, 단락전류밀도 ~ 36.5 $mA/cm^2$, 개방전압 0.69 V, 변환효율 19.4 %).

  • PDF

해저지형변화에 따른 파랑의 수치해석(I) (Numerical Analysis of Wave Deformation with Sea Bottom Variation (I))

  • 김성득;이성대
    • 물과 미래
    • /
    • 제19권3호
    • /
    • pp.259-266
    • /
    • 1986
  • 해저기형 변화가 있는 경우에 파랑의 변형(파의 반사 및 전달계수)을 선형요소를 사용한 경계요소법에 의해 수치해석하였다. 파랑은 2차원 선형파 이론으로부터 해석하였으며, 입사파 방향은 해저바닥상에 임의방향(직각입사 혹은 경사입사)으로 진행한다고 가정하였다. 본 계산의 신뢰도를 검증하기 위하여 다음과 같은 여러 경우에 대한 기존 연구자들의 결과와 비교하였다. (1) 단형이나 경사단락을 가지는 경우 (2) 불투과성 잠제가 있는 경우 (3) 해구가 있는 경우

  • PDF

형광등용 안정기의 화재원인 판정에 관한 연구 (A Study on the Judgment of Fire Cause of Ballast for Fluorescent Lamp)

  • 최충석;백동현
    • 한국화재소방학회논문지
    • /
    • 제14권3호
    • /
    • pp.1-5
    • /
    • 2000
  • 본 연구에서는 옥내 조명으로 널리 사용되고 있는 형광등용 안정기의 화재위험성을 분석하였다. 안정기권선을 실체현미경으로 분석한 결과 용융흔을 다수 발견할 수 있었으나, 육안으로 원인 판정은 불가하였다. $700^{\circ}C$ 이상에서 열열화된 안정기 권선은 연신구조(elongation structure)가 없어지고 구리입자의 확대된 형태만 보였다. 단락 권선의 금속현미경 분석에서 경계면을 중심으로 주상조직 및 보이드 성장의 규칙성이 확인된 것으로 보아 전기적인 단락이 층간에 일어났음이 증명되었다. SEM을 이용한 미세구조 분석에서 용융된 부분이 확인되었다. EDX를 이용한 스펙트라 분석에서 Cu의 구성요소인 CuL 및 CuK liness 뿐만 아니라 OK line이 고르게 관측되고 있다. 이것은 재결합 과정에서 산소가 반응에 참여했음을 의미한다.

  • PDF

전송선로의 매트릭스 표현법과 모멘트법을 이용한 임의 형태를 갖는 마이크로스트립 안테나의 해석 (An Analysis of Arbitrarily Shaped Microstrip Antennas Using Transmission - Line Matrix Representation and Moment Methods)

  • 조원서;김정기
    • 한국전자파학회지:전자파기술
    • /
    • 제2권2호
    • /
    • pp.11-18
    • /
    • 1991
  • 본 논문에서는 임의 형태를 갖는 마이크로스트립 안테나의 해석방법을 살펴보았다. 해석방법은 패치 내부 영역의 문제에 대하여 전송선로 매트릭스 표현법을 적용하였고, 패치 경계상의 문제에는 모멘트법을 적용하였다. 본 해석 방법을 이용하여 원형과 등변삼각혈 마이크로스트립 안테나의 입력임피던스 등 안테나 파라메터를 계산하였고 실험결과와 비교하였다. 모든 결과값들에 대하여 이론 및 실험결과는 좋은 일치를 보였으며, 본 해석 방법의 타당성이 입증되었다. 또한 , 본 해석방법은 단락핀이 삽입되어 있는 마이크로스트립 안테나를 해석하는데 이용될 수 있다.

  • PDF