• 제목/요약/키워드: Whole World Masking

검색결과 2건 처리시간 0.015초

패러프레이즈 문장 검출을 위한 양방향 트랜스포머 모델 구축 (Construction of a Bidirectional Transformer Model for Paraphrasing Detection)

  • 고보원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.465-469
    • /
    • 2019
  • 자연어 처리를 위해서 두 문장의 의미 유사성을 분석하는 것은 아주 중요하다. 이 논문은 패러프레이즈 검출 태스크를 수행하기 위한 Paraphrase-BERT를 제안한다. 우선 구글이 제안한 사전 학습된 BERT를 그대로 이용해서 패러프레이즈 데이터 (MRPC)를 가지고 파인 튜닝하였고 추가적으로 최근에 구글에서 새로 발표한 Whole Word Masking 기술을 사용하여 사전 학습된 BERT 모델을 새롭게 파인 튜닝하였다. 그리고 마지막으로 다중 작업 학습을 수행하여 성능을 향상시켰다. 구체적으로 질의 응답 태스크와 패러프레이즈 검출 태스크를 동시에 학습하여 후자가 더 잘 수행될 수 있도록 하였다. 결과적으로 점점 더 성능이 개선되었고 (11.11%의 정확도 향상, 7.88%의 F1 점수 향상), 향후 작업으로 파인 튜닝하는 방법에 대해서 추가적으로 연구할 계획이다.

  • PDF

RapidEye 영상을 이용한 북한의 논 면적 산정 (Estimation of Paddy Field Area in North Korea Using RapidEye Images)

  • 홍석영;민병걸;이지민;김이현;이경도
    • 한국토양비료학회지
    • /
    • 제45권6호
    • /
    • pp.1194-1202
    • /
    • 2012
  • 북한과 같이 접근이 힘들고 농업과 관련된 정보가 부족한 지역을 대상으로 RapidEye 위성영상의 판독 및 분류를 통하여 가장 기초적인 농업 현황과 생산 기반인 논 면적을 산정하였다. 291개의 RapidEye 영상을 이용하여 북한 전역을 대상으로 시기별로 논을 분류하기 위한 영상 판독 기준을 설정하였다. 5월 초에서 6월 말은 벼 이앙을 위해 관개를 하기 때문에 벼 이앙 전후에 물의 특성이 위성영상에서 잘 관측되기 때문에 영상이 어둡게 보이는 점을 이용하여 논과 다른 토지이용을 구분한다. 주요 벼 생육시기인 7월 초부터 9월 말에는 RapidEye 영상을 5:3:2 밴드조합으로 하여 영상을 판독하면 벼논의 색상과 질감의 차이를 이용하여 밭작물, 초지, 산림으로부터 논을 분류한다. 9월 말부터 10월 말은 벼 수확을 한 후로 논에 식생이 없는 시기로써 5:3:2 밴드 조합에서 회색빛이 나는 경지 형태를 대상을 논으로 판독한다. 그 결과 북한 전역에 대한 논 분포지도를 작성하였고 시도 행정구역별로 논 면적을 살펴보았다. 대부분의 논은 평안남북도와 황해남도가 위치한 서해안 평야지대에 전체 논 면적의 66% 정도인 $3,521km^2$가 분포하였고 함경남북도, 강원도, 나선시와 같이 동해에 인접한 지역의 논 면적은 $1,172km^2$로 전체 논 면적의 약 20%를 차지하는 것으로 나타났다. RapidEye 영상을 이용하여 분류한 논 면적은 2001년 및 2010년 FAO/WFP 북한 보고서와 비교할 때 각각 1% 이내의 면적 편차를 나타내었다. RapidEye 위성영상을 이용한 북한의 논 분류 결과는 농경지 이용 면적의 산정과 변화, 벼 수량 추정을 위한 마스킹 (masking) 자료로 활용될 수 있는 기본 자료로 의미가 매우 큰 것으로 판단된다. 향후에는 밭에 대한 분류 지도를 구축하고 나아가 옥수수와 같은 주요 밭작물에 대한 판독 방법에 대해서도 연구할 필요가 있을 것으로 생각된다.