• 제목/요약/키워드: Extraction characteristics

검색결과 1,702건 처리시간 0.028초

인공위성 영상레이더를 이용한 멕시코시티 시계열 지반침하 관측 (Monitoring of a Time-series of Land Subsidence in Mexico City Using Space-based Synthetic Aperture Radar Observations)

  • 주정헌;홍상훈
    • 대한원격탐사학회지
    • /
    • 제37권6_1호
    • /
    • pp.1657-1667
    • /
    • 2021
  • 지반침하는 인위적인 인간 활동 또는 자연적 현상에 의해 지표면이 가라앉는 현상이다. 멕시코시티는 전세계에서 가장 심각한 지반침하가 발생하는 지역 중 하나로 평가받고 있다. 멕시코시티 지반침하의 원인은 과도한 지하수 채취로서 해당 지역 전체의 물 사용량의 약 70%를 지하수가 차지하고 있다. 범 지구 위성 항법 시스템(Global Navigation Satellite System, GNSS) 또는 수준측량과 같은 전통적인 현장 관측 방법은 지반침하를 정확하게 측정하기 위해 선호되어 왔다. 하지만 GNSS 관측은 매우 높은 시간해상도를 가진 정확한 지표 변위량을 측정할 수 있음에도 불구하고, 넓은 지역에 대한 부분적인 관측 정보를 제공하고 많은 시간과 비용이 요구되는 한계점이 존재한다. 그러나, 인공위성 영상레이더(Synthetic Aperture Radar, SAR)는 주야 조건과 기상상태에 관계없이 높은 공간 해상도의 지표변화 정보를 mm에서 cm 크기의 정밀도로 비교적 낮은 비용으로 관측할 수 있다는 점에서 효과적인 방법으로 제시되고 있다. 본 연구에서는 2007년 2월 11일에서 2011년 2월 22일까지 획득된 ALOS PALSAR L-band 영상레이더를 이용하여 멕시코시티의 지반 침하 시계열을 추정하였다. 본 연구에서는 대표적인 시계열 분석 방법인 고정 산란체 위상간섭기법(persistent scatterer interferometry, PSI)과 small baseline subset (SBAS)을 적용하여 지표 변위의 시계열 결과를 획득하였으며 대기 효과 및 지형 오차를 제거하였다. PSI 및 SBAS 기법을 이용한 분석 결과 최대 지반침하 속도는 각각 -29.5 cm/year, -27.0 cm/year로 나타났다. 또한 연구지역을 지질 공학적 특성에 따라 세 가지 구역으로 분류하여 각 분류에서의 지반 침하속도를 비교한 결과, 단단한 기반암으로 구성된 지역에 비해 압축률이 큰 호수성 퇴적물로 구성된 지역에서 침하가 크게 발생하였다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

HeLa 암세포주에 대한 국산 프로폴리스의 독성 효과 및 단백질 발현 변화 (Cytotoxic Effect and Protein Expression by Korean Regional Propolis on HeLa Ovarian Cancer Cell Line)

  • 김성국;우순옥;한상미;김세건;방경원;김효영;최홍민;문효정
    • 한국양봉학회지
    • /
    • 제34권3호
    • /
    • pp.245-254
    • /
    • 2019
  • 꿀벌에 의해 생산되는 프로폴리스는 이미 항균, 항산화, 항염증, 항바이러스 그리고 항종양 등의 기능성으로 중요성이 증가하고 있으며, 인공적으로 생성된 화합물이 아닌 자연에서 얻어진 천연물이라는 점에서 특히 가치가 증가하고 있다. 그 중에서도 인류에게 대표적 난치병 질병 중의 하나인 암에 대한 항종양 특징은 화학적 예방 요법이라는 측면에서 중요성과 활용도가 주목받고 있다. 그러나 프로폴리스가 가지는 항종양 같은 현상적인 효과라던가 프로폴리스 구성 성분의 특징에 대해서만 연구가 이루어지고 있고, 암세포에서 나타나는 구체적인 분자 기전에 대해서는 아직까지도 연구가 미비한 상황이다. 본 연구에서는 암세포에 대해서 프로폴리스가 나타내는 구체적인 분자기전을 제시함으로써 어떤 메커니즘으로 의해 프로폴리스가 항암에 대해 효과를 나타내는지 확인하고자 하였다. 암세포에 대해서 확실한 항암 효과를 보이기 위해서는 프로폴리스의 세포 사멸 농도를 확인하고 그 안에서 이루어지는 단백질 분자의 발현 양상 또는 분자 기능의 활성화 등을 기본적으로 확인해야 한다. 수많은 단백질들이 암세포의 성장 및 분화에 관여하고 있지만 현실적으로 세포 내부의 모든 단백질의 기능을 확인하기엔 불가능하기 때문에 세포의 분열과 사멸에 관련된 기본적인 단백질과 더불어 암에 관련된 단백질의 활성화 등은 반드시 확인해야 한다. 따라서 본 연구에서 제시된 결과를 보면 프로폴리스가 암세포에 대해서 항암 효과를 보이기 위해서는 100 ㎍/mL의 농도에서 비로소 세포 사멸 현상을 나타낼 수가 있으며, 그에 따라 암세포 내부의 수많은 단백질의 변화가 나타남을 알 수 있다. 특히 주목할 점은 국내의 지역에 따라 수집된 프로폴리스의 항암 효과가 암세포 내부에서 작용할 때는 큰 차이를 보인다는 것이다. 이것은 매우 중요한 결과로서 각 지역에 식재된 밀원수에 따라 프로폴리스의 구성성분이 달라지는 것이며 그에 따라 프로폴리스의 기능성에 큰 차이를 나타낸다는 의미이다. 이는 프로폴리스가 가지는 기능에서 항암뿐만이 아니라 항염증, 항산화 그리고 항균 작용에서도 지역별로 구성된 식물상에 따라 기능성의 차이가 결정된다는 것이다. 역으로 추적해서 각 지역에서 나타난 프로폴리스의 기능성 차이를 확인하고 해당 지역의 식물상을 분석한다면 질병 또는 특정 기능성을 가진 프로폴리스를 생산할 수 있다는 의미가 될 것이다. 자궁경부암 세포에 대한 프로폴리스의 성장저해 효과는 확인했지만 아직도 확인해야 할 기전은 매우 다양하다. 세포는 내부의 신호 체계가 매우 복잡하고 단일 신호 체계가 아닌 다중 신호 체계를 가지고 있기 때문에, 프로폴리스에서 항암 효과가 나타난다고 하더라도 암세포는 다른 방향으로 anti-apoptitic signal을 생성할 수 있다. 따라서 다양한 신호 체계에 대한 암세포 내 단백질 발현에 대한 변화를 확인해야 하며, 추가로 단백질의 phosphorylation, acetylation, protein folding 그리고 mutation과 같은 기능성을 검증해야 한다. 이런 분석을 통해 프로폴리스의 구체적인 세포 신호 경로를 확인해야만 항암과 관련하여 약물을 제조할 때 손쉽게 표적 특이적인 신약 제조가 이루어질 수 있을 것이다. 특히 암은 조직별로 그 특성을 다르게 가질 수 있기 때문에 조직 특이적인 맞춤형 약제의 생산이 가능할 것이다. 따라서 본 연구에서 제시된 지역별 프로폴리스의 항암 분자 기전 분석에 더하여 해당 지역의 밀원수 분석 및 세포 내 단백질 변화추적을 기반으로 앞으로 더 많은 종류의 암세포 저해 기전을 밝힌다면 대표적 양봉 산물인 프로폴리스를 이용한 특정 암에 대한 효과적인 항암제의 개발이 가능할 것으로 보여진다.

목재수확 방법에 따른 벌채부산물 목재칩의 생산 및 연료 특성 (Production and Fuel Properties of Wood Chips from Logging Residues by Timber Harvesting Methods)

  • 최윤성;정인선;조민재;문호성;오재헌
    • 한국산림과학회지
    • /
    • 제110권2호
    • /
    • pp.217-232
    • /
    • 2021
  • 본 연구는 목재수확방법에 따른 단목수확시스템과 전목수확시스템으로 구분하여 벌채부산물 수집 및 가공작업의 생산성과 비용을 산출하고, 생산된 목재칩의 연료 특성을 비교 분석하여 목재칩 등급을 분류하고 에너지 시설에 연료 조건이 적합한지를 검토하였다. 벌채부산물 목재칩의 시스템 생산성 및 총 비용은 단목이 1.6 Gwt/SMH, 89,865 won/Gwt이었고, 전목은 2.9 Gwt/SMH, 72,974 won/Gwt로 단목에 비해 목재칩 생산성이 1.3배 높았고, 비용은 18.7% 절감되었다. 벌채 부산물 목재칩은 국제표준과 국내기준으로 단목의 목재칩은 등급에 적합하지 않았지만 선별처리를 통해 품질이 A2와 2급으로 향상되었다. 전목은 선별전 목재칩이 국내기준 2급이었으나 국제표준에 적합하지 않았고, 선별처리를 통해 A2 등급으로 향상 되었다. 또한 에너지 시설을 대상으로 Plant A는 단목의 선별전을 제외한 모든 목재칩이 건조처리를 통해 이용가능하였고, 전목 선별전 목재칩이 99,408 won/Gwt으로 가장 비용이 낮았다. 별도의 건조처리가 요구되지 않은 Plant B, C, D는 전목 선별전 목재칩이 57,204 won/Gwt으로 가장 비용이 낮았다. 따라서 벌채부산물을 이용하기 위해 전목수확시스템의 적용과 목재칩 품질 향상을 통해 에너지 이용시설에 적합한 목재칩을 생산할 수 있을 것으로 판단된다.

부여 응평리 출토 백제 사비기 인골 보존처리 및 과학적 분석 (Conservation and Scientific Analysis of Human Bone Excavated in Sabi Period of Baekje from Eungpyeong-ri, Buyeo)

  • 김미정;이윤섭;조은민;박수진;문민성
    • 헤리티지:역사와 과학
    • /
    • 제55권1호
    • /
    • pp.305-321
    • /
    • 2022
  • 부여 응평리 석실묘는 두 개체를 합장한 형태로 피장자 간의 상관관계 및 석실묘의 성격에 대해 조사하였다. 부여 응평리 석실묘는 지리적 입지·공반유물·출토인골을 통해 백제 사비기에 위계가 있는 도성민 혹은 지방관료로 추정할수 있었다. 본 연구는 인골 특성에 적합한 수습 및 보존처리와 함께 과학적 분석을 수행한 결과이다. 현장에서 출토되는 인골 수습에서 가장 중요한 사항은 과학적 분석용 시료를 제외한 잔존 뼈들에 대한 강화제의 종류와 농도이다. 부여 응평리 인골의 경우 paraloid B-72를 사용하였으며 현장에서 강화 처리 시 사용했던 약품을 동일하게 사용하여 표면의 이물질 제거·강화·접합 등 최소한의 보존처리를 수행하였다. 토양의 영향으로 인골의 외부 형태 식별이 어려운 경우 X-ray와 CT촬영 자료를 활용하였다. 안정동위원소와 DNA분석을 수행하기 앞서 근적외선 분석을 진행하였으며 그 결과를 토대로 시료 채취 부위를 선정하였다. 인골의 콜라겐을 이용하는 탄소·질소 안정동위원소 분석의 경우 콜라겐의 수율이 3.8~6.1%로 나타났으며 안정동위원소비는 EBW, EBE 개체 각각 δ13C -18.3‰±0.1‰, -19.0‰±0.1‰이고, δ15N 10.7‰±0.5‰, 10.6‰±0.1‰로 확인되었다. 두 개체는 C3 식물을 위주로 약간의 잡곡류를 함께 섭취했고, 단백질은 육상 동물로부터 공급되었을 것으로 판단된다. 또한 두 개체의 데이터 편차가 근소하여 유사한 식이를 하였을 것으로 추정된다. DNA 분석의 경우 증폭이 불가능하여 결과를 얻기 어려웠으며 이는 시료의 보존상태 등을 연관 지어 보았을 때 DNA가 극미량으로 잔존하여 증폭에 어려움이 있었을 것으로 생각된다. 부여 응평리 유적 석실묘에서 출토된 인골의 경우 안정동위원소분석 및 DNA 분석과 근적외선 분석의 연관성은 도출하기 어려웠으며 뼈의 보존상태 평가를 위한 추가 분석이 필요할 것으로 사료된다.

초소형 SAR 위성을 활용한 수체면적 추출: 대청댐 유역 대상 (Extraction of Water Body Area using Micro Satellite SAR: A Case Study of the Daecheng Dam of South korea)

  • 박종수;강기묵;황의호
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.41-54
    • /
    • 2021
  • 수자원 관리와 수재해 피해 분석 및 예측 등을 위해 원격탐사를 활용한 수체면적을 추정하는 것은 매우 필수적이다. 위성을 활용한 수체탐지는 주로 광학 및 영상레이더(Synthetic Aperture Radar, SAR) 센서를 탑재한 대형(무게 1,000kg 이상) 위성을 중심으로 수행되어왔다. 그러나 긴 재방문주기(repeat cycle)로 인해 재난/재해 시 적시 활용이 불가능한 한계가 존재한다. 최근 초소형위성(무게 100kg 미만) 개발이 활발히 이루어짐에 따라 기존 대형위성 중심의 시간해상도 한계를 극복할 수 있는 계기가 되었다. 현재 활발히 운용중인 초소형 SAR 위성은 핀란드의 ICEYE와 미국의 Capella 위성으로, 지구관측을 목적으로 군집(constellation) 형태로 운용되고 있다. 군집화 운용으로 인해 짧은 재방문주기(현재 0.8회/1일) 및 고해상도(Spot(0.5m))를 가지며, SAR센서 탑재로 기상 및 주야 무관하게 관측이 가능한 장점이 있다. 본 연구에서는 초소형위성의 운영 현황 및 특징에 대해서 기술하였으며, 초소형 SAR 위성 영상에 최적화된 수체면적 추정기술을 한반도 대청댐 유역에 적용해 보았다. 또한 광학 위성인 Sentinel-2 위성으로부터 생성된 수체를 참조값(reference)으로 하여 초소형위성 2기와 대형위성인 Sentinel-1위성과의 면적, 상관성 분석을 수행하였다. Capella 위성의 경우 가장 적은 면적의 차를 보였으며, 세 영상 모두 높은 상관관계를 나타냄을 확인하였다. 본 연구의 결과를 통해 초소형 SAR 위성의 낮은 NESZ(Noise Equivalent Sigma Zero)에도 불구하고 수체면적 추정이 가능함을 확인하였으며, 기존 대형 SAR 위성을 활용한 수자원/수재해 감시 활용의 한계를 극복할 수 있을 것으로 사료된다.

플라즈마 블라스팅, 공압파쇄, 진공추출이 활용된 지중 토양정화공법의 정화제 주입에 따른 투수성 개선 연구 (A Study on the Effect of Improving Permeability by Injecting a Soil Remediation Agent in the In-situ Remediation Method Using Plasma Blasting, Pneumatic Fracturing, and Vacuum Suction Method)

  • 이근춘;송재용;강차원;장현식;장보안;박유철
    • 지질공학
    • /
    • 제33권3호
    • /
    • pp.371-388
    • /
    • 2023
  • 지층구성이 복잡하고 저투수성의 토양이 분포하는 경우 정화효율은 급격히 저하되고 실질적인 정화가 이루어지지 않거나 정화기간이 증가하는 등의 문제가 발생한다. 효율적인 정화를 위해서는 투수성이 개선되어 오염된 구간으로 정화제 주입하여 오염물질과 충분한 접촉이 이루어져야 한다. 본 연구는 균열형성과 효과적인 정화제 유도를 위해 플라즈마 블라스팅, 공압파쇄, 진공추출을 복합적으로 활용하는 PPV 공법의 유체 전달특성을 분석하고 기존공법과의 비교를 통해 개선효과를 평가하였다. 연구는 TPH(Total petroleum hydrocarbons)로 오염된 실제 오염부지에 대한 정화제 전달효과를 확인하기 위한 실증시험을 수행하였으며 정화제의 전달특성과 영향범위 등을 산정하기 위해 주입량과 주입시간을 모니터링하고, 정성적인 지중환경 변화요인을 확인하고자 전기비저항탐사를 수행하였다. 또한, 투수시험을 수행하여 각 공법에 대한 투수성 변화를 평가하였다. 정화제의 주입량 모니터링 결과, 주입량은 대조군 대비 실험군의 주입량이 약 4.74~7.48배 증가하였고, 단위 시간 당 주입 유량(L/min)은 약 5.00~7.54배 실험군의 전달률이 빠른 것으로 분석되었다. 전기비저항탐사 결과, 실험군의 비저항변화비는 대조군과는 달리 지표까지 영향을 주어 비저항값이 전체적으로 감소하는 경향을 보인다. 따라서 실험군은 지표 상부에 분포하는 토사층까지 과산화수소 등의 유체 확산이 이루어져 저비저항 변화비가 감소하는 것을 볼 수 있으며 주입정과 추출정 사이의 수평적 변화비는 약 1.12~2.38배 비저항값이 감소되었다. 투수성의 경우, 대조군과 실험군 모두 유사한 초기 투수성을 보였으나 과산화수소의 정화기작 영향으로 투수성이 감소하는 특성을 나타내는 것으로 확인되었다. 수리전도도의 변화를 정량적으로 평가하면, 대조군은 시험 종료 후 초기 수리전도도 대비 21.1%의 수리전도도를 나타내어 투수성이 급격히 저하되는 양상을 보였으나 실험군은 실험종료 후 초기치 대비 81.3%로 초기 수리전도도와 근접한 값을 나타내는 것으로 파악되었다. 현장조사로 확인된 수리전도도와 정화재 주입실험을 통한 정화제 주입용량(m3/hr), 토양특성분석(함수비, 밀도)을 통한 공극률(%)의 분석을 통해 영향반경(ROI)을 산정산 결과, PPV 공법의 영향반경(ROI)은 대조군에 비해 평균 220% 개선되는 것으로 확인되었다. 이와 같은 성과는 PPV 공법 적용으로 인하여 기존공법 대비 보다 넓은 범위에 걸쳐 효율적인 정화제 전달이 가능하고 정화기작에서 나타나는 투수성 저해요인을 상당부분 극복할 수 있으며, 약 2배 이상의 영향반경 증대를 통해 정화효율을 높일 수 있음을 지시하는 중요한 지표로 볼 수 있다.

시민참여형 무미목 양서류 음성신호 수집 및 품질관리 방안 (Anura Call Monitoring Data Collection and Quality Management through Citizen Participation)

  • 김경태;이현정;송원경
    • 한국환경생태학회지
    • /
    • 제38권3호
    • /
    • pp.230-245
    • /
    • 2024
  • 외부 환경변화에 민감한 양서류는 지역 내 생태환경의 변화나 교란을 평가하는 생물지표종으로 활용되고 있다. 도시화로 인한 서식지 파괴, 단절과 같은 인위적인 위협으로 인해 무미목 양서류 종 3분의 1이 멸종 위험에 처한 것으로 알려져있다. 무미목 양서류의 적절한 보호 및 보전전략 마련을 위해서는 개체군의 특성을 고려한 생물종 조사가 요구된다. 본 연구는 무미목 양서류의 번식기 울음소리를 이용한 생태모니터링에 있어 시민들의 참여 가능성을 모색하고자 하였다. 또한 적절한 품질관리 방안을 제안하여 오류나 편향을 제거하고 신뢰도 높은 생물종 출현 자료를 추출하고자 하였다. 시민과학 프로젝트는 국내에 서식하는 무미목 양서류 12종을 대상으로 2022년 4월 1일부터 8월 31일까지 전국을 대상으로 수행되었다. 시민들의 자발적인 참여를 통해 무미목 양서류의 번식기 울음소리를 직접 청취하고 모바일 애플리케이션을 통해 녹음함으로써 음성신호 모니터링이 진행되었다. 또한 품질관리 프로세스를 구축하여 시민들로부터 수집된 데이터의 오류 및 편향을 누락, 허위, 잘못된 식별과 같이 3단계로 분류하여 신뢰도 높은 생물종 출현 자료를 추출하고자 하였다. 시민참여 무미목 양서류 음성신호 모니터링 결과 총 6,808건의 관찰 기록을 수집할 수 있었다. 품질관리 프로세스를 통해 6,808건의 데이터 중 1,944건(28.55%)에서 오류 및 편향이 발생하였다. 오류 및 편향 유형으로는 누락이 922건 (47.43%)으로 높은 빈도를 보였으며 잘못된 식별 540건(27.78%), 허위 482건(24.79%) 순서로 나타났다. 시민과학프로젝트를 통해 국내에 서식하는 12종의 무미목 양서류 중 두꺼비(Bufo gargarizans Cantor), 한국산개구리(Rana coreana)를 제외한 10종의 무미목 양서류의 번식기 울음소리를 관찰할 수 있었다. 주로 개체수 감소로 인하여 관찰이 어렵거나 비 출현 개체의 번식기와 시민과학 프로젝트 진행 시점과의 차이로 인해 번식기 울음소리를 수집하는데 어려움이 발생한 것으로 나타났다. 본 연구는 시민참여를 토대로 국내에 서식하는 무미목 양서류의 번식기 울음소리를 통해 분포현황과 생물종 출현 자료 수집을 처음으로 검토한 연구이다. 향후 시민과학을 접목한 생물음향 모니터링 설계와 시민과학 데이터 품질관리 방안에 대한 기초자료로 활용될 수 있을 것으로 판단된다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.