• 제목/요약/키워드: Engineering information

검색결과 82,730건 처리시간 0.112초

BERT-Fused Transformer 모델에 기반한 한국어 형태소 분석 기법 (Korean Morphological Analysis Method Based on BERT-Fused Transformer Model)

  • 이창재;나동열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권4호
    • /
    • pp.169-178
    • /
    • 2022
  • 형태소는 더 이상 분리하면 본래의 의미를 잃어버리는 말의 최소 단위이다. 한국어에서 문장은 공백으로 구분되는 어절(단어)의 조합이다. 형태소 분석은 어절 단위의 문장을 입력 받아서 문맥 정보를 활용하여 형태소 단위로 나누고 각 형태소에 적절한 품사 기호를 부착한 결과를 생성하는 것이다. 한국어 자연어 처리에서 형태소 분석은 가장 핵심적인 태스크다. 형태소 분석의 성능 향상은 한국어 자연어 처리 태스크의 성능 향상에 직결된다. 최근 형태소 분석은 주로 기계 번역 관점에서 연구가 진행되고 있다. 기계 번역은 신경망 모델 등으로 어느 한 도메인의 시퀀스(문장)를 다른 도메인의 시퀀스(문장)로 바꾸는 것이다. 형태소 분석을 기계 번역 관점에서 보면 어절 도메인에 속하는 입력 시퀀스를 형태소 도메인 시퀀스로 변환하는 것이다. 본 논문은 한국어 형태소 분석을 위한 딥러닝 모델을 제안한다. 본 연구에서 사용하는 모델은 기계 번역에서 높은 성능을 기록한 BERT-fused 모델을 기반으로 한다. BERT-fused 모델은 기계 번역에서 대표적인 Transformer 모델과 자연어 처리 분야에 획기적인 성능 향상을 이룬 언어모델인 BERT를 활용한다. 실험 결과 형태소 단위 F1-Score 98.24의 성능을 얻을 수 있었다.

Sentinel-1 SAR 영상의 수체 탐지 기법을 활용한 저수지 관측 기반 수문학적 가뭄 지수 평가 (Evaluation of Reservoir Monitoring-based Hydrological Drought Index Using Sentinel-1 SAR Waterbody Detection Technique)

  • 김완엽;정재환;최민하
    • 대한원격탐사학회지
    • /
    • 제38권2호
    • /
    • pp.153-166
    • /
    • 2022
  • 저수량은 가용한 수자원의 양을 가장 직접적으로 나타내는 인자중의 하나이다. 또한 가뭄의 영향을 보다 직관적으로 나타낼 수 있으므로, 가뭄 평가를 위한 연구에서도 다양하게 활용되고 있다. 최근에는 광학영상으로 저수면적을 관측하고, 또 이를 활용한 수문학적 가뭄지수인 RADI가 개발되기도 하였다. 인공위성을 통해 얻을 수 있는 광학영상은 관측주기가 뛰어나 많은 양의 자료를 획득할 수 있으나, 구름 등 기상과 대기환경에 의한 영향에 취약하여 실제 활용에서는 다소 한계가 있다. 이에 본 연구에서는 기상이나, 관측시간대와 상관없이 영상을 획득할 수 있는 SAR 영상을 활용한 가뭄지수 산정 연구를 수행하고자 하였다. Sentinel-1 위성의 SAR 영상을 활용하여 충북 진천군에 위치한 백곡, 초평저수지의 저수면적을 탐지하여, RADI를 산정하여 지역규모 가뭄 모니터링을 수행하였다. RADI는 실측 저수량을 기반으로 한 RSDI와 비교, 검증하였다. RADI는 RSDI와 상관계수 r=0.87, ROC의 밑면적 AUC=0.97로 매우 높은 상관 관계를 보여주었다. 이 결과는 SAR 기반 RADI의 지역규모 수문학적 가뭄 모니터링의 가능성을 보여주며, 추후 가용 SAR 영상의 종류가 늘어나고, 재방문주기가 단축될 것이므로 가뭄 모니터링에 대한 활용성이 증대될 것으로 기대된다.

위성 영상을 위한 경량화된 CNN 기반의 보간 기술 연구 (A Study on Lightweight CNN-based Interpolation Method for Satellite Images)

  • 김현호;서두천;정재헌;김용우
    • 대한원격탐사학회지
    • /
    • 제38권2호
    • /
    • pp.167-177
    • /
    • 2022
  • 위성 영상 촬영 후 지상국에 전송된 영상을 이용하여 최종 위성 영상을 획득하기 위해 많은 영상 전/후 처리 과정이 수반된다. 전/후처리 과정 중 레벨 1R 영상에서 레벨 1G 영상으로 변환 시 기하 보정은 필수적으로 요구된다. 기하 보정 알고리즘에서는 보간 기법을 필연적으로 사용하게 되며, 보간 기법의 정확도에 따라서 레벨 1G 영상의 품질이 결정된다. 또한, 레벨 프로세서에서 수행되는 보간 알고리즘의 고속화 역시 매우 중요하다. 본 논문에서는 레벨 1R에서 레벨 1G로 변환 시 기하 보정에 필요한 경량화된 심층 컨볼루션 신경망 기반 보간 기법에 대해 제안하였다. 제안한 기법은 위성 영상의 해상도를 2배 향상하며, 빠른 처리 속도를 위해 경량화된 심층 컨볼루션 신경망으로 딥러닝 네트워크를 구성하였다. 또한, panchromatic (PAN) 밴드 정보를 활용하여 multispectral (MS) 밴드의 영상 품질 개선이 가능한 피처 맵 융합 방법을 제안하였다. 제안된 보간 기술을 통해 획득한 영상은 기존의 딥러닝 기반 보간 기법에 비해 정량적인 peak signal-to-noise ratio (PSNR) 지표에서 PAN 영상은 약 0.4 dB, MS 영상은 약 4.9 dB 개선된 결과를 보여주었으며, PAN 영상 크기 기준 36,500×36,500 입력 영상의 해상도를 2배 향상된 영상 획득 시 기존 딥러닝 기반 보간 기법 대비 처리 속도가 약 1.6배 향상됨을 확인하였다.

구성가능한 소프트웨어 제품라인 시험에서 코드 커버리지 측정 (Code Coverage Measurement in Configurable Software Product Line Testing)

  • 한수빈;이지현;고서연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.273-282
    • /
    • 2022
  • 구성가능한 소프트웨어 제품라인 시험은 모든 멤버제품들에 포함되는 공통 부분과 일부 또는 단일 제품에 포함되는 가변 부분을 고려해야 하기 때문에 단일 제품 시험 방법들을 그대로 적용하기 어렵다. 소프트웨어 시스템 시험에서 시험 커버리지는 수행된 시험의 적절성을 측정하는 척도이다. 구성가능한 소프트웨어 제품라인으로부터 생성될 수 있는 멤버제품들은 수백 개에 이를 수 있기 때문에 시험 커버리지 측정은 소프트웨어 제품라인 수준에서 시험의 적절성을 평가하기 위해 중요하다. 이 논문은 구성가능한 소프트웨어 제품라인 시험에서 제품라인 수준의 코드 커버리지 측정 방법을 제안한다. 제안한 방법은 피처 집합의 포함 관계를 기준으로 제품들을 계층화한 후 제품라인의 멤버제품들을 시험하고, 시험으로부터 얻어진 각 제품의 시험 커버리지들을 종합하여 SPL 시험 커버리지를 정량화한다. 제안한 방법을 11개의 구성가능한 소프트웨어 제품라인 사례에 적용하여 검증한 결과, 제안한 방법은 SPL 시험이 얼마나 철저하게 수행되었는지를 정량적으로 기술하여 SPL 시험의 적정성을 확인할 수 있도록 도왔다. 또한, 새로 추가된 SPL 멤버제품의 시험이 이전 멤버제품 시험 대비 커버리지를 증가시키는 방향인지 확인할 수 있어 새로운 시험케이스들이 멤버제품들 간의 차이를 커버하는 방향으로 시험이 이루어지고 있는지 확인할 수 있었다.

한국어에서 의존 구문분석을 위한 구묶음의 활용 (Exploiting Chunking for Dependency Parsing in Korean)

  • 남궁영;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.291-298
    • /
    • 2022
  • 본 논문은 한국어에 대해서 구묶음을 수행한 후에 의존구조를 분석하는 방법을 제안한다. 의존구조 분석은 단어의 지배어를 결정하는 과정이다. 지배어를 정할 때, 문법적인 지배어를 정할 것인지 의미적인 지배어를 정할 것인지가 고질적인 문제이다. 일반적으로는 문법적인 지배어를 정하고 있다. 예를 들면 문장 "밥을 먹고 싶다"에서 어절 "먹고"의 지배어로 "싶다"를 정한다. 그러나 "싶다"는 보조용언으로 의미적으로 지배어가 될 수 없다. 이와 같은 방법으로 구문을 분석하면 의미분석을 위해서 또 다른 변환이 있어야 한다. 본 논문에서는 이런 문제를 다소 완화하기 위해서 구묶음을 수행한 후에 구문을 분석하는 방법을 제안한다. 구묶음은 문장을 구성성분 단위로 분할하는 과정이며 구성성분은 내용어 말덩이와 기능어 말덩이로 구성된다. 구묶음을 수행하면 구문 분석의 입력이 되는 문장 성분의 수가 줄어들므로 구문 분석 속도가 개선될 수 있으며, 문장에서 중심어를 중심으로 하나의 말덩이로 묶이므로 말덩이에 대해서만 그 의존 관계를 파악할 수 있어 구문 분석의 효율성을 높일 수 있다. 본 논문은 세종의존말뭉치를 사용해서 성능을 분석했으며 UAS와 LAS가 각각 86.48%와 84.56%였으며 입력의 노드 수도 약 22% 정도 줄일 수 있었다.

주기성을 갖는 입출력 데이터의 연관성 분석을 통한 회귀 모델 학습 방법 (Learning Method for Regression Model by Analysis of Relationship Between Input and Output Data with Periodicity)

  • 김혜진;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.299-306
    • /
    • 2022
  • 최근 로봇이나 설비, 회로 등에 센서 내장이 보편화 되고, 측정된 센서 데이터를 학습하여 기기의 고장을 진단하기 위한 연구가 활발하게 수행되고 있다. 이러한 고장 진단 연구는 고장 상황이나 종류를 예측하기 위한 분류(Classification) 모델 개발과 정량적으로 고장 상황을 예측하기 위한 회귀(Regression) 모델 개발로 구분된다. 분류 모델의 경우, 단순히 고장이나 결함의 유무(Class)를 확인하는 반면, 회귀 모델은 무수히 많은 수치 중에 하나의 값(Value)을 예측해야 하므로 학습 난이도가 더 높다. 즉, 입력과 출력을 대응시켜 고장을 예측을 할 때, 유사한 입력값이 동일한 출력을 낸다고 결정하기 어려운 불규칙한 상황이 다수 존재하기 때문이다. 따라서 본 논문에서는 주기성을 지닌 입출력 데이터에 초점을 맞추어, 입출력 관계를 분석하고, 슬라이딩 윈도우 기반으로 입력 데이터를 패턴화 하여 입출력 데이터 간의 규칙성을 확보하도록 한다. 제안하는 방법을 적용하기 위해, 본 연구에서는 MMC(Modular Multilevel Converter) 회로 시스템으로부터 주기성을 지닌 전류, 온도 데이터를 수집하여 ANN을 이용하여 학습을 진행하였다. 실험 결과, 한 주기의 2% 이상의 윈도우를 적용하였을 때, 적합도 97% 이상의 성능이 확보될 수 있음을 확인하였다.

Siemens star를 이용한 드론 영상의 품질 평가 (Quality Evaluation of Drone Image using Siemens star)

  • 이재원;성상민;백기석;윤부열
    • 한국측량학회지
    • /
    • 제40권3호
    • /
    • pp.217-226
    • /
    • 2022
  • 고정밀 공간정보제작 분야의 활용 측면에서 무인항공사진측량은 촬영된 영상의 정량적인 품질 검증 방법과 인증에 대한 절차와 세부 규정이 미흡한 문제점이 있다. 또한, 영상에 대한 검증 수단이 해상도와 명암의 대비 정도를 동시에 분석 할 수 있는 MTF (Modulation Transfer Function) 분석이 아닌 GSD (Ground Sample Distance) 만으로 품질을 평가하고 있어 유인항공영상보다 품질이 떨어지는 경우도 있다. 이에 본 연구에서는 드론 영상 품질 분석에서 MTF 분석의 필요성을 확인하기 위해 Siemens star를 이용하여 GSD와 MTF 분석을 동시에 실시하였다. 서로 다른 드론 기체와 센서로 동일한 해상도로 타겟을 촬영한 영상을 분석한 결과, GSD에서는 약간 상이한 결과를 나타내었지만, 영상의 해상도와 명암의 대비 정도를 동시에 분석할 수 있는 σMTF 수치는 큰 차이를 나타내었다. 이와 같은 결과로 MTF 분석이 보다 객관적이며 신뢰도 높은 품질분석 방법이라고 결론지을 수 있다. 아울러 작업자가 카메라 센서의 성능, 중복도 및 기체의 성능을 적절하게 판단하여 촬영을 실시하여야만 높은 품질의 드론 영상을 획득할 수 있음을 알 수 있었다. 하지만 본 연구는 제한된 기체와 촬영 조건하에서 취득된 영상으로만 분석을 수행한 결과이다. 따라서 향후 관련 분야의 다양한 실험 데이터를 축척하여 지속적인 연구를 수행하면 보다 객관적이고 신뢰성 있는 결과를 도출할 것으로 기대된다

패치 특징 코어세트 기반의 흉부 X-Ray 영상에서의 병변 유무 감지 (Leision Detection in Chest X-ray Images based on Coreset of Patch Feature)

  • 김현빈;전준철
    • 인터넷정보학회논문지
    • /
    • 제23권3호
    • /
    • pp.35-45
    • /
    • 2022
  • 현대에도 일부 소외된 지역에서는 의료 인력의 부족으로 인해 위·중증 환자에 대한 치료가 지연되는 경우가 많다. 의료 데이터에 대한 분석을 자동화하여 의료 서비스의 접근성 문제 및 의료 인력 부족을 해소하고자 하는 연구가 계속되고 있다. 컴퓨터 비전 기반의 진료 자동화는 훈련 목적에 대한 데이터 수집 및 라벨링 작업에서 많은 비용이 요구된다. 이러한 점은 희귀질환이나 시각적으로 뚜렷하게 정의하기 어려운 병리적 특징 및 기전을 구분하는 작업에서 두드러진다. 이상 탐지는 비지도 학습 전략을 채택함으로써 데이터 수집 비용을 크게 절감할 수 있는 방법으로 주목된다. 본 논문에서는 기존의 이상 탐지 기법들을 기반으로, 흉부 X-RAY 영상에 대해 이상 탐지를 수행하는 방법을 다음과 같이 제안한다. (1) 최적 해상도로 샘플링된 의료 영상의 색상 범위를 정규화한다. (2) 무병변 영상으로부터 패치 단위로 구분된 중간 수준 특징 집합을 추출하여 그 중 높은 표현력을 가진 일부 특징 벡터들을 선정한다. (3) 최근접 이웃 탐색 알고리즘을 기반으로 미리 선정된 무병변(정상) 특징 벡터들과의 차이를 측정한다. 본 논문에서는 PA 방식으로 촬영된 흉부 X-RAY 영상들에 대한 제안 시스템의 이상 탐지 성능을 세부 조건에 따라 상세히 측정하여 제시한다. PadChest 데이터세트로부터 추출한 서브세트에 대해 0.705 분류 AUROC를 보임으로써 의료 영상에 대한 이상 탐지 적용의 효과를 입증하였다. 제안 시스템은 의료 기관의 임상 진단 워크플로우를 개선하는 데에 유용하게 사용될 수 있으며, 의료 서비스 접근성이 낮은 지역에서의 조기 진단을 효율적으로 지원할 수 있다.

다중분광 드론영상의 표준화를 위한 전처리 기법 비교·분석 (Comparative Analysis of Pre-processing Method for Standardization of Multi-spectral Drone Images)

  • 안호용;류재현;나상일;이병모;김민지;이경도
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1219-1230
    • /
    • 2022
  • 농업관측에서의 다중분광 드론은 식생구분 및 식생활력도 분석에 있어 복사량이나 반사도와 같은 물리량을 기반으로 한 정량적이고 신뢰성 있는 데이터가 필요하다. 작황분석 모니터링을 위한 원격탐사 자료의 경우 동일지역에 대해 여러 시기에 걸쳐 촬영된 영상이 요구되며, 특히 엽면적 지수 또는 엽록소와 같은 생물리자료의 경우 동일한 기준에서의 시계열 자료를 통해 분석되므로 직접적으로 비교 가능한 반사도 자료가 필요하다. 드론영상을 기반 정사영상(정합영상)은 전체 영상 화소값이 왜곡되거나 접합 경계면 화소값의 차이가 발생하여 정확한 물리량 산출에 한계를 가진다. 본 연구는 시계열 작황 모니터링을 위한 드론영상의 보정방법에 따른 지상 반사도와 드론영상 기반 식생지수를 산정하고 그 결과를 지상관측자료와 비교하여 전처리 방법에 따른 드론영상의 분광학적 특성을 구명하고자 수행하였다.

Extra Tree와 ANN을 활용한 이상 탐지 및 공격 유형 분류 메커니즘 (Anomaly detection and attack type classification mechanism using Extra Tree and ANN)

  • 김민규;한명묵
    • 인터넷정보학회논문지
    • /
    • 제23권5호
    • /
    • pp.79-85
    • /
    • 2022
  • 이상 탐지는 일반적인 사용자들의 데이터 집합 속에서 비정상적인 데이터 흐름을 파악하여 미리 차단하는 방법이다. 기존에 알려진 방식은 이미 알려진 공격의 시그니처를 활용하여 시그니처 기반으로 공격을 탐지 및 방어하는 방식인데, 이는 오탐율이 낮다는 장점이 있지만 제로 데이 취약점 공격이나 변형된 공격에 대해서는 매우 취약하다는 점이 문제점이다. 하지만 이상 탐지의 경우엔 오탐율이 높다는 단점이 존재하지만 제로 데이 취약점 공격이나 변형된 공격에 대해서도 식별하여 탐지 및 차단할 수 있다는 장점이 있어 관련 연구들이 활발해지고 있는 중이다. 본 연구에서는 이 중 이상 탐지 메커니즘에 대해 다뤘다. 앞서 말한 단점인 높은 오탐율을 보완하며 그와 더불어 이상 탐지와 분류를 동시에 수행하는 새로운 메커니즘을 제안한다. 본 연구에서는 여러 알고리즘의 특성을 고려하여 5가지의 구성으로 실험을 진행하였다. 그 결과로 가장 우수한 정확도를 보이는 모델을 본 연구의 결과로 제안하였다. Extra Tree와 Three layer ANN을 동시에 적용하여 공격 여부를 탐지한 후 공격을 분류된 데이터에 대해서는 Extra Tree를 활용하여 공격 유형을 분류하게 된다. 본 연구에서는 NSL-KDD 데이터 세트에 대해서 검증을 진행하였으며, Accuracy는 Normal, Dos, Probe, U2R, R2L에 대하여 각각 99.8%, 99.1%, 98.9%, 98.7%, 97.9%의 결과를 보였다. 본 구성은 다른 모델에 비해 우수한 성능을 보였다.