• 제목/요약/키워드: Machine Learning

검색결과 5,326건 처리시간 0.038초

상수도관망 내 데이터 불확실성에 따른 절점 압력 예측 ANN 모델 수행 성능 비교 (Comparison of ANN model's prediction performance according to the level of data uncertainty in water distribution network)

  • 장혜운;정동휘;전상훈
    • 한국수자원학회논문집
    • /
    • 제55권spc1호
    • /
    • pp.1295-1303
    • /
    • 2022
  • 안정적인 수도 공급을 위한 상수도관망의 역할이 더욱 주목받음에 따라 비정상 상황에 대한 신속한 탐지와 적절한 대처 역시 중요시되고 있다. 장치에 의존한 탐지기법 등 기존의 방법론에는 한계가 존재하므로 데이터를 이용한 모델 기반의 방법이 개발되었다. 하지만 상수도관망 내 측정 데이터는 불확실성을 가져 실제 사용량과 다르다. 따라서 본 연구에서는 기계학습 방법의 하나인 인공신경망 모델을 이용하여 상수도관망 압력값을 예측함에 있어 데이터 불확실성의 영향을 조사한다. 정규분포를 따르는 임의의 값을 고려하여 데이터에 측정치 오류를 형성하고 측정치 오류 여부 및 종류에 따라 총 9가지 데이터를 인공신경망 모델을 통해 예측해 경향성을 비교한다. 분석을 통해 데이터 불확실성이 증가할수록 모델 성능이 감소하며, 출력데이터의 측정치 오류가 모델 성능에 미치는 정도가 더 큼을 확인하였다. 특히 입력데이터와 출력데이터의 측정 오차 크기가 동일한 경우 예측 정확도는 각각 72.25%, 38.61%로 큰 차이를 보였다. 따라서 ANN 모델 예측 성능 향상을 위해서는 입력 데이터보다 출력데이터인 주절점의 측정 오류 크기를 줄이는 것이 중요하다.

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

  • 신현호;정선기;전홍우;권이남;이재민;박강희;최성필
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.159-172
    • /
    • 2023
  • 일반적으로 사회문제 해결 연구는 과학기술을 활용하여 다양한 사회적 현안들에 의미있는 해결 방안을 제시함으로써 중요한 사회적 가치를 창출하는 것을 연구 목표로 한다. 그러나 사회문제와 쟁점을 완화하기 위하여 많은 연구들이 국가적으로 수행되었음에도 불구하고 여전히 많은 사회문제가 남아 있는 상황이다. 사회문제 해결 연구의 전 과정을 원활하게 하고 그 효과를 극대화하기 위해서는 사회적으로 시급한 현안들에 대한 문제를 명확하게 파악하는 것이 중요하다. 사회문제 해결과 관련된 기존 R&D 보고서와 같은 자료에서 중요한 사안을 자동으로 식별할 수 있다면 사회문제 파악 단계가 크게 개선될 수 있다. 따라서 본 논문은 다양한 국가 연구보고서에서 사회문제와 해결방안을 자동으로 감지하기 위한 기계학습 모델을 구축하는 데에 필수적인 데이터셋을 제안하고자 한다. 우선 데이터를 구축하기 위해 사회문제와 쟁점을 다룬 연구보고서를 총 700건 수집하였다. 수집된 연구보고서에서 사회문제, 목적, 해결 방안 등 사회문제 해결과 관련된 내용이 담긴 문장을 추출 후 라벨링을 수행하였다. 또한 4개의 사전학습 언어모델을 기반으로 분류 모델을 구현하고 구축된 데이터셋을 통해 일련의 성능 실험을 수행하였다. 실험 결과 KLUE-BERT 사전학습 언어모델을 미세조정한 모델이 정확도 75.853%, F1 스코어 63.503%로 가장 높은 성능을 보였다.

AWS 기반 행위와 객체 인식을 통한 위협 상황 판단 시스템 (Threat Situation Determination System Through AWS-Based Behavior and Object Recognition)

  • 김예영;정수현;박소현;박영호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.189-198
    • /
    • 2023
  • 길거리에서 묻지마 범죄가 자주 발생함에 따라 CCTV의 보급이 증가하고 있다. 그러나 수동적으로 작동되는 CCTV의 단점 때문에 지능형 CCTV의 필요성이 주목 받고 있다. 이러한 지능형 CCTV의 무거운 시스템 때문에, 높은 성능의 기기들이 필요해 일반 CCTV를 대체하는데 비용적 측면에서 부담이 발생한다. 이 문제를 해결하기 위해 낮은 품질의 영상도 인식하며 높지 않은 성능의 기기에서도 시스템이 구동되는 지능형 CCTV 시스템이 필요하다. 따라서 본 논문은 AWS 기반 플랫폼을 활용하여 시스템을 경량화하고 영상을 텍스트화하여 실시간으로 위협을 감지할 수 있는 Saying CCTV 시스템을 제안한다. 이는 YOLO v4와 OpenPose를 사용해 추출한 데이터를 바탕으로 위험 객체와 위협 행동 그리고 위협 상황을 판단하며, 위험도를 머신러닝으로 계산하도록 구현하였다. 이를 통해, 언제 어디서나 네트워크만 연결되면 시스템을 동작시킬 수 있으며, 영상 촬영과 이미지 업로드가 최소한의 성능의 기기에서도 시스템 사용이 가능하다. 나아가 영상을 분석하여 텍스트로 저장되는 데이터들로 하여금 범죄의 유의미한 통계를 자동화하여 신속한 범죄 예방이 가능하다.

Reliability of mortar filling layer void length in in-service ballastless track-bridge system of HSR

  • Binbin He;Sheng Wen;Yulin Feng;Lizhong Jiang;Wangbao Zhou
    • Steel and Composite Structures
    • /
    • 제47권1호
    • /
    • pp.91-102
    • /
    • 2023
  • To study the evaluation standard and control limit of mortar filling layer void length, in this paper, the train sub-model was developed by MATLAB and the track-bridge sub-model considering the mortar filling layer void was established by ANSYS. The two sub-models were assembled into a train-track-bridge coupling dynamic model through the wheel-rail contact relationship, and the validity was corroborated by the coupling dynamic model with the literature model. Considering the randomness of fastening stiffness, mortar elastic modulus, length of mortar filling layer void, and pier settlement, the test points were designed by the Box-Behnken method based on Design-Expert software. The coupled dynamic model was calculated, and the support vector regression (SVR) nonlinear mapping model of the wheel-rail system was established. The learning, prediction, and verification were carried out. Finally, the reliable probability of the amplification coefficient distribution of the response index of the train and structure in different ranges was obtained based on the SVR nonlinear mapping model and Latin hypercube sampling method. The limit of the length of the mortar filling layer void was, thus, obtained. The results show that the SVR nonlinear mapping model developed in this paper has a high fitting accuracy of 0.993, and the computational efficiency is significantly improved by 99.86%. It can be used to calculate the dynamic response of the wheel-rail system. The length of the mortar filling layer void significantly affects the wheel-rail vertical force, wheel weight load reduction ratio, rail vertical displacement, and track plate vertical displacement. The dynamic response of the track structure has a more significant effect on the limit value of the length of the mortar filling layer void than the dynamic response of the vehicle, and the rail vertical displacement is the most obvious. At 250 km/h - 350 km/h train running speed, the limit values of grade I, II, and III of the lengths of the mortar filling layer void are 3.932 m, 4.337 m, and 4.766 m, respectively. The results can provide some reference for the long-term service performance reliability of the ballastless track-bridge system of HRS.

언어 정보가 반영된 문장 점수를 활용하는 삭제 기반 문장 압축 (Deletion-Based Sentence Compression Using Sentence Scoring Reflecting Linguistic Information)

  • 이준범;김소언;박성배
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.125-132
    • /
    • 2022
  • 문장 압축은 원본 문장의 중요한 의미는 유지하면서 길이가 축소된 압축 문장을 생성하는 자연어처리 태스크이다. 문법적으로 적절한 문장 압축을 위해, 초기 연구들은 사람이 정의한 언어 규칙을 활용하였다. 또한 시퀀스-투-시퀀스 모델이 기계 번역과 같은 다양한 자연어처리 태스크에서 좋은 성능을 보이면서, 이를 문장 압축에 활용하고자 하는 연구들도 존재했다. 하지만 언어 규칙을 활용하는 연구의 경우 모든 언어 규칙을 정의하는 데에 큰 비용이 들고, 시퀀스-투-시퀀스 모델 기반 연구의 경우 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 이를 해결할 수 있는 방법으로 사전 학습된 언어 모델인 BERT를 활용하는 문장 압축 모델인 Deleter가 제안되었다. Deleter는 BERT를 통해 계산된 perplexity를 활용하여 문장을 압축하기 때문에 문장 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않다는 장점이 있다. 하지만 Deleter는 perplexity만을 고려하여 문장을 압축하기 때문에, 문장에 속한 단어들의 언어 정보를 반영하여 문장을 압축하지 못한다. 또한, perplexity 측정을 위한 BERT의 사전 학습에 사용된 데이터가 압축 문장과 거리가 있어, 이를 통해 측정된 perplexity가 잘못된 문장 압축을 유도할 수 있다는 문제점이 있다. 이를 해결하기 위해 본 논문은 언어 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 계산에 반영하는 방법을 제안한다. 또한 고유명사가 자주 포함되어 있으며, 불필요한 수식어가 생략되는 경우가 많은 뉴스 기사 말뭉치로 BERT를 fine-tuning하여 문장 압축에 적절한 perplexity를 측정할 수 있도록 하였다. 영어 및 한국어 데이터에 대한 성능 평가를 위해 본 논문에서 제안하는 LI-Deleter와 비교 모델의 문장 압축 성능을 비교 실험을 진행하였고, 높은 문장 압축 성능을 보임을 확인하였다.

인공지능 기법을 활용한 한반도 해역의 수질평가지수 예측모델 개발 (Development of a Water Quality Indicator Prediction Model for the Korean Peninsula Seas using Artificial Intelligence)

  • 김성수;손규희;김도연;허장무;김성은
    • 해양환경안전학회지
    • /
    • 제29권1호
    • /
    • pp.24-35
    • /
    • 2023
  • 급격한 산업화와 도시화로 인해 해양 오염이 심각해지고 있으며, 이러한 해양 오염을 실효적으로 관리하기 위해 수질평가지수(Water Quality Index, WQI)를 마련하여 활용하고 있다. 하지만 수질평가지수는 다소 복잡한 계산과정으로 인한 정보의 손실, 기준값 변동, 실무자의 계산오류, 통계적 오류 등의 불확실성(uncertainty)을 내포하고 있다. 이에 따라 국내·외에서 인공지능 기법을 활용하여 수질평가지수를 예측하기 위한 연구가 활발히 이루어지고 있다. 본 연구에서는 해양환경측정망 자료(2000 ~ 2020년)를 활용하여 우리나라 전 해역 즉, 5개의 생태구에 대한 WQI를 추정할 수 있는 가장 적합한 인공지능기법을 도출하기 위해 총 6가지의 기법(RF, XGBoost, KNN, Ext, SVM, LR)을 실험하였다. 그 결과, Random Forest 기법이 다른 기법에 비해 가장 우수한 성능을 보였다. Random Forest 기법의 WQI 점수 예측값과 실제값의 잔차 분석 결과, 모든 생태구에서 시간적 및 공간적 예측 성능이 우수한 것으로 나타났다. 이를 통해 본 연구에서 개발한 Random Forest 기법은 높은 정확도를 바탕으로 우리나라 전해역에 대한 WQI를 예측 가능할 것으로 사료된다.

정부의 기술혁신 재정지원 정책효과에 대한 체계적 문헌연구 (Systemic literature review on the impact of government financial support on innovation in private firms)

  • 안준모
    • 기술혁신연구
    • /
    • 제30권1호
    • /
    • pp.57-104
    • /
    • 2022
  • 정부는 시장실패 방지, 정보의 비대칭성 완화, 자원의 효율적 배분 등 다양한 목적을 가지고 시장에 개입하여 민간기업의 기술혁신을 지원해 왔다. 2000년대 들어 국가 연구개발 예산이 급격히 증가하면서 기업에게 지원되는 정부재원도 비례하여 증가해왔으나 정부의 재정지원이 효과적이고 바람직한 정책목표를 달성했는지에 대해서는 분명하지 않다. 본 연구는 이러한 문제인식 하에 국내·외 관련 논문과 정책연구 보고서, 리뷰 페이퍼 등을 종합적·체계적으로 분석하여 다양한 정부 재정지원에 대한 문제점을 살펴보고자 하였다. 국·내외 총 168편의 연구를 체계적 문헌분석과 컨텐츠 분석을 활용하여 정책 부가성, 지원방식, 기업규모, 분석단위(unit of analysis), 분석대상, 연구방법론과 데이터 등 다양한 관점에서 입체적으로 분석하였다. 문헌 간 교차 비교를 통해 다수의 중복 수혜, 재정지원과 정책효과 간의 구조적 시차, 재정지원 효과의 비선형성, 정책간의 간섭과 교호작용, 폐쇄형 혁신과 제조업에 최적화된 조세제도 등이 현재 정부 재정지원의 문제점으로 분석되었으며, 이를 해결하기 위한 정책개선 방향으로 행동 부가성을 고려한 재정지원사업 성과지표 개발, 정부부처 간 정책협력과 조율 강화, 다양한 상황을 고려할 수 있는 정책혼합(policy mix) 도입, 디지털 혁신·서비스 연구개발 등 새로운 형태의 기술혁신에 맞는 기업 재정지원 방식, 데이터에 기반 한 증거기반 정책강화 등을 제시하였다.

센서 데이터를 위한 스마트 통합 처리 시스템 연구 (Study of Smart Integration processing Systems for Sensor Data)

  • 지효상;김재성;김리원;김정준;한익주;박정민
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권8호
    • /
    • pp.327-342
    • /
    • 2017
  • 본 논문은 센서 데이터를 수집하고 효과적으로 처리하는 IoT 서비스를 위한 스마트 센서 데이터 통합 처리 시스템을 소개한다. IoT 분야의 발전으로 센서 데이터를 수집하고 이를 네트워크로 송·수신하는 기술을 바탕으로 하는 스마트 홈, 자율주행 자동차 등의 다양한 프로젝트가 진행됨에 따라 센서 데이터를 처리하고 효과적으로 활용하기 위한 자율제어 시스템이 이슈가 되고 있다. 그러나 자율제어 시스템의 모니터링을 위한 센서 데이터 형식은 도메인에 따라 다르기 때문에 각기 다른 다양한 도메인에 자율제어 시스템을 적용하는 스마트 센서 데이터 통합 처리 시스템이 필요하다. 따라서 본 논문은 스마트 센서 데이터 통합 처리 시스템을 소개하고, 이를 적용시켜 창문을 기준으로 내부와 외부의 센서 데이터를 처리하기 위해 1) receiveData, 2) parseData, 3) addToDatabase의 3단계 프로세스를 가지고, 자율제어 시스템에 의하여 쾌적한 실내 환경을 조성하기 위해 환기를 하는 자동 창문 개폐 시스템 'Smart Window'를 제안하고 구현한다. 이를 통해 대기 정보를 수집해 모니터링하며, 저장된 데이터를 토대로 통계 분석 및 더 나은 자율제어 수행을 위한 기계학습을 가능하게 한다.

GAN 데이터 기반의 머신러닝 모델을 통한 미계측 하천에서의 수생태계 건강성 등급 예측 방안 연구 (A study on the prediction of aquatic ecosystem health grade in ungauged rivers through the machine learning model based on GAN data)

  • 이서로;이지민;이관재;김종건;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.448-448
    • /
    • 2021
  • 최근 급격한 기후변화와 도시화 및 산업화로 인한 지류하천에서의 수량과 수질의 변동은 생물 다양성 감소와 수생태계 건강성 저하에 큰 영향을 미치고 있다. 효율적인 수생태 관리를 위해서는 지속적인 유량, 수질, 그리고 수생태 모니터링을 통한 데이터 축적과 더불어 면밀한 상관 분석을 통해 수생태계 건강성의 악화 원인을 규명해야 할 필요가 있다. 그러나 수많은 지류하천을 대상으로 한 지속적인 모니터링은 현실적으로 어려움이 있으며, 수생태계의 특성 상 단일 영향 인자만으로 수생태계의 건강성 변화와의 관계를 정확히 파악하는데 한계가 있다. 따라서 지류하천에서의 유량 및 수질의 시공간적인 변동성과 다양한 영향 인자를 고려하여 수생태계의 건강성을 효율적으로 예측할 수 있는 기술이 필요하다. 이에 본 연구에서는 경험적 데이터 기반의 머신러닝 모델 구축을 통해 미계측 하천에서의 수생태계 건강성 지수(BMI, TDI, FAI)의 등급(A to E)을 예측하고자 하였다. 머신러닝 모델은 학습 데이터셋의 양과 질에 따라 성능이 크게 달라질 수 있으며, 학습 데이터셋의 분포가 불균형적일 경우 과적합 또는 과소적합 문제가 발생할 수 있다. 이를 보완하고자 본 연구에서는 실제 측정망 데이터셋을 바탕으로 생성적 적대 신경망 GAN(Generative Adversarial Network) 알고리즘을 통해 머신러닝 모델 학습에 필요한 추가 데이터셋(유량, 수질, 기상, 수생태 등급)을 확보하였다. 머신러닝 모델의 성능은 5차 교차검증 과정을 통해 평가하였으며, GAN 데이터셋의 정확도는 실제 측정망 데이터셋의 정규분포와의 비교 분석을 통해 평가하였다. 최종적으로 SWAT(Soil and Water Assessment Tool) 모형을 통해 예측 된 미계측 하천에서의 데이터셋을 머신러닝 모델의 검증 자료로 사용하여 수생태계 건강성 등급 예측 정확도를 평가하였다. 본 연구에서의 GAN에 의해 강화된 머신러닝 모델은 수질 및 수생태 관리가 필요한 우심 지류하천 선정과 구조적/비구조적 최적관리기법에 따른 수생태계 건강성 개선 효과를 평가하는데 활용될 수 있을 것이다. 또한 이를 통해 예측된 미계측 하천에서의 수생태계 건강성 등급 자료는 수량-수질-수생태를 유기적으로 연계한 통합 물관리 정책을 수립하는데 기초자료로 활용될 수 있을 것이라 사료된다.

  • PDF

분광 다양성을 고려한 초분광 영상 기반 부유사 농도 계측 기법 개발 (Development of Suspended Sediment Concentration Measurement Technique Based on Hyperspectral Imagery with Optical Variability)

  • 권시윤;서일원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.116-116
    • /
    • 2021
  • 자연 하천에서의 부유사 농도 계측은 주로 재래식 채집방식을 활용한 직접계측 방식에 의존하여 비용과 시간이 많이 소요되며 점 계측 방식으로 고해상도의 시공간 자료를 측정하기엔 한계가 존재한다. 이러한 한계점을 극복하기 위해 최근 위성영상과 드론을 활용하여 촬영된 다분광 혹은 초분광 영상을 통해 고해상도의 부유사 농도 시공간분포를 측정하는 기법에 대한 연구가 활발히 진행되고 있다. 하지만, 다른 하천 물리량 계측에 비해 부유사 계측 연구는 하천에 따라 부유사가 비균질적으로 분포하여 원격탐사를 통해 정확하고 전역적인 농도 분포를 재현하기는 어려운 실정이다. 이러한 부유사의 비균질성은 부유사의 입도분포, 광물특성, 침강성 등이 하천에서 다양하게 분포하기 때문이며 이로 인해 부유사는 지역별로 다양한 분광특성을 가지게 된다. 따라서, 본 연구에서는 이러한 영향을 고려한 전역적인 부유사 농도 예측 모형을 개발하기 위해 실내 실험을 통해 부유사 특성별 고유 분광 라이브러리를 구축하고 실규모 수로에서 다양한 부유사 조건에 대한 초분광 스펙트럼과 부유사 농도를 측정하는 실험을 수행하였다. 실제 부유사 농도는 광학 기반 센서인 LISST-200X와 샘플링을 통한 실험실 분석을 통해 계측되었으며, 초분광 스펙트럼 자료는 초분광 카메라를 통해 촬영한 영상에서 부유사 계측 지점에 대한 픽셀의 스펙트럼을 추출하여 구축하였다. 이렇게 생성된 자료들의 분광 다양성을 주성분 분석(Principle Component Analysis; PCA)를 통해 분석하였으며, 부유사의 입도 분포, 부유사 종류, 수온 등과의 상관관계를 통해 분광 특성과 가장 상관관계가 높은 물리적 인자를 규명하였다. 더불어 구축된 자료를 바탕으로 기계학습 기반 주요 특징 선택 알고리즘인 재귀적 특징 제거법 (Recursive Feature Elimination)과 기계학습기반 회귀 모형인 Support Vector Regression을 결합하여 초분광 영상 기반 부유사 농도 예측 모형을 개발하였으며, 이 결과를 원격탐사 계측 연구에서 일반적으로 사용되어 오던 최적 밴드비 분석 (Optimal Band Ratio Analysis; OBRA) 방법으로 도출된 회귀식과 비교하였다. 그 결과, 기존의 OBRA 기반 방법은 비선형성을 증가시켜도 좁은 영역의 파장대만을 고려하는 한계점으로 인해 부유사의 다양한 분광 특성을 반영하지 못하였으며, 본 연구에서 제시한 기계학습 기반 예측 모형은 420 nm~1000 nm에 걸쳐 폭 넓은 파장대를 고려함과 동시에 높은 정확도를 산출하였다. 최종적으로 개발된 모형을 적용해 다양한 유사 조건에 대한 부유사 시공간 분포를 매핑한 결과, 시공간적으로 고해상도의 부유사 농도 분포를 산출하는 것으로 밝혀졌다.

  • PDF