• 제목/요약/키워드: 데이터 활용도

검색결과 18,245건 처리시간 0.046초

RNN-LSTM 알고리즘을 이용한 하천의 수질인자 예측 (Prediction of Water Quality Factor for River Basin using RNN-LSTM Algorithm)

  • 임희성;안현욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.219-219
    • /
    • 2020
  • 하천의 수질을 나타내는 환경지표 중 국가 TMS(Tele Monitoring system)의 수질측정망을 통해 관리되고 있는 지표로는 DO, BOD, COD, SS, TN, TP 등 여러 인자들이 있다. 이러한 수질인자는 하천의 자정작용에 있어 많은 영향을 나타내고 있다. 이를 활용한 경제적이고 합리적인 수질관리를 위해 하천의 자정작용을 활용하는 것이 중요하다. 생물학적 작용을 가장 효과적으로 활용하기 위해서는 수질오염 데이터에 기초한 수질예측을 채택하여 적절한 대책이 필요하다. 이를 위해서는 수질인자의 데이터를 측정하고 축적해 수질오염을 예측하는 것이 필수적인데, 실제적으로 수질인자의 일일 측정은 비용 관점에서 쉽게 접근할 수 없다. 본 연구에서는 시계열 학습으로 알려진 RNN-LSTM(Recurrent Neural Network-Long Term Memory) 알고리즘을 활용하여 기존에 측정된 수질인자의 데이터를 통해 시간당 및 일일 수질인자를 예측하려고 했다. 연구에 앞서, 기존에 시간단위로 측정된 수질인자 데이터의 이상 유무를 확인 후, 에러값은 제거하고 12시간 이하 데이터가 누락되었을 때는 선형 보간하여 데이터를 사용하고, 1일 데이터도 10일 이하 데이터가 누락되었을 때 선형 보간하여 데이터를 활용하여 수질인자를 예측하였다. 수질인자를 예측하기 위해 구글이 개발한 딥러닝 오픈소스 라이브러리인 텐서플로우를 활용하였고, 연구지역으로는 대한민국 부산에 위치한 온천천의 유역을 선정하였다. 수질인자 데이터 수집은 부산광역시에서 운영하는 보건환경정보 공개시스템의 자료를 활용하였다. 모델의 연구를 위해 하천의 수질인자, 기상자료 데이터를 입력자료로 활용하였다. 분석에서는 입력자료와, 반복횟수, 시계열의 길이 등을 조절해 수질 요인을 예측했고, 모델의 정확도도 분석하였다.

  • PDF

초거대 언어 모델로부터의 추론 데이터셋을 활용한 감정 분류 성능 향상 (Empowering Emotion Classification Performance Through Reasoning Dataset From Large-scale Language Model)

  • 박눈솔;이민호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.59-61
    • /
    • 2023
  • 본 논문에서는 감정 분류 성능 향상을 위한 초거대 언어모델로부터의 추론 데이터셋 활용 방안을 제안한다. 이 방안은 Google Research의 'Chain of Thought'에서 영감을 받아 이를 적용하였으며, 추론 데이터는 ChatGPT와 같은 초거대 언어 모델로 생성하였다. 본 논문의 목표는 머신러닝 모델이 추론 데이터를 이해하고 적용하는 능력을 활용하여, 감정 분류 작업의 성능을 향상시키는 것이다. 초거대 언어 모델(ChatGPT)로부터 추출한 추론 데이터셋을 활용하여 감정 분류 모델을 훈련하였으며, 이 모델은 감정 분류 작업에서 향상된 성능을 보였다. 이를 통해 추론 데이터셋이 감정 분류에 있어서 큰 가치를 가질 수 있음을 증명하였다. 또한, 이 연구는 기존에 감정 분류 작업에 사용되던 데이터셋만을 활용한 모델과 비교하였을 때, 추론 데이터를 활용한 모델이 더 높은 성능을 보였음을 증명한다. 이 연구를 통해, 적은 비용으로 초거대 언어모델로부터 생성된 추론 데이터셋의 활용 가능성을 보여주고, 감정 분류 작업 성능을 향상시키는 새로운 방법을 제시한다. 제시한 방안은 감정 분류뿐만 아니라 다른 자연어처리 분야에서도 활용될 수 있으며, 더욱 정교한 자연어 이해와 처리가 가능함을 시사한다.

  • PDF

인공신경망 이론과 비정형데이터를 활용한 하천수위 예측에 관한 연구 (A Study on the Prediction of River Water Level Using Artificial Neural Network Theory and Unstructured Data)

  • 이정하;황석환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.388-388
    • /
    • 2020
  • 매년 국지성호우 및 태풍으로 인해 하천 범람이나 저지대침수가 발생하고 있으며 이는 인명 피해 사례로 이어지기도 한다. 피해 발생을 최소화시키기 위해 강우와 유량과 같은 정형데이터로 홍수예보가 이뤄지고 있으나 기존의 정형데이터만 사용하다보니 도심지역이나 소규모 하천에서 인명 피해 예측에 어려움이 있다. 이를 보완하기 위해서는 인구의 유동성을 고려한 비정형데이터를 활용해야 한다. 최근 소셜 네트워크 서비스(SNS)의 사용자가 증가됨에 따라 텍스트나 사진과 같은 다양한 비정형데이터가 생성되고 있다. 이렇게 생성된 데이터는 다양한 분야에서 활용되고 있으며 특히 지진이나 홍수와 같은 재난 발생 시 유용한 데이터로 활용된 사례가 증가하고 있다. 이는 사람들이 GIS와 같은 위치정보나 시간 등을 포함한 다양한 정보를 포함하기 때문이다. 하지만 이렇게 생산된 비정형데이터를 기존 물리적 기반의 수문모형의 데이터로 활용하기에는 많은 한계점이 있다. 따라서 본 연구에서는 SNS 채널을 통해 생성된 비정형 데이터들을 인공신경망모형에 적용하여 하천수위를 예측하였다.

  • PDF

인체 데이터를 포함한 과학 데이터 리파지터리의 구축 및 활용에 관한 연구 (A Study on Building the Scientific Data Repository Involving Human Data and Its Application)

  • 이상호;이상환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.170.1-170.1
    • /
    • 2012
  • 본 발표에서는 KISTI에서 현재 구축하고 있는 인체 데이터의 현황과 인체 데이터를 포함한 과학 데이터 리파지터리의 구축과 활용에 대한 전반적인 내용을 소개한다. 인체 데이터는 인체 절단면 영상을 중심으로 한 Visible Korean 데이터와 CT, MR 영상과 인체 뼈대 물성을 중심으로 한 Digital Korean 데이터로 나누어지며 이들 데이터의 제작 과정과 활용 내용을 주로 소개한다. 과학 데이터 리파지터리 구축 내용은 현재 국가의 연구개발 예산으로 수행되고 있는 연구과제에서 생성된 다양한 과학 데이터들을 국가적 차원에서 수집, 관리, 유통시키기 위해 기관별 또는 분야별로 과학데이터센터를 육성하고 이를 거점으로 하여 국내의 과학데이터가 수집, 관리, 유통, 활용될 수 있도록 국가적 과학데이터 관리체계를 구축한다. 또한 이렇게 수집된 과학데이터의 활용을 위해 연구자들이 데이터 기반의 연구 과제를 수행할 수 있도록 데이터 기반의 첨단 연구 환경을 구축하고 연구에 필요한 S/W, H/W 및 기타 필요한 IT 기반의 요소기술들을 개발, 지원한다. 또한 KISTI가 제작 주체가 되어 생산한 상기의 인체 데이터뿐만 아니라 의료 관련 분야의 연구 현장에서 생산되고 있는 다양한 인체 데이터를 수집, 관리, 공유할 수 있도록 인체 데이터 리파지터리를 구축하기 위해 Visible Korean, Digital Korean 데이터를 포함한 다양한 의료 데이터의 리파지토리를 설계하고 이러한 의료 데이터 기반 연구의 활성화 및 데이터 리파지터리의 활성화를 위한 정부 및 분야별 커뮤니티 차원의 다양한 대책들을 소개한다.

  • PDF

빅데이터를 이용한 IoT 활용사례와 발전방향 (Application cases of IoT using big data and its' direction of improvement.)

  • 조영주;김진혁;소윤정;노창희;권순필
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.67-70
    • /
    • 2017
  • 빅데이터는 인터넷의 발달로 인하여 규모를 가늠할 수 없을 정도로 많은 양의 정보가 생산되어지는 데이터를 말한다. 빅데이터를 활용하는 다양한 사례 중 기업에서 활용된 사례로 사람들의 구매데이터를 분석하여 개인의 구매 취향을 분석한 뒤 구매자가 원하는 제품을 빠르게 안내하는 시스템이 있으며, 정부에서 빅데이터를 활용된 사례로는 사회복지 자금이 대상자들에게 제대로 지급되고 있는지 판단하여 부정수급자를 원천봉쇄 하는 시스템이 있다. 이처럼 빅테이터가 인간의 삶에 긍정적인 영향을 주는 등 다양한 분야에서 활용되고 있는데 본 논문에서는 빅데이터를 이용한 IoT의 활용사례를 알아보고, 긍정적 사례와 부정적인 활용사례를 분석한 뒤 그 발전방향에 대해 제시하고자 한다.

  • PDF

생명공학분야의 연구데이터 공유 사례에 관한 연구 (A Study on Use Case of Research Data Sharing in Biotechnology)

  • 박미영;안인자;김준모
    • 한국비블리아학회지
    • /
    • 제29권1호
    • /
    • pp.393-416
    • /
    • 2018
  • 연구데이터 관리 공유의 연구 패러다임 변화로 미국 및 유럽은 연구데이터 관리 의무화를 법제도화 하고 있으나 국내 연구현장은 인식부족과 인프라 미비로 연구데이터 관리지침 및 관리계획 등이 부재한 상황이다. 본 연구에서는 주요국가의 연구데이터 관리지침(미국 NISO DMP, 영국 UK 아카이브 DMP 등)을 조사하여 연구데이터 관리계획의 주요 단계를 도출하였다. 도출한 결과는 연구데이터 정책 계획 지원, 연구데이터 기술적 지원, 연구데이터 공유 활용 지원, 연구데이터 법적 매커니즘 지원, 연구데이터 교육 지원이다. 데이터 활용도가 가장 높은 생명공학분야 국내외 7개 기관의 연구데이터 공유 활용 사례를 연구데이터 관리 구성요소, 연구데이터 공유방법에 따라 비교 분석하였다. 유럽생물정보학연구소와 미국 국립생명공학정보센터는 연구데이터 공유 활용을 하고자 연구데이터 관리계획, 문서화, 데이터포맷, 데이터 저장, 공유 및 접근, 보존 등 관리를 위한 각 단계를 시행하고 있으나 국내의 경우 연구성과물 중 생물자원에 대한 제출만 이루어지고 있다. 연구데이터 관리계획(DMP)지원, 기술적 지원, 공유 활용 체계 지원, 법적 저작권 지원 등에 대한 가이드 및 매뉴얼 제작 배포로 국내 연구데이터 관리 및 공유 활용 대책을 연구데이터 관리계획 단계별로 마련해야 한다.

3차원 지리정보 데이터 포맷들 간의 변환 (Conversion between 3D geographical information data formats)

  • 이태훈;황정래;이기준
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.75-81
    • /
    • 2008
  • 오늘날 정부기관, 지자체 그리고 민간 기업 에서 3차원 지리정보데이터에 대한 필요성이 증가하고 있어 그에 대한 연구가 활발히 이루어지고 있다. 이러한 연구의 결과로 국내에서 3차원 지리정보 데이터 포맷인 3DF-GML(3DFeature-GML)이 개발되었다. 하지만 3DF-GML의 데이터는 기존의 Shape 파일만을 사용하여 구축되기 때문에 활용성에 제한을 받고 있다. 또한 제작 및 수정 시에는 제한된 애플리케이션 활용만이 허용된다. 이에 따라 3DF-GML의 활용성을 높이기 위해 국내의 데이터뿐 만이 아니라 국외에서 제작되어진 3차원 지리정보 데이터 포맷의 데이터를 활용할 수 있는 방안이 필요하다. 본 논문에서는 국내의 3차원 지리정보 포맷(3DF-GML)과 국외의 3차원 지리정보 포맷들간의 데이터 포맷을 비교 및 분석한다. 이러한 분석은 국외 3차원 지리정보 포맷의 데이터 활용 및 호환을 유도하는 것이 가능하다. 따라서 본 논문에서는 국내 3차원 지리 정보데이터(3DF-GML)와 국외 3차원 지리정보 데이터 간의 변환 규칙 및 방법을 제시한다.

  • PDF

데이터 분석을 통한 통합물관리 유역관리방안 연구 (A Study on Water Management of Integrated Watershed Management Using Data Analysis)

  • 조부건;정우석;김영도
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.80-80
    • /
    • 2020
  • 최근 국내·외에서 빅 데이터에 관한 관심이 높아지고 있으며 수자원 분야에서도 빅데이터 활용의 중요성이 강조되어 왔다. 물관리를 위해서는 기본적으로 물관련 기초데이터가 충분해야 하며, 최근 선진국에서 효과적인 통합물관리를 위해서 빅데이터를 활용한 유역관리 방안이 시도되고 있는 실정이다. 일본의 경우 물환경 데이터와 사회과학 데이터를 활용한 유역특성 파악한다. 다양한 방법의 유역특성을 분석하여 유역관리계획을 마련한다. 국내에서의 물환경 관리계획은 부하량을 기반으로한 수립으로 데이터의 다양상이 부족한 부분이 있다. 하천은 각기 다른 특성을 가지고 있다. 낙동강 유역은 22개의 중권역으로 이루어져 있으며 각 중권역은 다양한 문제점과 특성을 가지고 있다. 따라서 유역의 특성에 따른 유역관리방안이 필요하다고 판단된다. 본 연구에서는 데이터 분석을 활용하여 유역의 종합적 분석을 통해 유역을 진단하고자 한다. 또한 물관련 지표들을 활용하여 유역을 평가하고 시각화 그래프를 통해 유역의 기초자료들의 특성을 나타내고 결과를 통해 데이터 분석을 기반으로 한 유역특성을 분석하여 맞춤형 유역관리방안을 모색하고자 한다.

  • PDF

농업관련기업의 빅데이터 수용의도에 미치는 영향: 농업관련기업 종사자 중심으로

  • 류가현;허철무
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2021년도 추계학술대회
    • /
    • pp.129-134
    • /
    • 2021
  • 농업은 잦은 자연재해, 코로나 같은 예측하기 힘든 불확실성이 높아지는 상황이며 이를 해결하기 위해 새로운 기술적 접근방안과 돌파구 마련이 필요하다. ICT의 급속한 발전과 4차 산업혁명 시대가 도래하면서 데이터의 중요성은 더욱 커지고 있다. 빅데이터는 농업이 직면한 다양한 기술적 난제를 해결함과 동시에 생산,소비,유통 분야의 밸류체인 혁신을 통해 높은 경쟁력을 확보할 수 있게 핵심 요소가 될 것이다. 실제 농업 분야의 해외 사례를 살펴보면 주로 빅데이터에 대한 수집 분석이 기업을 중심으로 이루어지고 있고 기업의 새로운 가치 창출에 중요한 역할을 담당하고 있어 상업적 측면에서 활용가치가 매우 높음을 알 수 있다. 우리나라도 기업의 빅데이터 활용을 위한 다양한 시도가 이루어지고 있으나 아직은 대기업, 소수의 혁신기술 기반 중소기업이 대부분이다. 기업의 빅데이터 활용에 영향을 미치는 연구는 계속 진행되고 있으나, 산업별 특성이 반영되어 결과는 상이하게 나타났다. 또한 대부분의 연구가 조직 차원에서 초기 도입 의도에 영향을 주는 요인 파악에 집중하였다. 반면 기업이 빅데이터를 활용하여 성과를 창출하기 위해서는 각 분야 현업 종사자들의 지속적인 활용 의도에 영향을 미치는 요인에 관한 연구가 필요하다. 따라서 본 연구는 혁신기술 수용 의도를 파악하는데 높은 설명력을 나타내는 통합기술수용이론(UTAUT)과 혁신성향 변수를 활용하여 농업 관련 기업 종사들의 빅데이터 수용 의도에 미치는 영향 요인들을 살펴보고 경제적 혜택과 실용적 혜택의 매개 효과를 분석하고자 한다. 실제 농업 관련 기업 종사자 대상 설문을 통한 실증 연구를 통해 현장 종사자들의 빅데이터 활용 수준을 높이고 우수의 고급 인력을 확보하여 육성하기 위한 방안을 제시하여 농업관련분야 기업의 빅데이터 활성화 정책 도출에 시사점을 제시하고자 한다.

  • PDF

R기반 데이터마이닝 분석을 통한 상수관망 자료 활용가능성 제시 (Presenting the possibility of using water pipe network data through R-based data mining analysis)

  • 홍성진;이찬욱;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.236-236
    • /
    • 2020
  • 데이터마이닝은 빅데이터를 활용하는데 주로 활용되는 기술이다. 빅데이터 활용의 중요성이 증대됨에 따라 빅데이터를 기반으로 데이터마이닝을 활용한 생산, 금융, 통신 등의 성공적인 활용사례가 있지만 상수도 시설물에 적용한 사례는 드물다. 본 연구에서는 R프로그램을 기반으로 확보하기 어려운 데이터를 얻고자 관련 기사를 수집하고 데이터마이닝의 주요 기능인 분류, 군집(K-means)분석을 수행하였다. 예를들어, 상수관로의 정밀한 누수 분석을 위해서는 관경, 매설년도 등의 세분화된 자료가 필요하나 이러한 자료들은 쉽게 확보할 수 없다는 한계를 갖고 있다. 이러한 관점에서 상수관망 단수, 누수 등의 키워드를 통해 얻을 수 있는 기사를 기반으로 주요 키워드에 대한 군집분석을 수행하여 세분화된 상수관망 자료를 획득 및 분석하였다. 단수, 누수 키워드 기사에 의해 관경정보 등 파손된 관로의 정보를 확보할 수 있는 것으로 나타났으며 향후 확보하기 어려운 데이터를 보완할 수 있는 방법 중 하나로 활용될 수 있을것으로 기대된다. 그러나, 데이터의 양과 보다 정교한 군집분석을 위한 키워드설정 등의 추가연구가 필요할 것으로 판단된다.

  • PDF