• 제목/요약/키워드: 데이터 활용성

검색결과 8,108건 처리시간 0.035초

분산 스트림 컴퓨팅 기술 동향 (Technology of Distributed Stream Computing)

  • 이미영
    • 전자통신동향분석
    • /
    • 제26권1호
    • /
    • pp.80-88
    • /
    • 2011
  • 데이터의 효과적인 활용이 경쟁력 확보에 주요한 요인이나, 데이터 폭증은 유용한 정보를 얻는데 필요한 처리 시간의 지연을 야기하고 있다. 개인 맞춤형 서비스, 방범 방재 서비스 등 모니터링 & 대응 서비스를 위해 분석할 데이터의 양이 급증하고 있으며, 텍스트, 영상, 오디오 등 비정형 데이터에 대한 실시간 분석 필요성이 증대하고 있다. 대량의 폭증하는 데이터에 대한 실시간 분석 처리 환경을 제공하기 위해 분산 병렬 컴퓨팅 기술과 데이터 스트림 연속 처리 기술이 활용되고 있다. 본고에서는 폭증하는 데이터 스트림 처리를 위하여 확장성 및 유연한 처리 환경을 제공하는 분산 스트림 컴퓨팅 기술에 대해 소개한다.

  • PDF

데이터 탐색을 활용한 딥러닝 기반 제천 지역 산사태 취약성 분석 (Assessment of Landslide Susceptibility in Jecheon Using Deep Learning Based on Exploratory Data Analysis)

  • 안상아;이정현;박혁진
    • 지질공학
    • /
    • 제33권4호
    • /
    • pp.673-687
    • /
    • 2023
  • 데이터 탐색은 수집한 데이터를 다양한 각도에서 관찰 및 이해하는 과정으로 데이터 구조 및 특성 분석을 통해 데이터의 분포와 상관관계를 파악하는 과정이다. 일반적으로 산사태는 다양한 인자들에 의해 유발되고 발생 지역에 따라 유발 인자들이 미치는 영향이 상이하기 때문에 산사태 취약성 분석 이전에 데이터 탐색을 통해 유발 인자 사이의 상관관계를 파악하고 특징적인 유발 인자를 선별한다면 효과적인 분석을 수행할 수 있다. 따라서 본 연구는 데이터 탐색이 예측 모델의 성능에 미치는 결과를 확인하기 위해 두 단계에 걸친 데이터 탐색을 수행하여 인자를 선별하고, 선별된 유발 인자들 사이의 조합과 23개의 전체 유발 인자 조합을 활용하여 딥러닝 기반의 산사태 취약성 분석을 진행하였다. 데이터 탐색 과정에서는 Pearson 상관계수 heat map과 random forest의 인자 중요도 histogram을 활용하였으며, 딥러닝 기반 산사태 취약성 분석 결과의 정확도는 분석을 통해 획득한 산사태 취약 지수 값을 이용해 제작한 산사태 취약성 지도를 confusion matrix 기반의 정확도 검증 방법을 통해 분석하였다. 분석 결과, 전체 23개의 인자를 사용한 산사태 취약성 해석 결과는 55.90%의 낮은 정확도를 보였지만 한 단계의 탐색을 거쳐 선별한 13개 인자를 활용한 취약성 해석 결과는 81.25%의 분석 정확도를 보였고, 두 단계 데이터 탐색을 모두 수행하여 선별된 9개의 유발 인자를 활용한 산사태 취약성 분석 결과는 92.80%로 가장 높은 정확도를 보였다. 따라서 데이터 탐색을 통해 특징적인 유발 인자를 선별하고 분석에 활용하는 것이 산사태 취약성 분석에서 더 좋은 분석 성능을 기대할 수 있음을 확인하였다.

초연결사회에서 IoT 기반의 라이프로그 데이터를 활용한 사용자 맞춤형 디바이스 지능형 캐릭터 개발 (Development of User-customized Device Intelligent Character using IoT-based Lifelog data in Hyper-Connected Society)

  • 성기훈;김정우;설상훈;강성필;최재붕
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.21-31
    • /
    • 2018
  • 초연결사회에서 IoT 기반의 라이프로그 데이터는 사물인터넷 기술 전반에 활용되며 사용자의 요구사항을 반영한 맞춤형 서비스의 중요 요소로 자리 잡고 있다. 또한 사용자들은 소셜네트워크서비스를 활용하여 관심사 및 감정들을 쉽게 표현하면서 다양한 라이프로그 데이터가 축척되고 있다. 본 논문에서는 IoT 기반의 라이프로그 데이터를 활용한 지능형 캐릭터를 개발하여 사용자들의 감성을 체계적으로 파악하기 위해 정성적/정량적 데이터를 수집 및 분석한다. 이를 위해 사용자가 이용하는 소셜네트워크서비스를 통한 정성적 데이터와 웨어러블 디바이스를 통한 정량적 데이터를 수집한다. 수집한 데이터는 에스노그라피를 통한 페르소나와 비교하여 신뢰성을 검증한다. 추후에는 더 많은 사용자 라이프로그 데이터를 수집하여 데이터의 신뢰성을 확보하고 분석 과정에서 오차를 줄여 개인맞춤형 서비스를 제공할 수 있도록 지능형 캐릭터를 개발할 예정이다.

인공신경망 이론과 비정형데이터를 활용한 하천수위 예측에 관한 연구 (A Study on the Prediction of River Water Level Using Artificial Neural Network Theory and Unstructured Data)

  • 이정하;황석환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.388-388
    • /
    • 2020
  • 매년 국지성호우 및 태풍으로 인해 하천 범람이나 저지대침수가 발생하고 있으며 이는 인명 피해 사례로 이어지기도 한다. 피해 발생을 최소화시키기 위해 강우와 유량과 같은 정형데이터로 홍수예보가 이뤄지고 있으나 기존의 정형데이터만 사용하다보니 도심지역이나 소규모 하천에서 인명 피해 예측에 어려움이 있다. 이를 보완하기 위해서는 인구의 유동성을 고려한 비정형데이터를 활용해야 한다. 최근 소셜 네트워크 서비스(SNS)의 사용자가 증가됨에 따라 텍스트나 사진과 같은 다양한 비정형데이터가 생성되고 있다. 이렇게 생성된 데이터는 다양한 분야에서 활용되고 있으며 특히 지진이나 홍수와 같은 재난 발생 시 유용한 데이터로 활용된 사례가 증가하고 있다. 이는 사람들이 GIS와 같은 위치정보나 시간 등을 포함한 다양한 정보를 포함하기 때문이다. 하지만 이렇게 생산된 비정형데이터를 기존 물리적 기반의 수문모형의 데이터로 활용하기에는 많은 한계점이 있다. 따라서 본 연구에서는 SNS 채널을 통해 생성된 비정형 데이터들을 인공신경망모형에 적용하여 하천수위를 예측하였다.

  • PDF

An Enhanced Data Utility Framework for Privacy-Preserving Location Data Collection

  • Jong Wook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.69-76
    • /
    • 2024
  • 최근 센서 기술과 모바일 기술의 급속한 발전으로 인하여 사용자 위치 데이터 수집이 가능해졌다. 사용자 위치 정보는 다양한 산업에서 중요한 자산으로 활용되고 있으며, 그 결과 위치 데이터의 수집 및 공유에 대한 수요가 증가하고 있다. 그러나 위치 정보에는 사용자의 민감한 데이터가 포함되어 있으므로, 무분별한 수집은 프라이버시 침해 문제를 일으킬 수 있다. 최근에는 차분 프라이버시의 한 방법으로 Geo-Indistinguishability (Geo-I)가 위치 데이터의 프라이버시 보호에 활용되고 있다. Geo-I는 사용자의 위치를 효과적으로 보호할 수 있는 강력한 방법을 제공하지만, 데이터 변조로 인해 수집된 위치 데이터의 유용성이 감소하는 문제가 있다. 따라서, 본 논문에서는 Geo-I 기술을 활용해 사용자 위치 데이터를 효과적으로 수집하면서 데이터의 유용성을 유지할 수 있는 방법을 제안한다. 제안 기법은 사용자의 사전 분포 정보를 활용하여 정확한 위치 정보를 보호하면서도 데이터의 전체적인 유용성을 향상시킨다. 실데이터를 이용한 실험 결과는 제안 기법이 기존 방법보다 수집된 데이터의 유용성을 상당히 향상시킬 수 있음을 보여준다.

안드로이드 플랫폼에서 애플리케이션 간 데이터 전송을 위한 메타서비스 (Meta Service for Data Transfer between Applications on Android Platform)

  • 최화영;박상원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.104-107
    • /
    • 2011
  • 최근 이슈가 되고 있는 안드로이드 플랫폼은 높은 개방성을 지니고 있다. 이러한 안드로이드 플랫폼에서 애플리케이션을 개발할 때 애플리케이션 간의 데이터 처리는 매우 중요한 이슈이다. 안드로이드 플랫폼에서 데이터를 전송할 때 활용할 수 있는 메커니즘에는 클립보드, 인텐트 그리고 컨텐트 프로바이더 등이 있다. 클립보드는 윈도우즈의 클립보드와 동일한 기능을 가지지만 스트링 타입의 데이터만을 전송할 수 있어 다양한 데이터 처리에는 활용하기가 어렵다. 그리고 인텐트는 데이터 전송에 사용할 수 있지만 인텐트 메커니즘의 주목적은 어떤 액션이 수행되어야 할 메시지를 전달하는 것이기 때문에 다양한 타입의 데이터를 전달하는 데는 적합하지 않다. 또한 데이터를 전달하더라도 데이터의 정보를 포함해야하고 이를 구현하기는 까다롭다. 컨텐트 프로바이더는 애플리케이션 간 데이터 전송을 위해 제공하는 메커니즘이지만 양 애플리케이션 간에는 같은 형식의 레코드를 포함해야 한다. 데이터 저장소로 데이터베이스를 사용하기 때문에 컨텐트 프로바이더를 사용하기 위해서 데이터베이스의 연결 및 질의에 대한 구현도 개발자의 작업에 추가가 된다. 이러한 안드로이드 플랫폼에서 애플리케이션 간의 데이터 전송을 하기 위한 방법의 문제점을 보완하고 해결하기 위하여 본 논문에서는 메타서비스를 설계하고 구현하였다. 메타서비스는 클립보드의 간단한 활용방법에 착안하여 텍스트 데이터뿐만 아니라 다른 타입의 데이터도 전송이 가능하도록 지원해주는 서비스이다. 또한 애플리케이션 개발 과정에서 데이터 처리에 대한 구현 시 복잡성을 주여 효율적이며 높은 가독성을 제공한다. 본 논문에서는 메타서비스의 구조와 디자인 그리고 활용 방법에 대해서 자세히 다룬다.

효율적인 HWP 악성코드 탐지를 위한 데이터 유용성 검증 및 확보 기반 준지도학습 기법 (Efficient Hangul Word Processor (HWP) Malware Detection Using Semi-Supervised Learning with Augmented Data Utility Valuation)

  • 손진혁;고기혁;조호묵;김영국
    • 정보보호학회논문지
    • /
    • 제34권1호
    • /
    • pp.71-82
    • /
    • 2024
  • 정보통신기술(ICT) 고도화에 따라 PDF, MS Office, HWP 파일로 대표되는 전자 문서형 파일의 활용이 많아졌고, 공격자들은 이 상황을 놓치지 않고 문서형 악성코드를 이메일과 메신저를 통해 전달하여 감염시키는 피해사례가 많아졌다. 이러한 피해를 막고자 AI를 사용한 악성코드 탐지 연구가 진행되고 있으나, PDF나 MS-Office와 같이 전 세계적으로 활용성이 높은 전자 문서형 파일에 비해 주로 국내에서만 활용되는 HWP(한글 워드 프로세서) 문서 파일은 양질의 정상 또는 악성 데이터가 부족하여 지속되는 공격에 강건한 모델 생성에 한계점이 존재한다. 이러한 한계점을 해결하기 위해 기존 수집된 데이터를 변형하여 학습 데이터 규모를 늘리는 데이터 증강 방식이 제안 되었으나, 증강된 데이터의 유용성을 평가하지 않아 불확실한 데이터를 모델 학습에 활용할 가능성이 있다. 본 논문에서는 HWP 악성코드 탐지에 있어 데이터의 유용성을 정량화하고 이에 기반하여 학습에 유용한 증강 데이터만을 활용하여 기존보다 우수한 성능의 AI 모델을 학습하는 준지도학습 기법을 제안한다.

재난안전연구데이터 통합관리·활용을 위한 전략 수립 연구 (A Study on Establishing the Strategies for Integrated Management and Utilization of Disaster & Safety Research Data)

  • 류신혜;윤희원;김대욱;최선화
    • 대한원격탐사학회지
    • /
    • 제38권6_3호
    • /
    • pp.1789-1803
    • /
    • 2022
  • 데이터의 증가와 AI 기술의 발전에 따라 전 세계적으로 데이터의 활용성을 높이고자 통합 데이터 전략 및 정책 수립이 활발히 진행되고 있다. 최근 연구 분야에서도 국가주도적으로 연구데이터를 활용하기 위해 세계적으로 인프라 사업 및 관리·활용 체계 마련이 이뤄지고 있으며 국내 역시 연구데이터의 검색과 공유를 위한 플랫폼 개발이 활발히 진행되고 있다. 국립재난안전연구원은 국가 재난과 안전관리 총괄 연구기관으로서 재난안전과 관련한 방대한 연구를 수행해 왔으나, 일관성 있는 데이터 관리 체계 및 생산 데이터에 대한 메타데이터 부재, 데이터 활용을 위한 전문인력과 관리 정책 부족 등 원활한 데이터 관리 및 활용이 미흡한 실정이다. 이에 데이터 기반 연구 패러다임의 전환을 위해 재난안전연구데이터의 통합 관리, 활용을 위한 기본계획과 목표모델 검증을 수행하였다. 본 연구를 통해 원내 데이터 통합 관리의 필요성과 실제 수요를 기반으로 데이터 표준화 및 관리 체계 일원화, 전담 조직/인력 구성 등 차별화된 데이터 거버넌스 마련의 필요성을 도출할 수 있었다. 도출된 시사점을 반영한 목표모델의 실효성을 검증하기 위해 파일럿 모델 구축 및 주요 개선 방안을 도출하여 향후 재난안전연구데이터 관리 시스템 구축을 위한 실행 과제로 삼고자 한다.

비정형 데이터를 활용한 가뭄평가 - 보령지역을 중심으로 - (Drought evaluation using unstructured data: a case study for Boryeong area)

  • 정진홍;박동혁;안재현
    • 한국수자원학회논문집
    • /
    • 제53권12호
    • /
    • pp.1203-1210
    • /
    • 2020
  • 가뭄은 다양한 수문학적 또는 기상학적 인자들이 복합적으로 작용하여 발생하기 때문에 가뭄의 사상을 정확히 평가하는 것은 어려운 일이나, 이를 정량적으로 해석하기 위해 다양한 가뭄지수들이 개발되어 왔다. 하지만 현재 활용중인 가뭄지수들은 단일변량의 부족량을 통해 산정되며, 복합적인 원인으로 발생하는 가뭄의 사상을 정확히 판단하지 못하는 문제가 있다. 단순 단일변량의 부족을 가뭄이라고 판단하기는 어렵기 때문이다. 최근에는 빅데이터 분석에서 많이 활용되고 있는 비정형 데이터를 활용하여 지수를 개발하는 연구들이 타 분야에서 진행되고 있으며 우수성이 입증되고 있다. 따라서 본 연구에서는 기존 가뭄지수에 활용 중인 기상 및 수문정보(강수량, 댐 유입량)에 각각 비정형 데이터(뉴스데이터)를 결합하여 가뭄지수를 산정하고, 산정된 가뭄지수의 검증을 통해 가뭄해석의 활용성을 평가하고자 한다. 결합가뭄지수 산정을 위해 Clayton Copula 함수를 활용하였으며, 매개변수 추정은 교정방법을 이용하였다. 분석결과, 기존의 가뭄지수(SPI, SDI)보다 비정형 데이터를 결합한 가뭄지수가 가뭄기간을 적절히 재현하는 것으로 나타났다. 또한 Receiver Operating Characteristic (ROC) score가 기존의 가뭄지수들보다 높게 산정되어 가뭄해석에 있어 활용성이 우수하였다. 본 연구에서 산정된 결합가뭄지수는 기존 단일변량 가뭄지수의 해석적 한계를 보완하고 비정형데이터를 활용한 가뭄지수의 활용성이 우수하다는 점에서 활용성이 높다고 판단된다.

빅데이터를 활용한 보안로그시스템

  • 전경식;이현경;전삼현;김종배
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.710-711
    • /
    • 2015
  • 최근 사이버 공격이사회, 국가적 위협으로 대두되고 있다. 최근 신종 악성코드에 의한 A.P.T 공격이 사회적으로 큰 혼란을 야기하고 있다. 이에 따라 기업 내에서 방화벽, IPS, VPN 등의 네트워크 보안 시스템의 통합 관리를 목적으로 하는 통합관제시스템(ESM)의 필요성이 제기되었다. 그러나 기존의 ESM의 방식은 외부에서 내부로 유입되는 트래픽만을 모니터링하는 네트워크 기반 공격 탐지기법을 사용하기 때문에, 외부 사이버 공격만을 차단할 수 있다는 한계점을 가지고 있다. 따라서 본 연구는 주요 IT 기반시설의 네트워크, 시스템, 응용 서비스 등으로부터 발생하는 데이터 및 보안 이벤트 간의 연관성을 분석하여 보안 지능을 향상시키는 빅데이터를 활용한 보안로그시스템을 제안한다. 본 연구에서 제안한 빅데이터를 활용한 보안로그시스템을 통해 분산 기반의 저장/처리 기술 적용하고자 한다.본 기술을 적용한 지능형 정보 분석 플랫폼 구성을 통해, 가용성과 확장성을 확보하여 통합적 보안 관제가 가능하도록 한다. 뿐만 아니라 기업 내로의 악성코드 유입, 감염(전파) 그리고 실시간 모니터링이 가능하여 고객 서비스 만족도가 향상되는 파급효과가 기대된다.

  • PDF