• 제목/요약/키워드: 연구데이터 활용

검색결과 13,214건 처리시간 0.039초

형사사법정보의 빅데이터 활용방안 연구: 구조화 범주화 관점으로 (A Study on the Use of Criminal Justice Information Big Data in terms of the Structuralization and Categorization)

  • 김미령;노윤주;김성훈
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.253-277
    • /
    • 2019
  • 4차 산업혁명시대를 맞아 데이터의 중요성은 심화되고 있으나, 개인정보보호 등의 문제로 데이터의 활용이 쉽지 않은 경우가 많이 있다. 형사사법정보는 범죄 예측 및 예방, 범죄수사 과학화, 양형합리화 등 다양한 활용가치가 예상됨에도 현재 개인정보보호와 형사사법정보 관련 법률적 해석 문제로 활용이 상당히 제한되고 있다. 본 연구는 형사사법정보의 구조화·범주화를 통해 '범죄데이터'로 전환하여 빅데이터로서 활용하도록 제안하였으며, '범죄데이터' 활용시 법률적 문제, 활용가치, 데이터 생성 및 활용시 고려사항을 전문가를 통해 검증하고 향후 전략적 발전방안을 도출하였다. 연구결과, '범죄데이터'는 개인정보보호문제는 해결된 것으로 보여지나, 형사사법정보 관련법에 명시할 필요는 있으며, 빅데이터 활용을 위해 분석 가능하도록 표준화된 형태로 정리되는 것이 시급함이 밝혀졌다. 향후 진행방향으로는 데이터 요소 도출, 용어사전 시소러스 구축, 데이터 등급화를 위한 개인민감정보 정의 및 등급지정, 비정형데이터의 정형화를 위한 알고리즘 개발 등을 제시하였다.

CCTV 영상 기반 강수량 산정을 위한 데이터 전처리 방안 연구 (A Study on data pre-processing for rainfall estimation from CCTV videos)

  • 변종윤;전창현;이진욱;김현준;차호영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.167-167
    • /
    • 2022
  • 최근 빅데이터에 관련된 연구에 있어 데이터의 품질관리에 대한 논의가 꾸준히 이뤄져 오고 있다. 특히 이미지 처리 및 분석에 활용되어온 딥러닝 기술의 경우, 분류 작업 및 패턴인식 등으로부터 데이터의 특징을 추출함으로써 비지도학습(Unsupervised Learning)을 가능하게 한다는 장점이 있음에도 불구하고 빅데이터를 다루는 과정에 있어 용량, 다양성, 속도 및 신뢰성 측면에서의 한계가 있었다. 본 연구에서는 CCTV 영상을 활용한 강수량 산정 모델 개발에 있어 예측 정확도 향상 및 성능 개선을 도모할 수 있는 데이터 전처리 방법을 제안하였다. 서울 근린 AWS 4개소 지역(김포장기, 하남덕풍, 강동, 성남) 및 중앙대학교 지점 내 CCTV를 설치한 후, 최대 9개월의 영상을 확보하여 강수량 산정을 위한 딥러닝 모델을 개발하였다. 배경분리, 조도조정, 영역설정, 데이터증진, 이상데이터 분류 등이 가능한 알고리즘을 개발함으로써 데이터셋 자체에 대한 전처리 작업을 수행한 후, 이에 대한 결과를 기존 관측자료와 비교·분석하였다. 본 연구에서 제안한 전처리 방법들을 적용한 결과, 강수량 산정 모델의 예측 정확도를 평가하는 지표로 선정한 평균 제곱근 편차(Root Mean Square Error; RMSE)가 약 30% 감소함을 확인하였다. 본 연구의 결과로부터 CCTV 영상 데이터를 활용한 강수량 산정의 가능성을 확인할 수 있었으며 특히, 딥러닝 모델 개발시 필요한 적정 전처리 방법들에 대한 기준을 제시할 수 있을 것으로 판단된다.

  • PDF

아바타 애니메이션을 위한 행위 기술 언어의 정의 및 활용 (Definition and Application of The Behavior Description Language for Avatar Animation)

  • 김택수;최윤철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.453-456
    • /
    • 2001
  • 가상환경에서 애니메이션을 구현하는 방법으로는 여러 가지가 있다. 그러나 그 방법들을 살펴보면 애니메이션 데이터와 아바타 데이터가 서로 분리되지 못하고, 애니메이이션 데이터는 아바타 데이터에 종속되어 있다는 단점이 있다. 이에 본 연구에서는 애니메이션 데이터를 아바타 데이터에 독립적으로 기술할 수 있도록 새로운 행위 기술언어를 정의하고 이를 활용할 수 있도록 하는 시스템을 개발, 제시하도록 한다.

  • PDF

데이터 리터러시 개념에 대한 재접근 및 도서관 정보서비스에의 적용 (Re-approach to the Concept of Data Literacy and Its Application to Library Information Services)

  • 이정미
    • 한국문헌정보학회지
    • /
    • 제53권1호
    • /
    • pp.159-179
    • /
    • 2019
  • 본 연구의 목적은 데이터 리터러시라는 개념에 대한 재접근을 시도하는 연구로 개념에 대한 정리와 함께 여타 다른 리터러시와의 차이점은 무엇이고, 도서관 정보서비스에 데이터 리터러시를 활용하는 이유와 방법은 무엇인가에 대한 해답을 도출하고자 했다. 연구결과에 따르면 데이터 리터러시는 다른 리터러시 개념들과의 상호작용에 있어 가장 중심적인 역할을 하는, 미래사회 인류가 살아가는데 필수적인 데이터기반 문제해결능력으로 이해되어야 한다. 이러한 개념정의를 바탕으로 도서관 정보서비스에 데이터 리터러시를 적용할 때 교육 서비스와 연구지원 서비스 측면 모두에 활용을 제안하였으며 각각의 구체적 서비스안을 제시하였다. 결과적으로 데이터 기반 사회에 이용자에게 필요한 데이터 활용 능력을 데이터 리터러시로 규정하고 여타 다른 리터러시와의 차이점을 구분함으로써 데이터 리터러시가 왜 현대 사회에 이용자에게 필요한 데이터 활용 능력인가를 설명하고자 했으며 이를 통해 어떠한 도서관 정보서비스를 구현할 수 있을지에 대한 고민과 제안으로 마무리했다.

순환신경망을 활용한 야구승부예측 (A Prediction of Baseball Game Results Using Recurrent Neural Netowrks)

  • 정경석;김진학;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 딥러닝(Deep-learning)을 활용한 기상 예측, 심리 예측, 교통상황 예측 등 다양한 분야에 걸쳐 여러 모델의 인공신경망이 활용되고 있다. 본 논문에서는 여러 분야 중 스포츠라는 분야에 접근했으며, 딥러닝 모델을 통해 승부를 예측하는 실험을 진행하였다. 야구의 승부는 선수의 능력치, 기상의 변화, 험/어웨이 여부, 교체 여부 등 가늠할 수 없이 수많은 데이터들에 의존하고 있다. 그러나 본 논문에서는 이러한 수많은 데이터 중 경기 외적인 데이터를 제외한 데이터를 활용하여 그 다음 경기의 승부를 예측할 수 있을 지를 연구한다. 날짜 별 경기들이 훈련데이터가 되고 목표는 이전 경기들의 영향으로 예측된 다음 경기의 승/패를 예측한다. 즉 순차적인 데이터의 활용에 적합한 모델, Recurrent Neural-Network을 이용하였다. 이를 위하여 KBreport에서 데이터를 수집하였고, 수집된 데이터를 훈련 데이터 세트로 만들어 Recurrent Neural Network를 통해 훈련시켜 다음 경기의 승패를 예측하였다.

시계열 데이터 특성 기반 품질 관리 방법 연구 (Data Quality Management Method base on Seasonality from Time series Data)

  • 이지훈;문재원;황지수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.93-96
    • /
    • 2022
  • IoT 기기의 보급 및 확산으로 많은 산업군에서 이를 바탕으로 시계열 데이터를 획득하고 분석하려는 시도가 확대되고 있다. 시간의 흐름에 따라 저장된 데이터들은 주기에 따라 특정 패턴을 갖는 경우가 많으며 이러한 패턴을 파악한다면 주요 산업군의 의사 결정에 도움이 된다. 그러나 IoT 기기의 수집 오류 및 네트워크 환경에 의해 대부분의 시계열 데이터들은 누락 데이터, 이상 데이터를 갖고 있으며 이를 처리하지 않고 분석할 경우 오히려 잘못된 결과를 초래한다. 본 논문에서는 패턴 파악을 위해 '시간, 일, 주, 월, 년' 등 시간의 주기를 기준으로 데이터를 분할하며 이에 기반하여 데이터셋을 재구성하고 활용 가능한 데이터와 불가능한 데이터로 구분한다. 선별된 데이터셋은 클러스터링에 적용하였으며, 제안하는 방법을 적용할 경우 주기를 갖는 시계열 데이터를 활용하는 분석 및 학습에서 더 나은 결과를 보임을 확인하였다.

  • PDF

국가 과학데이터 공유·활용 서비스를 위한 사례 연구 (A Case Study on Sharing & Using of National Scientific Data)

  • 진영근;이원구
    • 한국융합학회논문지
    • /
    • 제9권8호
    • /
    • pp.9-15
    • /
    • 2018
  • 모든 분야에서 과학데이터의 생산 및 수집에 많은 비용과 시간이 소요되고 있으며, 또한 공유와 재활용 정도가 매우 낮은 실정이다. 학제간 연구를 지원하기 위해서는 대량으로 발생하고 있는 과학데이터가 체계적으로 보존 및 공유되어야 하며, 또한 반복할 수 없거나 반복하는데 많은 비용이 발생하는 실험 및 관찰 데이터의 보존과 재사용 및 활용 환경 구축이 필수적이다. 이에, 본 연구에서는 국가 과학데이터를 수집 저장 관리 공유 활용할 수 있는 서비스와 국가 R&D 관련 기관, 국제적인 과학기술 단체 및 기관과의 다양한 과학데이터 연동 인터페이스를 제안한다. 이를 통해, 현재 개발되어 있는 기존 과학 데이터베이스들의 활용성을 증대시키고 산업적 파급 효과가 높은 과학 데이터를 더욱 개발하여 국가 연구개발 활동을 지원하는 과학 데이터 인프라를 확충하는데 기여하고자 한다.

가명 데이터 활용연구 - 기술적 처리방법 및 기업의 활용방향을 중심으로 - (Research on the Use of Pseudonym Data - Focusing on Technical Processing Methods and Corporate Utilization Directions -)

  • 김정선
    • 정보보호학회논문지
    • /
    • 제30권2호
    • /
    • pp.253-261
    • /
    • 2020
  • 본 연구는 본격적인 데이터 경제 활성화를 위한 데이터 3법 통과 이후 기업의 가명데이터의 활용과 관련한 기술과 적용 프로세스에 대하여 살펴보고, 기업이 가명 데이터를 활용하기 위해 준비해야 할 사항과 그 과정에서 발생하게 되는 불확실성을 제거하는데 기여하고자 하였다. 앞으로 기업에서는 기존 IT 시스템 관점의 정보보호 관리체계를 확장하여 데이터 프라이버시 보호 관점에서의 관리와 통제 및 제3자 제공 관점에서의 관리가 필요하다. 또한 내부이용자가 활용하는 데이터 이용환경에서조차 적절한 가명데이터 이용통제가 이루어져야 한다. 가명화 데이터 활용에 따른 시장 변화 및 이종 데이터 결합 활용을 통한 경제적 창출 효과는 매우 클 것이며, 이를 위해 조속한 시간 내에 데이터 활용 및 거래 활성화를 위한 적절한 비식별 조치 기준 및 위험도 판단 기준 수립이 준비되어야 한다.

관제 로그의 빅데이터 관리 방안 연구 (A Study on the Big Data Management of VTS Log)

  • 김혜진;오재용
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2019년도 추계학술대회
    • /
    • pp.24-25
    • /
    • 2019
  • 최근 빅데이터 기술 개발로 방대한 데이터의 유의미한 분석 및 예측이 용이해졌다. 선박교통관제센터에서는 각종 센서와 다양한 정보를 기반으로 VHF 교신을 통해 선박교통관제를 수행한다. 관제사가 활용하는 레이더, AIS, Port-MIS. 센서 등의 데이터들이 디지털로 저장되고 있으며, 관제사의 VHF 교신내용은 디지털파일로 저장되어 선박교통관제센터의 서버 2개월간 보관된다. 본 논문에서는 관제 결과로 저장되고 있는 관제 로그 데이터를 활용하여 빅데이터를 구성하고 이를 기반으로 유의미한 정보를 생성할 수 있는 방안을 연구하였다.

  • PDF

지리정보 활용을 위한 영상데이터의 표준화 (The Standadization of Imagery Data for Improving the Utilization of Geographic Information)

  • 김계현;김희두
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 1998년도 학술회의 논문집 1권1호
    • /
    • pp.173-180
    • /
    • 1998
  • GIS데이터와 함께 고해상도 원격영상데이터의 활용을 높이기 위한 영상데이터의 표준화에 관한 연구가 추진중이다. 본 연구에서는 ISO/TC와 OGC 등을 비롯한 해외 영상데이터의 표준화 사례를 분석하였으며 국내의 표준화 추이를 살펴보았다. 이러한 분석의 결과를 바탕으로 가장 보편적이고 사용이 용이한 영상데이터의 표준안이 제시되도록 하였다.

  • PDF