• 제목/요약/키워드: 통계데이터

검색결과 3,229건 처리시간 0.032초

빅데이터를 활용한 미세먼지와 질병 간의 상관관계 분석 (Analysis of the Correlation between Fine Dust and Disease Using Big Data)

  • 남경윤;문소영;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.368-370
    • /
    • 2022
  • WHO 산하의 국제암연구소는 2013 년부터 미세먼지를 1 급 발암 물질로 분류하고 있으며 미세먼지 노출에 대한 질병 발생의 심각성은 점점 수면 위로 드러나고 있는 추세다. 본 연구에서는 국민건강보험공단의 진료 내역 정보 데이터와 2015 년부터 2021 년까지의 미세먼지 및 초미세먼지 월 평균 농도 데이터를 이용하여 미세먼지 및 초미세먼지 농도와 순환기계와 호흡기계 질병 간의 상관 관계를 보이고, 연관성있는 질병을 찾아내었다. 이를 위해 시계열분석, 상관분석, 빈도분석을 시행하였으며 실험 결과 호흡기질환에서는 급성 부비동염, 코의 농양 등의 질병과 순환기질환에서는 상세불명의 원발성 고혈압, 폐색전증이 상관관계가 높은 질병으로 판명되었다.

전기자동차 충전기록 데이터 처리에 관한 연구 (A study on data processing of electric vehicle charging archives)

  • 황윤영;진효정;김소연;이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.337-338
    • /
    • 2022
  • 본 논문에서는 환경공단이 제공하는 전기자동차 충전기의 운영기록 분석하는 과정에서 주기적으로 공개 데이터를 수집하여 지역 데이터베이스에 저장하고 데이터의 오류를 정제하는 방안에 대해 연구한다. 전력시스템 부하에 직접적으로 영향을 주는 급속충전기 운영기록만을 추출하고 날짜필드에서의 오류 혹은 역전을 포함하는 트랜잭션을 제거한 후 일차적으로 충전시간길이를 히스토그램으로 분석한다. 대부분의 충전이 20분 이내에 완료되었지만 23%는 충전완료 후에도 충전기에서 플러그를 제거하지 않은 것으로 보인다.

제주 택시 텔레매틱스 시스템에서 이동 이력 데이터의 처리 구조 (Data Processing Architecture on the Jeju Taxi Telematics System)

  • 이정훈;홍영신;박경린
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.879-880
    • /
    • 2008
  • 본 논문은 제주 택시 텔레매틱스 시스템에 축적되고 있는 차량들의 이동이력 데이터에 대한 처리구조를 설계하고 구현한다. 각 차량은 1분마다 자신의 위치와 GPS 정보 및 택시의 상태에 관련된 보고를 발생시키며 중앙의 관제시스템은 이를 수합하여 이력데이터를 구성한다. 본 논문에서 구현하는 시스템은 위치 보고를 처리하여 인코딩 변환, 좌표 변환, 맵 매칭, 도로상에서의 위치 계산 등을 수행한 후 오라클 데이터베이스의 이력 테이블에 저장하도록 한다. 이를 위하여 도로 네트워크가 데이터베이스로 변환되었으며 도로망에의 가시화를 위하여 지도 인터페이스 프로그램이 구현되었다. 이러한 정보들은 이력 테이블과 아울러 공간 데이터베이스 엔진과 결합하여 C 언어나 SQL 문장에 의하여 다양한 위치기반 질의를 가능하게 할 뿐 아니라 배차 정보 분석, 현재 통행 속도 분석 등 부가가치가 높은 정보를 산출하는데 필수적인 역할을 수행한다.

전자저널 관리를 위한 이용통계의 효과적 활용 방안 (Toward the Effective Utilization of Usage Statistics for the Management of Electronic Journals)

  • 김성진
    • 정보관리연구
    • /
    • 제41권4호
    • /
    • pp.69-91
    • /
    • 2010
  • 제한된 예산, 고가의 패키지 구독비, 출판사 주도의 라이선스 협상 등의 불리한 환경에서 자관의 실정에 맞는 전자저널을 구성하기 위해 도서관은 전자저널 이용데이터를 수집하고 분석해야 한다. 본 연구는 전자저널 이용통계 연구 동향 및 COUNTER 3판에 근거한 이용통계 제공 현황을 살펴보고 현장에서 쉽게 활용 가능한 이용통계 분석의 가이드라인을 제시하고자 하였다. 현재 제공되는 이용통계 보고서를 기반으로 분석할 수 있는 핵심 이용통계치로 저널별 원문이용도, 저널이용률, 원문이용단가, 고이용군, 저이용군을 제안함으로써 전자저널 관리를 위한 이용통계의 효과적인 활용 방안을 다루었다.

음성위조 탐지에 있어서 데이터 증강 기법의 성능에 관한 비교 연구 (Comparative study of data augmentation methods for fake audio detection)

  • 박관열;곽일엽
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 데이터 증강 기법은 학습용 데이터셋을 다양한 관점에서 볼 수 있게 해주어 모형의 과적합 문제를 해결하는데 효과적으로 사용되고 있다. 이미지 데이터 증강기법으로 회전, 잘라내기, 좌우대칭, 상하대칭등의 증강 기법 외에도 occlusion 기반 데이터 증강 방법인 Cutmix, Cutout 등이 제안되었다. 음성 데이터에 기반한 모형들에 있어서도, 1D 음성 신호를 2D 스펙트로그램으로 변환한 후, occlusion 기반 데이터 기반 증강기법의 사용이 가능하다. 특히, SpecAugment는 음성 스펙트로그램을 위해 제안된 occlusion 기반 증강 기법이다. 본 연구에서는 위조 음성 탐지 문제에 있어서 사용될 수 있는 데이터 증강기법에 대해 비교 연구해보고자 한다. Fake audio를 탐지하기 위해 개최된 ASVspoof2017과 ASVspoof2019 데이터를 사용하여 음성을 2D 스펙트로그램으로 변경시켜 occlusion 기반 데이터 증강 방식인 Cutout, Cutmix, SpecAugment를 적용한 데이터셋을 훈련 데이터로 하여 CNN 모형을 경량화시킨 LCNN 모형을 훈련시켰다. Cutout, Cutmix, SpecAugment 세 증강 기법 모두 대체적으로 모형의 성능을 향상시켰으나 방법에 따라 오히려 성능을 저하시키거나 성능에 변화가 없을 수도 있었다. ASVspoof2017 에서는 Cutmix, ASVspoof2019 LA 에서는 Mixup, ASVspoof2019 PA 에서는 SpecAugment 가 가장 좋은 성능을 보였다. 또, SpecAugment는 mask의 개수를 늘리는 것이 성능 향상에 도움이 된다. 결론적으로, 상황과 데이터에 따라 적합한 augmentation 기법이 다른 것으로 파악된다.

특허조사에서 온라인 검색의 역할

  • 김수천
    • 디지털콘텐츠
    • /
    • 2호통권57호
    • /
    • pp.55-57
    • /
    • 1998
  • 검색이란 데이터베이스에 축적된 막대한 데이터로부터 필요로하는 데이터를 찾아내는 조사로서, 통신회선을 이용하여 리얼타임으로 결과를 인출하는 것이 온라인 검색이다. 데이터베이스의 내용으로는 학술문헌, 신문기사, 물성 데이터, 통계 데이터, 기업 데이터 등 여러 분야에 대한 자료를 포함하며 특허도 이에 포함된다. 본 자료는 특허 조사에서 온라인 검색의 역할과 특징에 대하여 이야기 하고자 한다. 특허에는 특허와 실용신안 그리고 이들의 공개, 공고, 등록의 여러 형태가 존재하나, 여기서는 이를 총칭하여 특허라는 용어로 사용하고자 한다.

  • PDF

의사결정 규칙을 이용한 데이터 통합에 관한 연구 (A Study on the Data Fusion Method using Decision Rule for Data Enrichment)

  • 김순영;정성석
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.291-303
    • /
    • 2006
  • 대용량의 데이터로부터 의미있는 지식을 찾는 과정에서 데이터의 질은 무엇보다도 중요하다. 본 연구에서는 데이터의 충실도를 높이기 위한 방법으로 여러 경로로부터 수집된 데이터의 정보를 활용하기 위해 데이터 마이닝 알고리즘인 의사결정 규칙을 이용한 데이터 통합 기법을 제안하고, 실제 데이터를 이용하여 모의실험을 통해 제안된 알고리즘의 효율성을 비교하였다. 실험결과 제안된 알고리즘이 데이터 통합의 성능을 향상시킴을 알 수 있었다.

한국의 국가통계체계에 대한 소고 (Reviews and prospects on the official statistical system in Korea)

  • 이인실
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권3호
    • /
    • pp.419-446
    • /
    • 2012
  • 우리나라는 국가통계체제는 고속성장이라는 국가적 과제와 발전의 궤를 같이 하면서 필요할 때마다 관련 통계를 만들어 왔으며 이로 인해 기초통계가 체계적으로 균형 있게 발전해오지 못한 한계를 지니고 있다. 변화하는 경제사회 환경에 맞추어 필요통계를 발굴해내는 수요체계 파악, 국제기구의 통계와의 정합성 제고, 유사중복통계 작성 방지, 통계인력의 전문성 제고 등 구조적 문제를 해결하기 위한 법적 및 실질적 운영상의 개선 노력이 필요하다. 국가통계 총괄 조정기능 강화하고 실천력이 전제되는 거버넌스 구조를 위해 통계청을 차관급인 처나 장관급 행정부로 격상시키고 통계기관장을 임기제로 하고 공모를 통하여 선정해야 한다. 행정자료의 활용도 제고를 위한 대통령직속위원회의 신설, 민간 통계생산기관과의 협력강화, 지방자치단체의 통계역량 제고, 자료처리센터의 설치, 마이크로데이터의 공동 활용 시스템 설치 등도 시급한 과제들이다.

직장 네트워크 데이터에 대한 통계적 ERGM 분석 (Statistical ERGM analysis for consulting company network data)

  • 박예진;엄정민;홍수빈;한유진;김재희
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.527-541
    • /
    • 2022
  • 회사는 영리 등의 공동 목표를 달성하는 조직으로, 더 나은 성과를 도출해내기 위해 함께 노력하는 수많은 개인으로 구성된 사회 집단이다. 이에 따라 개인의 의사소통 능력을 비롯한 구성원 간의 네트워크 형성이 중요해지고 있다. 이러한 배경으로부터 본 연구는 직원 간 조언 관계 형성에 어떠한 요인이 영향을 미치는지 알아보고자 수행되었다. 이를 위해 미국과 유럽에 지사를 둔 컨설팅 회사 내 직원 44명의 네트워크 데이터를 ERGM(Exponential Random Graph Model) 방법으로 분석하였다. 분석 결과로 첫째, 연결을 비롯해 네트워크의 구조와 관련한 변수들이 유의하였다. 둘째, 서로 조언을 구할 확률에 성별 속성이 가장 큰 주효과로 나타났다. 셋째, 지역별 동질성은 성별 주효과보다 더 큰 연결 확률을 유도하였다. 이러한 결과로부터 직장 내 네트워크가 조금 더 효율적으로 활발하게 이루어질 수 있는 방법을 제시하였다.