• 제목/요약/키워드: 데이터 집계

검색결과 215건 처리시간 0.027초

Privacy-Preserving Collection and Analysis of Medical Microdata

  • Jong Wook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.93-100
    • /
    • 2024
  • 4차 산업혁명의 도래와 함께 인공지능, 빅데이터, 사물인터넷, 클라우드 컴퓨팅 등의 첨단 정보 기술이 다양한 산업 분야에서 혁신을 이끌고 있다. 이 기술들은 방대한 양의 데이터를 생성하고 있으며, 많은 기업들이 이를 활용하고 있다. 그러나 개인 데이터 수집 시 발생할 수 있는 프라이버시 침해 위험으로 인해 사용자들은 민감한 정보 제공을 망설이고 있다. 특히 의료 분야에서는 환자의 병명과 같은 민감한 정보 수집이 큰 도전이 되고 있으며, 프라이버시 문제가 데이터 수집과 분석의 장애가 되고 있다. 본 연구는 프라이버시 보호를 유지하면서도 통계적 정보를 효과적으로 추출할 수 있는 의료 데이터 수집 및 분석 기법을 제안한다. 제안 기법은 기존의 단순한 데이터 수집을 넘어서, 프라이버시를 보장하면서 수집된 데이터에서 통계적 정보를 효과적으로 추출하는 방법을 포함한다. 실제 데이터를 이용한 성능 평가에서는 제안된 기법이 기존 방법보다 더 효과적으로 프라이버시를 보존하며 통계적 정보를 도출할 수 있음을 입증한다.

스마트카드 데이터를 활용한 도시철도 서비스 평가 (인천 1호선의 차내혼잡과 정시성을 중심으로) (Evaluation of Metro Services based on Transit Smart Card Data (A Case Study of Incheon Line 1))

  • 엄진기;최명훈;김대성;이준;송지영
    • 한국철도학회논문집
    • /
    • 제15권1호
    • /
    • pp.80-87
    • /
    • 2012
  • 본 연구에서는 인천 1호선 구간을 대상으로 2009년 집계된 스마트카드 데이터를 활용해 승객좌석점유(혼잡도)와 정시성 지표를 사용하여 도시철도 서비스를 평가하였다. 차량단위의 대중교통 서비스 평가를 위해 개별 이용객의 스마트카드 데이터를 스케줄에 의해 운행되는 차량단위로 집합화하였다. 분석결과 인천 1호선 하행선(계양${\rightarrow}$국제업무지구)의 오전 첨두 시간대(7시-9시)의 차내 혼잡과 차량의 정시도착 측면에서 낮은 서비스 수준을 보이는 것으로 분석되었다. 차내 혼잡도와 정시성 간에는 밀접한 연관성이 있으며 이는 이전 역에서의 높은 승객수요가 지속적인 열차의 연착을 발생시키는 것으로 분석되었다.

Flower을 사용한 점진적 연합학습시스템 구성 (Construction of Incremental Federated Learning System using Flower)

  • 강윤희;강명주
    • Journal of Platform Technology
    • /
    • 제11권4호
    • /
    • pp.80-88
    • /
    • 2023
  • 인공지능 분야에서 학습모델을 구성하기 위해서는 학습데이터의 수집이 선행되어야 하며, 학습데이터를 학습모델 구성이 이루어지는 중앙 서버로 전달하여야 한다. 연합 학습은 클라이언트 측면의 데이터 이동없이 협력적은 방법으로 전역 학습 모델을 구성하는 기계학습 방법이다. 연합학습은 개인 정보를 보호하기 위해 활용될 수 있으며, 개별 클라이언트에서 로컬 학습모델을 구성한 후 로컬 모델의 매개변수를 중앙에서 집계하여 전역 모델을 업데이트한다. 이 본문에서는 연합학습의 개선을 위해 기존의 학습 결과인 학습 매개변수를 사용한다. 이를 위해 연합학습 프레임워크인 Flower를 사용하여 실험을 수행한 후 알고리즘의 수행시간 및 최적화에 따른 결과를 평가하여 제시한다.

  • PDF

실시간 임베디드 센서 네트워크 시스템에서 강건한 데이터, 이벤트 및 프라이버시 서비스 기술 (Robust Data, Event, and Privacy Services in Real-Time Embedded Sensor Network Systems)

  • 정강수;;손상혁;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권6호
    • /
    • pp.324-332
    • /
    • 2010
  • 실시간 임베디드 센서 네트워크 시스템에서의 이벤트 감지는 대부분 현실세계에서 수집된 센서 데이터들의 조합에 기반한다. 이에 최근에 이루어진 연구들에선 센서 데이터들을 수집, 집계하는 낮은 수준의 다양한 메커니즘들을 제안하였다. 그러나 실시간에서 연속적으로 발생하는 복잡한 이벤트들의 감지와 다양한 종류의 센서들로부터 입력되는 실시간 데이터의 처리를 위한 시스템에 대한 솔루션은 보다 많은 연구를 필요로 한다. 즉, 경량의 데이터 혼합이 가능하고 많은 컴퓨팅 자원을 필요로 하지 않는 실시간 이벤트 감지 기법이 필요하다. 이벤트 감지 프레임워크는 실시간 모니터링과 센서 데이터의 도착으로 일어나는 데이터 융합 메커니즘을 통하여 적시성과 임베디드 센서 네트워크의 자원 요구량을 감소시킬 수 있는 잠재력을 지니고 있다. 또한 임베디드 센서 네트워크 시스템이 신뢰성을 지닐 수 있도록 하기 위한 기반 기술인 프라이버시를 보장할 수 있는 익명화 기술을 설명한다.

웹 로그 분석을 위한 OLAP 시스템 및 성능 평가 (OLAP System and Performance Evaluation for Analyzing Web Log Data)

  • 김지현;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.909-920
    • /
    • 2003
  • CRM을 위해서는 다차원 분석이 가능한 OLAP (On-Line Analysis Processing)기술을 적 용한 방법 그리고 데이타 마이닝을 이용한 방법들이 각광 받고 있다. 고객 데이터 중에서 웹 로그 데이터를 실시간에 다차원 분석을 하기 위해서는 OLAP을 사용해야 한다. 그러나 OLAP을 적용하게 되면 웹 로그 데이터 자체가 가지고 있는 특성에 의해 희박성이 발생되고, 사전 집계 연산을 수행 할 시 데이터의 폭발(Explosion)현상이 일어난다. 이는 저장공간의 낭비 뿐 아니라 다차원 질의 시 성능 저하를 발생 시킨다. 본 논문에서는 웹 로그 데이터의 희박성에 대한 체계적인 접근을 위해 희박성을 발생시키는 원인과 2,3 차원의 희박성 형태들에 대해 밝혀보고, 이러한 분석을 기반으로 성능 평가를 위한 테스트 데이터 모델과 질의 모델을 설계하였다. 그리고 희박성 처리를 위해 청크 방식을 사용한 MOLAP시스템을 구현해 보고, 이 시스템과 MS SQL 2000 Analysis Services, Oracle Express의 성능을 평가 및 분석 해보았다. 이는 웹 로그 데이터내의 희박성을 효율적으로 처리할 수 있는 저장구조와 인덱스 방식을 발견하는데 토대가 될 수 있다.

  • PDF

큐보이드 전위트리를 이용한 빙산질의 처리 (Iceberg Query Evaluation Technical Using a Cuboid Prefix Tree)

  • 한상길;양우석;이원석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.226-234
    • /
    • 2009
  • 무한한 데이터 스트림을 저장하는 것은 거의 불가능하기 때문에 데이터 스트림 환경에서 빙산질의를 수행하기 위해서는 새로운 데이터 구조와 알고리즘이 요구된다. 본 논문에서는 데이터 스트림 환경에서 빙산질의를 처리하기 위해 전위트리 구조에 기반한 규보이드 전위트리(Euboid prefix tree)를 제안한다. 큐보이드 전위트리는 빙산질의에 사용된 그룹항목으로 이루어진 항목집합만을 트리에서 관리하므로 전위트리보다 적은 메모리를 사용한다. 1-항목 관리를 통해서 빈발하지 않은 항목을 트랜잭션에서 제거함으로써 갱신 시 불필요하게 소요되는 시간을 줄일 수 있다. 또한 다중 빙산질의에서 공통적으로 사용된 그룹속성에 따라 노드를 공유함으로써 적은 메모리를 사용하여 효율적으로 다중 빙산질의를 처리할 수 있는 방법을 제안한다. 큐보이드 전위트리는 무한히 연속적으로 생성되는 데이터에 대하여 빙산질의를 처리하는데 있어서 메모리 사용량과 처리시간을 효과적으로 줄이며, 이를 여러 실험을 통해 확인하였다.

공식통계의 추론통제 전략 - 정부의 특허경비지원사업 사례를 중심으로 - (A Strategy for Inference Control of Official Statistics - Centering around the Patent Application Expense Support Project -)

  • 이덕성;최인수
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.199-211
    • /
    • 2009
  • 정부와 지역사회를 위해 나라에서는 공식통계를 수집하는데, 이러한 공식통계는 정부 정책이나 프로그램의 유효성을 평가하는 데에도 사용된다. 따라서 공식통계는 정확한 사실을 바탕으로 수집되고 공표되어야 한다고 본다. 정확하지 못한 공식통계는 정부 정책이나 프로그램의 평가를 그르치게 하기 때문이다. 오늘날 여러 통계기관이 주가 되는 공식통계 전달 매체로서 집계기능을 발휘하는 OLAP 데이터 큐브를 채택하고 있는데, 이러한 데이터 큐브에서의 기밀을 보호하는 것도 아주 중요한 문제로 대두되고 있다. 왜냐하면 데이터 큐브가 악의적 추론을 당하게 되면 데이터 큐브에서 기밀유지를 해야 할 중요부분이 누설될 수 있기 때문이다. 저자들은 먼저 정확한 큐브를 작성하게 하고 큐브에서의 기밀누설을 막을 수 있는 OLAP 데이터 큐브에서의 추론통제 프로세스를 제안한 바 있다. 본 연구에서는 이 추론통제 프로세스를 사용하여 공식통계의 추론통제 전략을 수립하는 것을 목적으로 하고 있으며, 정부의 특허경비지원사업을 사례로 삼고 있다.

XQuery에서의 XML 데이터 특성을 고려한 group by 지원을 위한 질의 표현 기법에 대한 연구 (Research on supporting the group by clause reflecting XML data characteristics in XQuery)

  • 이민수;조혜영;오정선;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.501-512
    • /
    • 2006
  • 현재 널리 채택되고 있는 XML은 플랫폼에 의존하지 않는 데이터 표현 형식으로 B2B 응용 프로그램이나 워크플로우 상황에서처럼 느슨하게 연결된(loosely coupled) 이기종 시스템 간에 정보를 교환하는 데 매우 유용하게 사용되고 있다. XML의 이러한 장점 때문에 점차 증가하는 XML에 대한 관리 및 검색에 대한 요구 사항에 대처할 수 있도록 강력한 질의 언어인 XQuery가 만들어졌다. 문서의 검색을 위한 질의 언어인 XQuery는 다양한 데이터 소스로부터 가져온 XML 데이터를 고유한 구조를 가진 질의 결과로 구성할 수 있도록 설계되었으며 현재 XML 질의 언어의 표준이다. XQuery는 반복문 등을 포함하는 강력한 검색 기능을 지원하나 데이터를 그룹화 하는 경우에는 질의 표현이 상대적으로 어렵고, 복잡한 형태를 취한다. 따라서 본 논문에서는 XQuery에 그룹화 처리를 위한 명시적인 groupby절을 도입한 질의 표현 기법을 모색함으로써 XML 데이터의 재구성과 집계 함수 처리를 위한 그룹화를 보다 효율적으로 처리할 수 있도록 하였다. 이를 위해서 XQuery에 groupby절을 도입하기 위한 EBNF(Extended Backus-Naur Form)를 제안하고, 네이티브 XML 데이터베이스인 eXist 기반의 XQuery 그룹화 질의 처리 시스템을 구현하였다.

웹 기반 네트워크 근태 관리 시스템 개발 (Development of Web-based Network Diligence and Indolence Management System)

  • 최우식;김병준;안병구
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.151-158
    • /
    • 2011
  • 기존의 근태관리시스템은 서버와 클라이언트가 분리되어 있지 않고, 데이터가 데이터베이스화 되어있지 않기 때문에 데이터 가공 및 관리 등에 있어서 많은 취약점을 가진다. 본 논문에서는 이러한 문제점들을 보완 해결한 새로운 웹기반 네트워크 근태관리 시스템을 제안 개발한다. 제안 개발 설계된 시스템의 주요한 특징 및 기여도는 다음과 같다. 첫째, 서버와 클라이언트를 분리하고 모든 데이터를 데이터베이스화 한다. 둘째, APM 서버를 구축하여 데이터의 가공 및 관리를 효율적으로 한다. 셋째, 근태관리 시스템의 정책적인 설정을 한다. 넷째, 근태관리 데이터 수집 및 휴무일 집계 업무등 사용자 위주의 서비스를 제공한다. 구현 및 성능평가 결과 제안된 웨기반 네트워크 근태관리 시스템은 효율적으로 근태관리를 지원할 수 있음을 알 수 있으며, 제안된 시스템은 현재 실제적인 현장에 적용하여 사용 중에 있다.

K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템 제안 (Proposal of a Monitoring System to Determine the Possibility of Contact with Confirmed Infectious Diseases Using K-means Clustering Algorithm and Deep Learning Based Crowd Counting)

  • 이동수;;김영광;신혜주;김진술
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.122-129
    • /
    • 2020
  • 전 세계적으로 무증상의 코로나바이러스 감염증-19 감염자가 자신이 감염된 것을 모르고 주변인들에게 전파할 수 있다는 가능성은 국민이 전염병 확산에 대한 불안과 두려움에서 벗어나지 못하고 있다는 점에서 여전히 매우 중요한 이슈이다. 본 논문에서는 K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템을 제안하였다. 모든 입력 학습 영상에 대해 300회 반복 학습한 결과, PSNR값은 21.51, 전체 데이터 셋에 대한 최종 MAE값은 67.984였다. 이는 확진자와 주변인과의 거리와 감염률 산출, 잠재적 환자 동선 주변 인원의 위험도 순 그룹 및 감염률 예측에 대한 영상 속 화질 정보, 관측치 간의 평균 절대 오차를 의미하며 각 CCTV 장면에서 군중의 수가 4,000명 이하일 때에는 평균 절대 오차 값이 0에 가까움을 증명하였다.