• 제목/요약/키워드: 데이터 정제

검색결과 469건 처리시간 0.024초

종합병원 데이터웨어하우스 시스템에 관한 연구 (A Study on the Data Warehousing System of General Hospital)

  • 박찬석;고석하
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.304-318
    • /
    • 2002
  • 본 연구는 종합병원에서 운영중인 병원정보시스템(Hospital Information System)을 기준으로 업무별 데이터 마트를 구성하여 종합병원 데이터 웨어하우스 시스템을 제안하는 연구이다. 본 연구에서 제안한 병원 데이터웨어하우스 모형은 충남대학교병원 데이터 웨어하우스 시스템 구축 보고서, Inmon의 데이터 웨어하우스 개발방법론에 기초를 두었다. 종합병원의 데이터하우스시스템을 제안하면 다음과 같다. 첫째, 원무 데이터마트, 병원의 원무팀에서 주로 사용하는 것으로써 수입에 관련된 정보, 진료인원에 관한 정보, 심사/청구/삭감에 관한 정보들로 구성되어 있다. 둘째, 약국 데이터마트, 처방전달 데이터 마트와 연결되어 외래/입원의 처방에 관한 정보, 약에 대한 효능과 성분에 대한 정보, 투약과 검사에 대한 정보들로 구성된다. 셋째, 의무기록 데이터마트, 의무기록팀에서 관리하는 퇴원 정보, 암환자에 대한 정보, 외래/입원 환자 통계에 대한 정보들로 이루어진다. 넷째, 처방전달 데이터마트, 주로 의사가 환자에게 행한 처치/처방/수술과 진료기록에 대한 정보들을 기준으로 환자진료나 임상연구에 필요한 정보를 제공한다. 다섯째, 병원 행정 데이터마트, 인사정보, 급여정보, 회계정보, 예산정보, 물류정보 등으로 구성되어 병원의 자원활용이나 행정에 대한 전반적인 정보를 제공한다. 여섯째, 경영지원 데이터마트, 병원경영에 필요한 수입정보, 원가분석 정보, 진료인원 정보들을 한 형태로 제공한다. 또한 의사결정 형태도 의료진 중심의 병원에서 환자중심의 병원으로 구조를 바꾸었고 투명한 정보공유와 기초 데이터들의 정제는 부가가치가 높은 정보로 가공할 수 있게 되었으며 각 전문 직종간의 단절된 정보 흐름을 유기적으로 교환할 수 있게 되어 지식의 교환을 촉진시켰다. 그리고 온라인거래처리시스템(OLTP)의 한계점인 하드웨어적인 문제와 성능 저하에 대한 문제를 해결하였고, OLTP시스템에서 분리되고 이원화된 코드체계와 데이터 형태의 이질화를 통일하는 방법으로 데이터웨어하우스 시스템을 제시하였다. 결국 병원에서 데이터웨어하우스 시스템의 구축은 임상, 연구, 교육의 유기적 순환관계를 정립하여 지식의 순환적 고리인 수집, 공유, 확산, 재창출을 지속적 유지할 수 있는 인프라를 구축해 준다. 반면 상이한 정보들간의 충돌과 이에 따른 해석의 오류로 잘못된 의사결정을 위한 정보를 제공할 수 있고 기초정보의 접근 및 추출의 유용성에 의해서 정보유출에 대한 문제가 한계점으로 나타났다.

  • PDF

종합병원 데이터웨어하우스 시스템에 관한 연구 (A Study on the Data Warehousing System of General Hospital)

  • 박찬석;고석하
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.304-318
    • /
    • 2002
  • 본 연구는 종합병원에서 운영중인 병원정보시스템(Hospital Information System)을 기준으로 업무별 데이터 마트를 구성하여 종합병원 데이터 웨어하우스 시스템을 제안하는 연구이다. 본 연구에서 제안한 병원 데이터웨어하우스 모형은 충남대학교병원 데이터 웨어하우스 시스템 구축 보고서, Inmon의 데이터 웨어하우스 개발방법론에 기초를 두었다. 종합병원의 데이터하우스시스템을 제안하면 다음과 같다. 첫째, 원무 데이터마트, 병원의 원무팀에서 주로 사용하는 것으로써 수입에 관련된 정보, 진료인원에 관한 정보, 심사/청구/삭감에 관한 정보들로 구성되어 있다. 둘째, 약국 데이터마트, 처방전달 데이터 마트와 연결되어 외래/입원의 처방에 관한 정보, 약에 대한 효능과 성분에 대한 정보, 투약과 검사에 대한 정보들로 구성된다. 셋째, 의무기록 데이터마트, 의무기록팀에서 관리하는 퇴원요약 정보, 암환자에 대한 정보, 외래/입원 환자 통계에 대한 정보들로 이루어진다. 넷째, 처방전달 데이터마트, 주로 의사가 환자에게 행한 처치/처방/수술과 진료기록에 대한 정보들을 기준으로 환자진료나 임상연구에 필요한 정보를 제공한다. 다섯째, 병원 행정 데이터마트, 인사정보, 급여정보, 회계정보, 예산정보, 물류정보 등으로 구성되어 병원의 자원활용이나 행정에 대한 전반적인 정보를 제공한다. 여섯째, 경영지원 데이터마트, 병원경영에 필요한 수입정보, 원가분석 정보, 진료인원 정보들을 요약한 형태로 제공한다. 또한 의사결정 형태도 의료진 중심의 병원에서 환자중심의 병원으로 구조를 바꾸었고 투명한 정보공유와 기초 데이터들의 정제는 부가가치가 높은 정보로 가공할 수 있게 되었으며 각 전문 직종간의 단절된 정보 흐름을 유기적으로 교환할 수 있게 되어 지식의 교환을 촉진시켰다 그리고 온라인거래처리시스템(OLTP)의 한계점인 하드웨어적인 문제와 성능 저하에 대한 문제를 해결하였고, OLTP시스템에서 분리되고 이원화된 코드체계와 데이터 형태의 이질화를 통일하는 방법으로 데이터웨어하우스 시스템을 제시하였다. 결국 병원에서 데이터웨어하우스 시스템의 구축은 임상, 연구, 교육의 유기적 순환관계를 정립하여 지식의 순환적 고리인 수집, 공유, 확산, 재창출을 지속적 유지할 수 있는 인프라를 구축해 준다. 반면 상이한 정보들간의 충돌과 이에 따른 해석의 오류로 잘못된 의사결정을 위한 정보를 제공할 수 있고 기초정보의 접근 및 추출의 유용성에 의해서 정보유출에 대한 문제가 한계점으로 나타났다.

  • PDF

XMDR을 이용한 데이터웨어하우스 실시간 데이터 정제 시스템 설계 (Design of DatawareHouse Real-Time Cleansing System using XMDR)

  • 송홍율;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제14권8호
    • /
    • pp.1861-1867
    • /
    • 2010
  • 데이터웨어하우스는 기업에서 의사결정이나 기업의 정책을 결정하는데 사용하고 있다. 그러나 분산 환경에서 새로운 시스템이 추가되면 데이터 통합 측면에서 시스템간의 여러 가지 이질적인 특성으로 인해 많은 비용과 시간이 필요로 하게 된다. 따라서 이러한 이질적인 특성을 해결하기 위해 첫째, 데이터 구조의 이질성은 표준기관에서 제정한 표준스키마와 XMDR(eXtended Master Data Registry)를 이용하여 추상화된 쿼리를 생성하고, XMDR에 맞게 쿼리를 분리함으로써 구조적인 이질성을 해결한다. 둘째, 데이터 정의 및 표현의 이질성은 메타데이터에 대한 유사어와 데이터 값의 표현 방식을 정의한 메타데이터 사전을 이용함으로써 해결한다. 특히 본 논문에서는 XMDR을 이용하여 분산 시스템 통합시 로컬시스템의 영향을 최소화하고, 데이터웨어하우스의 정보를 실시간으로 생성하기 위해 분산된 환경에서 데이터 통합을 위한 표준화된 정보를 제공한다.

빅데이터 분석기법을 활용한 숙박업체 운영 개선 방안에 대한 연구 (A Study on Improvement of Pension Operation and Management using Big Data Analysis Techniques)

  • 윤선희
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.815-821
    • /
    • 2021
  • 빅데이터의 장점은 인터넷상의 대량의 데이터를 수집하여 가치 있는 데이터를 정제하여 사용하는 것이다. 즉, 비정형 데이터를 사용자가 필요한 관점에서 분석하여 활용할 수 있도록 가공하는 것이다. 본 논문은 실생활에 밀접하게 적용되어 마케팅에 활용할 수 있는 비정형 데이터를 기반으로 하며 실험 대상은 서울에서 한 시간 거리의 수도권에 있는 숙박업체를 모델로 하여 빅데이터를 사용자가 필요한 관점에서 분석하여 매출 증대, 비용 감소 및 수익률 증가 등의 효과를 나타낸 실험으로 소셜네트워크 등의 빅데이터를 분석하는 과정에서 입력되는 데이터가 숙박 정보로써 활용할 수 있는 데이터인지를 판별하여 필터링하는 시스템을 제안하여 숙박률의 향상 및 공실률을 감소시킬 수 있는 마케팅 전략을 구축하고자 한다.

유비쿼터스 센서 네트워크에서 스트림 데이터를 효율적으로 관리하는 저장 관리자 구현 (Implementation of Storage Manager to Maintain Efficiently Stream Data in Ubiquitous Sensor Networks)

  • 이수안;김진호;신성현;남시병
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.24-33
    • /
    • 2009
  • 유비쿼터스 센서 네트워크를 통해 수집되는 데이터는 끊임없이 변화하는 스트림 데이터이다. 이 스트림 데이터는 기존의 데이터베이스와는 매우 다른 특성을 가지고 있어서, 이를 저장하고 분석 및 질의 처리하는 방법에 대한 새로운 기법이 필요하며, 이에 대한 연구가 최근에 많은 관심을 끌고 있다. 본 연구에서는 센서 네트워크로부터 끊임없이 들어오는 스트림 데이터를 수집하고 이를 효율적으로 데이터베이스에 저장하는 저장 관리자를 구현하였다. 이 저장 관리자는 무선 센서 환경에서 발생하는 오류에 대한 정제, 반복적으로 센싱되는 동일한 데이터에 대한 축소 기능, 장기간의 스트림 데이터를 경동 시간 구조로 유지하는 기능 등을 제공한다. 또 이 연구에서는, 구현된 저장 관리자를 건물의 온도, 습도, 조도 등을 수집하는 건물 화재 감시 센서네트워크에 적용하여 그 성능을 측정하였다. 실험 결과, 이 저장 관리자는 스트림 데이터의 저장 공간을 현저히 줄이며, 건물 화재 감시를 위한 장기간의 스트림 데이터를 저장하는데 효과적임을 보였다.

래퍼 기반 경제 데이터 수집 시스템 설계 및 구현 (Wrapper-based Economy Data Collection System Design And Implementation)

  • 박철호;구영현;유성준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.227-230
    • /
    • 2015
  • 경제의 흐름, 주가 등을 분석, 예측을 위해 경제 뉴스, 주가 등 데이터 수집이 필요하다. 일반적인 웹 크롤러는 자동적으로 웹서버를 방문하면서 웹페이지 내용을 분석하고 URL들을 추출하면서 웹 문서를 수집한다. 반면 특정한 주제의 문서만을 수집할 수 있는 크롤러 형태도 있다. 특정 사이트에서 경제 뉴스 정보만 수집하기 위하여 사이트의 구조를 분석하고 직접적으로 데이터를 수집해올 수 있는 래퍼 기반 웹 크롤러 설계가 필요하다. 본 논문에서는 빅데이터를 기반으로, 경제뉴스 분석 시스템을 위한 크롤러 래퍼를 설계, 구현하여 경제 전문 분야의 뉴스 데이터를 수집하였다. 2000년부터 현재까지 미국 자동차 시장의 주식 데이터를 래퍼 기반으로 가져오고, 사이트 상에서의 데이터가 업데이트되는 주기를 판단하여 주기적으로 업데이트 함으로써 중복되지 않게 하였다. 그리고 미국, 한국의 경제 기사를 래퍼 기반의 웹 크롤러를 사용하여 수집하고, 향후 분석이 쉽게 데이터를 정형화 시켜 저장한다.

  • PDF

차량 데이터 기반 빅데이터 처리 및 모니터링 시스템 (Big Data Processing and Monitoring System based on Vehicle Data)

  • 신동윤;김주호;이승해;신동진;오재곤;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.105-114
    • /
    • 2019
  • 4차 산업혁명의 발전에 따라 빅데이터의 기술들을 이용하여 연식이 오래된 차량들에서 확인할 수 없는 결과들을 모바일을 이용하여 즉각적으로 확인할 수 있는 시스템을 개발하였다. 먼저 OBD2 센서를 이용하여 차량의 데이터를 수집하였고 수집된 데이터를 라즈베리파이에 저장하여 라즈베리파이가 차량이 주행하는 것과 같은 상황을 두었다. 이후 차량의 데이터가 발생되면 데이터를 실시간으로 수집하고, 수집된 데이터를 여러 개의 노드를 이용해 분산저장한 뒤 시각화 하고자 하는 데이터를 가공, 정제, 처리하고 처리된 결과를 바탕으로 시각화하여 출력한다. 우리는 이와 같은 진행에 빅데이터를 이용하고 차량데이터를 빠르게 처리하여 모바일 기기를 통하여 효과적으로 확인할 수 있다.

효율적인 비동기 전송을 지원하기 위한 RTLS 미들웨어의 확장 (API Extension of RTLS Middleware for Efficient Asynchronous Transmission)

  • 박재관;홍봉희;이승철
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.111-118
    • /
    • 2009
  • 최근, 많은 기업에서 실시간 자산 관리를 위해 RTLS 시스템을 구축하고 있다. RFID와 달리, RTLS 태그는 이동 과정과 한정되지 않고 임의의 위치에서 지속적으로, 자동적으로 인식된다. 그러나, RTLS 미들웨어의 표준 API는 2가지 한계점이 있다. 미들웨어가 애플리케이션으로 불필요한 데이터를 포함하는 대용량의 데이터를 전달해야 한다는 것과 미들웨어에서 애플리케이션으로 질의 결과를 전달하는 방식에서 동기 방식만을 지원한다는 문제가 그것이다. 이 논문에서는 이러한 문제를 해결하기 위해, 다양한 질의에 대해 애플리케이션으로 전달되는 데이터 량을 줄이기 위한 질의 타입별 정제 조건을 명세할 수 있는 SessionSpec을 정의하고 실시간 이벤트 처리를 위한 비동기 방식 지원 방법을 제안한다. 또한, 이러한 방법을 적용한 RTLS 미들웨어를 설계하고 구현하여 그 결과를 확인하였다.

  • PDF

반복적 2차원 프로젝션 필터링을 이용한 확장 고차원 클러스터링 (Extended High Dimensional Clustering using Iterative Two Dimensional Projection Filtering)

  • 이혜명;박영배
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.573-580
    • /
    • 2001
  • 대용량의 고차원 데이터 집합은 고차원 데이터 고유 희소성에 의하여 상당한 양의 잡음을 포함하므로 효과적인 고차원 클러스터링에 어려움을 더한다. CLIP은 이와 같은 고차원 데이터의 특성을 지원하는 클러스터링 알고리즘으로 개발되었다. CLIP은 1차원 성형변환 프로젝션을 점진적으로 적용하여, 각 프로젝션 공간에서 얻어진 1차원 클러스터들의 곱집합을 찾는다. 이 집합은 클러스터를 포함할 뿐 아니라 잡음도 포함할 수 있다. 본 논문에서는 클러스터를 포함하는 곱집합을 정제하는 확장된 CLIP 알고리즘을 제안한다. 이미 CLIP에서 찾은 곱집합에 반복적인 2차원 프로젝션을 적용하여 클러스터의 고차원적 잡음을 제거한다. 확장된 알고리즘의 성능을 평가하기 위해 합성 데이터를 이용한 일련의 실험을 통하여 효과성을 증명한다.

  • PDF

맞춤 접두 필터링을 이용한 효율적인 유사도 조인 (Efficient Similarity Joins by Adaptive Prefix Filtering)

  • 박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.267-272
    • /
    • 2013
  • 데이터 정제나 복사 탐지와 같은 많은 응용들을 가진 중요한 연산인 유사도 조인은 도전적인 주제로 데이터집합에서 주어진 한계치 이상의 유사도를 가지는 모든 쌍의 레코드들을 찾는 것이다. 우리는 빠른 유사도 조인을 위해 후보 쌍들의 생성 시에 접두 필터링 원리를 강한 제약 조건으로 사용하는 새 알고리즘을 제안한다. 그 원리에 의해 한정된 접두 토큰들내에서 탐색 레코드의 현재 접두 토큰이 인덱싱 레코드의 접두 토큰을 공유할 때에만 후보 쌍이 생성된다. 이 생성 방법은 두 레코드들 사이에 공통부분의 상한 값을 계산할 필요가 없어서 실행시간을 감소시킨다. 실제 데이터 집합에 적용된 실험 결과는 제안된 알고리즘이 이전의 접두 필터링 방법의 알고리즘들에 비해 상당히 우수함을 보여준다.