• 제목/요약/키워드: Record Linkage

검색결과 35건 처리시간 0.027초

확률적 자료연계의 이론과 적용에 관한 연구 (A study on the probabilistic record linkage and its application)

  • 최연옥;이상인
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.849-861
    • /
    • 2021
  • 본 논문은 확률적 자료연계 방법의 기본 개념과 이론적 모형을 소개하고, 실제 통계청 데이터를 사용하여 확률적 자료연계가 진행되는 과정과 원리를 보여준다. 먼저 확률적 자료연계와 결정적 자료연계와의 차이를 간단히 알아보고, 확률적 자료연계 방법론의 토대가 되는 Fellegi-Sunter 모형의 기본 구성과 관련된 모수(m-확률, u-확률), 가중치, 매치여부 판정기준에 대해 기술한다. 그리고 통계청 등록센서스와 인구총조사 자료를 이용하여 그 모형을 적용한 자료연계가 이루어지는 구체적인 과정에 대해 설명하고, 이를 통해 얻어진 연계 결과의 정확성을 살펴본다.

국가기록물 접근성 및 활용성 향상을 위한 국가기록포털 연계 개선방안 (Advancement Plans for Linkage of National Archives Portal Service to Improve Accessibility and Usability of National Records)

  • 강윤아;조영준;김민정;오효정
    • 정보관리학회지
    • /
    • 제39권4호
    • /
    • pp.99-125
    • /
    • 2022
  • 하나의 기록을 이해하기 위해서는 기록의 내용뿐 아니라 그 기록의 생산배경과 업무 맥락을 함께 파악해야 한다. 또한 다양한 부서와 기관에 흩어져 있는 관련 기록들을 쉽게 찾을 수 있는 기능도 필요하다. 따라서 기록 검색서비스에서 정보 간의 '연계'는 갈수록 중요해지고 있다. 국가기록원 역시 영구기록관리시스템의 검색서비스 기능으로 '연계'를 강조하고 있지만, 정작 국가기록포털을 살펴보면 전거정보의 연계 부족, 독립적으로 존재하는 내부 서비스와 콘텐츠, 유관 기관과의 연계 부재 등의 문제가 확인된다. 본 연구는 이와 같은 국가기록포털의 한계를 해결하고자, 이상적인 연계서비스를 구축한 기록관리 선진기관을 선정하여 이들 기관의 연계구조를 전반적으로 확인하고, 연계구조 중 타 기록관리 기관에서 볼 수 없었던 특이점과 국가기록포털에서 차용 가능한 요소를 도출하였다. 다음으로, 국가기록포털 연계구조의 현황을 분석하여 연계가 이루어지지 않은 부분을 비롯해 연계방식을 개선해야 할 항목 등을 규명, 이를 해결하기 위한 구체적인 개선방안을 제시하였다. 본 연구의 목적은 국가기록포털의 개선된 연계 서비스를 통해 이용자의 검색 만족도를 높이고, 소장기록 및 기 구축된 내부 서비스와 콘텐츠의 접근성 및 활용성을 향상시키는 데에 있다.

Secure Blocking + Secure Matching = Secure Record Linkage

  • Karakasidis, Alexandros;Verykios, Vassilios S.
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.223-235
    • /
    • 2011
  • Performing approximate data matching has always been an intriguing problem for both industry and academia. This task becomes even more challenging when the requirement of data privacy rises. In this paper, we propose a novel technique to address the problem of efficient privacy-preserving approximate record linkage. The secure framework we propose consists of two basic components. First, we utilize a secure blocking component based on phonetic algorithms statistically enhanced to improve security. Second, we use a secure matching component where actual approximate matching is performed using a novel private approach of the Levenshtein Distance algorithm. Our goal is to combine the speed of private blocking with the increased accuracy of approximate secure matching.

대구지역 암등록사업의 효율적 수행방안 (The Efficient Methods of Population-based Cancer Registration in Daegu City)

  • 진대구;천병렬;안순기;김종연;감신
    • Journal of Preventive Medicine and Public Health
    • /
    • 제35권4호
    • /
    • pp.322-330
    • /
    • 2002
  • Objective: This study was conducted to automatically improve the completeness and validity of the Daegu Cancer Registry, using cross record linkage of many data sources, and to develop a computerized patient enrollment system for efficient communication among cancer researchers via the internet. Method: We analyzed 10,229 cancer patients who were reported in the National Cancer Registry, and from pathological reports, health insurance cancer claims lists, cancer patient records at hospital information centers and death certificates from the Korea National Statistical Office. Result: We confirmed 4,624 cancer patients and found 897 of new cases from a review of medical chart. The new cases were detected efficiently using cross record linkage. We developed a computerized patient enrollment system, based on a client-sewer model, for the input of cancer patients, and then developed a web-based reporting homepage and patient enrollment system for the internet. Conclusion: This system could manage cancer databases systematically, and could be given to other researchers as a basic database.

Record Linkage를 통해 본 영아 사망 요인 분석

  • 이한나;이종태
    • 한국환경보건학회:학술대회논문집
    • /
    • 한국환경보건학회 2005년도 가을학술대회
    • /
    • pp.121-125
    • /
    • 2005
  • 우리나라 영아 사망은 계속 감소를 보이고 있으나 상대적으로 낮은 출산율이 최근 문제시되고 있다. 영아 사망률은 인구의 사회적 건강의 요인으로서 넓게 인식된다. 따라서 영아 사망률의 사인을 밝히는 것은 낮은 출생률에 대비하고 출생아가 건강한 성인으로 자라날 수 있는 토대를 마련하기 위해서 중요한 연구가 될 것이다. 이에 본 연구에서는 국내에서는 처음으로 Record linkage를 통해 2000년부터 2003년 까지의 출생 자료와 사망 자료를 통합하여 유아 사망에 영향을 미치는 요인을 분석하였다. 다중 로지스틱 회귀분석을 통해 관련 변수들을 보정한 상태에서 조산아의 유아 사망 위험비는 1.42(95%CI =1.25-1.63)로 나타났다. 그 외에 산모의 연령, 부모의 직업, 거주지역 등이 유의한 위험요인으로 나타났고 본 연구에서 저체중은 영아 사망의 위험 요인으로 나타나지 않았다.

  • PDF

기록물분류기준표의 운영과 과제 (A study on Improving Operation of the Records Disposition Schedule)

  • 박유진
    • 기록학연구
    • /
    • 제8호
    • /
    • pp.57-95
    • /
    • 2003
  • For a good record maintenance according to organization and functions in Korea, it is required to make better use of 'Records Disposition Schedule', which is originally developed as a computerized system that can control the whole records maintenance procedure and manage every record according to organization and functions. 'Records Disposition Schedule' is only a system that allows us to maintain every record according to organization and functions and manage every information about such organization and functions. Accordingly, a well-functioning Records Disposition Schedule requires the exact modification and operation of such schedule depending upon organizational or functional changes. If the Records Disposition Schedule is not reasonably modified and operated depending upon organizational or functional changes, we won't be able to maintain any records in linkage with organization and functions and control the whole works throughout record maintenance.

정보자원의 개방과 연계를 위한 SRU, SRU Record Update 프로토콜 연구 (A Study on SRU & SRU Record Update Protocol for Openness and Linkage of Resources)

  • 이지원
    • 한국도서관정보학회지
    • /
    • 제40권3호
    • /
    • pp.317-336
    • /
    • 2009
  • 다양한 가상공간에 산재하는 많은 분산자원들을 보다 효과적으로 활용하기 위하여 여러 프로토콜들이 개발되어 왔다. 이 연구는 분산 정보자원 검색과 갱신을 위한 SRU, SRU Record Update 프로토콜의 개발 배경, 기능, 구성 요소 등을 살펴봄으로 새로운 표준 프로토콜에 대한 이해를 넓히기 위함이다. 또한 다른 프로토콜과의 비교 및 실제 구현 사례 등을 통하여 자관의 정보자원을 외부에 효과적으로 제공하고, 외부 정보자원을 적절히 활용하려는 도서관 및 정보서비스 기관들에게 상호운용성 보장을 위한 실제적인 방안을 제시하기 위함이다.

  • PDF

Statin Intake and Gastric Cancer Risk: An Updated Subgroup Meta-analysis Considering Immortal Time Bias

  • Bae, Jong-Myon
    • Journal of Preventive Medicine and Public Health
    • /
    • 제55권5호
    • /
    • pp.424-427
    • /
    • 2022
  • A retrospective record-linkage study (RLS) based on medical records containing drug prescription histories involves immortal time bias (ITB). Thus, it is necessary to control for this bias in the research planning and analysis stages. Furthermore, a summary of a meta-analysis including RLSs that did not control for ITB showed that specific drugs had a preventive effect on the occurrence of the disease. Previous meta-analytic results of three systematic reviews evaluating the association between statin intake and gastric cancer risk showed that the summary hazard ratio (sHR) of the RLSs was lower than 1 and was statistically significant. We should consider the possibility of ITB in the sHR of RLSs and interpret the results carefully.

결합키 생성항목의 갱신에 강건한 결합키 생성 기법 (Combination Key Generation Scheme Robust to Updates of Personal Information)

  • 장호빈;노건태;정익래;천지영
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.915-932
    • /
    • 2022
  • 개인정보 보호법과 가명정보 처리 가이드라인에 따르면, 서로 다른 결합신청자들이 결합을 희망할 때 Salt값을 포함한 결합키 생성항목의 해시값으로 매핑을 진행한다. 결합키 생성항목의 예시로는 성명, 전화번호, 생년월일, 주소 등의 개인정보가 될 수 있으며, 해시 함수의 특성상 서로 다른 결합신청자들이 이들의 항목을 정확히 동일한 형태로 저장하고 있을 때 문제없이 결합을 진행할 수 있다. 하지만 이러한 기법은 서로 다른 결합신청자들의 데이터베이스 갱신 시점이 달라서 발생하는 주소 변경, 개명 등의 시나리오에서의 결합은 취약하다. 따라서 본 연구에서 우리는 주소 변경, 개명 등의 결합키 생성항목이 갱신된 시나리오에서도 개인정보보호를 만족하는 강건한 결합키 생성기법을 확률적 자료 연계를 통한 임계값을 바탕으로 제안하며, 본 연구 결과를 활용한 국내 빅데이터 및 인공지능 사업의 발전에 기여하고자 한다.

국채보상운동 디지털 아카이브 기록물의 활용을 위한 위키데이터 연계 방안에 대한 연구 (A study on Wikidata linkage methods for utilization of digital archive records of the National Debt Redemption Movement)

  • 도슬기;박희진
    • 한국기록관리학회지
    • /
    • 제23권2호
    • /
    • pp.95-115
    • /
    • 2023
  • 본 연구는 세계기록유산으로 등재된 국채보상운동 디지털 아카이브 기록물의 활용성을 높이기 위한 방안으로 위키데이터와 연계하는 데이터 모델을 설계하고, 적용가능성을 검토하였다. 국채보상운동 기록물 메타데이터, 시소러스, 시맨틱 네트워크 그래프를 분석하여 시사점을 도출하고, 기록물의 내용 분석을 통해 위키데이터와 연계를 위한 데이터 모델의 클래스인 기록물건, 행위주체, 시간, 장소, 사건을 도출하였다. 또한 클래스 간 연결을 위한 관계 속성들을 파악하여, 설계한 데이터 모델을 실제 기록물 사례에 적용해봄으로써, 속성을 중심으로 한 객체 간의 이동을 통해 풍부한 관련 정보들을 획득할 수 있는 가능성을 확인하였다. 본 연구의 결과는 소규모 로컬 아카이브에서 위키데이터를 활용한 데이터의 공유와 활용 체계 마련에 활용될 수 있을 것이다.