• 제목/요약/키워드: 공공도메인

검색결과 30건 처리시간 0.027초

도서관 공공도메인 지정방안에 관한 연구 (A Study on the Designation Plan for Public Domain of Library)

  • 노영희;최만호;김윤정
    • 한국비블리아학회지
    • /
    • 제32권1호
    • /
    • pp.151-170
    • /
    • 2021
  • 도메인이름은 사용자의 웹 접근성과 편의성을 고려하여 최소한으로 등록·사용하여야 하며, 도메인 이름만으로 도서관의 유형과 지역과 특성을 알 수 있도록 함으로서 도서관의 위상과 권위를 높이며, 이용자의 편의성을 고려할 수 있도록 해야 한다. 본 연구에서는 국가 지정 2단계 공공도메인 현황을 조사하고, 도서관과 유사한 성격의 교육기관의 2단계 공공도메인도 분석하여, 교육기관의 수와 비슷한 규모의 도서관이 2단계 도메인을 갖지 못함으로써 나타나는 문제점을 파악하였다. 최종적으로 도서관의 유형별로 국가도서관(nl), 공공도서관(pl), 작은도서관(sl)의 2단계 도메인과 교육기관에 소속된 대학도서관(lib.대학도메인), 학교도서관(lib.학교도메인)은 해당교육기관의 2단계 도메인을 활용하는 것으로 제안하였다. 이는 이용자가 직관적으로 도서관임을 알 수 있고, 도서관의 유형도 구분하며, 도서관의 특성이나 지역도 알 수 있도록 하기 위한 것으로, 학계와 도서관계, 그리고 도서관정보정책위원회의 공동의 노력이 이루어져야 할 것이다.

데이터 분포 통계를 이용한 CSV 형식의 공공데이터 도메인 판별 모델에 관한 연구 (A Study on Domain Discrimination Model for CSV Format Public Data Using Data Distribution Statistics)

  • 정하나;김재웅;이윤열;채의근;정영석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.79-80
    • /
    • 2023
  • 정부는 공공데이터의 품질 관리를 위하여 공공데이터 품질관리 수준평가를 진행하여 공공데이터 품질을 관리하고 있다. 파일 형식의 공공데이터를 진단 시 품질진단 담당자가 대량의 파일데이터를 필드명과 필드 내 데이터에 의존하여 수작업으로 도메인을 판단하여 진단한다. 때문에 품질진단의 정확성을 신뢰하기 어렵고 진단에 많은 시간이 소요된다. 본 논문은 파일형식의 공공데이터 품질진단의 정확성을 확보하고 진단 소요시간을 단축하기 위해 데이터 분포 통계를 이용한 CSV 형식의 공공데이터 도메인 판별 모델을 제안하였다. 제안된 모델을 적용하면 공공데이터 품질의 정확성을 향상하고 진단 소비 시간을 단축시킬 것으로 기대된다.

  • PDF

공공데이터 품질환경 내 데이터 오류의 발생원인별 보안기술 대응방안에 관한 연구

  • 이원재;김휘강
    • 정보보호학회지
    • /
    • 제30권4호
    • /
    • pp.77-89
    • /
    • 2020
  • 이 연구는 우리나라 정부의 공공데이터 공개 제도에 따른 공공데이터 품질관리체계를 이해하고, 공공기관이 신뢰성 있는 데이터를 위해 품질 점검을 시행하면서도 효과적인 관리를 하기 위한 방안에 관한 것이다. 공공데이터법과 공공데이터 품질관리체계를 이해하고, 저품질 공공데이터의 오류와 발생원인에 대해 알아본다. 오류 데이터 분석을 통한 보안위협에 따른 위험 분류를 통해 효과적인 대응방안을 도출하는 것을 목표로 한다. 이를 위해 공공데이터를 데이터 품질 점검하여 도메인별 오류데이터를 살펴보고, 오류데이터 발생원인에 대한 분석을 통해 보안위협과 공공데이터를 사용하는 사용자 측면과 기관 측면의 보안 문제를 분류하였다. 분류된 오류 발생원인별 보안문제를 기준으로 데이터 품질관리를 통한 개선방향을 제시하고, 품질관리 오류 개선방향별 데이터보안 정책별 보안기술을 비교 정리하여, 데이터 보안기술을 통한 품질관리 오류 개선 연계 대응방안을 제안하였다.

공공데이터의 도메인 자동 판별 정확도 향상을 위한 정규표현식 및 접미사 적용 방법 (Application Method of Regular Expressions and Suffixes to improve the Accuracy of Automatic Domain Identification of Public Data)

  • 김석균;이관우
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.81-86
    • /
    • 2022
  • 본 연구에서 csv포맷으로 구조화된 파일 데이터의 컬럼의 도메인을 자동 판별하는 방법을 제안한다. 데이터와 데이터 간 융합을 통해 새로운 데이터를 생성할 수 있고, 이들 새로운 데이터가 중요한 자원이 되기 위해서는 조인 되는 컬럼의 일관성이 유지되어야 한다. 데이터 품질을 측정하기 위한 방법 중의 하나가 도메인 기반 품질 진단 방법이다. 도멘인이란 각 컬럼의 성격을 규정하는 가장 광범위한 지표이므로 이를 자동으로 판별하는 방법이 필요하다. 기존의 연구에서는 관계형 데이터베이스의 도메인 자동 판별이 주로 연구 되었지만 본 연구는 파일데이터의 특성을 이용하여 도메인을 자동화 할 수 있는 모델을 개발하였다. 파일데이터의 도메인 판별을 특화하기 위하여 정규표현식을 이용하여 데이터를 단순화 하고 이를 패턴화 하였고, 컬럼명에 해당하는 데이터 헤더의 내용을 분석하여 사용된 접미사를 분석하여 파생변수로 사용하였다. 정규표현식과 접미사의 파생변수를 추가하였을 때 기존 방법인 87%의 정확도 보다 큰 95%의 정확도로 도메인을 자동 판별하는 결과를 도출하였다. 본 연구는 공공데이터 품질진단에 자동화 방법론을 제시하여 품질 측정 기간 및 인원을 줄일 수 있을 것으로 기대된다.

A Study on the Domain Discrimination Model of CSV Format Public Open Data

  • Ha-Na Jeong;Jae-Woong Kim;Young-Suk Chung
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.129-136
    • /
    • 2023
  • 정부는 공공데이터 품질관리 수준평가를 진행하여 공공 개방데이터의 품질관리를 진행하고 있다. 공공 개방데이터는 XML, JSON, CSV 등 여러 오픈포맷 형태로 제공되며 CSV 형식이 대다수를 차지한다. 이러한 CSV 형식의 공공 개방데이터 품질진단 시 품질진단 담당자가 공공 개방데이터 파일의 필드명과 필드 내 데이터에 의존하여 필드 별 도메인을 판단하여 진단한다. 그러나 대량의 개방 데이터 파일을 대상으로 품질진단을 수행하기 때문에 많은 시간이 소요된다. 또한 의미 파악이 어려운 필드의 경우 품질진단의 정확성이 품질진단 담당자의 데이터 이해도 역량의 영향을 받는다. 본 논문은 필드명과 데이터 분포 통계를 이용한 CSV 형식 공공 개방데이터의 도메인 판별 모델을 제안하여 품질진단 결과가 품질진단 담당자의 역량에 좌지우지 되지 않도록 일관성과 정확성을 보장하고 진단 소요 시간 단축을 지원한다. 본 논문의 모델 적용 결과 행정안전부에서 제공하는 파일형식 개방데이터 진단도구보다 2.8% 높은 약 77%의 정답률을 보였다. 이를 통해 공공데이터 품질관리 수준진단·평가에 제안 모델 적용 시 정확성을 향상시킬 수 있을 것으로 기대한다.

공공데이터 활용을 위한 링크드 데이터 국가 연계체계 구축에 관한 연구 (A Study on National Linking System Implementation based on Linked Data for Public Data)

  • 윤소영
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.259-284
    • /
    • 2013
  • 공공데이터는 공공기관의 정책 수립 등의 공적 기능을 수행하기 위하여 많은 비용을 들여 수집되고 있으나 대부분은 사일로(silos)로 방치되고 있다. 우리나라도 공공데이터를 개방하려는 움직임이 활발해지고 있으나 일부 기관을 중심으로 OpenAPI 형식으로 데이터를 제공하는 등 제한적인 수준에 머물고 있다. 국가차원에서 LOD(Linking Open Data) 시범사업으로 공공DB 피디아를 구축하면서 최근 들어 공공데이터 활용을 위한 링크드 데이터 구축이 활발하게 논의되고 있다. 본 연구에서는 관련연구 및 공공부문을 중심으로 한 링크드 데이터 구축 사례를 바탕으로 공공데이터 활용을 위한 국가 연계체계 사업인 공공DB 피디아 구축과정에서 도출된 문제를 파악하고 기존의 국가DB 연계체계 구축과정을 참고하여 그 해결 방안을 제시하였다.

데이터 마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성 (Semi-Automatic Ontology Generation about XML Documents using Data Mining Method)

  • 구미숙;황정희;류근호;홍장의
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.299-308
    • /
    • 2006
  • 최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.

Proposal of Public Data Quality Management Level Evaluation Domain Rule Mapping Model

  • Jeong, Ha-Na;Kim, Jae-Woong;Chung, Young-Suk
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.189-195
    • /
    • 2022
  • 정부는 공공데이터의 민간 개방, 활용을 장려함으로써 신산업, 일자리 창출 등 창조경제 활성화에 기여하는 것을 주요 국정과제로 삼고 있다. 그리고 고품질 공공데이터 보유를 위해 공공데이터 품질관리 수준평가 진행 등의 활동을 통해 공공데이터 품질 향상을 도모하고 있다. 그러나 품질진단 도구 사용자의 데이터 전문성, 이해도에 따라 공공데이터 품질관리 수준평가 결과에 격차가 발생하기 때문에 진단 결과의 정확성을 보장하기 어렵다. 본 논문은 데이터 이해도가 낮은 사용자의 진단 결과에 대한 정확성을 보장하기 위해 데이터 품질진단 기준 중 유효성 진단에 적용 가능한 공공데이터 품질관리 수준평가 도메인규칙 매핑 모델을 제안하였다. 또한 모델에 실제 데이터를 적용한 결과 공공데이터 품질진단의 안정성과 정확성을 높이는 것을 확인하였다.

시멘틱 검색을 위한 공리(axiom) 데이터베이스 구축의 개념적 모델 (Developing Conceptual Model of Axiom Database for Semantic Search)

  • 조용훈;서은경
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.113-117
    • /
    • 2013
  • 팀 버너스 리에 의해 '시멘틱 웹'은 1998년 제안되었으나 현재 새롭게 생성되고 있는 데이터 혹은 자연어 형식의 데이터를 시멘틱 검색을 위해 활용하기에는 아직까지 온톨로지 데이터베이스가 따라가지 못하고 있다. 이를 위해 온톨로지 구축의 구성요소인 공리(axiom)를 공공을 위한 데이터로 개발하여 시멘틱 검색에 활용하는 개념적 모델을 제안한다. 공리 데이터베이스는 단일 도메인에서 벗어난 시멘틱 검색을 위한 데이터베이스로서 도메인 온톨로지 구축에 기본적인 요소들을 제공하고, 이용자들이 시멘틱 검색을 통해 보다 만족한 정보검색을 할 수 있도록 한다. 또한 온톨로지 데이터를 확보하기 위해 정보생산자로부터 사전어휘에 대한 온톨로지 트리플을 생성하는 실험을 하였다. 온톨로지 자동구축에 대한 연구와 개발이 활발하지만 보편적 시멘틱 검색을 위해 정보생산자와 정보관리자가 많은 부분 데이터를 생성하고 검증해야할 필요가 있다.

  • PDF

도메인 지식 기반 이슈 탐지 모델링 - 해외 발생 감염병 국내 유입 이슈를 중심으로 (Socio-National Issues Detection Modeling based on Domain Knowledge - Focusing on the Issue of Increase in Domestic Inflow Infectious Diseases)

  • 황미녕;이승우
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.158-168
    • /
    • 2017
  • 빅데이터 관련 기술의 발전으로 공공 보건 분야 등을 필두로 데이터에 기반한 정책을 결정하는 체계적인 방법론에 대한 관심이 증가하고 있다. 본 연구는 데이터를 기반으로 국가, 사회의 주요 이슈를 지능적으로 탐지하기 위해서 도메인 전문가와의 협업을 통해 이슈 탐지 모델을 개발하는 방법을 제안한다. 우선, '해외 발생 감염병 국내 유입' 이슈를 대상으로 이슈에 영향을 주는 요인을 도출하고, 영향 요인을 대표하는 변수 들을 설정한다. 다음으로 시스템 다이내믹스 기법을 이용하여 각 영향요인 간의 인과 분석을 통해 인과지도를 구성하여 영향력 높은 주요 요인들을 찾아낸다. 이 과정에서는 데이터 분석가와 감염병 도메인의 전문가와의 협업을 통해 실증적인 모델링을 진행한다. 이러한 도메인 지식 기반 이슈 탐지 모델을 기반으로 하여 상시 모니터링이 가능한 이슈 탐지 체계가 구축되면 더욱 효과적인 정책 의사 결정이 가능할 것이다.