• 제목/요약/키워드: 개방데이터

검색결과 727건 처리시간 0.03초

빅데이터 환경에서 개인정보보호를 위한 익명화된 데이터의 비익명화를 통한 데이터 안전성 테스트 방법론에 관한 연구 (A Study on Data Safety Test Methodology through De-Anonymization of Anonymized data for Privacy in BigData Environment)

  • 이재식;오용석;김호성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.684-687
    • /
    • 2013
  • 빅데이터 환경은 수많은 데이터의 조합으로 가치를 발견하여 이를 활용하는 것이다. 이러한 환경의 전제조건은 데이터의 공개 및 공유 개방이 될 것이다. 하지만 데이터 공개 시 개인정보와 같은 정보가 포함되어 법적 도덕적인 문제나 공개된 정보의 범죄 활용 등 2차적인 피해가 발생할 수 있어 데이터 공개 시 개인정보에 대한 익명화가 반드시 필요하다. 하지만 익명화된 데이터는 다른 정보와 결합을 통하여 재식별되어 비익명화 될 가능성이 항상 존재한다. 따라서 본 논문에서는 데이터 공개 시 익명화된 데이터를 공개하기 전에 재식별성에 대한 위험을 평가하는 테스트 방법론을 제안한다. 제안하는 방법론은 실제 테스트를 수행하는 3가지 과정 및 테스트 레벨 설정과 익명화 시 고려해야 할 부분으로 이루어져 있다. 제안하는 방법론을 통하여 안전한 데이터 공개 환경이 조성되어 빅데이터 시대에 개인정보에 안전한 데이터 공유와 개방이 이루어질 것으로 기대한다.

형식 개념 분석을 통한 공공데이터의 메타데이터 분석 (Metadata Analysis of Open Government Data by Formal Concept Analysis)

  • 김학래
    • 한국콘텐츠학회논문지
    • /
    • 제18권1호
    • /
    • pp.305-313
    • /
    • 2018
  • 공공데이터는 공공기관이 만들어내는 자료나 정보를 국민에게 공개한 것이다. 정부는 공공데이터포털과 개별기관의 웹사이트를 통해 공공데이터를 개방하고 있다. 그러나 데이터 사용자 관점에서 원하는 공공데이터를 탐색하고 활용하는데 제약이 있는 것이 현실이다. 특히, 데이터 목록의 특성을 파악하고 서로 다른 데이터를 연계하는 과정에 많은 노력과 시간이 필요하다. 본 연구는 공공데이터로 개방된 데이터 목록이 갖고 있는 항목명의 공통 관계를 분석하여 데이터 목록사이의 연결 가능성을 제안한다. 공공데이터포털에서 제공하는 데이터 목록을 수집하고, 데이터 목록에 포함된 데이터 항목명을 추출한다. 추출된 항목명은 형식 개념 분석을 통해 형식 문맥 (formal context)과 형식 개념 (formal concept)으로 구성된다. 형식 개념은 데이터 목록과 항목명을 각각 외연과 내연으로 갖고 있고, 내연의 공통항목을 분석해 데이터 연결 가능성을 판별한다. 형식 개념 분석을 통해 도출한 결과는 데이터 목록의 의미적 연결에 효과적으로 활용될 수 있고, 공공데이터 개방을 위한 데이터 표준 및 품질개선에 적용할 수 있다.

조달청 OPEN API 빅데이터를 활용한 공공 소프트웨어 산업의 SNA 패턴 분석 (SNA Pattern Analysis on the Public Software Industry based on Open API Big Data from Korea Public Procurement Service)

  • 김소정;심선영;서용원
    • 정보화정책
    • /
    • 제24권3호
    • /
    • pp.42-66
    • /
    • 2017
  • 본 연구는 우리나라를 대표하는 개방 데이터인 조달청의 빅데이터를 활용하여, 최근 사회과학 연구에서 활발하게 사용되는 사회관계망 분석을 통해 정부의 특정 정책(소프트웨어 대기업 참여 상한제) 전후의 산업 네트워크 구조를 비교 분석함으로써 소프트웨어 시장의 생태계 변화를 조망하고 공공데이터 개방의 시사점을 살펴보는 것을 목적으로 한다. 2013년에서 2015년까지 3년에 걸쳐 공공 소프트웨어 시장의 정보화 사업에 대한 발주 및 수주 계약 데이터를 분석해 본 결과, 첫째 공공 소프트웨어 시장에서 Power Law현상이 관찰되고 있으며, 이 현상은 규제 등의 외부적 충격과 상관없이 지속되고 있음을 알 수 있었다. 둘째, 이 시장에서 Power Law현상은 지속되고 있었지만 생태계의 구성은 년도별로 유의미한 차이를 보임도 확인하였다. 이러한 결과를 바탕으로, 공공 소프트웨어 시장의 생태계 구성 및 변화에 대한 시사점을 도출하고, 근본적으로 이러한 분석을 가능케 하는 공공 빅 데이터 개방의 장점에 대해 논의하였다.

공공데이터 개방 평가지표 개발을 통한 현황분석 및 가시화 (Service Level Evaluation Through Measurement Indicators for Public Open Data)

  • 김지혜;조상우;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.53-60
    • /
    • 2016
  • 공공데이터 포털에 공개된 지자체 데이터와 공공기관 데이터를 자동으로 수집한 후, 공공 데이터의 개방현황 및 다양한 영역별 데이터 제공여부, 파일 형식 등 다양한 기준으로 다차원 분석하여 서비스 수준 평가를 제공하고자 한다. 이를 위해, 해외 평가지표 사례를 바탕으로 평가지표 내용을 설정한 후 이를 기준으로 데이터웨어하우스(DW)를 구축하였으며, 다차원 분석 기법을 사용한 서비스 수준평가 결과를 지역별로, 기관별로, 분야별로 시각화한다.

  • PDF

도서관 공공데이터의 품질에 관한 연구: 도서관 정보나루의 도서 상세 조회 API를 중심으로 (Quality Diagnosis of Library-Related Open Government Data: Focused on Book Details API of Data for Library)

  • 양수완
    • 정보관리학회지
    • /
    • 제37권4호
    • /
    • pp.181-206
    • /
    • 2020
  • 공공데이터의 개방과 제공의 활성화와 함께, 공공도서관이 업무 중에 생산한 서지 데이터와 대출 이력과 같은 데이터가 도서관 공공데이터로 제공되고 있다. 본 논문은 도서관 공공데이터의 품질을 진단하고, 그 결과를 바탕으로 도서관 공공데이터의 품질을 높일 개선방안을 제안하고자 한다. 먼저, 문헌정보학 영역에서 공공데이터에 관해 이루어진 연구를 개괄한다. 그다음으로, 도서관 공공데이터 개방 플랫폼인 도서관 정보나루의 오픈 API를 통해 확보한 도서관 공공데이터의 완전성과 정확성을 진단한다. 마지막으로, 데이터 품질 진단 결과에 바탕을 개선방안을 도출한다. 완전성을 진단한 결과, 도서의 식별과 검색을 위 필수적인 서지 요소에서 다수의 공백이 확인되었다. 정확성을 진단한 결과, 값의 유형, 값의 범위, 제한조건을 따르지 않는 부정확한 서지 요소가 확인되었다. 본 연구는 데이터 품질 진단 분석 결과를 바탕으로, 도서관 정보나루의 데이터 수집 절차 개선, 데이터별 스키마 구축, 데이터 수집과 데이터 처리에 관한 안내 제공, 원자료 공개를 제언하였다.

CORBA 서비스의 성능 향상을 위한 인터페이스 설계 (Interface Design for Performance Improvment of CORBA Services)

  • 김상호;지정희;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.203-210
    • /
    • 2004
  • 지리정보시스템에 대한 연구는 개방형 구조, 상호운영성과 확장 가능성에 초점을 두고 발전되어 왔다. 이 연구들은 기존에 구축된 하나의 통합시스템의 형태에서 대용량의 데이터, 고차원 구조의 데이터 그리고, 서로 다른 지리 포멧의 데이터를 처리하기 위하여, 응용 프로그램과 사용자 인터페이스를 레이어 별로 구분하여 각기 관리하는 개방형 구조로 시스템이 구현되어야 함을 의미한다. 현재 구현되는 개방형 지리정보시스템을 위한 미들웨어들 중 CORBA 미들웨어는 특정 운영체제를 기반으로 하지 않아 많은 개발자들이 이용하고 있다. 이때, CORBA의 서비스는 점대점 통신만을 지원하고, 다른 미들웨어보다 데이터 제공 시간이 많이 소요되는 문제점을 가지고 있다. 따라서 이 논문에서는 점대점 통신기법의 수정 방법을 제안하고, 구현한다. 제시된 방법은 클라이언트가 서버의 데이터를 한번의 연결로 데이터를 제공함으로써 그룹 통신과 빠른 데이터 제공 속도를 보장할 수 있게 한다.

FACE 적합성을 위한 항공전자 소프트웨어 데이터 모델링 방안 및 검증 (Avionics Software Data Modeling Method and Test For FACE Conformance)

  • 조경연;이두환;차상철;김정열
    • 항공우주시스템공학회지
    • /
    • 제16권6호
    • /
    • pp.45-53
    • /
    • 2022
  • 항공전자 시스템에서는 하드웨어 장비가 변경되면 통신 방식 및 ICD 변경이 빈번히 발생하며, 소프트웨어 또한 그에 맞게 수정이 필요하다. 이는 개발 일정 및 비용에 큰 영향을 주는 요소이다. 따라서 최근 항공전자 산업에서는 소프트웨어의 이식성을 높이기 위해 개방형 아키텍처를 도입하고 있으며, 관련 연구 또한 활발히 진행되고 있다. 본 논문에서는 개방형 항공전자 아키텍처 중 하나인 FACE를 준수하기 위한 데이터 모델링 방안 및 고려사항에 대하여 설명한다. 또한, 항전 장비 중 하나인 VOR/ILS에서 출력하는 데이터에 대해 FACE 데이터 모델을 설계 및 구현하고, FACE Conformance Test Suite(CTS) 프로그램을 이용하여 데이터 모델이 FACE를 준수하여 설계되었다는 것을 검증한다.

Delft Dashboard 개방경계조건을 이용한 Delft-3D 수치모의 (Delft-3D Simulation using Open Boundary Condition in Delft Dashboard)

  • 권갑근;김진;김건형
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.210-210
    • /
    • 2021
  • Delft Dashboard는 유동모델을 위한 오픈소스 프로그램으로 로컬 및 글로벌 데이터 세트를 사용하여 다수의 입력 매개변수를 신속하게 생성, 편집하고 모델 내 입력을 시각화하도록 설계된 그래픽 사용자 인터페이스(GUI) 이다. 특히 Delft Dashboard에 제공하는 개방경계조건을 이용하면 격자영역을 인식하여 개방경계를 자동으로 분배 및 지정하고, 각 개방경계 위치에서 분조별 조석조화상수 값도 산출되므로 유동 모델의 편의성을 증대시킬 수 있지만 상황에 따라 적합하게 경계를 분배하여 개방경계로 지정하는 것이 중요하다. 본 연구에서는 Delft Dashboard에서 제공하는 개방경계조건 중 TPXO 8.0을 이용한 Delft-3D 해수유동 수치모의를 수행하여 개방경계조건이 결과에 미치는 영향을 분석하였다. TPXO 8.0의 경우 격자영역에서 개방경계조건을 설정할 때 사용자가 경계조건에 포함될 격자 수를 지정하면 전체 격자경계에서 격자 수에 해당하는 만큼 경계를 나누어 개방경계를 지정하고 각 개방경계 위치에서의 분조별 조석조화상수값을 산출한다. 특히 격자 수에 따라 개방경계로 지정되는 정도에 따른 영향을 분석하기 위하여 인위적으로 경계를 다양하게 분배하여 개방경계를 지정한 후 수치모의에 적용하였다. 수치모의는 동해안 고리원전 인근을 대상으로 격자 생성 후 Delft Dashboard TPXO 8.0을 이용하여 전술된대로 다양한 개방경계조건을 생성하였고 이를 Delft-3D내 적용하여 해수유동 모의를 수행하였다. 각 개방경계 조건별 초기 수면 변위 분석 및 인근 조위관측소의 관측값의 비교를 통해 개방경계조건이 모의결과에 미치는 영향을 분석하였다.

  • PDF

Proposal of Public Data Quality Management Level Evaluation Domain Rule Mapping Model

  • Jeong, Ha-Na;Kim, Jae-Woong;Chung, Young-Suk
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.189-195
    • /
    • 2022
  • 정부는 공공데이터의 민간 개방, 활용을 장려함으로써 신산업, 일자리 창출 등 창조경제 활성화에 기여하는 것을 주요 국정과제로 삼고 있다. 그리고 고품질 공공데이터 보유를 위해 공공데이터 품질관리 수준평가 진행 등의 활동을 통해 공공데이터 품질 향상을 도모하고 있다. 그러나 품질진단 도구 사용자의 데이터 전문성, 이해도에 따라 공공데이터 품질관리 수준평가 결과에 격차가 발생하기 때문에 진단 결과의 정확성을 보장하기 어렵다. 본 논문은 데이터 이해도가 낮은 사용자의 진단 결과에 대한 정확성을 보장하기 위해 데이터 품질진단 기준 중 유효성 진단에 적용 가능한 공공데이터 품질관리 수준평가 도메인규칙 매핑 모델을 제안하였다. 또한 모델에 실제 데이터를 적용한 결과 공공데이터 품질진단의 안정성과 정확성을 높이는 것을 확인하였다.

사전기반 항목명 표준화 시스템 설계 및 구현 (Design and Implementation of Dictionary-based Column Name Standardization System)

  • 신수미;문영수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.621-624
    • /
    • 2021
  • 최근 빅데이터에 대한 관심이 높아지면서 분석을 위해 필요한 데이셋의 표준화에 대한 중요성이 강조되고 있다. 데이터 표준화를 위해서는 업무 처리에 필요한 모든 데이터의 명명 규칙을 규정하고 그 기준에 따라 표준 명칭을 부여하여야 한다. 본 연구에서는 사전을 기반으로 하는 항목명 표준화 시스템을 제안하였다. 제안한 시스템은 공개된 표준단어사전을 활용하여 유의어를 포함한 참조 사전을 구축하고 이를 기반으로 표준사전을 구축하여 표준 항목명을 제공한다. 기 구축된 데이터셋의 항목명을 입력하거나 사용자가 원하는 새로운 항목명을 입력하면 항목명 표준화 시스템은 표준화된 한글 항목명과 영문 항목명, 그리고 테이블 설계에 사용하는 영문 약어명을 출력한다. 본 연구에서 제안한 시스템을 테이블 설계에 활용하거나 기 구축된 데이터셋을 표준화하는데 적용하면 일관된 데이터 해석이나 관리가 가능할 것으로 기대된다.

  • PDF