• 제목/요약/키워드: 데이터 표준화

검색결과 1,713건 처리시간 0.026초

웹 사전 크롤링을 이용한 데이터베이스 메타데이터 표준화 처리 모델 (Database metadata standardization processing model using web dictionary crawling)

  • 정하나;박구락;정영석
    • 디지털융복합연구
    • /
    • 제19권9호
    • /
    • pp.209-215
    • /
    • 2021
  • 데이터 품질 관리는 최근 중요한 이슈로 자리잡았다. 데이터베이스의 메타데이터 표준화는 데이터 품질관리 방안 중 하나이다. 본 연구에서는 일관된 메타데이터 관리를 위하여 표준단어사전 관리를 지원하는 알고리즘을 제시한다. 해당 알고리즘은 웹 사전 크롤링을 통해 데이터베이스 메타데이터의 동의어 관리 자동화를 지원한다. 또한 웹 사전 크롤링 과정에서 생길 수 있는 동음이의어 판별 이슈를 해결하여 데이터의 정확도를 향상시킨다. 본 연구에서 제안하는 알고리즘은 기존의 수동적 관리에 비해 메타데이터 데이터 품질의 신뢰도를 높인다. 또한 이음동의어 데이터 등록 및 관리에 소비되는 시간을 단축시킬 수 있다. 새로운 데이터 표준화 부분 자동화 모델에 대한 추가 연구는 향후 데이터 표준화 프로세스에서 자동화 가능한 작업을 파악하여 진행되어야 한다.

기계학습 활용을 위한 학습 데이터세트 구축 표준화 방안에 관한 연구 (A study on the standardization strategy for building of learning data set for machine learning applications)

  • 최정열
    • 디지털융복합연구
    • /
    • 제16권10호
    • /
    • pp.205-212
    • /
    • 2018
  • 고성능 CPU/GPU의 개발과 심층신경망 등의 인공지능 알고리즘, 그리고 다량의 데이터 확보를 통해 기계학습이 다양한 응용 분야로 확대 적용되고 있다. 특히, 사물인터넷, 사회관계망서비스, 웹페이지, 공공데이터로부터 수집된 다량의 데이터들이 기계학습의 활용에 가속화를 가하고 있다. 기계학습을 위한 학습 데이터세트는 응용 분야와 데이터 종류에 따라 다양한 형식으로 존재하고 있어 효과적으로 데이터를 처리하고 기계학습에 적용하기에 어려움이 따른다. 이에 본 논문은 표준화된 절차에 따라 기계학습을 위한 학습 데이터세트를 구축하기 위한 방안을 연구하였다. 먼저 학습 데이터세트가 갖추어야할 요구사항을 문제 유형과 데이터 유형별로 분석하였다. 이를 토대로 기계학습 활용을 위한 학습 데이터세트 구축에 관한 참조모델을 제안하였다. 또한 학습 데이터세트 구축 참조모델을 국제 표준으로 개발하기 위해 대상 표준화 기구의 선정 및 표준화 전략을 제시하였다.

지상파 DMB 국내표준화와 국제표준화

  • 김대중
    • 정보와 통신
    • /
    • 제25권5호
    • /
    • pp.80-84
    • /
    • 2008
  • 지상파 DMB는 유럽의 디지털 오디오 방송(DAB)인 Eureka-147 표준에서 규정한 스트림 모드를 통하여 MPEG-4 AVC 비디오 압축 데이터, MPEG4 BSAC오디오 압축 데이터, 그리고 대화형 데이터 방송을 위한 MPEG-4 BIFS 데이터를 MPEG-4 S와 MPEG-2 TS로 다중화한 후, RS(204, 188) 및 길쌈 끼워 짜기에 의한 추가 오류 보호 메커니즘이 적용된 스트림을 전송하는 방식으로 초기 시스템의 주요 목적은 오디오 방송이었으나, 국내에서 이동 수신에 탁월한 DMB의 데이터 채널을 이용하여 동영상 비디오를 전송하는 방법을 표준화한 규격이다. 모바일 이동 멀티미디어 방송을 위한 표준 방식은 정보통신부에서 2003년 결정되었고 세부적인 표준 규격초안은 차세대방송포럼에서 만들어져 TTA DMB 프로젝트그룹에서 제안되어 심층적인 토론을 통해 2003년 10월 1차 버전이 제정되었다. 국내표준은 개정과 후속표준을 제정하였고 국제표준화가 추진되어 2005년 6월 유럽표준으로, 2007년 12월 ITU국제표준으로 제정 반영되었다. 본고에서는 독자들은 직관적 이해력을 돕고자 시배열 표로 지상파 DMB송수신 정합표준에 대한 국내표준화 추진 현황을 정리하였다.

응용시스템 구축을 위한 OLE/COM 기반의 GIS 데이터 제공자 컴포넌트 시스템에 관한 연구 (A Study on OLE/COM-based GIS Data Provider Component Development Toward Application System Development)

  • 김민수;김광수;오병우;이기원
    • Spatial Information Research
    • /
    • 제7권2호
    • /
    • pp.175-190
    • /
    • 1999
  • 최근 GIS 관련 기술이 급속도로 발전되고 안정화됨에 따라 기 구축된 우수한 GIS 기술들의 재사용 문제가 제기되고 있다. 현재 이러한 재사용 문제들은 GIS 모듈의 컴포넌트화와 표준 인터페이스 제정을 기본 방향으로 하는 GIS의 표준화 연구 방향으로 해결책을 모색하고 있다. [1] 현재 GIS 표준화 연구는 초기 단계로서 GIS 하부구조의 표준화, 다시 말하면 범세계적으로 통용될 수 있는 GIS 정보의 표준 하부구조의 구축에 역점을 두고 있다. 이러한 표준화 작업은 국제적인 GIS 선도 업체 위주로 구성된 개방형 GIS 정보의 표준 하부구조의 구축에 역점을 두고 있다. 이러한 표준화작업은 국제적인 GIS 선도 업체 위주로 구성된 개방향 GIS 컨소시엄(OGC : Open GIS Consortium)을 주축으로 하여 국제적인 GIS의 표준모델을 제시하고 있다. 특히 본 연구에서는 개방형 GIs 컨소시엄(OGC ; OpenGIS Consortium)에서 제안한 OLE/COM Simple Feature 구현 사양 1.1을 주축으로 하여 응용 시스템에 표준화된 방식으로 GIS 데이터를 서비스할 수 있는 데이터 제공자(Data Provider) 컴포넌트의 구축에 관한 사항을 종합적으로 살펴보고자 한다. 다양한 데이터베이스 시스템 또는 파일 시스템을 GIS 데이터의 기반으로 하여 표준화된 인터페이스를 제공할 수 있는 데이터 제공자 컴포넌트의 구축 방법, 데이터 제공자 컴포넌트들간의 GIS 데이터의 공유 방법 그리고 응용시스템에서의 데이터 제공자 컴포넌트 이용 방법에 관하여 중점적으로 살펴볼 것이다. 특히 이러한 OGC 사양의 데이터 제공자 컴포넌트를 구현하는 과정에서 야기되는 문제점들을 리스트하고 이의 해결방안에 대하여서도 논의할 것이다. 그리고 본 연구에서는 데이터 제공자 컴포넌트의 설계 및 분석과정을 수행함에 있어서 UML(Univied Modeling Language)을 이용함으로서 향후 타데이터 제공자 컴포넌트 개발을 위한 모델을 제시하고 있다.

  • PDF

효율적인 CRM을 위한 데이터구조 품질관리 방안 (Data Structure Quality Management for efficient CRM)

  • 이선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.1-5
    • /
    • 2007
  • 고객 데이터 중심의 통합을 근간으로 하는 CRM을 추진하면서 데이터 품질은 필수적인 선결과제로 인식되고 있어, 데이터 품질 개선을 위해 데이터, 데이터구조, 데이터관리프로세스를 대상으로 활발한 연구가 진행되고 있다. 본 논문에서는 데이터 품질 개선을 위해 표준화를 통한 데이터구조에 대한 품질관리 모델을 제안하고, 제시한 모델을 적용하여 기존 시스템의 관리 항목을 현저히 감소시켜 데이터구조의 품질을 개선하고 데이터구조 표준화 관리 시스템을 통하여 지속적인 개선이 가능하도록 하였다.

  • PDF

고속 인터페이스 기술과 표준화 동향

  • 정태식;주범순;정해원
    • 전자공학회지
    • /
    • 제31권8호
    • /
    • pp.73-82
    • /
    • 2004
  • SONET/SDH 전송망에서의 데이터 전송율은 10Gb/s급인 OC-192에서 40Gb/s급인 OC-768 로 발전하였으며, 이더넷 (Ethernet)에서의 데이터 전송율은 1998년 1기가비트 이더넷 기술이 표준화된데 이어 2002년에 10기가비트 이더넷기술의 표준화가 완료되었고 조만간 후속 기술로서 40Gb/s또는 100Gb/s급의 이더넷에 대한 논의가 대두될 것으로 예측된다.(중략)

  • PDF

표준화된 데이터베이스 구축을 통한 지하철 통신설비의 효율적 관리방안 연구 (A Study on the Maintenance of Communication Facilities using the Standardized Database)

  • 김길동;신정렬;이우동;강승욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 전문대학교육위원
    • /
    • pp.99-102
    • /
    • 2004
  • 21세기 정보화시대에 맞추어, 도시철도운영기관의 전략적 발전과 도시철도의 정보화 기술 축적 및 표준화된 정보 인프라 구축의 일환으로 도시철도 시설물 유지보수체계를 표준화하고 정보화시스템을 구축중에 있다. 이중, 도시철도 통신 설비의 효율적인 유지보수를 위해서 유지보수체계의 표준화 및 정보화시스템 구축을 통한 실시간 정보의 구축 및 기존 유지보수작업 이력정보의 관리가 매우 중요하다. 본 연구에서는 도시철도 통신 설비의 효율적인 유지관리를 위한 데이터베이스 설계 및 구축방안에 대하여 제시하였다. 통신 설비의 데이터베이스 구축을 위하여 표준분류체계를 수립하였고, 관리항목 및 유지보수작업항목을 표준화하였으며, 유지 보수업무절차를 표준화하고 도면 및 각종 문서양식을 표준화하였다. 통신 설비의 데이터베이스는 개체관계모델(ERB)을 사용하여 설계하였고 특히, 통신 설비는 위치정보와 밀접한 관계를 가지고 있으므로 일반 데이터 외에 GIS용 공간 데이터베이스를 구축하여 서로 연관된 Key를 가지고 상호조회가 가능하도록 설계하였다. 그리고, 통신 설비에 대한 기초 데이터를 구축하기 위한 방안으로 엑셀조사 양식을 통하여 방대한 기초 자료를 작성하고, $SQL^*$Loader 등의 데이터 변환프로그램을 활용하여 데이터베이스에 일괄 등록되도록 하는 방안을 제시하였다 또한. 도면반입절차서 및 표준도면작성지침서, 그리고 GIS DB 구축지침서를 통하여 표준화된 데이터베이스 구축이 이루어지도록 하였다.

  • PDF

표준화된 데이터베이스 구축을 통한 지하철 신호장치의 효율적 관리방안 연구 (A Study on the Maintenance of Signal Facilities using the Standardized Database)

  • 김길동;신정렬;이우동;강승욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 전문대학교육위원
    • /
    • pp.130-133
    • /
    • 2004
  • 21세기 정보화시대에 맞추어, 도시철도운영기관의 전략적 발전과 도시철도의 정보화 기술 축적및 표준화된 정보 인프라 구축의 일환으로 도시철도 시설물 유지보수체계를 표준화하고 정보화시스템을 구축중에 있다. 이중, 도시철도 신호 장치의 효율적인 유지보수를 위해서 유지보수체계의 표준화 및 정보화시스템 구축을 통한 실시간 정보의 구축 및 기존 유지보수작업 이력정보의 관리가 매우 중요하다. 본 연구에서는 도시철도 신호 장치의 효율적인 유지관리를 위한 데이터베이스설계 및 구축방안에 대하여 제시하였다. 신호 장치의 데이터베이스 구축을 위하여 표준분류체계를 수립하였고, 관리항목 및 유지보수작업항목을 표준화하였으며, 유지보수업무절차를 표준화하고 도면 및 각종 문서양식을 표준화하였다. 신호 장치의 데이터베이스는 개체관계모델(ERD)을 사용하여 설계하였고 특히, 신호 장치는 위치 정보와 밀접한 관계를 가지고 있으므로 일반 데이터 외에 GIS용 공간 데이터베이스를 구축하여 서로 연관된 Key를 가지고 상호조회가 가능하도록 설계하였다. 그리고, 신호 장치에 대한 기초 데이터를 구축하기 위한 방안으로 엑셀조사 양식을 통하여 방대한 기초 자료를 작성하고, SQL*Loader 등의 데이터 변환프로그램을 활용하여 데이터베이스에 일괄 등록되도록 하는 방안을 제시하였다 또한, 도면반입절차서 및 표준도면작성지침서, 그리고 GIS DB 구축지침서를 통하여 표준화된 데이터베이스 구축이 이루어지도록 하였다.

  • PDF

기후환경 변화예측 위한 데이터 표준화에 관한 연구 (Study on Data Standardization for Predicting Climate and Environment Change)

  • 김무준;김계현;남기범;김나영
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 추계학술대회
    • /
    • pp.350-354
    • /
    • 2010
  • 전 세계적인 지구 온난화 현상으로 해수면 상승과 생태계 변화가 발생하여 기후변화에 대한 사회적관심이 증가하고 있다. 이와 더불어 기후변화와 지구환경시스템의 대기, 수권, 생물권, 지표면 동 각 권역간의 상호작용과 피드백을 고려한 연구가 증가하고 있는 실정이다. 기후와 환경을 통합적으로 분석하여 기후변화에 따른 지구환경시스템의 변화특성을 이해하고 이러한 피드백 과정을 파악하기 위해서는 분석 자료의 원활한 공유와 연계를 위한 통합 데이터베이스 구축이 필요하다. 이를 위해서는 먼저 다양한 기후/환경 연구 분야의 자료를 관리하기 위한 데이터의 의미, 명칭, 정의 등에 대한 원칙의 수립이 요구된다. 따라서 본 연구에서는 기후/환경 변화예측 연구 자료의 원활한 공유와 관리를 위한 데이터 표준화 연구를 수행하였다. 기후/환경 변화예측 연구 분야의 자료 현황을 조사 및 분석하였고 그에 따른 자료 관리 방안을 마련하였다. 그 결과 관리할 오브젝트를 기준으로 기후/환경 연구 분야의 데이터 표준화를 수행하였고 표준단어, 표준도메인, 표준용어를 정의하였다. 데이터 표준화 결과는 기후/환경 변화예측 자료를 관리하고 공유하는데 있어 데이터의 의미를 효율적으로 파악하고, 데이터베이스 설계과정에서 데이터의 품질과 생산성을 향상 시킬 수 있다. 향후 연구에서는 데이터베이스 개념적 엔티티의 속성설계 단계부터 데이터 표준을 적용한 통합 데이터베이스 구축이 필요하다.

  • PDF

한국과학기술정보연구원의 정보유통부문 표준화 현황분석 (A Survey on the Standardization of Information Service Sector in KISTI)

  • 이윤석;서태설
    • 정보관리연구
    • /
    • 제32권2호
    • /
    • pp.40-53
    • /
    • 2001
  • 이 연구의 목적은 KISTI의 정보유통 관련 부서들이 채택하고 있는 지식정보의 표준 및 기술 활용실태와 문제점을 파악하여, 향후의 국가 지식정보 표준화 기반구축의 기반자료를 수집하는 것이다. 데이터의 수집은 설문조사와 인터뷰를 통하여 수행되었고, 주요한 분석의 내용은 데이터 관리, 교환 및 통신 네트워크 운영의 표준화의 측면에서 검토되었다. 총 50종의 원내 DB 운영 체제 및 소프트웨어 활용과 표준의 활용 현황 분석에서 시급히 추진할 표준화의 과제는 과학기술분류, 메타데이터, 데이터 모델링, 데이터 포맷 및 DBMS, 과학기술용어, 검색프로토콜 등으로 나타났다.

  • PDF