• 제목/요약/키워드: 데이터 특성

검색결과 10,155건 처리시간 0.046초

데이터 오류에서 추출한 데이터 품질 특성 (Extraction of Data Quality Characteristics from Dirty Data)

  • 김수경;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.549-551
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제표준인 ISO/IEC 9126은 소프트웨어 품질 및 특성 및 측정 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 데이터 오류 형태를 분류하고, 이를 기반으로 데이트 품질 특성 및 부특성을 분류한다. 데이터 품질 특성 분류는 ISO/IEC 9126에 정의한 소프트웨어 품질 특성을 데이터 오류 형태에 대응시켜 추출한다. 본 논문에서 제시하는 데이트 품질특성 분류는 지식 공학(knowledge engineering)시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

데이터 분석을 통한 통합물관리 유역관리방안 연구 (A Study on Water Management of Integrated Watershed Management Using Data Analysis)

  • 조부건;정우석;김영도
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.80-80
    • /
    • 2020
  • 최근 국내·외에서 빅 데이터에 관한 관심이 높아지고 있으며 수자원 분야에서도 빅데이터 활용의 중요성이 강조되어 왔다. 물관리를 위해서는 기본적으로 물관련 기초데이터가 충분해야 하며, 최근 선진국에서 효과적인 통합물관리를 위해서 빅데이터를 활용한 유역관리 방안이 시도되고 있는 실정이다. 일본의 경우 물환경 데이터와 사회과학 데이터를 활용한 유역특성 파악한다. 다양한 방법의 유역특성을 분석하여 유역관리계획을 마련한다. 국내에서의 물환경 관리계획은 부하량을 기반으로한 수립으로 데이터의 다양상이 부족한 부분이 있다. 하천은 각기 다른 특성을 가지고 있다. 낙동강 유역은 22개의 중권역으로 이루어져 있으며 각 중권역은 다양한 문제점과 특성을 가지고 있다. 따라서 유역의 특성에 따른 유역관리방안이 필요하다고 판단된다. 본 연구에서는 데이터 분석을 활용하여 유역의 종합적 분석을 통해 유역을 진단하고자 한다. 또한 물관련 지표들을 활용하여 유역을 평가하고 시각화 그래프를 통해 유역의 기초자료들의 특성을 나타내고 결과를 통해 데이터 분석을 기반으로 한 유역특성을 분석하여 맞춤형 유역관리방안을 모색하고자 한다.

  • PDF

오류 데이터로부터의 데이터 품질 메트릭의 정립 (Establishing Data Quality Metric from Dirty Data)

  • 김수경;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.409-411
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제 표준인 ISO/IEC9126은 소프트웨어 품질 특성 및 측적 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 오류 데이터 형태를 분류하고, 이를 기반으로 데이터 품질 특성을 추출한다. 추출된 데이터 품질 특성을 측정하기 위해, 오류 데이터를 품질 속성으로 하는 데이터 품질 특성을 추출한다. 본 논문에서 제시하는 데이터 품질 메트릭은 지식 공학(knowledge engineering) 시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

히스토그램 비교법을 이용한 영역기반 유사 이미지 검색 (A Region Based Similar Image Retrieval using Histogram Comparison)

  • 임동혁;김창룡;정진완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.130-132
    • /
    • 2000
  • 주요 멀티미디어 자료인 이미지는 데이터 특성을 표현하기가 어렵고, 특성추출에서 얻은 데이터가 너무 고차원적이라 이를 저차원의 처리가능한 데이터로 변환하는 과정에서 많은 손실이 있다. 이미지의 특성값을 전체 이미지의 평균값으로 변경하여 저차원 데이터를 얻는 기존의 이미지 전체 특성추출기법이나 고정된 블록의 평균값으로 변경하여 저차원 데이터를 얻는 이미지 블록 특성추출기법은 유사 이미지의 검색이 부정확하다는 단점이 있다. 본 논문에서는 이미지를 가변적인 영역으로 나누어 특성값을 얻고, 히스토그램을 이용하여 효율적으로 유사 이미지를 찾는 영역기반 유사 이미지 검색기법을 제안하고 이를 구현하였다.

  • PDF

빅데이터를 활용한 유역수질관리방안 (A study on Watershed Water Quality Management Plans Based on Big Data Analysis)

  • 조부건;정우석;김영도
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.90-90
    • /
    • 2021
  • 물 관리를 위해서는 물 관련 정보 혹은 데이터가 있어야 하며, 최근 효과적인 물관리를 위해서 스마트 물관리 혹은 빅데이터를 활용한 물관리가 자주 언급되고 있는 실정으로 물 관리에서도 일찍부터 빅데이터 활용의 중요성이 강조되어 왔으며, 유역관리는 본질적으로 다양한 정보의 수집 가공 처리를 필요로 하기 때문에 필수적으로 빅데이터 기술이 필요한 분야라 할 수 있다. 국내 물 환경관리는 대권역, 중권역 물환경관리계획, 수질오염총량제와 같이 오염원과 부하량을 기반으로 하여 목표수질의 달성여부를 통하여 유역을 관리하고 있다. 수질오염총량관리제도는 수질관리의 효율성, 각 행정 주체들의 책임성을 강화하여 목표수질을 달성하고자하는 제도로 환경과 개발을 고려한 국내에서의 핵심적 유역관리 제도이다. 이와 함께 각각의 특성을 가진 유역에서 유역특성을 반영할수 있는 유역관리방안이 필요하며 따라서 다양한 정보들의 활용하여 특성을 분석하는 빅데이터를 적용하여 유역의 특성을 반영한 유역관리방안을 연구하고자 한다. 수질, 기상, 수리, 수생태등 각 기관에서 제공하는 데이터를 융복합적으로 확보하여 유역 여건에 맞는 실현가능한 현실적인 물관리 대책이 필요하다. 이에 빅데이터 구축 및 데이터 분석을 적용하여 유역의 다양한 정보들을 활용하여 유역의 특성을 반영한 실효성 있는 유역에서의 수질관리방안의 마련하고자 한다.

  • PDF

관계망 데이터 특성을 이용한 모바일 인맥 네트워크의 시각화에 관한 연구 (A study on the Human Network Visualization on Mobile Phone for Characteristics of Relational Data)

  • 정겨운;이경원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.424-431
    • /
    • 2007
  • 본 연구는 관계망 시각화에 이용되는 데이터의 특성을 분석하고 그에 맞는 시각화 요소를 추출하여 시각화하는 것에 관한 연구이다. 사회 관계망 시각화는 점과 선을 기초 요소로 하여 점은 사회적 요소(actor), 선은 관계(relation)를 의미한다, 점과 선은 시각화에 사용되는 데이터의 특성에 따라 다양한 형태를 갖게 된다. 이 논문에서는 관계망 시각화에 사용되는 데이터의 특성을 데이터의 형태, 관계, 상태에 따라 분류하고, 각각의 특성에 맞는 관계망 시각화의 형태를 추출하고, 그에 따른 시각화 요소를 추출하였다. 이를 바탕으로 모바일 커뮤니케이션을 통해 형성되는 인맥 네트워크를 시각화함으로써, 인맥 네트워크 구성원 간의 친밀도를 효과적으로 파악할 수 있는 방법에 대해 제시하였다. 또한, 시각화의 결과를 이용하여 휴대전화로 인맥 네트워크를 유지, 관리하기 위한 서비스를 제안하였다. 이러한 연구는 데이터의 특성에 맞는 시각화의 요소를 추출하고, 데이터의 형태, 관계, 상태를 직관적으로 제공함으로써 사용자로 하여금 자신의 인맥 네트워크 구성원들의 친밀도와 관계 형태, 상태를 파악하여 자신의 인맥을 유지, 관리하고 보수할 수 있도록 한다.

  • PDF

공공개방데이터 품질 특성에 관한 연구 (Quality Characteristics of Public Open Data)

  • 박고은;김창재
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.135-146
    • /
    • 2015
  • 공공데이터 개방은 민간을 포함한 누구나 공공데이터를 자유롭게 재이용하여 국민 삶의 질을 높이고 신(新) 산업, 일자리 창출로 창조 경제 활성화에 기여하고자 하는 목표를 가진다. 공공데이터 개방은 전 세계적으로 중요성이 강조되고 있는 정책이며, 개방의 성공 사례들이 만들어지고 있다. 공공개방데이터는 공공의 목적을 달성하기 위해 이에 적합한 품질을 갖추어야 한다. 그러나 공공데이터 품질 관리와 표준화의 미흡으로 인한 오류데이터 발견 및 활용성 저하 문제가 제기되며, 품질에 관한 가이드라인이 미흡하다. 이에 본 연구에서는 기존의 데이터 품질과 공공데이터 품질, 공공 서비스 품질에 관한 복합적 시각을 적용한 연구를 통해 개방 공공데이터가 갖춰야 할 품질 특성에 대해 도출하고 전문가 설문을 통해 모델을 수정 및 검증하였으며, 그 결과 공공개방데이터의 품질 특성으로 공공성, 활용성, 신뢰성, 적합성을 도출하였다. 공공개방데이터의 품질 향상과 활용 활성화를 위해 갖춰야 할 품질 특성을 제시함에 본 연구의 의의가 있다.

계층적 스토리지 시스템에서 데이터 특성을 이용한 데이터 이동기법 (A Data Migration Method Based on Characteristics of Data for Hierarchical Storage System)

  • 이주운;김신우;이용규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.1675-1678
    • /
    • 2005
  • 최근에는 대량의 데이터를 저장 및 관리하기 위해서 3차 저장장치를 이용한 계층적 스토리지 시스템을 이용하고 있다. 이러한 계층적 스토리지 시스템에서는 모든 데이터에 같은 방식으로 저장장치들 간의 데이터를 이동하고 있는데, 이는 시스템에서의 데이터 이동이 빈번하게 일어나는 원인이 된다. 이러한 문제를 해결하기 위해서, 본 논문에서는 계층적 스토리지 시스템에서의 데이터 특성을 이용한 데이터 이동 기법을 제안한다. 이를 위해서 데이터를 일반 데이터, QoS 데이터 그리고 아카이브 데이터로 분류하고 각 데이터 타입에 따른 데이터 이동을 관리한다. 성능평가를 통해 데이터 특성을 고려한 데이터 이동 방법과 기존의 이동 방법을 비교 분석하여, 본 논문에서 제안한 이동 방법의 우수함을 보인다.

  • PDF

데이터 마이닝 기법을 이용한 학습 능력 분석 시스템 개발 (Application of Data Mining Technique in Characterizing the Scholastic Aptitude of the Students)

  • 김범은;김덕희;원유집
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.144-146
    • /
    • 1999
  • 데이터 마이닝은 대량의 데이터로부터 데이터 내에 존재하는 관계, 패턴, 규칙 등을 찾아내고 모형화 함으로서 유용한 지식을 추출하는 방법이다. 데이터 마이닝을 이용한 이 시스템은 데이터를 비슷한 특성을 가지는 집단으로 분류하여 집단의 특성을 찾아내고 데이터 항목간의 연관성을 유출해 내어 학생들의 적절한 학습지도 영역을 찾아내는데 목적이 있다. 본 논문에서는 개발한 시스템에서 수학 학습 능력에 대한 특성을 도출해 내는 방법을 알아보고, 어떻게 기존의 학원의 역할을 대신할 수 있는지 검증한다.

  • PDF

건설 장비 운영 데이터 분포 특성에 관한 연구 - 버력 처리 시스템을 중심으로 - (An Analysis on the Data Distribution of Construction Equipment Operations - A Case on Muck Hauling System -)

  • 서형범;정원지;김경민;김경주
    • 대한토목학회논문집
    • /
    • 제26권4D호
    • /
    • pp.661-670
    • /
    • 2006
  • 건설 공정계획을 수립함에 있어 시뮬레이션의 제한적인 활용은 시뮬레이션 관련 데이터의 수집과 모델 구축의 어려움에 그 원인을 두고 있다. 본 연구에서는 시뮬레이션 관련 데이터 수집과 분석을 통하여 건설 장비 운영 특성 데이터 축적과 데이터 분포 특성 분석 방법론을 제시하였다. 실제 현장에서 측정한 건설 장비 운영 데이터를 확률 통계적 기법을 적용하여 데이터의 분포 특성을 분석하였으며, 이러한 데이터 축적 및 데이터베이스(DB)화는 시뮬레이션 입력 데이터의 지원과 건설 장비 운영 계획에 다시 사용되어 건설 관련 정보의 효율적 활용이 가능하다.