• 제목/요약/키워드: 검증 데이터

검색결과 7,169건 처리시간 0.035초

XML 변경 유효성 검증을 위한 경계락킹에 기초한 시퀀스 그룹 검증기법 (Sequence Group Validation based on Boundary Locking for validation of updating XML)

  • 최윤상;박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.61-63
    • /
    • 2004
  • DTD에 의해서 문서의 형식이 정의된 valid XML을 XML 데이터베이스 시스템을 사용하여 관리하는 경우 XML의 변경은 그 변경 결과가 DTD에 대한 유효성(validity)을 만족시킬 때에만 수행되어야 한다. 이것은 다수의 사용자에 의해서 데이터가 공유되는 데이터베이스 시스템의 데이터 무결성과 관련되는 문제이기 때문에 XML 문서 변경에 대한 DTD 유효성은 XML 데이터베이스 시스템에서 중요한 속성이라고 할 수 있다. 변경 연산의 결과에 대한 XML의 유효성을 보장하기 위해서 변경의 유효성을 검증하는 방법을 사용할 수 있다 XML에서의 엘리먼트들은 순서 관계를 가질 수 있으며 DTD는 이러한 엘리먼트 순서 관계들을 정의하고 있기 때문에 이러한 유효성 검증 기법은 변경되는 데이터 아이템 외에도 주변의 데이터 아이템-엘리먼트-들에 대한 순서 정보를 필요로 한다. 그리고 데이터베이스와 같은 다중 사용자 환경에서 유효성 검증 기법이 정확하게 수행되기 위해서는 유효성 검증이 필요한 정보들이 다른 트랜잭션에 더해 변경되지 않도록 하는 병행수행 제어 기법을 필요로 한다 이렇게 유효성 검증 기법과 병행수행 제어 기법이 관련을 가지고 있음에도 불구하고 기존의 유효성 검증 기법은 오직 검증의 효율성에만 초점을 맞추고 있다. 본 연구는 유효성 검증의 검증 범위를 최소화 시켜 pan-out 값이 큰 XML 문서에 대해서도 유효성 검증이 효율적으로 수행될 수 있고, 또한 유효성 검증을 위해 락킹되는 데이터 아이템의 수란 최소화 할 수 있는 시퀀스 그룹 검증 기법을 제안한다. 또한 이 검증 기법의 정확을 보장하면서도 높은 트랜잭션 병행수행 성능을 보장한 수 있는 경계 락킹 기법을 제안한다. 제안된 유효성 검증 기법과 경계 락킹 기법은 유효성 검증의 정확성을 일해 병행수행 성능이 저하될 수바에 없는 기존의 기법들의 문제점들을 해결하여 XML 데이터 베이스 시스템이 안정적인 성능을 제공할 수 있다는 것을 실험을 통해 확인할 수 있었다.

  • PDF

ICT 기반 환경모니터링 센서 데이터 검증을 위한 원스탑 플랫폼 (One-stop Platform for Verification of ICT-based environmental monitoring sensor data)

  • 채민아;조재혁
    • Journal of Platform Technology
    • /
    • 제9권1호
    • /
    • pp.32-39
    • /
    • 2021
  • 기존 환경측정기기는 전자파 및 친환경 제품 인증, 내구성 시험 위주이며, 센서 신뢰성 검증 및 측정 데이터에 대한 검증은 형식 승인 및 등록, 인수시험, 초기교정, 주기시험 등을 통해 센서 성능평가 위주로 수행된다. 본 플랫폼은 각 타겟 센서별 성능평가 뿐만 아니라 센서의 데이터 신뢰성에 대한 검증체계 지원 ICT 기반 환경 모니터링 센서 신뢰성 검증 체계를 구축하였다. 환경 정보에 대한 센서 데이터를 수집할 센서보드를 제작하였고 센서 및 데이터 신뢰성 평가 및 검증 서비스 체계를 규격화 하였다. 또한, ICT 기반 센서 데이터 신뢰성 평가 및 검증을 위해 LoRa 통신을 이용한 센서 데이터 플랫폼 모니터링 프로토타입을 제작하였고 이를 스마트 시티 등에 실증 테스트하였다. 해당 시스템을 통해 받은 데이터 분석을 위해 머신러닝을 이용하여 최적화 알고리즘 개발하였다. 이를 통해 신뢰성 검증을 위한 센서 빅데이터 분석시스템을 구축하였고 통합 평가 및 검증 시스템의 기반을 마련하였다.

단백질 상호작용 데이터의 신뢰도 검증 기법 (A scoring method for evaluating the reliability of protein-protein interaction data)

  • 홍진선;한경숙
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.292-294
    • /
    • 2004
  • 단백질 상호작용 검출 방법의 발달로 많은 양의 데이터가 산출되고 있고, 이러한 상호작용 데이터의 방대한 양으로 인해 통계적 방법을 이용하여 데이터를 처리함으로서 유용한 지식을 얻을 수 있다 예측한 상호작용 데이터는 첫째, 대량의 데이터를 생산해내므로, 많은 false-positive를 내포하고 있고, 둘째, 예측한 상호작용을 검증시 실험을 하는 방법 외에는 신뢰도를 측정하기가 어렵다는 문제점이 있다. 본 연구에서는 점수 할당시스템을 사용함으로서 예측한 인간 단백질 상호작용 데이터의 false-positive를 줄이고, 각각 상호작용에 점수를 부설함으로서 상호작용 데이터의 신뢰도를 검증하는 방법을 제안하고 있다.

  • PDF

HyperCLOVA를 이용한 한국어 Fact 검증을 위한 자동 데이터 생성 (HyperCLOVA for Data Generation of Korean Fact Verification)

  • 이종현;나승훈;신동욱;김선훈;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.118-123
    • /
    • 2021
  • 현대 사회에서 소셜 네트워킹 서비스의 증가와 확산은 많은 정보를 쉽고 빠르게 얻을 수 있도록 하였지만 허위·과장 정보의 확산이 큰 문제로 자리잡고 있다. 최근 해외에서는 이들을 자동으로 분류 및 판별하고자하는 Fact 검증 모델에 관한 연구 및 모델 학습을 위한 데이터의 제작 및 배포가 활발히 이루어지고 있다. 그러나 아직 국내에서는 한국어 Fact 검증을 위한 데이터가 많이 부족한 상황이기 때문에 본 논문에서는 최근 좋은 성능을 보이는 openai 의 GPT-3를 한국어 태스크에 적용시킨 HyperCLOVA 를 이용하여 한국어 Fact 검증 데이터 셋을 자동으로 구축하고 이를 최신 Fact 검증 모델들에 적용하였을 때의 성능을 측정 및 분석 하고자 하였다.

  • PDF

블록체인을 활용한 ECU 데이터 무결성 검증 시스템 (ECU Data Integrity Verification System Using Blockchain)

  • 변상필;김호윤;신승수
    • 산업융합연구
    • /
    • 제20권11호
    • /
    • pp.57-63
    • /
    • 2022
  • 자동차의 센서, 신호 등 데이터를 수집·처리하는 ECU 데이터가 공격에 의해 조작되면 운전자에게 피해를 줄 수 있다. 본 논문에서는 블록체인을 이용하여 자동차 ECU 데이터의 무결성을 검증하는 시스템을 제안한다. 자동차와 서버는 세션 키를 이용해 데이터를 암호화하여 송·수신하기 때문에 통신 과정에서 신뢰성을 보장한다. 서버는 해시 함수를 이용해 전송받은 데이터의 무결성을 검증한 후, 데이터에 이상이 없으면 블록체인과 off-chain인 분산저장소에 저장한다. ECU 데이터 해시값은 블록체인에 저장하여 변조할 수 없으며, 원본 ECU 데이터는 분산저장소에 저장한다. 해당 검증 시스템을 이용해 ECU 데이터에 대한 공격 및 변조를 사용자가 검증할 수 있으며, 악의적인 사용자가 ECU 데이터에 접근하여 데이터 변조 시 무결성 검증을 수행할 수 있다. 보험, 자동차 수리, 거래 및 판매 등의 상황에서 사용자의 필요에 따라 사용할 수 있다. 향후 연구로는 실시간 데이터 무결성 검증을 위한 효율적인 시스템 구축이 필요하다.

계수행렬을 이용한 외부 스토리지 무결성 검증 기법 (Outsourced Storage Auditing Scheme using Coefficient Matrix)

  • 은하수;오희국;김상진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권11호
    • /
    • pp.483-488
    • /
    • 2013
  • 사용자들은 외부 스토리지를 사용함으로써 언제, 어디서나 자신의 데이터에 접근할 수 있다. 하지만 자신의 데이터가 어떻게 관리되고 있는지는 알 수 없다. 심지어 자신의 데이터에 손상이 발생하여도 인지할 수 없다. 이와 같은 불편을 해결하기 위해 외부 스토리지 검증기법들이 제안되었다. 대부분의 기법들이 준동형 검증 태그(homomorphic verifiable tags)를 사용하고 있지만, 이는 데이터를 지수로 하여 계산하기 때문에 효율성에 한계가 있다. 본 논문에서는 외부 스토리지 무결성 검증의 새로운 접근 방법으로써 계수행렬을 이용한 기법을 제안한다. 제안하는 기법은 데이터를 계수행렬의 형태로 변환하여 검증에 사용한다. 검증과정은 선형연립방정식의 해를 구하는 형태로 진행되며, 검증자는 수식에 해벡터를 대입함으로써 쉽게 검증을 수행할 수 있다. 제안하는 기법을 사용하면 검증자는 sqrt(n) 크기의 데이터로 크기가 n인 데이터를 검증할 수 있다.

교사교육을 위한 공공 빅데이터 수집 및 스프레드시트 활용 기초 데이터과학 교육 사례 연구 (A Case Study of Basic Data Science Education using Public Big Data Collection and Spreadsheets for Teacher Education)

  • 허경
    • 정보교육학회논문지
    • /
    • 제25권3호
    • /
    • pp.459-469
    • /
    • 2021
  • 본 논문에서는 현장 교사 및 예비교사를 위한 기초 데이터과학 실습 교육 사례를 연구하였다. 본 논문에서는 기초 데이터과학 교육을 위해, 스프레드시트 SW를 데이터 수집 및 분석 도구로 사용하였다. 이후 데이터 가공, 예측 가설 및 예측 모델 검증을 위한 통계학을 교육하였다. 또한, 수천명 단위의 공공 빅데이터를 수집 및 가공하고, 모집단 예측 가설 및 예측 모델을 검증하는 교육 사례를 제안하였다. 이와 같은 데이터과학의 기초 교육내용을 담아, 스프레드시트 도구를 활용한 34시간 17주 교육 과정을 제시하였다. 데이터 수집, 가공 및 분석을 위한 도구로서, 스프레드시트는 파이썬과 달리, 프로그래밍 언어 및 자료구조에 대한 학습 부담이 없고, 질적 데이터와 양적 데이터에 대한 가공 및 분석 이론을 시각적으로 습득할 수 있는 장점이 있다. 본 교육 사례 연구의 결과물로서, 세가지 예측 가설 검증 사례들을 제시하고 분석하였다. 첫 번째로, 양적 공공데이터를 수집하여 모집단의 그룹별 평균값 차이 예측 가설을 검증하였다. 두 번째로, 질적 공공데이터를 수집하여 모집단의 질적 데이터 내 연관성 예측 가설을 검증하였다. 세 번째로, 양적 공공데이터를 수집하여 모집단의 양적 데이터 내 상관성 예측 가설 검증에 따른 회귀 예측 모델을 검증하였다. 그리고 본 연구에서 제안한 교육 사례의 효과성을 검증하기 위해, 예비교사와 현장교사의 만족도분석을 실시하였다.

ICT 기반 환경 모니터링 센서 데이터의 신뢰성 검증을 위한 플랫폼 (Platform of ICT-based environmental monitoring sensor data for verifying the reliability)

  • 채민아;조재혁
    • Journal of Platform Technology
    • /
    • 제9권1호
    • /
    • pp.23-31
    • /
    • 2021
  • 최근 몇 년간 국내 산업에서 센서 오작동과 환경 모니터링의 부재로 인한 유해가스 방출 등으로 인명피해가 발생하고 이러한 유해 물질이 감지할 수 있는 환경 센서의 평가는 내구성 시험 및 위해성 검사 위주이기 때문에 센서의 측정 데이터에 대한 신뢰성 검증에는 한계가 있다. 본 플랫폼은 환경센서의 신뢰성을 검증하고 수집한 데이터를 통해 환경 분석을 위해 주요한 10종의 물질에 대해 측정하는 센서 보드와 각 센서의 성능 검증 체계를 설계하였다. 데이터를 수집하기 위해 센서 보드로 수집된 데이터를 LoRa 통신을 이용하여 데이터 신뢰성 평가 및 검증을 위한 서버로 전달되고 전달된 데이터를 모니터링 하기 위한 센서 데이터 플랫폼의 프로토타입을 제작하였다. 그리고 수집한 데이터를 이용하여 machine learning 기법을 통해 대기 환경을 분석하고 예측한다.

지방자치단체 통합 데이터 활용성 분석 : 데이터마이닝 기법을 활용하여 (Analysis of the Utilization of Integrated Data on Local Governments: Using Data Mining Techniques)

  • 임광혁
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.115-116
    • /
    • 2017
  • 자체별 또는 연도별과 같은 공통 요소를 통한 교차 분석이 가능하도록 통합 DB를 설계함으로써 다면적인 연구 분석을 위한 프레임워크를 구축하는 데 중점을 두어야 한다. 본 연구는 지자체 통합 데이터베이스에 구축되고 있는 지자체 통합 데이터의 활용성 검증을 위하여, 데이터마이닝 기법을 적용하여 지자체 통합 데이터를 분석하고자 한다. 데이터마이닝 기법을 적용하기 위해서 데이터의 추출, 적재, 변환의 과정을 수행하고, 이렇게 준비된 데이터를 실제 데이터마이닝 기법을 이용하여 분석하고 결과를 검증하는 과정을 수행하면서 지자체 통합 데이터의 활용성을 검증하고자 한다.

  • PDF

영상 데이터 특징 커버리지 기반 딥러닝 모델 검증 기법 (Deep Learning Model Validation Method Based on Image Data Feature Coverage)

  • 임창남;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권9호
    • /
    • pp.375-384
    • /
    • 2021
  • 딥러닝 기법은 영상 처리 분야에서 높은 성능을 입증 받아 다양한 분야에서 적용되고 있다. 이러한 딥러닝 모델의 검증에 가장 널리 사용되는 방법으로는 홀드아웃 검증 방법, k-겹 교차 검증 방법, 부트스트랩 방법 등이 있다. 이러한 기존의 기법들은 데이터 셋을 분할하는 과정에서 클래스 간의 비율에 대한 균형을 고려하지만, 같은 클래스 내에서도 존재하는 다양한 특징들의 비율은 고려하지 않고 있다. 이러한 특징들을 고려하지 않을 경우, 일부 특징에 편향된 검증 결과를 얻게 될 수 있다. 따라서 본 논문에서는 기존 검증 방법들을 개선하여 영상 분류를 위한 데이터 특징 커버리지 기반의 딥러닝 모델 검증 기법을 제안한다. 제안하는 기법은 딥러닝 모델의 학습과 검증을 위한 훈련 데이터 셋과 평가 데이터 셋이 전체 데이터 셋의 특징을 얼마나 반영하고 있는지 수치로 측정할 수 있는 데이터 특징 커버리지를 제안한다. 이러한 방식은 전체 데이터 셋의 특징을 모두 포함하도록 커버리지를 보장하여 데이터 셋을 분할할 수 있고, 모델의 평가 결과를 생성한 특징 군집 단위로 분석할 수 있다. 검증결과, 훈련 데이터 셋의 데이터 특징 커버리지가 낮아질 경우, 모델이 특정 특징에 편향되게 학습하여 모델의 성능이 낮아지며, Fashion-MNIST의 경우 정확도가 8.9%까지 차이나는 것을 확인하였다.