• 제목/요약/키워드: 오류데이터

검색결과 1,766건 처리시간 0.028초

오토인코더를 이용한 작업 데이터 정상 여부 판단 알고리즘 (Algorithm for Determining Whether Work Data is Normal using Autoencoder)

  • 김동현;오정석
    • 한국가스학회지
    • /
    • 제25권5호
    • /
    • pp.63-69
    • /
    • 2021
  • 본 연구에서는 오토인코더의 재구성 오류의 임계값을 이용하여 가스 시설에서의 작업이 정상 작업인지 비정상 작업인지를 판단하는 알고리즘을 구축하였다. 이 알고리즘은 정상 작업의 시계열 데이터만으로 오토인코더를 학습하여 최적화된 정상 작업의 재구성 오류의 임계값을 도출한다. 이 알고리즘을 새로운 작업의 시계열 데이터에 적용하여 재구성 오류를 구한 다음 이것을 정상 작업의 재구성 오류 임계값과 비교하여 정상작업인지 비정상 작업인지를 판별한다. 이 알고리즘을 학습하고 검증하기 위해서 가상의 가스 시설에서의 작업을 규정하고 정상 작업 데이터로만 이루어진 학습 데이터 세트와 정상 작업과 비정상 작업 데이터를 모두 포함한 검증 데이터 세트를 구축하였다.

공개검증 기법에 대한 연구 (A Study on Scheme for Public Auditing)

  • 은하수;이훈정;이재경;오희국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.544-547
    • /
    • 2013
  • 클라우드 컴퓨팅의 출현은 외부 스토리지(예를 들면, 클라우드 스토리지)에 저장되는 사용자의 데이터를 크게 증가시켰다. 사용자는 자신의 데이터가 저장되어 있음을 알 수 있지만, 어떻게 관리되는지 알 수 없다. 이러한 상황에서 서버 오류나 해커의 공격 등을 통해 데이터 손실이 발생하게 된다면, 그 피해는 고스란히 사용자에게 돌아가게 된다. 만일 피해를 입은 데이터가 잘 사용되지 않는 데이터라면 서버는 오류 사실을 은닉하고 정상적인 데이터처럼 보이거나, 해당 데이터를 소거해 버릴 수도 있다. 따라서 사용자는 자신의 데이터를 보호하기 위해 외부 스토리지에 저장된 데이터를 검증할 필요가 있다. 본 논문에서는 클라우드 컴퓨팅이 등장하기 이전에 제안된 기법들에서부터 최근 제안된 기법들까지 정리하고 이들에 대한 모델을 세워 분류한다. 또한 각 모델에서 발생할 수 있는 문제점들을 분석하여 보안 요구사항을 정리한다.

언어 사용환경에 적응적인 영어 문맥의존 철자오류 교정 기법 (Adaptive English Context-Sensitive Spelling Error Correction Techniques for Language Environments)

  • 김민호;김경식;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-136
    • /
    • 2015
  • 문서 교정기에서 문맥의존 철자오류를 교정하는 방법은 크게 규칙을 이용한 방법과 통계 정보를 이용한 방법으로 나뉜다. 한국어와 달리 영어는 오래전부터 통계 모형에 기반을 둔 문맥의존 철자오류 교정 연구가 활발히 이루어졌다. 그러나 대부분 연구가 문맥의존 철자오류 교정 문제를 특정 어휘 쌍을 이용한 분류 문제로 간주하기 때문에 실제 응용에는 한계가 있다. 또한, 대규모 말뭉치에서 추출한 통계 정보를 이용하지만, 통계 정보 자체에 오류가 있을 경우를 고려하지 않았다. 본 논문에서는 텍스트에 포함된 모든 단어에 대하여 문맥의존 철자오류 여부를 판단하고, 해당 단어가 오류일 경우 대치어를 제시하는 영어 문맥의존 철자오류 교정 기법을 제안한다. 또한, 통계 정보의 오류가 문맥의존 철자오류 교정에 미치는 영향과 오류 발생률의 변화가 철자오류 검색과 교정의 정확도와 재현율에 미치는 영향을 분석한다. 구글 웹데이터에서 추출한 통계 정보를 바탕으로 통계 모형을 구성하고 평가를 위해 브라운 말뭉치에서 무작위로 2,000문장을 추출하여 무작위로 문맥의존 철자오류를 생성하였다. 실험결과, 문맥의존 철자오류 검색의 정확도와 재현율은 각각 98.72%, 95.79%였으며, 문맥의존 철자오류 교정의 정확도와 재현률은 각각 71.94%, 69.81%였다.

  • PDF

한국어 복합명사 분해 오류 탐지 기법 (Error Detection Method for Korean Compound Noun Decomposition)

  • 강민규;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.181-185
    • /
    • 2009
  • 복합명사를 분해하는데 있어서 발생하는 분해오류들은 대부분 예외상황들로 취급된다. 전체적으로 차지하는 비중은 크지 않은데 오류 처리를 위해 들어가는 비용이 상대적으로 크기 때문이다. 하지만 분해된 데이터를 색인기나 문서분류기, 기계번역기 등에 실제로 적용해야 할 경우, 분해오류들을 수정해주어야 더 나은 성능을 보일 수 있기 때문에 분해오류를 찾아내고 수정하는 방법을 고안해야 한다. 본 논문에서는 복합명사 분해기에서 추출된 결과를 살펴보고, 주요 분해오류들이 가진 공통적인 특징을 파악하여 분해오류를 발견하는 방법을 생각해보고자 한다.

  • PDF

H.263v2에서 계층부호화를 이용한 오류 은닉 (The Error concealment using Scalability in H.236v2)

  • 한승균;장승기;서덕영
    • 한국통신학회논문지
    • /
    • 제25권7A호
    • /
    • pp.1063-1075
    • /
    • 2000
  • 본 논문은 압축된 비디오에 대한 적응적 오류 은닉 기법을 제안한다. 압축 과정에서 중복성이 제거되므로, 무선 채널이나 인터넷과 같이 오류가 발생하기 쉬운 네트워크에서 비디오 전송시 압축된 비디오 데이터는 오류에 대해 민감하다. 오류의 은닉은 손상된 비트열에서 비디오 데이터를 재생하는 방법이다. 본 논문에서는 계층화된 부호화 방법이 오류은닉에 매우 유용함을 입증했다. 실험 결과에서 영상의 어떤 부분은 기본계층의 정보를 사용하면 더 잘 은닉이 되고, 다른 부분은 이전 프레임 정보를 사용함으로써 좀 더 은닉이 잘 된다는 것을 보였다. 또한 움직임 벡터와 움직임 정도를 기본으로 하는 더욱 효과적이고 적응적인 기술을 개발하였다. 본 논문에서는 계층화된 부호화에 H.263.v2를 사용했는데, 더 나아가 DCT를 기본으로 하는 모든 비디오 코텍에 응용할 수 있다.

  • PDF

임베디드 센서를 위한 시계열 예측 기반 실시간 오류 검출 기법 (Real-time Error Detection Based on Time Series Prediction for Embedded Sensors)

  • 김형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권12호
    • /
    • pp.11-21
    • /
    • 2011
  • 임베디드 센서는 낮은 전력량과 신호의 세기로 장애물이나 거리와 같은 공간 환경에 많은 영향을 받으며, 이러한 원인들로 인해 임베디드 센서에서는 노이즈 데이터가 빈번히 발생한다. 임베디드 센서에서 획득하는 정보는 시계열 데이터로 존재하기 때문에 지속적으로 발생하는 시계열 정보에 대한 오류 검출을 실시간적으로 수행하기는 어렵다. 본 논문에서는 임베디드 장치의 물리적 특성을 고려하여 실시간적으로 발생하는 임베디드 센서의 오류 신호를 검출하는 시계열 예측 기반 오류 검출 기법을 제안한다. 본 논문에서 제안한 시계열 예측 기반 오류 검출 기법은 안정 구간 함수를이용하여 현재 발생하는 임베디드장치 신호의 오류를 판단한다. 안정 구간 함수는 임베디드장치 신호를 관측하여 오류 검출을 수행할 때 최근의 신호들에 오류 가중화를 적용함으로써 효과적으로 오류 신호를 탐지할 수 있다. 본 논문에서 제안한 기법을 Intel Lab 신호를 이용하여 실험하였으며, 실험에서 본 논문에서 제안한 기법은 중심이동평균 기법에 비해 26.25%의 정확도 향상을 나타내었다.

주택가격동향조사를 위한 데이터편집 사례연구 (A Case Study of Data Editing for the Korean Housing Price Survey)

  • 박진우;박현주;김진억
    • 한국조사연구학회지:조사연구
    • /
    • 제6권1호
    • /
    • pp.83-98
    • /
    • 2005
  • 대규모 통계조사에서 수집된 데이터에는 오류나 결측값의 문제가 발생하기 마련이다. 조사, 데이터 입력, 데이터 처리 등의 과정에서 여러 가지 요인에 의해 이런 문제가 생길 수 있는데 이런 데이터를 방치한 채 통계를 생산할 경우 편향이나 다양한 분석에서의 불일치의 문제가 발생하게 되어 통계의 품질과 신뢰성을 떨어뜨릴 수 있으므로 수집된 데이터의 오류나 결측값을 찾아 수정하는 데이터편집은 매우 중요한 작업이다. 해외에서는 데이터편집의 문제를 공론화하여 다루고 있는 데 반해 우리나라에서 데이터편집에 관한 논의는 거의 없는 편이다. 본 연구의 목적은 주택가 격동향조사를 위한 데이터편집의 사례를 소개함으로 데이터편집에 대한 논의의 폭을 넓히는 데 있다. 조사목적에 맞도록 편집규칙을 정하는 과정 및 관련 자료들을 소개하고, 온라인조사라는 조사방식에 맞는 입력 데이터편집방법을 마련하여 실시하는 예들을 소개하며, 마지막으로 출력 데이터편집에 의해 입력 편집에서 걸러지지 않은 오류나 문제들을 제거하는 방법도 소개한다.

  • PDF

AIS 데이터 손실에 의한 VTS 시스템의 영향 분석

  • 안병옥;김만식;김석재
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2011년도 춘계학술대회
    • /
    • pp.123-125
    • /
    • 2011
  • 울산항은 1996년 9월부터 입출항 선박의 항행안전을 위해 VTS 시스템을 설치운영하고 있으나 많은 선박통항량과 위험화물 운송선박의 잦은 운항으로 여러 가지 위험요소가 상존하고 있는 개항장이다. VTS 시스템은 레이더의 자동물표추적장치에 의한 데이터, PORT-MIS의 선박관련 데이터 등 많은 정보들이 분산 처리되어 관제사에게 제공되고 있으나 최근 선박에 설치 운영되고 있는 선박자동식별장치(AIS)에 의해 선박의 정보들이 더욱 신속하고 정확하게 처리되는 것으로 평가되고 있다. 그러나 인위적인 과실에 의한 AIS의 오류정보들과 원활하지 못한 데이터통신에 의한 데이터 누락현상에 의해 VTS 시스템 운용에 막대한 영향을 초래하고 있다. 이러한 인위적인 과실에 의한 AIS의 오류 데이터는 PSC 검사관들의 적극적인 개선의지로 정책적인 계도작업을 수행하고 있으므로 점차 개선될 것으로 기대된다. 따라서 본 연구에서 AIS의 원활하지 못한 통신망에 의한 데이터 누락 현상에 의한 VTS 시스템에서의 영향을 조사 분석하고 이에 따른 개선 방안을 제시하고자 한다.

  • PDF

RFID 물류 유통 모니터링 시스템을 위한 오류 감지 알고리즘 (Faults Detection Algorithms for RFID Logistic Monitoring Systems)

  • 성동욱;박준호;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.545-546
    • /
    • 2011
  • 물류 산업이 크게 성장함에 따라 유통 및 관리되어야 할 물류량 또한 증가하게 되었다. RFID 시스템은 이에 대한 효율적인 관리 방법의 대안으로 떠올랐다. 하지만 RFID 시스템의 특성상 외부에 노출되어 운용되며, 이에 따라 다양한 외부 요소의 간섭으로 인해 RFID 태그 인지 오류를 야기할 수 있다. 뿐만 아니라 RFID 물류 유통 모니터링에 적용된 RFID 시스템은 실시간 모니터링을 위해 스트리밍 형태로 데이터가 발생하여 인지 오류의 감지가 어렵다. 본 논문에서는 RFID 시스템의 약점을 해결하기 위해 RFID 시스템에서 발생하는 스트리밍 데이터를 대상으로 실시간 오류 감지를 할 수 있는 알고리즘을 제안한다.

  • PDF

특징 공간을 사선 분할하는 퍼지 결정 트리 (A Fuzzy Decision Tree to Partition Feature Space with Oblique Planes)

  • 이우항;이건명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.21-23
    • /
    • 1999
  • 결정 트리는 실세계에서 얻어지는 많은 사례들로부터 분류 정보를 얻기 위해 사용되는 유용한 방법중의 하나이다. 분류를 목적으로 사용되는 사례, 즉 데이터들은 실제 현장에서 얻어지기 때문에 관측오류, 불확실성, 주관적인 판단 등의 원인으로 참 값이 아닌 근사 값으로써 기술되는 경우가 많으며, 이러한 잠재적 오류로 인해 잘못된 결정 트리가 생성될 수 있다. 한편, 트리를 생성하는 각각의 과정에서 하나의 특징 값만을 고려하지 않고 두 가지 이상의 특징 값을 동시에 고려하여 결정 트리를 생성할 경우 보다 정확한 분류 정보를 기대할 수 있다. 본 논문에서는 수치 특징 값으로 기술된 데이터로부터 보다 정확한 분류 정보를 얻을 수 있고, 작은 오류에 강건한 사선형 분할 퍼지 결정 트리를 제안한다. 또한 제안된 사선형 분할 퍼지 결정 트리의 생성 절차 및 생성된 결정 트리를 이용하여 새로운 데이터에 분류 정보를 부여하는 추론 과정을 소개한다.

  • PDF