• 제목/요약/키워드: 데이터 오류

검색결과 1,761건 처리시간 0.032초

OCR 프로그램을 활용한 선박 항해일지 데이터 추출 모델 개발 (Development of a Ship's Logbook Data Extraction Model Using OCR Program)

  • 이다인;김성철;윤익현
    • 해양환경안전학회지
    • /
    • 제30권1호
    • /
    • pp.97-107
    • /
    • 2024
  • 빠르게 발전하는 이미지 인식 기술에도 불구하고 표 형식의 문서와 수기로 작성된 문서를 완벽하게 디지털화하기에는 아직 어려움이 따른다. 본 연구는 표 형식의 수기 문서인 선박 항해일지를 작성하는 데에 사용되는 규칙을 이용하여 보정 작업을 수행함으로써 OCR 결과물의 정확도를 향상시키고자 한다. 이를 통해 OCR 프로그램을 통하여 추출된 항해일지 데이터의 정확성과 신뢰성을 높일 것으로 기대된다. 본 연구는 목포해양대학교 실습선 새누리호의 2023년에 항해한 57일간의 항해일지 데이터를 대상으로 OCR 프로그램 인식 후 발생한 오류를 보정하여 그 정확도를 개선하고자 하였다. 이 모델은 항해일지 기재 시 고려되는 몇 가지 규칙을 활용하여 오류를 식별한 후, 식별된 오류를 보정하는 방식으로 구성하였다. 모델을 활용하여 오류를 보정 후, 그 효과를 평가하고자 보정 전과 후의 데이터를 항차별로 구분한 후, 같은 항차의 같은 변수끼리 비교하였다. 본 모델을 활용하여 실제 셀 오류율은 약 11.8% 중 약 10.6%의 오류를 식별하였고, 123개의 오류 중 56개를 개선하였다. 본 연구는 항해일지 중 항해정보를 기입하는 Dist.Run부터 Stand Course까지의 정보만을 대상으로 수행하였다는 한계점이 있으므로, 추후 항해정보 뿐만 아니라 기상정보 등 항해일지의 더 많은 정보를 보정하기 위한 연구를 진행할 예정이다.

합성단위 자동생성을 위한 자동 음소 분할기 후처리에 대한 연구 (The Postprocessor of Automatic Segmentation for Synthesis Unit Generation)

  • 박은영;김상훈;정재호
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.50-56
    • /
    • 1998
  • 본 논문은 자동 음소 분할기의 음소 경계 오류를 보상하기 위한 후처리 (Postprocessing)에 관한 연구이다. 이는 현재 음성 합성을 위한 음성/언어학적 연구, 운율 모델링, 합성단위 자동 생성 연구 등에 대량의 음소 단위 분절과 음소 레이블링된 데이터의 필요성에 따른 연구의 일환이다. 특히 수작업에 의한 분절 및 레이블링은 일관성의 유지가 어렵고 긴 시간이 소요되므로 자동 분절 기술이 더욱 중요시 되고 있다. 따라서, 본 논문은 자동 분절 경계의 오류 범위를 줄일 수 있는 후처리기를 제안하여 자동 분절 결과를 직접 합성 단위로 사용할 수 있고 대량의 합성용 운율 데이터 베이스 구축에 유용함을 기술한다. 제안된 후처리기는 수작업으로 조정된 데이터의 특징 벡터를 다층 신경회로망 (MLP:Multi-layer perceptron)을 통해 학습을 한 후, ETRI(Electronics and Telecommunication Research Institute)에서 개발된 음성 언어 번역 시스템을 이용한 자동 분절 결과와 후처리기인 MLP를 이용하여 새로운 음소 경계를 추출한다. 고립단어로 발성된 합성 데이터베이스에서 후처리기로 보정된 분절 결과는 음성 언어 번역 시스템의 분할율보 다 약 25%의 향상된 성능을 보였으며, 절대 오류(|Hand label position-Auto label position |)는 약 39%가 향상되었다. 이는 MLP를 이용한 후처리기로 자동 분절 오류의 범위를 줄 일 수 있고, 대량의 합성용 운율 데이터 베이스 구축 및 합성 단위의 자동생성에 이용될 수 있음을 보이는 것이다.

  • PDF

리눅스 클러스터 화일 시스템 $SANique^{TM}$의 오류 탐지 기법 (Failure Detection in the Linux Cluster File System $SANique^{TM}$)

  • 임화정;이규웅;이장선;오상규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.37-39
    • /
    • 2002
  • 본 논문은 SAN(storage area network)강에 네트워크-부착형 (network-attached) 저장 장치들을 직접 연결하여 화일 서버 없이 직접 데이터 전송이 가능한 SAN 기반의 리눅스 클러스터 공유 화일 시스템인 SANique$^{TM}$의 오류 탐지 기법 및 회복 기법에 대하여 기술한다. 클러스터 내의 노드 오류에 의해 발생하는 "split-brain"오류 상황 및 문제점을 공유 화일 시스템 환경 하에서 성의하고, 이 문제를 해결할 수 있는 오류 탐지기법을 제시한다.

  • PDF

실시간 운영체제에서 타이머를 이용한 TCP 오류 제어' (Error Control in TCP Using Timers on Real-Time Operating Systems)

  • 류현수;성영락;이철훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.232-234
    • /
    • 2003
  • TCP(Transmission Control Protocol)는 신뢰성 있는 전송계층 프로토콜이다. 이것은 데이터 스트림을 TCP 로 전달하는 응용프로그램이 전체 스트림을 순서에 맞고 오류 없이 전달하는 것을 의미한다. TCP 는 오류 제어를 이용하여 신뢰성을 제공하는데, 오류제어는 손상 세그먼트, 손실 세그먼트, 순서가 어긋난 세그먼트, 그리고 중복 세그먼트를 감지하는 메커니즘이 포함되며 특히 타이머(timer)를 이용한 오류제어를 본 내용에서 설명하고 있다.

  • PDF

PBCA의 상태전이행렬을 이용한 이중 오류정정부호의 설계 (Design of Double-Error Correcting Code using the Transition Matrix of PBCA)

  • 조성진;허성훈;김석태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1561-1564
    • /
    • 2004
  • 초고속 유무선 통신망이 확대됨에 따라 디지털 데이터 통신 및 저장 시스템 설계 시 통신채널에서 발생하는 오류를 효율적으로 제어하기 위한 오류정정부호 장치가 중요한 요소가 되었다. 본 논문에서는 기존의 셀룰라 오타마타 기반의 오류정정부호를 개선시킨 이중 오류정정부부호를 설계하는 방법을 제안한다.

  • PDF

DBSCAN을 이용한 등부표 위치 데이터 Clustering 연구(I) (A Study on Data Clustering of Light Buoy Using DBSCAN(I))

  • 최광영;김소라;박상원;송재욱
    • 한국항해항만학회지
    • /
    • 제47권4호
    • /
    • pp.231-238
    • /
    • 2023
  • 등부표는 조류, 바람 등 외력에 영향을 받아 위치가 항상 유동적이고 위치는 항로표지용 AIS 또는 RTU를 통해 확인할 수 있다. 위치 확인이 가능한 등부표의 최근 5년간(2017~2021년) 위치 데이터 분석 결과 위치 오류 데이터는 평균 15.4%로 나타났으며 항해 안전사고예방 및 관리를 위해서는 위치 오류 데이터를 검출하고 정제된 위치 데이터 획득이 필요하다. 본 연구에서는 항로표지용 AIS 또는 RTU를 통해 획득한 위치 데이터를 DBSCAN Clustering하여 위치 오류 데이터를 검출하고 정제된 위치 데이터를 획득하고자 한다. 이를 위하여 위치 오류가 가장 많은 서해 해역 중 RTU가 설치된 군산항 1호 등부표의 21년도 위치 데이터를 Python library를 사용하여 DBSCAN Clustering 하였다. DBSCAN Clustering에 필요한 minPts는 2차원 데이터에 일반적으로 사용하는 값을 적용하였고 epsilon은 k-NN(최근접 이웃)알고리즘을 사용하여 값을 산출 및 적용하였다. DBSCAN Clustering 결과 minPts와 epsilon을 만족하지 못하는 위치 오류 데이터를 검출하였고 정제된 위치 데이터를 획득할 수 있었다. 본 연구는 항로표지용 AIS 또는 RTU가 설치된 등부표의 신뢰성 있는 위치 데이터를 획득할 수 있는 기초 자료로 활용할 수 있으며 항해 안전사고 예방에도 큰 도움이 될 것으로 판단된다.

회전하는 태양전지판에 장착된 태양센서를 이용한 자세오류 감지 (Attitude Error Detection with Sun sensor on a Rotating Solar Array)

  • 오시환
    • 항공우주기술
    • /
    • 제13권1호
    • /
    • pp.27-36
    • /
    • 2014
  • 인공위성은 예측 가능한 데이터를 이용하여 자신의 상태를 스스로 파악하며, 자연적으로 발생할 수 있는 일시적인 문제가 아니거나 오류가 전이되어 더 큰 문제를 발생시킬 수 있다고 판단될 경우를 대비하여 지상국과의 접속이 없는 상태에서도 스스로 고장 관리를 수행할 수 있도록 설계되어 있다. 태양 센서를 이용한 정상상태에서의 자세 오류 감지도 이러한 고장관리 항목 중의 하나로 사용될 수 있다. 본 연구에서는 회전하는 태양전지판에 장착되어 있는 태양 센서 데이터를 이용한 오류 감지 방법을 제안하였다. 태양전지판의 운용 방법에 따라 정상적인 상태에서 발생할 수 있는 태양 센서의 오차를 예측하고 이 예측된 값으로부터 벗어나는 정도를 파악하여 오류를 감지하도록 하였다. 또한, 식구간 존재 시에는 태양센서가 그 출력을 내지 못하므로 오류 감지에 문제가 없도록 보정하였다. 마지막으로 궤도 상 데이터를 이용하여 제안된 방법의 타당성을 검증하였다.

e-Manufacturing을 위한 제품데이터 품질 향상 (Product Data Quality Assurance for e-Manufacturing)

  • 양정삼;김준기;강혜정
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2003년도 종합학술대회 논문집
    • /
    • pp.39-44
    • /
    • 2003
  • ㆍ 분산 환경에서 설계와 생산이 이루어짐 ㆍ 서로 다른 CAD 시스템 상호간에 오류 없는 CAD 정보 교환이 필수 그러나 현실은 CAD정보 교환 과정에서 많은 오류를 발생하고, 후공정에서 이러한 오류를 파악하고 수정하는데, 많은 시간과 비용이 투입되고 있다.(중략)

  • PDF

혼합 부호화에 의한 압축률 개선에 관한 고찰II (A Study on Improving Compression Ratio Using hybrid Coding)

  • 차인숙;박지환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.196-199
    • /
    • 2001
  • 국제 전신전화자문위원회인 ITU-T에서는 일반 공중전화망을 이용하는 데이터 통신을 위하여 표준권고안 중 V시리즈의 하나인 V.42bis라는 표준을 제정하여 권고하고 있다. 이 표준은 자동재전송 방식(ARQ)으로 오류를 제어하고 있는 V.42 표준에 새로이 LZW압축기법을 추가한 것으로 모뎀 내에 오류제어와 데이터 압축방식을 함께 채용함으로써 데이터전송에 있어서 신뢰성과 효율성을 제공하도록 한 것이다. 이 논문에서는 V.42bis방식의 압축 효율성에 대하여 고찰하고, 적응형 산술 부호(Arithmetic Code)와 1중 마르코프 산술부호로 각각 혼합 부호화하여 압축률을 향상시키는 기법에 대하여 기술한다.

  • PDF

오토인코더를 이용한 작업 데이터 정상 여부 판단 알고리즘 (Algorithm for Determining Whether Work Data is Normal using Autoencoder)

  • 김동현;오정석
    • 한국가스학회지
    • /
    • 제25권5호
    • /
    • pp.63-69
    • /
    • 2021
  • 본 연구에서는 오토인코더의 재구성 오류의 임계값을 이용하여 가스 시설에서의 작업이 정상 작업인지 비정상 작업인지를 판단하는 알고리즘을 구축하였다. 이 알고리즘은 정상 작업의 시계열 데이터만으로 오토인코더를 학습하여 최적화된 정상 작업의 재구성 오류의 임계값을 도출한다. 이 알고리즘을 새로운 작업의 시계열 데이터에 적용하여 재구성 오류를 구한 다음 이것을 정상 작업의 재구성 오류 임계값과 비교하여 정상작업인지 비정상 작업인지를 판별한다. 이 알고리즘을 학습하고 검증하기 위해서 가상의 가스 시설에서의 작업을 규정하고 정상 작업 데이터로만 이루어진 학습 데이터 세트와 정상 작업과 비정상 작업 데이터를 모두 포함한 검증 데이터 세트를 구축하였다.