• 제목/요약/키워드: 불완전한 데이터

검색결과 150건 처리시간 0.027초

RFID 태그 메모리 접근의 일관성을 위한 태그 연산의 동시성 제어 (Concurrency Control of RFID Tag Operations for Consistent Tag Memory Accesses)

  • 류우석;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.171-175
    • /
    • 2010
  • 본 논문에서는 RFID 전자태그에 부착된 메모리의 정보를 접근할 때 발생하는 태그 연산 실행의 불완전성에 따른 태그 데이터의 불일치 문제를 분석하고, 이를 해결하기 위한 프로토콜을 제안한다. 수동형 RFID 태그는 통신의 불확실성과 단절성으로 인해 태그 메모리 접근연산의 완전한 실행을 보장하지 못하므로, 불완전하게 실행된 연산으로 인해 태그 데이터의 비일관성을 초래하는 문제가 발생한다. 본 논문에서는 태그 접근의 일관성을 유지하면서 불완전 연산의 실행을 완료시키기 위한 동시성 제어 프로토콜을 제안한다. 이 프로토콜은 불완전 실행된 연산의 대상태그를 연속질의로 정의하고 태그의 인식을 모니터링 함으로써 다른 연산들에 의한 불확실 데이타의 접근을 차단하고, 재수행을 통해 불완전하게 실행된 연산의 수행을 완료시킨다. 또한, 증명을 통해 제안한 프로토콜의 정확성, 일관성을 입증하였으며, 실험을 통해 본 프로토콜이 기존의 일관성 유지기법보다 좋은 성능을 나타냄을 보였다.

KoCED: 윤리 및 사회적 문제를 초래하는 기계번역 오류 탐지를 위한 학습 데이터셋 (KoCED: English-Korean Critical Error Detection Dataset)

  • 어수경;최수원;구선민;정다현;박찬준;서재형;문현석;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-231
    • /
    • 2022
  • 최근 기계번역 분야는 괄목할만한 발전을 보였으나, 번역 결과의 오류가 불완전한 의미의 왜곡으로 이어지면서 사용자로 하여금 불편한 반응을 야기하거나 사회적 파장을 초래하는 경우가 존재한다. 특히나 오역에 의해 변질된 의미로 인한 경제적 손실 및 위법 가능성, 안전에 대한 잘못된 정보 제공의 위험, 종교나 인종 또는 성차별적 발언에 의한 파장은 실생활과 문제가 직결된다. 이러한 문제를 완화하기 위해, 기계번역 품질 예측 분야에서는 치명적 오류 감지(Critical Error Detection, CED)에 대한 연구가 이루어지고 있다. 그러나 한국어에 관련해서는 연구가 존재하지 않으며, 관련 데이터셋 또한 공개된 바가 없다. AI 기술 수준이 높아지면서 다양한 사회, 윤리적 요소들을 고려하는 것은 필수이며, 한국어에서도 왜곡된 번역의 무분별한 증식을 낮출 수 있도록 CED 기술이 반드시 도입되어야 한다. 이에 본 논문에서는 영어-한국어 기계번역 분야에서의 치명적 오류를 감지하는 KoCED(English-Korean Critical Error Detection) 데이터셋을 구축 및 공개하고자 한다. 또한 구축한 KoCED 데이터셋에 대한 면밀한 통계 분석 및 다국어 언어모델을 활용한 데이터셋의 타당성 실험을 수행함으로써 제안하는 데이터셋의 효용성을 면밀하게 검증한다.

  • PDF

암의 분류를 위한 음의 상관관계 유전자의 신경망 쌍 (Neural Network Pair with Negatively Correlated Genes for Cancer Classification)

  • 원홍희;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.359-361
    • /
    • 2003
  • 정확한 암의 분류는 암의 진단 및 치료에 있어 매우 중요하지만, 암을 진단하기 위한 기존의 여러 방법들은 종종 불완전한 결과를 도출한다. 최근의 마이크로어레이 기술에 기반한 분자 수준의 진단은 정확하고 객관적이며 체계적인 암의 분류를 위한 방법론을 제시해준다. 유전자 발현 데이터는 일반적으로 수천개 이상의 유전자를 포함하는데, 유전자 발현 데이터의 모든 유전자가 암과 관련이 있는 것이 아니므로 정확한 암을 분류하기 위하여 중요한 유전자만을 추출하는 것이 바람직하다. 본 논문에서 음의 상관관계를 갖는 두 개의 이상적인 유전자 벡터를 정의한 후 이와 유사한 정도를 기준으로 중요한 유전자 집단을 추출하고, 각각을 신경망으로 학습하여 결합하는 신경망 쌍을 제안한다. 실험 결과는 음의 상관관계를 갖는 두 개의 유전자 집단이 암의 클래스를 잘 구분할 수 있음을 보여주었다. 이 유전자 집단을 특징으로 하여 각각 학습한 신경망을 베이시안 방법으로 결합한 결과, 벤치마크 데이터에 대하여 신경망 쌍이 개별 분류기에 비해 우수한 성능을 보임을 확인하였다.

  • PDF

유비쿼터스 환경에서 Context 처리를 위한 패턴 수집 모델의 설계와 구현 (Design and Implementation of Pattern Collection Model for Handling the Context on a Ubiquitous Environment)

  • 이대준;김성조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.344-349
    • /
    • 2007
  • 유비쿼터스 환경에서 사용자의 편의성을 증대하기 위해 상황인지 기술이 필요하며 댁내의 다양한 기기의 정보를 수집하여 현재 상태를 파악하고 그에 맞는 서비스를 제공해야 한다. 하지만 다양한 종류의 디바이스, 센서, 서비스에 따라 생성하는 데이터의 형태와 의미가 다르기 때문에 이를 활용하는데 어려움이 있다. 본 논문은 다양한 기기와 환경에서 발생하는 데이터를 처리하여 사용자의 패턴을 수집하고 활용할 수 있는 연구 모델을 제안하고 구현한다. 구성요소는 실제 환경과 유사하게 Context를 생성할 수 있는 Emulator와 수집된 Context를 활용하여 패턴을 찾는 패턴 수집 서버와 수집된 데이터를 표현하는 시각화 도구로 구성된다. Emulator는 댁내에 존재할 수 있는 다양한 종류의 Context를 정의하고 서로간의 관계에 따라 Context를 생성하고 패턴 수집 서버는 Emulator에서 생성한 불완전한 Context를 통합하여 완전한 Context를 생성한다. 그리고 생성된 Context를 통해서 사용자의 서비스 이용패턴, Fault, Conflict를 발견했다.

  • PDF

베이지안 기법을 이용한 소표본 보증데이터 분석 방법 연구 (A Study of the Small Sample Warranty Data Analysis Using the Bayesian Approach)

  • 김종걸;성기우;송정무
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2013년 춘계학술대회
    • /
    • pp.517-531
    • /
    • 2013
  • 보증 데이터를 통해 제품의 수명 및 형상모수를 추정할 때 최우추정법과 같은 전통적인 통계 분석방법(Classical Statistical Method)을 많이 사용하였다. 그러나 전통적인 통계 분석방법을 통해 수명과 형상모수의 추정 시 표본의 크기가 작거나 불완전한 경우 추정량의 신뢰성이 떨어진다는 단점이 있고 또 누적된 경험과 과거자료를 충분히 이용하지 못하는 단점도 있다. 이러한 문제점을 해결하기 위해 모수의 사전분포를 가정하는 베이지안(Bayesian) 기법의 적용이 필요하다. 하지만 보증 데이터분석에 있어서 베이지안 기법을 이용한 연구는 아직 미흡한 실정이다. 본 연구에서는 수명분포가 와이블 분포를 갖는 보증데이터를 활용하여 모수 추정의 효율성을 비교 분석하고자 한다. 이를 위해 와이블 분포의 모수가 대수정규분포를 따르는 사전분포를 갖는 베이지안 기법과 전통적 통계기법인 생명표법(Actuarial method)을 활용하여 추정량을 도출하고 비교 분석하였다. 이를 통해 충분한 관측 데이터를 확보할 수 없는 경우에 베이지안 기법을 이용한 보증 데이터 분석방법의 성능을 확인하고자 한다.

  • PDF

SOLAS를 이용한 결측자료의 다중대치법

  • 김현정;문승호;신재경
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 춘계학술대회
    • /
    • pp.145-158
    • /
    • 2003
  • 불완전 데이터 즉, 결측값을 가지는 데이터를 분석할 경우 결측데이터에 대해서 어떠한 처리를 해야할 필요가 있다. 결측데이터에 대한 처리로서 주로 이용되어온 방법으로는 결측값을 포함한 관측값(case)을 제외하는 방법이었다. 이후 여러 방법들이 제안되어 EM알고리즘이나 회귀알고리즘에 의한 추정을 바탕으로 결측값에 대한 추정을 해서 그 추정값으로 결측값을 대치하는 방법을 사용할 수 있게되었다. 본 논문에서는 복수 개의 데이터세트를 생성해서 대치하는 다중대입 소프트인 SOLAS를 소개한다.

  • PDF

객체-관계형 데이터베이스를 이용한 XML 문서 저장 기법 (Storage Techniques Using an Object-Relational Database for XML Documents)

  • 이월영;용환승
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.305-316
    • /
    • 2004
  • XML은 그 스키마가 비정규적이고 불완전한 특성을 가지고 있는 반구조적(semistructured) 데이터로써 인터넷 상의 데이터를 교환하기 위한 사실상의 표준이 되고 있다. 따라서 이러한 데이터를 효율적으로 다루기 위해서는 어떠한 저장장치에 어떠한 방식으로 저장하느냐가 중요한 요인이 된다. 본 연구에서는 기존의 객체-관계형 데이터베이스의 장점을 활용하면서도 DTD에 상관없이 XML 질의 언어에서 요구하는 다양한 질의 종류를 지원할 수 있는 저장 기법을 개발하였다. 이 기법은 XML 데이터 모델의 비정규적인 특성 때문에 발생할 수 있는 오버헤드를 최소화시키고 현존하는 데이터와 자연스럽게 연계할 수 있다.

잠재적 의미와 k-means 군집화를 이용한 개념추출 검색 (Extraction of Concept by Latent Semantic Indexing and k-means Clustering)

  • 장유진;임호섭;박기림;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.22-24
    • /
    • 2001
  • 정보검색 시스템에서 사용자의 질의어가 불완전함에 따라 생기는 검색 효율의 저하를 줄이기 위하여 용어의 상호관련성을 반영함과 동시에 벡터의 공간을 축소하는 LSI 모델을 사용하여 문서 집합으로부터 잠재적 의미 공간을 구축하였다. 또한 의미 공간상에 있는 문서의 분포에 따라 \"개념\"을 추출하기 하기 위해 k-means algorithm을 사용하여 군집화 시켰다. 이로부터 불완전한 초기 사용자 질의어를 의미 공간에 구축된 클러스터링 정보로 수정하여 새로운 질의어를 생성함으로 검색의 효율을 높이고자 하였다. 검색 효율을 측정하기 위해 TREC 데이터를 이용하여 분석하였으며 결과는 질의어의 성격에 따라 달라졌으나 대체적으로 우수한 성능을 보였다.한 성능을 보였다.

  • PDF

소동물 전용 양전자방출단층시스템의 섬광체 배열에 따른 특성 평가: 몬테칼로 시뮬레이션 연구 (Characterization Study of Detector Module with Crystal Array for Small Animal PET: Monte Carlo Simulation)

  • 백철하
    • 한국콘텐츠학회논문지
    • /
    • 제15권4호
    • /
    • pp.350-356
    • /
    • 2015
  • 본 연구의 목적은 몬테칼로 모사방법을 이용하여 소동물 전용 양전자방출단층촬영 시스템의 모듈 내 섬광체 배열 수에 따른 특성평가를 하는 것이다. 이 연구에서 제안한 소 동물 전용 양전자방출단층촬영 시스템은 모듈 내 섬광체 수를 1 ~ 8개로 구성하였으며, 섬광체 크기는 $2.0{\times}2.0{\times}10.0mm^3$ 크기의 LSO섬광결정을 사용하였고 스캐너의 직경은 100 mm로 설계하였다. 몬테칼로 시뮬레이션 방법중에 하나인GATE 코드를 이용하여 선원은 511 keV 점선원을 이용하였으며 동시계수 측정된 좌표값을 이용하여 민감도 및 사이노그램을 획득하였다. 모듈 내 섬광체 수가 적을수록 모듈 별 틈새가 줄어들어 민감도가 향상되는 결과를 보였으며, 사이노그램 결과에서도 불완전한 데이터(missing data)가 발생하지 않는 것을 알 수 있었다. 이 연구 결과는 모듈 안 섬광체 수가 적을수록 민감도 향상 및 불완전한 데이터 획득이 줄어드는 것을 증명함으로써, 소동물 전용 양전자방출단층촬영 시스템의 성능 개선을 위한 새로운 접근법을 제시한다.

불완전 디버깅 환경을 고려한 소프트웨어 신뢰도 성장모델 (Software Reliability Growth Models considering an Imperfect Debugging environments)

  • 이재기;이규욱;김창봉;남상식
    • 한국통신학회논문지
    • /
    • 제29권6A호
    • /
    • pp.589-599
    • /
    • 2004
  • 소프트웨어의 신뢰성을 정량적으로 평가하는 데 있어서 대다수의 모델이 발생된 소프트웨어 고장의 발생원인에 대한 완전한 수정을 요구하는 완전 디버깅 환경을 가정하고 있다. 그러나 실제 개발자가 디버깅 작업을 수행할 때 완전한 수정이 불가능하기 때문에. 새로운 결함이 삽입되는 경우가 많다. 즉, 결함 수정은 불완전 환경에 처한다. 본 논문에서는 결함 수정시 신규 결함의 삽입 가능성을 고려하고 불완전 디버깅 환경에 대한 소프트웨어 신뢰도 성장모델을 제안하고 소프트웨어 동작 환경 하에서 발생된 소프트웨어 고장과 시험 전 소프트웨어 내의 고유 결함에 의한 고장과 동작 중에 랜덤하게 삽입된 결함에 의해 발생되는 고장 등 2종류의 결함을 고려하여 비동차포아송과정(NHPP)에 의한 소프트웨어 고장발생 현상을 기술한다. 또 소프트웨어 신뢰성 평가에 유용한 정량적인 척도를 도출하고 실측 데이터를 이용하여 적용한 결과를 제시하고 기존 모델과의 적합성을 비교, 분석한다.