• 제목/요약/키워드: 불완전한 데이터

검색결과 150건 처리시간 0.025초

불완전한 데이터를 위한 딥러닝 모델 (Deep Learning Model for Incomplete Data)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.1-6
    • /
    • 2019
  • 제안 모델은 소실 데이터를 포함하는 불완전한 데이터에서 정보의 손실을 최소화할 수 있도록 개발되었다. 이를 위한 과정은 우선 데이터 확장기법을 이용하여 손실 정보를 보상하도록 학습 데이터를 변환한다. 이 변환 과정에서 데이터의 속성값은 원-핫 인코딩으로 이진 또는 확률값으로 채워진다. 다음 이 변환 데이터는 딥러닝 모델에 입력되는데, 이때 각 속성의 카디너리티에 따라 엔트리 수가 일정하지 않게 된다. 그리고 각 속성의 엔트리 값들을 각각의 입력 노드에 할당하고 학습을 진행한다. 이점이 기존 학습 모델과의 차이점으로, 임의의 속성값이 입력층에서 여러 개의 노드로 분산되는 특이한 구조를 가진다. 제안 모델의 학습 성능을 평가하기 위해, 소실 데이터를 대상으로 다양한 실험을 수행하여 성능 면에서 우수함을 보인다. 제안 모델은 유비쿼터스 환경에서 손실을 최소화하기 위한 알고리즘으로 유용하게 사용될 것으로 본다.

질의완화를 기반으로 한 지능적인 비디오 검색 시스템 (A Study on Intelligent Video Retrieval System based on query relaxation)

  • 윤미희;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.941-944
    • /
    • 2001
  • 최근 하드웨어와 압축기술의 발달 및 보편화로 인해 사용자들의 비디오 데이터에 대한 요구가 증가하였다. 비디오 데이터는 비정형, 대용량의 특징을 가지고 있으므로 사용자의 다양한 요구를 만족시키기 위해서는 단순한 텍스트 형식의 데이터가 아닌 비디오 데이터에 대한 다양한 검색기법이 요구된다. 효율적인 비디오의 검색을 위해서는 사용자의 불완전한 질의에도 근사한 질의결과의 제시가 필요하다. 본 논문에서는 비디오데이터에 대한 효율적인 의미검색을 위해 주석기반과 특징기반을 혼합한 내용기반 검색을 지원하며 특히 사용자의 불완전한 질의에도 근접한 질의결과를 제시할 수 있는 지능적인 비디오 검색 시스템을 제안한다.

  • PDF

구조적 차이를 고려한 서브 그래프 매칭을 위한 요약 색인 기법 (Summary Indexing Scheme for Subgraph Matching Considering Structural Differences)

  • 최도진;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.447-448
    • /
    • 2019
  • 생명 공학 분야에서는 노이즈가 많고 불완전한 데이터 집합의 사용이 많이 이루어진다. 불완전한 그래프에서 구조적 차이를 고려한 근사 서브 그래프 매칭에 대한 활용이 이루어지고 있다. 본 논문에서는 기존 기법에서 모든 데이터 및 경우의 수를 색인하는 과도한 색인 문제와 계산 비용 감소를 위한 요약 색인 기법을 제안한다. 구조적 차이 정보를 저장하기 위해서 특정 정점간의 최단 거리 값을 관리하고, 색인 부하 감소 및 일관성을 위해 요약 색인에 대한 간결화 작업을 수행한다.

  • PDF

센서 네트워크에서의 불완전 스트림데이터를 위한 효율적인 스트림 데이터 관리 시스템 (An Effective Stream Data Management System for the Incomplete Stream Data on Sensor Network)

  • 박은지;변정우;최다솜;김진한;오염덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.125-126
    • /
    • 2014
  • 센서 스트림 데이터는 센서 네트워크를 통해 수집되는 데이터로 실시간 처리를 요구하며, 연속적으로 끊임없이 발생하는 스트림 데이터이다. 이러한 스트림 데이터는 양이 방대하여 이를 저장하기가 매우 어려우며, 동시에 데이터를 검색하는 데에는 많은 시간이 소요된다. 본 논문에서는 센서 네트워크에서의 효율적인 스트림 데이터 처리 시스템을 제안한다. 이 시스템은 캐시테이블을 사용함으로써 데이터베이스에 최소화된 접근으로 데이터 스트림 관리 시스템의 성능을 개선하였다. 그리고 센서 네트워크에서 읽어 들여온 불완전 데이터를 효율적으로 정제하고 상위 단계로 전송한다.

  • PDF

불완전한 채널 정보를 갖는 OFDMA 중계 네트워크를 위한 자원 할당 기법 (Resource Allocation for OFDMA Relay Networks with Imperfect CSI)

  • 이재호;이재홍
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.247-249
    • /
    • 2011
  • 기존의 OFDMA 시스템에서의 자원할당 기술은 주로 완벽한 채널정보에 기반하여 송신 전력, 부반송파를 할당하였다. 하지만 실제 시스템에서는 사용자의 움직임이나 채널 피드백 지연에 의해 완전한 채널정보를 얻을 수 없다. 본 논문에서는 불완전한 채널 정보를 갖는 OFDMA 중계 네트워크를 위한 자원 할당 기법을 제안한다. 불완전한 채널 정보를 갖는 환경에서는 패킷 오류가 발생할 확률이 높기 때문에 이를 예측하여 적응적 데이터 전송률을 할당하는 기법이 필요하다. 제안된 알고리즘은 채널 정보를 예측하여 데이터 전송률, 그리고 부반송파 할당을 통해 유효처리율을 최대화시킨다. 모의 실험 결과 제안된 알고리즘은 채널정보를 예측하지 않는 단순한 알고리즘과 비교하여 더 높은 유효처리율을 갖음을 확인하였다.

  • PDF

결정트리를 이용하는 불완전한 데이터 처리기법 (Incomplete data handling technique using decision trees)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.39-45
    • /
    • 2021
  • 본 논문은 손실값을 포함하는 불완전한 데이터를 처리하는 방법에 대해 논한다. 손실값을 최적으로 처리한다는 것은 학습 데이터가 가지고 있는 정보들에서 본래값과 가장 근사한 추정치를 구하고, 이 값으로 손실값을 대치하는 것이다. 이것을 실현하기 위한 방안으로 분류기가 정보를 분류하는 과정에서 완성되어가는 결정트리를 이용한다. 다시말해 이 결정트리는 전체 학습 데이터 중에서 손실값을 포함하지 않는 완전한 정보만을 C4.5 분류기에 입력하여 학습하는 과정에서 얻어진다. 이 결정트리의 노드들은 분류 변수의 정보를 가지는데, 루트에 가까운 상위 노드일수록 많은 정보를 포함하게 되고 말단 노드에서는 루트로부터의 경로를 통해 분류 영역을 형성하게 된다. 또한 각 영역에는 분류된 데이터 사건들의 평균이 기록된다. 손실값을 포함하는 사건들은 이러한 결정트리에 입력되어 각 노드의 정보에 따라 순회과정을 통해 사건과 가장 근접한 영역을 찾아가게 된다. 이 영역에 기록된 평균값을 손실값의 추정치로 간주하고, 보상 과정은 완성된다.

실시간 센서 네트워크에서 불완전 센서 스트림 데이터를 위한 질의 처리 시스템 (Query Processing System for Incomplete Sensor Stream Data of in Real-time Sensor Network)

  • 장유호;이상호;김용승;오염덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.123-124
    • /
    • 2014
  • 무선 센서 네트워크는 센서들을 근거리 네트워크로 연결하여 사용자와 현장의 정보를 실시간으로 연결해 주는 매개체 역할을 한다. 이러한 무선 센서 네트워크는 기존의 컴퓨팅 시스템과는 달리 제한된 자원과 환경 속에서 동작을 해야 하고, 접근이 힘든 곳이나 지속적인 관리가 필요한 지역에서 효율적으로 사용된다. 본 논문에서는 무선 센서네트워크의 제한된 자원 속에서 불완전 스트림 데이터를 효율적으로 정제하고 처리하여 빠르고 정확한 질의어 처리가 가능한 질의 시스템을 제안하였다.

  • PDF

불완전한 레이더 신호로부터 양질의 이미지 획득 방법 (Qualified Image Aquisition from the Incomplete Radar Signal Sequences)

  • 김도현;김춘림;차의영
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.249-253
    • /
    • 2002
  • 레이더 기술은 획득된 신호를 바탕으로 물체(object)를 추출, 추적함으로써 자동항해시스템, 항공기 충돌방지시스템 둥의 각종 첨단 분야에 두루 활용되고 있으며, 산업 전반에 걸쳐 눈부신 발전을 거듭해 왔다. 본 논문에서는 레이더로부터 획득한 신호로부터 효율적인 물체를 추출, 추적하기 위한 전처리 단계로서 레이더 이미지를 구성하는 방법에 대해 제안한다. 특히, 불완전한 데이터 시퀀스를 갖는 신호를 양질의 레이더 이미지로 복원하는 방법을 제안하고 결과 영상을 통해 제안하는 방법의 우수성을 검증하였다.

  • PDF

불완전한 데이터를 처리할수 있는 분류기 (A Classifier Capable of Handling Incomplete Data Set)

  • 이종찬;이원돈
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.53-62
    • /
    • 2010
  • 본 논문은 변수 값들이나 부류 값을 손실한, 불완전한 데이터를 포함하는 데이터 집합을 가지고 학습하는 문제에 적용될 수 있는 분류 알고리즘을 소개한다. 이 알고리즘은 가중치 값과 확률 기법들을 이용하는 데이터 확장 방법을 사용한다. 이는 휘셔(Fisher)의 식을 기반으로 최적의 투사 면이 되도록 고려된 분류기를 확장함으로써 수행한다. 이를 위해, 데이터 확장에 적용되는 과정으로 부터 몇몇 식들이 유도된다. 제안한 알고리즘의 성능평가를 위해, 데이터에서 하나의 변수를 선택하고 이 선택된 변수에 소실 값과 소실되지 않은 값들의 비율을 변형함에 의해 다른 측정값들의 결과들이 반복적으로 비교된다. 또한 데이터 집합의 객관적인 평가를 위해 기계학습에서 지식 습득 도구로 널리 쓰이는 C4.5의 결과와 비교한다.

데이터 확장 기법에서 손실값을 대치하는 확률 추정 방법 (Probability Estimation Method for Imputing Missing Values in Data Expansion Technique)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.91-97
    • /
    • 2021
  • 본 논문은 불완전한 데이터를 처리하기 위해 본래 규칙개선 문제를 위해 고안되었던 데이터 확장 기법을 사용한다. 이 기법은 사건마다 중요도를 의미하는 가중치를 가질 수 있으며 각 변수를 확률값으로 나타낼 수 있는 특징이 있다. 본 논문에서의 핵심 문제가 손실값과 가장 근사한 확률을 구하여 손실값을 확률로 대치하는 것이므로, 3가지 다른 알고리즘으로 손실값에 대한 확률을 구한 후 이 데이터 구조의 형식으로 저장한다. 그리고 각각의 확률 구조에 대한 평가를 위해 SVM 분류 알고리즘으로 각각의 정보 영역을 분류하는 학습을 한 후, 본래의 정보와 비교하여 얼마나 서로 일치하느냐를 측정한다. 손실값의 대치 확률을 위한 3가지 알고리즘들은 같은 데이터 구조를 사용하고 있으나 접근 방법에서는 서로 다른 특징을 가지고 있어 적용 분야에 따라 다양한 용도로 이용될 수 있기를 기대한다.