• 제목/요약/키워드: 데이터 분할

검색결과 2,611건 처리시간 0.038초

무선 센서 네트워크를 위한 클러스터 2중 분할 알고리즘 (A Cluster Duplication Partition Algorithm for Wireless Sensor Networks)

  • 주세영;최정률;장길웅
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.373-375
    • /
    • 2005
  • 본 논문은 무선 센서 네트워크상에서 클러스터 2중 분할 알고리즘을 제안한다. 본 알고리즘은 센서 네트워크에서 클러스터 방식 프로토콜이 데이터를 헤드에서 수집하고 집약하여 전송한다는 특성과 이웃한 노드간 유사한 데이터를 가진다는 특성을 이용한다. 인접한 이웃노드가 쌍을 형성하여 교대로 센싱하는 논리적인 클러스터 2중 분할을 하고 헤드도 2개가 존재하여 교대로 데이터 전송을 함으로써 에너지 효율을 높인다.

  • PDF

특징 공간을 사선 분할하는 퍼지 결정 트리 (A Fuzzy Decision Tree to Partition Feature Space with Oblique Planes)

  • 이우항;이건명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.21-23
    • /
    • 1999
  • 결정 트리는 실세계에서 얻어지는 많은 사례들로부터 분류 정보를 얻기 위해 사용되는 유용한 방법중의 하나이다. 분류를 목적으로 사용되는 사례, 즉 데이터들은 실제 현장에서 얻어지기 때문에 관측오류, 불확실성, 주관적인 판단 등의 원인으로 참 값이 아닌 근사 값으로써 기술되는 경우가 많으며, 이러한 잠재적 오류로 인해 잘못된 결정 트리가 생성될 수 있다. 한편, 트리를 생성하는 각각의 과정에서 하나의 특징 값만을 고려하지 않고 두 가지 이상의 특징 값을 동시에 고려하여 결정 트리를 생성할 경우 보다 정확한 분류 정보를 기대할 수 있다. 본 논문에서는 수치 특징 값으로 기술된 데이터로부터 보다 정확한 분류 정보를 얻을 수 있고, 작은 오류에 강건한 사선형 분할 퍼지 결정 트리를 제안한다. 또한 제안된 사선형 분할 퍼지 결정 트리의 생성 절차 및 생성된 결정 트리를 이용하여 새로운 데이터에 분류 정보를 부여하는 추론 과정을 소개한다.

  • PDF

한국어 대어휘 음성DB를 이용한 HM-Net 음성인식 시스템의 성능평가 (Performance Evaluation of HM-Net Speech Recognition System using Korea Large Vocabulary Speech DB)

  • 오세진;김광동;노덕규;송민규;김범국;황철준;정현열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2443-2446
    • /
    • 2003
  • 본 논문에서는 한국전자통신연구원에서 제공된 대어휘 음성DB를 이용하여 HM-Net(Hidden Markov Network) 음성인식 시스템의 성능평가를 수행하였다. 음향모델 작성은 음성인식에서 널리 사용되고 있는 통계적인 모델링 방법인 HMM(Hidden Markov Model)을 개량한 HM-Net을 도입하였다 HM-Net은 PDT-SSS 알고리즘에 의해 문맥방향과 시간방향의 상태분할을 수행하여 생성되는데, 특히 문맥방향 상태분할의 경우 학습 음성데이터에 출현하지 않는 문맥정보를 효과적으로 표현하기 위해 음소결정트리를 채용하고 있으며, 시간방향 상태분할의 경우 학습 음성데이터에서 각 음소별 지속시간 정보를 효과적으로 표현하기 위한 상태분할을 수행한다. 이러한 상태분할을 수행하여 파라미터를 공유하게 되며 최적인 모델 네트워크를 작성하게 된다. 대어휘 음성데이터를 이용하여 음향모델을 작성하고 인식실험을 수행한 결과, 100명의 100단어와 60문장에 대해 평균 97.5%, 96.7%의 인식률을 보였다.

  • PDF

지형 분석을 위한 영역 기반 장면 분할 기법 (Region based Scene Segmentation method for Topography Analysis)

  • 전태균;전문구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.503-506
    • /
    • 2012
  • 본 연구에서는 일반 야외 영상 및 항공 시뮬레이션 영상에 대한 지형 분석을 위해 영역 기반 장면 분할 기법을 제시한다. 영역의 분류를 위해 MeanShift 기법을 기반으로 한 표현과 Texton, SIFT, 위치정보를 특징으로 하는 기법을 제안하고 실험을 통해 주요 대상 영역이 분할되는 결과를 보인다. Sowerby 데이터 셋과 Google Earth 데이터로부터 자체적으로 제작한 데이터 셋에 대해 실험하였으며 수풀지형, 초목지형, 도로 등에 대해 분류하였다.

딥러닝을 이용한 병징에 최적화된 딸기 병충해 검출 기법 (Strawberry Pests and Diseases Detection Technique Optimized for Symptoms Using Deep Learning Algorithm)

  • 최영우;김나은;볼라파우델;김현태
    • 생물환경조절학회지
    • /
    • 제31권3호
    • /
    • pp.255-260
    • /
    • 2022
  • 본 논문은 딥러닝 알고리즘을 이용하여 딸기 영상 데이터의 병충해 존재 여부를 자동으로 검출할 수 있는 서비스 모델을 제안한다. 또한 병징에 특화된 분할 이미지 데이터 세트를 제안하여 딥러닝 모델의 병충해 검출 성능을 향상한다. 딥러닝 모델은 CNN 기반 YOLO를 선정하여 기존의 R-CNN 기반 모델의 느린 학습속도와 추론속도를 개선하였다. 병충해 검출 모델을 학습하기 위해 일반적인 데이터 세트와 제안하는 분할 이미지 데이터 세트를 구축하였다. 딥러닝 모델이 일반적인 학습 데이터 세트를 학습했을 때 병충해 검출률은 81.35%이며 병충해 검출 신뢰도는 73.35%이다. 반면 딥러닝 모델이 분할 이미지 학습 데이터 세트를 학습했을 때 병충해 검출률은 91.93%이며 병충해 검출 신뢰도는 83.41%이다. 따라서 분할 이미지 데이터를 학습한 딥러닝 모델의 성능이 우수하다는 것을 증명할 수 있었다.

의미론적 분할 기반 모델을 이용한 조선소 사외 적치장 객체 자동 관리 기술 (Segmentation Foundation Model-based Automated Yard Management Algorithm)

  • 정민규;노정현;김장현;하성헌;강태선;이병학;강기룡;김준현;박진선
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.52-61
    • /
    • 2024
  • 조선소에서는 사외 적치장의 관리를 위해 일정 주기로 Unmanned Aerial Vehicle (UAV)을 이용해 항공영상을 획득하고, 이를 사람이 판독하여 적치장 현황을 파악한다. 이러한 방법은 넓은 면적의 사외 적치장 현황을 파악하는 데 상당한 시간과 인력을 요구한다. 본 논문에서는 이러한 문제점을 해결하고 정확한 사외 적치장 현황을 파악하기 위해 사전 학습된 의미론적 분할 기반 모델(Foundation Model)을 활용한 자동 관리 기술을 제안한다. 또한, 조선소 사외 적치장의 경우 관련 부품이나 장비를 포함한 공개 데이터셋이 충분하지 않기 때문에, 의미론적 분할 기반 모델에 필요한 객체 프롬프트(Prompt)를 생성하기 위한 소규모 사외 적치장 객체 데이터셋을 직접 구축하였다. 이를 이용해 객체 검출기를 소규모 데이터셋에 추가 학습하여 초기 객체 후보를 추출하고, 의미론적 분할 기반 모델인 Segment Anything Model (SAM)의 프롬프트로 활용해 정확한 의미론적 분할 결과를 얻는다. 더 나아가, 지속적인 적치장 데이터셋 수집을 위해 SAM을 활용한 훈련 데이터 생성 파이프라인을 제안한다. 본 연구에서 제안한 방법은 기존의 의미론적 분할 방법과 비교하여 평균적 4.00%p, SegFormer에 비해 5.08%p 높은 성능을 달성하였다.

RFID태그 객체의 간격 데이터 색인 (Indexing of Interval Data of RFID Tag Objects)

  • 이기형;반재훈;김동현;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.82-84
    • /
    • 2004
  • 최근 유비쿼터스 환경에서 객체에 태그를 장착하여 위치를 추적하는 응용분야가 늘어가고 있는 추세이며, 이러한 응용에서 빈번히 사용되는 질의는 객체의 위치를 찾는 find와 특정 위치의 객체를 찾는 look질의가 있다. 두 질의에서 처리되는 데이터는 시간과 공간을 포함한 다차원 대용량 데이터이며 과거 및 현재 상태의 검색을 지원해야 하므로 효율적인 질의 처리를 위해서는 태그 객체를 위한 새로운 데이터 모델과 색인이 필요하다. 본 논문에서는 태그 객체를 간격 데이터로 정의하고 과거 및 현재 데이터에서 find와 look질의를 처리할 수 있는 색인 구조를 제안한다. 제안하는 색인에서 노드에 오버플로우가 발생할 경우 새로운 단말 노드 분할 정책을 사용하여 분할하며 성능 평가를 통해서 기존 정책보다 우수함을 증명한다.

  • PDF

대용량 유전자형 데이터에 대한 LD기반의 일배체형 재구성 시스템 (The LD based Haplotype Reconstruction System for Large scale Genotype dataset)

  • 김상준;여상수;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.271-273
    • /
    • 2005
  • 유전자 분석기술의 발전은 지놈 프로젝트(genome project)와 햅맵 프로젝트(hapmap project)를 가능하게 하였으며 이제는 맞춤형 진단 및 신약 개발 등 실제 사업의 구체화를 가져오게 하였다. 실제 사업에 적용시키기 위해서는 비용 절감의 문제를 해결해야 한다. 그래서 대용량의 유전자형(genotype)데이터를 정확하고 빠르게 일배체형(haplotype)으로 재구성해 줄 수 있는 시스템이 생물 산업 및 제약 산업에서 제기되어 지고 있다. 기존의 연구에서 비록 정확성이 높은 알고리즘들이 개발되어 있지만 기존의 방법들은 계산에 필요한 양이 크기 때문에 대용량 데이터에 대한 처리가 불가능하였다. 우리가 제안하는 시스템은 대용량 데이터를 유동적인 크기로 블록을 분할하여 대용량 데이터 처리 문제를 해결하였다. 또한 나누어진 블록에서 나타나는 모호한 이형접합체(heterozygote)의 위상(phase)의 결정 과정에 LD기반의 블록 분할 방법을 이용함으로써, 추론된 결과의 정확률을 높였다. 구현된 시스템의 성능평가는 ms로 구성한 인공데이터를 사용하여 수행하였다.

  • PDF

한국어 인식을 위한 인식 단위와 학습 데이터 분류 방법에 대한 연구 (A Study on Recognition Units and Methods to Align Training Data for Korean Speech Recognition))

  • 황영수
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.40-45
    • /
    • 2003
  • 본 연구는 한국어 분절음 인식을 위한 인식 단위 설정과 학습시 학습 데이터 분할 방법에 대한 연구이다 대용량 음성 인식을 수행할 경우, 표준 패턴의 인식 단위를 단어나 음절이 아닌 분절음 단위로 사용하여야 효율적인 음성 인식을 수행할 수 있다. 본 연구는 이와 같은 분절음 인식을 수행하기 위한 연구로서, 인식 단위 설정 변화와 학습시 학습 데이터 분할 방법에 따른 인식 결과를 미국 OGI 연구소의 speech toolkit을 이용하여 검토한다. 인식 단위에 관해서 특히 모음의 경우 철자에 기초한 음소별 인식 단위 설정과 현대어 발음에 기초한 인식 단위 설정을 비교했으며, 그 결과 발음에 기초해 몇 개의 모음을 통합한 경우가 더 우수한 결과를 보였으며, 학습 데이터 분할 방법에 따른 인식 결과는 손으로 분할한 방법이 자동 분할 방법보다 약 2-3%의 인식 향상을 보였다. 또한 인식 단위의 설정에 있어서 독립된 분절음으로 설정한 경우보다 앞, 뒤의 소리의 상황을 고려한 바이폰(bipbone)을 이용할 경우가 5.7%-25.9%의 향상된 인식 결과를 보였다 인식 방법에 있어서는 HMM 만을 이용한 방법보다 신경회로망과 HMM을 결합한 인식 방법이 6.1%-7.5%의 더 좋은 인식률을 나타내었다.

  • PDF

영역분할에 의한 SLI와 벡터 지도 간의 건물영역 일치도 향상 (Improvement of Building Region Correspondence between SLI and Vector Map Based on Region Splitting)

  • 이정호;가칠오;김용일;유기윤
    • 한국측량학회지
    • /
    • 제30권4호
    • /
    • pp.405-412
    • /
    • 2012
  • SLI(Street-Level Imagery)와 벡터지도의 합성을 통해 두 데이터 간의 위치 편차를 제거한 후, SLI의 매개변수를 기반으로 두 데이터의 대응되는 건물영역을 찾을 수 있다. 그러나 합성 이후에도 여러 요인으로 인하여 건물영역이 완전히 일치하지는 않는다. 본 연구는 영상의 영역분할을 통해 두 데이터 간의 건물영역 일치도를 향상시키는 것을 목적으로 한다. 합성을 통해 생성한 벡터 지도의 건물 객체를 SLI 영상에 투영한 선을 영역분할의 초기 정보로 사용한다. 우선, 필터링, 분할(segmentation), 하늘영역 탐지를 통해 하늘 영상을 생성한다. 그리고 에지 검출자를 통해 건물 분리 후보선을 추출한 후, 색상 차이와 하늘정보를 함께 활용하여 건물 최적분리선을 추출함으로써 보다 정확한 건물영역으로 분할한다. 실제 데이터에 대한 실험 결과, 영역 분할을 통해 건물영역 일치 정확도가 83.3%에서 89.7%로 향상된 것을 확인하였다. 본 연구의 성과는 SLI 서비스를 강화하는데 유용하게 활용될 수 있을 것이다.