• 제목/요약/키워드: 오류데이타

검색결과 85건 처리시간 0.024초

XML 기반 효율적인 돼지개량체계 구축을 위한 통합정보관리 시스템의 개발 (The development of Integrated Information Management System for the efficient construction of Pig Improvement System based on XML Schema)

  • 김현주;정기화;김흥준;김봉기;이광석;김창근;김인철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.745-748
    • /
    • 2011
  • 현재 양돈산업에서의 인공수정(Artificial Insemination, AI) 기술은 1994년 이후 본격적으로 국내 양돈농가에 보급되어 양돈 산업 발전에 많은 영향을 주었다. 현재 국내 비육돈 임신의 80% 이상이 인공수정 센터에 공급하는 정액에 의해 이뤄지는 등 양돈 산업에서 차지하는 비중과 중요성이 매우 중요하며, 또한 국내 양돈 산업분야의 인공수정 기술은 번식과 육종개량 분야에서 절대적인 영향을 미치고 있다. 이러한 중요성에도 불구하고 전국 AI센터의 정액 생산 및 공급에 관한 기록은 53%이상 수기에 의존하고 있다. 그나마 이에 대한 수집된 현장자료는 전국 AI센터의 개별시스템에 수작업으로 입력 관리되어 원시 데이타의 오류 및 통합정보 활용이 매우 어렵다. 이에 XML을 기반으로 전국 AI센터의 통합정보 관리시스템 모델을 제안한다. 제안된 정보관리 모델은 웹을 기반으로 전국 AI센터의 정보를 통합관리 활용할 수 있으며, 이를 통해 통합된 정보의 통계분석, 미래 예측분석 자료 등으로 활용되어 효율적인 돼지개량 체계를 구축할 것으로 기대한다.

  • PDF

우도비 특징 벡터를 이용한 SVM 기반의 음성 검출기 (Voice Activity Detection Based on SVM Classifier Using Likelihood Ratio Feature Vector)

  • 조규행;강상기;장준혁
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.397-402
    • /
    • 2007
  • 본 논문에서는 기존의 통계적 모델 기반의 음성 검출기의 성능 향상을 위해 이진 분류에 우수한 support vector machine(SVM)을 도입한다. 기존의 통계적 모델 기반 음성 검출기의 경우 음성의 존재와 부재에 대한 가설로부터 각각의 통계적 모델을 세워 입력 데이타에 의해 결정된 각 주파수 채널별 우도비(likelihood ratio)를 단순히 기하 평균을 취하여 문턱값과 비교, 음성 검출 여부를 판단한다. 제안된 음성 검출기는 기존의 기하 평균을 이용한 결정식을 대신하여 분류 오류 확률이 최소화되도록 각 주파수 채널별 우도비를 SVM의 특징 벡터로 적용한다. 제안된 SVM 기반의 통계적 모델 음성 검출기는 기존의 LRT를 이용한 음성 검출기 및 SVM 기반의 음성 검출기들과 비교하여 다양한 잡음 환경에서 우수한 성능을 나타낸다.

형태학과 문자의 모양을 이용한 뉴스 비디오에서의 자동 문자 추출 (Automatic Text Extraction from News Video using Morphology and Text Shape)

  • 장인영;고병철;김길천;변혜란
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권4호
    • /
    • pp.479-488
    • /
    • 2002
  • 최근 들어 인터넷 사용의 증가와 더불어 디지털 비디오의 수요 또한 급격히 증가하고 있는 추세이다. 따라서 디지털 비디오 데이타베이스의 인덱싱을 위한 자동화된 도구가 필요하게 되었다. 디지털비디오 영상에 인위적으로 삽입되어진 문자와 배경에 자연적으로 포함되어진 배경문자 등의 문자 정보는 이러한 비디오 인덱싱을 위한 중요한 단서가 되어질 수 있다. 본 논문에서는 뉴스 비디오의 정지 영상에서 뉴스 자막과 배경 문자를 추출하기 위한 새로운 방법을 제안한다. 제안된 알고리즘은 다음과 같이 세 단계로 구성된다. 첫 번째 전처리 단계에서는 입력된 컬러 영상을 명도 영상으로 변환하고, 히스토그램 스트레칭을 적용하여 영상의 수준을 향상시킨다. 이 영상에 적응적 임계값 추출에 의한 분할 방법을 수정 적용하여 영상을 분할한다. 두 번째 단계에서는 적응적 이진화가 적용된 결과 영상에 모폴로지 연산을 적절하게 사용하여, 우선 문자 영역은 아니면서 문자로 판단되기 쉬운 양의 오류(false-positive) 요소들이 강조되어 남아있는 영상을 만든다. 또한, 변형된 이진화 결과 영상에 모폴로지 연산과 본 논문에서 제안한 기하학적 보정(Geo-corrertion) 필터링 방법을 적용하여 문자와 문자로 판단되기 쉬운 요소들이 모두 강조되어 남아있는 영상을 만든다. 이 두 영상의 차를 구함으로서 찾고자 하는 문자 요소들이 주로 남고, 문자가 아닌 문자처럼 보이는 오류 요소들은 대부분 제거된 결과 영상을 만든다. 문자로 판단되는 양의 오류 영역들을 남기는데 사용된 모폴로지 연산은 3$\times$3 크기의 구조 요소를 갖는 열림과 (열림닫힘+닫힘열림)/2 이며, 문자 및 문자와 유사한 요소들을 남기는데 사용된 연산은 (열림닫힘+닫힘열림)/2와 기하학적 보정이다. 세 번째 검증 단계에서는 전체 영상 화소수 대비 각 후보 문자 영역의 화소수 비율, 각 후보 문자 영역의 전체 화소수 대비 외곽선의 화소수 비율, 각 외곽 사각형의 폭 대 높이간의 비율 등을 고려하여 비문자로 판단되는 요소들을 제거한다. 임의의 300개의 국내 뉴스 영상을 대상으로 실험한 결과 93.6%의 문자 추출률을 얻을 수 있었다. 또한, 본 논문에서 제안한 방법으로 국외 뉴스, 영화 비디오 등의 영상에서도 좋은 추출을 보임을 확인할 수 있었다.

오프라인 필기체 한글 자소 인식에 있어서 특징성능의 비교 (Comparison of Feature Performance in Off-line Hanwritten Korean Alphabet Recognition)

  • 고태석;김종렬;정규식
    • 인지과학
    • /
    • 제7권1호
    • /
    • pp.57-74
    • /
    • 1996
  • 본 논문에서는 근래의 필기체 한글인식에서 상요되고 있는 특징들의 인식 성능을 비교한다.본 연구는 인식률 뿐만 아니라 인식시스템의 효율성을 향상시키기 위한 특징 선택의 기반을 마련함에 그 목적이 있다.특징성능 비교를 위해 그 특징들의 특성들을 분석하였고,그 특성에 따라 특징들을 전역적 특징(영상변환,통계적 특징,지역/위상적 특징의 3가지 종류로 분류하였다.각 종류별로 한글 자소 특징을 나타내는데 적합한 특징들을 4-5가지씩 선정하였고,인식실험을 한글의 초성자음,횡모음,종모음별로 수행하였다. 실험에 사용된 인식기로는 오류역전파 알고리즘으로 학습된 은닉층이 하나인 다층 퍼셉트론이 사용되었다.실험에 사용된 학습 및 시험용 데이타는 PE92중 30벌이다.실험결과를 보면,1)지역/위상적 특징들이 다른 종류의 특징들보다 인식 성능이 우수하였으며,2) 통계적 특징 중에서는 망 특징과 투영특징이,전역적인 특징들 중에서는 왈쉬특징과 DCT특징이,지역/위상적 특징에서는 윤곽선 위상변화 특징과 오목성 특징이 각각 성능이 우수하였다.

  • PDF

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.