• 제목/요약/키워드: Pattern Processing

검색결과 2,350건 처리시간 0.032초

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

Quad Chip 외관 불량 검사를 위한 2D/3D 광학 시스템 (2D/3D Visual Optical Inspection System for Quad Chip)

  • 한창호;이상준;박철근;이지연;유영기;고국원
    • 한국산학기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.684-692
    • /
    • 2016
  • LQFP/TQFP(Low-profile Quad Flat Package/Thin Quad Flat Package) 패키지 공정에서는 높은 수준의 품질 관리를 위해 3차원 형상 측정 방법을 도입하고 있어 본 연구에서는 최종 외관 불량 검사를 위하여 projection moire 방식의 3D 영상 검사를 위한 광학 시스템과 영상처리 알고리즘을 개발하였다. LQFP/TQFP칩에서 발생하는 불량들은 2D 불량항목과 3D 불량 항목으로 구분하여 불량 항목을 상세히 정의하였다. 광학계를 설계함에 있어서 2D 측정 광학계는 돔 조명을 사용하여 일정한 광분포도를 갖도록 설계하고, 3D 측정 광학계는 PZT를 이용하여 모아레 패턴이 90도씩 정확한 위상을 갖도록 이송을 위한 기구적 메커니즘을 설계한다. 물체의 모아레 측정시 위상 변화에서 나타나는 $2{\pi}$ 모호성을 해결하기 위해 측정된 모아레 무늬를 비교하여 $2{\pi}$ 위상의 모호성이 발생하는 부분에서 수정된 다른 위상을 참고하는 알고리즘을 적용하였다. 개발된 검사 시스템은 LQFP/TQFP 외관 검사 공정에 적용하였으며, 실험에서 최대 높이의 측정 오차는 $1.34{\mu}m$ 이내로, 3차원 외관형상 불량 검사 조건을 만족할 만한 성능을 보였다.

연관규칙 흥미성 척도의 실용성 향상을 위한 장바구니 크기 효과 반영 방안 (Utilizing the Effect of Market Basket Size for Improving the Practicality of Association Rule Measures)

  • 김원서;정승렬;김남규
    • 정보처리학회논문지D
    • /
    • 제17D권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 연관규칙 마이닝은 물품들 간의 동시 구매 패턴 파악에 사용되는 대표적 마이닝 기법 중 하나로, 카탈로그 설계, 교차판매, 매장배치 등 다양한 마케팅 전략 수립에 활용된다. 방대한 데이터로부터 도출된 많은 연관규칙 중 수익성이 있는 규칙만을 식별해 내는 작업은 지나치게 많은 시간 및 비용을 필요로 한다. 따라서 연관규칙들의 흥미성 평가 과정을 신속하고 체계적으로 수행하기 위해 다양한 흥미성 척도들이 고안되어 왔다. 하지만 신뢰도와 지지도를 비롯한 대다수의 척도들은 대상 물품들의 발생 빈도수에만 근거하여 도출되므로, 실제 판매 현상을 정확하게 반영하지 못한다는 한계를 갖는다. 예를 들어, 기존의 척도는 매우 큰 장바구니에서 동시 구매된 한 건의 거래와 작은 크기의 장바구니에서 동시 구매된 한 건의 거래를 동일한 빈도로 측정한다. 그런데 매우 큰 장바구니에서는 서로 연관관계가 없는 물품들이 우연히 동시에 존재할 가능성이 크므로, 이에 대한 보정이 이루어지는 것이 타당하다. 기존의 척도들과 달리, 본 논문에서는 장바구니 크기 효과를 반영한 흥미성 척도를 새롭게 소개한다. 제안하는 척도는 큰 바구니에서 발생한 패턴과 작은 바구니에서 발생한 패턴에 대해 상이한 가중치를 부여하는 방식으로 계산됨으로써, 우연히 발생한 패턴으로 인해 결과가 왜곡되는 현상을 최소화할 수 있을 것으로 기대된다. 또한, 시뮬레이션 데이터 및 실 데이터에 대한 실험을 통해 제안하는 척도와 기존 척도가 다양한 환경 하에서 보이는 정확성과 일관성을 분석하고 그 결과를 제시하였다.

인공신경망 기반 온실 외부 온도 예측을 통한 난방부하 추정 (Outside Temperature Prediction Based on Artificial Neural Network for Estimating the Heating Load in Greenhouse)

  • 김상엽;박경섭;류근호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권4호
    • /
    • pp.129-134
    • /
    • 2018
  • 최근, 인공신경망 모델은 예측, 수치제어, 로봇제어, 패턴인식 등의 분야에서 촉망되는 기술이다. 본 연구에서는 인공신경망 모델을 이용하여 온실 외부 온도를 예측하고 이를 온실제어에 활용하는데 목적이 있다. 예측 모델의 성능 평가를 위해 다중회귀모델과 SVM 모델과의 비교분석을 수행하였다. 평가 방법으로는 10-Fold Cross Validation을 사용하였으며, 예측 성능 향상을 위해 상관관계분석 통해 데이터 축소를 수행하였고, 측정 데이터로부터 새로운 Factor 추출하여 데이터의 신뢰성을 확보하였다. 인공신경망 구축을 위해 Backpropagation algorithm을 사용하였으며, 다중회귀모델은 M5 method로 구축하였고, SVM 모델을 epsilon-SVM으로 구축하였다. 각 모델의 비교분석 결과 각각 0.9256, 1.8503과 7.5521로 나타났다. 또한 예측모델을 온실 난방부하 계산에 적용함으로써 온실에 사용되는 에너지 비용 절감을 통한 수입증대에 기여할 수 있다. 실험한 온실의 난방부하는 3326.4kcal/h이며, 총 난방시간이 $10000^{\circ}C/h$일 때 연료소비량은 453.8L로 예측된다. 아울러 데이터 마이닝 기술 중 하나인 인공신경망을 정밀온실제어, 재배기법, 수확예측 등 다양한 농업 분야에 적용함으로써 스마트 농업으로의 발전에 기여할 수 있다.

WebPR :빈발 순회패턴 탐사에 기반한 동적 웹페이지 추천 알고리즘 (WebPR : A Dynamic Web Page Recommendation Algorithm Based on Mining Frequent Traversal Patterns)

  • 윤선희;김삼근;이창훈
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.187-198
    • /
    • 2004
  • 월드 와이드 웹(World-Wide Web)은 가장 커다란 분산된 정보저장소로서 계속하여 빠른 속도로 성장해왔다. 그러나 비록 웹이 빠른 속도로 성장하고 있다 할지라도, 웹의 정보를 읽고 이해하는 데는 본질적으로 한계가 있다. 웹 사용자 입장에서 보면 웹의 정보 폭발, 꾸준하게 변화하는 환경, 사용자 요구에 대한 이해 부족 둥으로 오히려 혼란을 겪을 수 있다. 웹의 이러한 환경에서 사용자의 순회패턴(traversal patterns)을 탐사하는 것은 시스템 설계나 정보서비스 제공 측면에서 중요한 문제이다. 순회패턴 탐사에 관한 기존의 연구들은 세션(sessions)에 나타나는 페이지들간의 연관성 정보를 충분히 활용하지 못한다. 본 논문에서는 세션에 나타나는 페이지들간의 연관성 정보를 활용하여 빈발 k-페이지집합을 탐사하고, 이를 기반으로 하여 추천 페이지집합을 생성함으로써 효율적인 웹 정보서비스를 제공할 수 있는 Web Page Recommend(WebPR) 알고리즘들을 제안한다. 제안한 WebPR 알고리즘은 웹 사이트를 방문한 사용자에게 추천 페이지집합을 포함하는 새로운 페이지뷰(pageview)를 제공함으로써 궁극적으로 찾고자하는 목표 페이지에 효과적으로 접근할 수 있도록 해준다. 기존 연구들과의 가장 큰 차이점은 페이지들간의 연관성 정보를 활용하는 방법들을 일관성 있게 고려하고 있다는 점과 가장 효율적인 트리모델을 제안한다는 점이다. 두개의 실제 웹로그(Weblog) 데이터에 대한 실험은 제안한 방법이 기존의 방법들보다 성능이 우수함을 보여준다.

리눅스 넷필터 기반의 인터넷 웜 탐지에서 버퍼를 이용하지 않는 빠른 스트링 매칭 방법 (A Fast String Matching Scheme without using Buffer for Linux Netfilter based Internet Worm Detection)

  • 곽후근;정규식
    • 정보처리학회논문지C
    • /
    • 제13C권7호
    • /
    • pp.821-830
    • /
    • 2006
  • 전 세계적으로 큰 피해를 주는 웜을 탐지하고 필터링 하는 것은 인터넷 보안에서 큰 이슈중의 하나이다. 웜을 탐지하는 하나의 방법으로서 리눅스 넷필터 커널 모듈이 사용된다. 웜을 탐지하는 기본 동작으로서 스트링 매칭은 네트웍 상으로 들어오는 패킷을 미리 정의된 웜 시그니쳐(Signature, 패턴)와 비교하는 것이다. 웜은 하나의 패킷 혹은 2개(혹은 그 이상의) 연속된 패킷에 나타난다. 이때, 웜의 일부분은 첫 번째 패킷에 있고 나머지 부분은 연속된 패킷 안에 있다. 웜 패턴의 최대 길이가 1024 바이트를 넘지 않는다고 가정하면, 2048 바이트의 길이를 가지는 2개의 연속된 패킷에 대해서 스트링 매칭을 수행해야만 한다. 이렇게 하기 위해, 리눅스 넷필터는 버퍼에 이전 패킷을 저장하고 버퍼링된 패킷과 현재의 패킷을 조합한 2048 바이트 크기의 스트링에 대해 매칭을 수행한다. 웜 탐지 시스템에서 다루어야 하는 동시 연결 개수의 수가 늘어날수록 버퍼(메모리)의 총 크기가 증가하고 스트링 매칭 속도가 감소하게 된다. 이에 본 논문에서는 메모리 버퍼 크기를 줄이고 스트링 매칭의 속도를 증가시키는 버퍼를 이용하지 않는 스트링 매칭 방식을 제안한다. 제안된 방식은 이전 패킷과 시그니쳐(Signature)의 부분 매칭 결과만을 저장하고 이전 패킷을 버퍼링하지 않는다. 부분 매칭 정보는 연속된 패킷에서 웜을 탐지하는데 사용된다. 제안된 방식은 리눅스 넷필터 모듈을 수정하여 구현하였고, 기존 리눅스 넷필터 모듈과 비교하였다. 실험 결과는 기존 방식에 비해 25%의 적은 메모리 사용량 및 54%의 속도 향상을 가짐을 확인하였다.

다중 입체 영상 획득을 위한 정밀 카메라 캘리브레이션 기법 (Accurate Camera Calibration Method for Multiview Stereoscopic Image Acquisition)

  • 김중희;윤여훈;김준수;윤국진;정원식;강석주
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.919-927
    • /
    • 2019
  • 본 논문에서는 입체 영상을 획득하기 위한 정밀 카메라 캘리브레이션(calibration) 기법을 제안한다. 일반적인 카메라 캘리브레이션 기법은 체커보드 구조의 목적 패턴을 이용하여 수행한다. 체커보드 패턴은 사전에 인지된 격자구조를 활용할 수 있으며, 체커보드 코너점을 통해 특징점 매칭을 용이하게 수행할 수 있음에 따라 2차원 영상 픽셀 지점과 3차원 공간상의 관계를 정확히 추정할 수 있다. 특징점 매칭을 통해 카메라 파라미터를 추정하므로 정밀한 카메라 캘리브레이션을 위해선 영상 평면내의 정확한 체커보드 코너 검출이 필요하다. 따라서 본 논문은 정확한 체커보드 코너 검출을 통해 정밀한 카메라 캘리브레이션을 수행하는 기법을 제안한다. 정확한 코너를 검출하기 위해 1-D 가우시안 필터링을 활용하여 코너 후보군들을 검출한 후 코너 정제(refinement) 과정을 통해 이상치(outlier)들을 제거하며 영상내의 부분 픽셀(sub-pixel) 단위의 정확한 코너를 검출한다. 제안한 기법을 검증하기 위해 카메라 내부 파라미터를 추정 결과를 판단하는 재투사 오차(reprojection error)를 확인하며, 카메라 위치 ground truth 값이 제공된 데이터 셋을 활용하여 카메라 외부 파라미터 추정 결과를 확인한다.

ORYZA2000 모델에 기반한 격자형 벼 생육 모의 지원 시스템 개발 (Development of a Gridded Simulation Support System for Rice Growth Based on the ORYZA2000 Model)

  • 현신우;유병현;박진유;김광수
    • 한국농림기상학회지
    • /
    • 제19권4호
    • /
    • pp.270-279
    • /
    • 2017
  • 최적의 재배관리나 식량생산 관력 정책 수립의 위해 지역적인 작물 생산성 모의 정보들이 사용 될 수 있다. 국내 주요 작물인 벼의 생산성 예측을 위해 ORYZA2000 모델이 널리 사용되어 왔지만, 지역 규모에서 생산성을 예측하기 위한 격자별 작물 모델 구동 체계는 보고되어 있지 않다. 본 연구에서는 격자형식의 입력자료를 사용하여 작물 모델을 구동하고 공간적인 생산성 예측자료를 생산할 수 있는 시스템을 개발하였다. 이를 위해 입출력 처리 모듈과 격자별 모델 구동 모듈을 개발하였으며, 각각의 모듈은 C++와 R을 이용하여 구현되었다. 사례 연구를 위해 남한의 논 지역을 대상으로 2000년대에 대한 생산성을 모의하였다. 1km 및 12.5km 해상도의 격자형 기상자료로부터 13000여개의 기상입력자료가 생성되었다. 관행적인 재배관리 설정을 사용하여 격자별로 구동을 하였으며, 출력자료는 다시 netCDF 형태의 격자형 자료로 취합하였다. 모의된 벼 생산성의 공간적 분포는 실제 분포와 비슷한 경향을 보였으나, 실제 생산성과는 차이가 있었다. 이러한 차이는 이앙시기, 품종 등의 재배관리의 차이 또는 기상자료의 불확실성에 의해 생기게 된다. 본 연구에서 개발된 격자별 모델 구동 시스템을 통해 다른 작물 모델을 이용한 격자별 모의가 가능할 것이다.

휴리스틱 진화에 기반한 효율적 클러스터링 알고리즘 (An Efficient Clustering Algorithm based on Heuristic Evolution)

  • 류정우;강명구;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.80-90
    • /
    • 2002
  • 클러스터링이란 한 군집에 포함된 데이터들 간의 유사한 성질을 갖도록 데이터들을 묶는 것으로 패턴인식, 영상처리 등의 공학 분야에 널리 적용되고 있을 뿐만 아니라, 최근 많은 관심의 대상이 되고 있는 데이터 마이닝의 주요 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 K-means나 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 개선하였으며, 클러스터링의 특성을 분산도와 분리도로 정의하였다. 분산도는 임의의 클러스터의 중심으로부터 포함된 데이터들이 어느 정도 흩어져 있는지를 나타내는 척도인 반면, 분리도는 임의의 데이터와 모든 클러스터 중심간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터 중심간의 거리를 나타내는 척도이다. 이 두 척도를 이용하여 자동으로 적절한 클러스터 개수를 결정하게 하였다. 또한 진화알고리즘의 문제점인 탐색공간의 확대에 따른 수행시간의 증가는 휴리스틱 연산을 적용함으로써 크게 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 이차원과 다차원 실험데이타를 사용하여 실험한 결과 제안한 알고리즘의 성능이 우수함을 나타내었다.

국제입찰정보 통합시스템의 설계 및 구현 (The Integration System for International Procurement Information Processing)

  • 윤종완;이종우;박찬영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.71-81
    • /
    • 2002
  • 현존하는 상업용 웹 정보검색 시스템들이 전문성을 갖추지 못하고 있는 이유가 검색된 분야별 정보를 통합하고 가공하는 능력이 부족하기 때문이다. 따라서, 단순 검색이 아닌 실제 사용자가 원하는 웹상의 의미정보를 추출하고 가공/통합하는 정보통합시스템의 필요성이 대두되었다. 본 논문에서는 분산된 이질의 웹사이트들에서 제공되는 특정분야의 정보를 추출 및 통합하는 정보통합시스템(TIC: Target Information collector)을 구현하고, 구현된 시스템의 평가결과를 제시한다. 본 논문에서 대상으로 설정한 정보 영역은 국제입찰정보이다. 국제입찰정보는 전 세계 국가의 정부에서 필요로 하는 조달물품 및 서비스에 대한 공개 입찰자료이다. 본 논문에서는 전 세계의 국제입찰 정보 제공 원천 사이트에서 공통 특성 정보를 자동 추출하기 위해 HTML 태그간 패턴을 사용한 정보위치지정 방법을 사용하였으며, 정보추출 및 통합을 위한 프레임워크 설계를 통해 큰 부담 없이 모든 원천사이트별 정보추출 및 통합 코드를 작성할 수 있었다. 또한, 구현된 TIC을 약 8개월 동안 운영한 결과 매우 단순한 기법을 사용하고도 거의 대부분의 중복정보가 제거된 고품질의 국제입찰정보를 수집할 수 있음을 확인하였다. 본 논문이 기여하는 바는 특정 범주에 속하는 공통정보를 추출 및 통합/가공하는 데에 필요한 시스템 프레임워크를 제시했다는 점이다.