• 제목/요약/키워드: Wrapper

검색결과 186건 처리시간 0.027초

선박매매정보 추출 에이전트 시스템 구조 설계에 관한 연구 (Design for Information Retrieving Agent System for Ship Sale and Purchase)

  • 박남규
    • 한국항해항만학회지
    • /
    • 제26권3호
    • /
    • pp.337-344
    • /
    • 2002
  • 선박매매사이트가 증가하고 있지만, 필요한 정보를 쉽게 찾아주는 에이전트에 관한 연구는 부족하다. 본 연구는 사이버공간상에 흩어져 있는 선박정보를 손쉽게 찾을 수 있는 지능형 에이젼트의 설계 구조를 정의하는 연구로서 Wrapper 방식의 설계기법을 사용하였다. 본 연구가 추구하고자 하는 것은 선박매매 전자상거래 시스템의 매매대상 선박을 정보추출 에이전트를 이용하여 선박정보를 선택적으로 추출, 이를 소비자에게 제공하는 선박매매용 정보추출 에이전트의 기능을 시험적으로 설계하는 것이다. 특히 본 연구는 사이버 해운거래시스템이 실현되는 환경 하에서 이를 활성화하기 방안으로 B2B 선박매매 분야에 적용하였다는 점에서 의의가 있다. 본 연구의 결과 에이전트의 프로세스는 URL 읽기, 해당 URL 원시 데이터 가져오기, 태그처리 프로세스, 패턴분석 및 분석내용 저장하기로 구성되어 있음을 파악하였다. 또한 설계전략으로 "URL페이지 읽기" 프로세스와 "소스분석" 프로세스의 연계성 정도에 따라 분리시키거나 연계시킬 수 있음을 파악하였으며, 각각의 장단점이 비교 검토되었다.

시멘틱 웹 기반의 비교구매 에이전트를 위한 동적 웹 온톨로지에 대한 연구 (A Study of Dynamic Web Ontology for Comparison-shopping Agent based on Semantic Web)

  • 김수경;안기홍
    • 지능정보연구
    • /
    • 제11권2호
    • /
    • pp.31-45
    • /
    • 2005
  • 본 논문에서는 전자상거래 상점별로 상이하게 정의되고 표현되어 있는 디지털 캠코더에 대한 HTML 페이지의 상품 정보를 래퍼(Wrapper)기술을 이용하여 획득하고 이를 RDF 문서 변환기를 통해 RDF 트리플(triple)과 RDF 문서로 변환하여 디지털 캠코더에 대한 메타데이터 스키마를 설계한다. 설계된 메타데이터 스키마를 기반으로 OWL 웹 온톨로지로 변환하고 이를 관계형 데이터베이스로 구현된 디지털 캠코더(DC: Digital Camcoder) 도메인 온톨로지 저장소(Domain Ontology Repository)에 DCC 지식 베이스 온톨로지 (DCCKBO: DCC Knowledge Based Ontology)로 저장한다. 다음 각 상점의 RDF 트리플과 문서를 DCCKBO와 비교, 매핑 그리고 추론 과정을 통해 최적의 상품 구매 정보를 가진 상점의 DCC 정보를 구매자에게 제공하고, DCCKBO에 저장되어 있는 도메인 온톨로지를 최적의 상품 구매 정보의 내용으로 재 정의하는 동적 웹 온톨로지를 제안하고자 한다.

  • PDF

분산 데이터 상호운용을 위한 SQL/XMDR 메시지 기반의 Wrapper를 이용한 데이터 허브 시스템 (Data hub system based on SQL/XMDR message using Wrapper for distributed data interoperability)

  • 문석재;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2047-2058
    • /
    • 2007
  • 기업의 업무 환경이 지리적, 공간적으로 분산된 환경에서는 데이터 통합 시 발생되는 데이터 소스들을 표준 규칙과 메타데이터에 여과시켜서 중복성을 제거하고 데이터의 통합과 단일 뷰어를 제공하기에는 어려움이 따른다. 특히 이질적인 시스템이나 다양한 어플리케이션에서 나오는 대량의 데이터를 종류와 형식에 관계없이 호환이 가능하고, 지속적으로 정확한 통합 정보를 실시간으로 동기화할 수 있는 것이 관건이다. 따라서, 본 논문에서는 레거시 시스템간의 데이터 공유 및 교환에서 발생하는 의미적 상호 운용성의 문제점을 극복하는 SQL/XMDR 메시지 기반의 데이터 허브 시스템을 제안한다. 이 시스템은 데이터 협업 시 실시간으로 변화는 데이터를 일관성 있게 유지하기 위해서 질의 변환 방법인 메시지 사상 기법을 제시하여 이용한다. 이는 레거시 시스템들 간의 협업에 필요한 데이터를 공유 및 교환 하는데 실시간으로 변화하는 데이터를 일관성 있게 유지 할 수 있으며, 통합 검색 시 단일 인터페이스를 제공하여 각 시스템의 독립성을 유지하면서 데이터의 투명성과 가용성을 향상 시킬 수 있다.

XMDR을 이용한 정형화된 메시지 교환 기법 설계 (Design of Formalized message exchanging method using XMDR)

  • 황치곤;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1087-1094
    • /
    • 2008
  • 최근 들어 XML은 데이터 교환을 위한 표준으로 널리 사용되고 있으며, XML 문서의 크기가 커지는 경향이 나타나고 있다. 특히, 데이터 웨어하우스와 같이 대량의 데이터를 수집하여 분석하는 경우 데이터 이동은 트래픽의 증가로 인해 문제점이 발생할 수 있다. 따라서 이러한 문제를 해결하기 위해 XMDR 래퍼는 XML Schema의 트리 구조를 분석하고, 분석된 트리 구조를 통해 XML Schema를 재생성하여 XMDR_Query와 함께 각 스테이션에 전송한다. 결과로 반환되는 XML 문서는 XML Schema에 따라 XML 태그를 코드화하여 정형화된 메시지를 전달한다. 정형화된 XML 문서는 네트워크의 트래픽을 감소시키고, XML 계층정보를 포함하고 있어 데이터 추출, 변환 및 정렬에 효율적 이라는 장점을 가진다. 뿐만 아니라 정형화된 형식 이므로 XSLT를 통한 변환과정에서도 효율적이다. 각 스테이션에 전송되는 XML Schema와 XMDR_Query는 XMDR(eXtended Meta-Data Registry)을 통해 생성하고, 각 스테이션의 래퍼에서 결과 생성 및 XML 변환이 이루어지도록 하는 방법을 제안한다.

네트워크 트래픽 데이터의 희소 클래스 분류 문제 해결을 위한 전처리 연구 (A Pre-processing Study to Solve the Problem of Rare Class Classification of Network Traffic Data)

  • 류경준;신동일;신동규;박정찬;김진국
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.411-418
    • /
    • 2020
  • 정보보안을 위한 IDS(Intrusion Detection Systems)는 통상적으로 서명기반(signature based) 침입탐지시스템과 이상기반(anomaly-based) 침입 탐지시스템으로 분류한다. 이 중에서도 네트워크에서 발생하는 트래픽 데이터를 기계학습으로 분석하는 이상기반 IDS 연구가 활발하게 진행됐다. 본 논문에서는 공격 유형 학습에 사용되는 데이터에 존재하는 희소 클래스 문제로 인한 성능 저하를 해결하기 위한 전처리 방안에 대해 연구했다. 희소 클래스(Rare Class)와 준 희소 클래스(Semi Rare Class)를 기준으로 데이터를 재구성하여 기계학습의 분류 성능의 개선에 대하여 실험했다. 재구성된 3종의 데이터 세트에 대하여 Wrapper와 Filter 방식을 연이어 적용하는 하이브리드 특징 선택을 수행한 이후에 Quantile Scaler로 정규화를 처리하여 전처리를 완료한다. 준비된 데이터는 DNN(Deep Neural Network) 모델로 학습한 후 TP(True Positive)와 FN(False Negative)를 기준으로 분류 성능을 평가했다. 이 연구를 통해 3종류의 데이터 세트에서 분류 성능이 모두 개선되는 결과를 얻었다.

데이터마이닝을 이용한 심혈관질환 판별 모델 방법론 연구 (A study of methodology for identification models of cardiovascular diseases based on data mining)

  • 이범주
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.339-345
    • /
    • 2022
  • 심혈관 질환은 전 세계적으로 주요 사망원인들 중 하나이다. 본 연구는 보다 우수한 심혈관질환 판별 모델을 생성하기 위한 방법에 대한 연구로써, 3가지 변수 선택법과 7가지 머신러닝 알고리즘을 바탕으로 사회인구학적 변수들을 이용하여 고혈압과 이상지질혈증 판별모델들을 생성하고, 생성된 모델들의 성능을 비교 평가한다. 본 연구의 결과에서는 두 가지 질병 모두에서, 전체변수 및 correlation-based feature subset selection 메소드 기반 모델들에서는 naive Bayes 모델이 다른 머신러닝을 이용한 모델들보다 다소 우수한 판별 성능이 있는 것으로 나타났고, wrapper 메소드 기반 변수 선택법에서는 logistic regression 모델이 다른 모든 모델보다 성능이 다소 우수한 것으로 나타났다. 본 연구의 결과는 원격의료 및 대중보건 분야에서 향후 한국인의 심혈관질환 판별 및 예측 모델 생성을 위한 참고자료로 활용될 수 있을 것으로 기대된다.

AMBA 기반 플랫폼을 이용한 디블록킹 필터 회로의 설계 및 검증 (Design and Verification of Deblocking Filter Circuit Using AMBA-Based Platform)

  • 박강필;이선영;조경순
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.735-738
    • /
    • 2005
  • This paper presents an AMBA-based IP that can perform the deblocking filtering operations required in the H.264 video compression. The deblocking filter circuit was optimized for area and performance. The AHB wrapper was added to the circuit to interface with the AMBA-based platform. The AMBA-compliant operation of the proposed IP was verified on the platform board with Xilinx Virtex2 XC2V600 FPGA and ARM9 processor.

  • PDF

Hybrid Feature Selection Using Genetic Algorithm and Information Theory

  • Cho, Jae Hoon;Lee, Dae-Jong;Park, Jin-Il;Chun, Myung-Geun
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.73-82
    • /
    • 2013
  • In pattern classification, feature selection is an important factor in the performance of classifiers. In particular, when classifying a large number of features or variables, the accuracy and computational time of the classifier can be improved by using the relevant feature subset to remove the irrelevant, redundant, or noisy data. The proposed method consists of two parts: a wrapper part with an improved genetic algorithm(GA) using a new reproduction method and a filter part using mutual information. We also considered feature selection methods based on mutual information(MI) to improve computational complexity. Experimental results show that this method can achieve better performance in pattern recognition problems than other conventional solutions.

통합 실시간 물관리 운영 시스템 구축 방안 연구 (A Study on the Development of Integrated Real-time Water Management System)

  • 김유진;김남일;황만하;고익환
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.1435-1439
    • /
    • 2005
  • 국내의 효율적인 수자원 관리를 위해서는 수량과 수질을 고려하여 한정된 수자원을 효율적으로 사용할 수 있도록 수자원 계획과 운영상의 문제점을 피드백할 수 있는 유역 단위의 통합 수자원 관리 시스템이 필요하다. 따라서 본 연구에서는 수자원의 효율적인 공급 및 배분을 위해 기상, 유출, 저수지 운영, 수질 모형과 수자원 정보가 통합된 실시간 물관리 운영 시스템을 구축하기 위한 방안을 제시하고자 한다. 본 연구에서 제안하고자하는 통합 실시간 물관리 운영 시스템(IRWMS)은 한국수자원공사의 물관리 운영자를 위한 시스템으로써 이를 이용하는 사용자와 운영 환경, 모의방식 등에 따라 DB & server 시스템, wrapper engine, on-line 시스템, off-line 시스템, 매크로 시스템의 5부분으로 구성된다.

  • PDF

GA-SVM Ensemble 모델에서의 accuracy와 diversity를 고려한 feature subset population 선택

  • 성기석;조성준
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.614-620
    • /
    • 2005
  • Ensemble에서 feature selection은 각 classifier의 학습할 데이터의 변수를 다르게 하여 diversity를 높이며, 이것은 일반적인 성능향상을 가져온다. Feature selection을 할 때 쓰는 방법 중의 하나가 Genetic Algorithm (GA)이며, GA-SVM은 GA를 기본으로 한 wrapper based feature selection mechanism으로 response model과 keystroke dynamics identity verification model을 만들 때 좋은 성능을 보였다. 하지만 population 안의 후보들간의 diversity를 보장해주지 못한다는 단점 때문에 classifier들의 accuracy와 diversity의 균형을 맞추기 위한 heuristic parameter setting이 존재하며 이를 조정해야만 하였다. 우리는 GA-SVM 알고리즘을 바탕으로, population안 후보들의 fitness를 측정할 때 accuracy와 diversity 둘 다 고려하는 fitness function을 도입하여 추가적인 classifier 선택 작업을 제거하면서 성능을 유지시키는 방안을 연구하였으며 결과적으로 알고리즘의 복잡성을 줄이면서도 모델의 성능을 유지시켰다.

  • PDF