• 제목/요약/키워드: XML Mining

검색결과 51건 처리시간 0.024초

비쥬얼 다이나믹 마이닝 툴을 이용한 신속한 의사결정;Spotfire (Quick Decision Making Using Visual Dynamic Mining Tool;Spotfire)

  • 김성기
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.89-91
    • /
    • 2008
  • 엄청나게 쏟아져 나오는 데이터 홍수 속에서 오늘날의 업체와 연구기관에서는 신속하게 의사 결정을 해야 한다. 당면한 문제점들을 해결하기 위하여 접근할 수 있는 수많은 다양한 데이터 속에서 정확하게 경향을 파악하고 그 근본 원인을 찾아내어 신속하고 action을 행하는 것은 어떠한 회사에서도 성공에 있어서 가장 중요한 인자들 중의 하나이다. 초기 아이디어 도출, 연구 개발에서부터 제품의 생산, 판매 및 서비스에 이르기까지 모든 팀원들은 아주 빠르게 고도의 정확성으로 중요한 결정을 할 필요가 있다. 오늘날의 경쟁 시장에서 기업의 성공은 다른 경쟁자들보다 더 빠르게 결정을 할 수 있는 능력에 달려 있다. 이에 Sporfire에서는 사용자가 쉽고 빠르게 데이터를 분석하여 의사 결정을 할 수 있도록 다양한 기능을 제공하고 있다. 사용자가 SQL같은 전문 언어를 사용하지 않고도 다양한 데이터 source에서 쉽게 데이터를 가져오도록 Information Library를 이용할 수 있으며, 데이터베이스에 들어 있는 숫자들의 집합체를 다양한 차트와 도표들을 이용, 그래픽 적으로 제공해 줌으로써 데이터에 대하여 직관적으로 파악하여 신속하게 대응할 수 있도록 도와준다. 또한 그 결과물들을 MS 파워포인트, 엑셀시트, xml 등으로 저장하여 다른 용도로 사용할 수 있도록 하고 있다.

  • PDF

지수적 가중치를 적용한 협력적 상품추천시스템 (A Recommendation System of Exponentially Weighted Collaborative Filtering for Products in Electronic Commerce)

  • 이경희;한정혜;임춘성
    • 정보처리학회논문지B
    • /
    • 제8B권6호
    • /
    • pp.625-632
    • /
    • 2001
  • 전자상점에서 이루어지는 고객의 구매패턴이 온라인 상에서 데이터베이스화되어, 이를 통하여 고객의 취향에 맞는 상품을 제공할 수 있는 많은 알고리즘이 연구되고 있다. 이러한 알고리즘은 전자상점에서 고객의 개별특성을 고려한 상품을 제공하기 위하여, 고객정보 데이터베이스와 거래정보 데이터베이스로부터 연관규칙 등을 추출하여 사용한다. 그러나 시간의 흐름에 민감한 계절상품이나 특선상품과 같이 전자상점의 거래량에 크게 직결될 수 있는 상품에도 기존의 시간을 고려하지 않은 알고리즘을 적용한다면 추천성공률이 떨어질 것이다. 따라서 본 논문에서는 시간의 영향을 많이 받는 상품추천을 위하여, 최근 전자상점 추천시스템으로 효과적인 아이템 기반 협력알고리즘에 지수적 가중치를 적용한 협력적 여과추천(EWCFR) 알고리즘을 제안한다. 또한 이러한 추천시스템이 대용량의 고객데이터와 상품데이터에 대한 연산을 수행하고 다수의 고객에게 실시간으로 서비스를 제공하여야 하므로, XML기반의 MMDB를 활용한 전자상거래 시스템과 알고리즘을 제안한다.

  • PDF

유무선 환경 하의 Event CRM 을 위한 정보기술 아키텍처 연구 (An Information Technology Architecture for Event CRM in Wired and Wireless Internet Environments)

  • 박주석;김재경;이우기;조형진;변성욱
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1819-1824
    • /
    • 2006
  • 고객과의 지속적 관계를 통하여 기업 이익을 극대화시키는 CRM (Custom Relationship Management) 시스템은 국내에서는 고객 정보를 분석하여 마케팅 전략을 수립하는 분석 CRM 중심으로 구축되었다. 하지만 인터넷 및 모바일 기술의 발전으로 고객과의 접점이 다양한 채널을 통해서 이루어지고 있으나, 채널별 고객 정보가 체계적으로 관리되지 못하며, 고객에 즉시 대응할 수 있는 체계가 미흡하여 고객이 원하는 시점에 고객을 만족시켜 주지 못하고 있는 실정이다. 따라서 오프라인 중심의 분석 CRM 보다는 운영 CRM이나 협업 CRM 측면을 고려한 실시간(real-time) CRM을 목표로 하며, 다양한 기관과 다양한 채널로 구성된 고객 접점을 체계화하여 고객이 원하는 시점에 고객을 만족시킬 수 있는 CRM 모델을 도출하고자 한다. 본 논문에서는 이러한 모델을 근거로 새로운 관점의 정보기술 아키텍처를 제안한다. 이 아키텍처는 이질적인 유무선 환경을 위하여 XML 기반의 데이터인터페이스를 제시하고, 비즈니스 규칙(rule) 시스템과 데이터마이닝(data mining) 시스템을 포함하고 있다.

  • PDF

A Study of Main Contents Extraction from Web News Pages based on XPath Analysis

  • Sun, Bok-Keun
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권7호
    • /
    • pp.1-7
    • /
    • 2015
  • Although data on the internet can be used in various fields such as source of data of IR(Information Retrieval), Data mining and knowledge information servece, and contains a lot of unnecessary information. The removal of the unnecessary data is a problem to be solved prior to the study of the knowledge-based information service that is based on the data of the web page, in this paper, we solve the problem through the implementation of XTractor(XPath Extractor). Since XPath is used to navigate the attribute data and the data elements in the XML document, the XPath analysis to be carried out through the XTractor. XTractor Extracts main text by html parsing, XPath grouping and detecting the XPath contains the main data. The result, the recognition and precision rate are showed in 97.9%, 93.9%, except for a few cases in a large amount of experimental data and it was confirmed that it is possible to properly extract the main text of the news.

A Methodology for Ontology-based Knowledge Acquisition and Structuring in an Industry-Academic-Government Project ″Go Japan!″

  • Hideki-Mima;Yoon, Tae-Sung
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2003년도 종합학술대회 논문집
    • /
    • pp.197-203
    • /
    • 2003
  • The purpose of the study is to develop an integrated knowledge structuring system for the domain of engineering, in which ontology-based literature mining, knowledge acquisition, knowledge integration, and knowledge retrieval are combined using XML-based tag information and ontology management. The system supports combining different types of databases (papers and patents, technologies and innovations) and retrieving different types of knowledge simultaneously. The main objective of the system is to facilitate knowledge acquisition and knowledge retrieval from documents through an ontology-based dynamic similarity calculation and a visualization of automatically structured knowledge. Through experimentations we conducted using 100,000 words economic documents reported in the "Go! Japan" project for analyzing Japanese industrial situation, and 100,000 words molecular biology Papers, we show the system is Practical enough for accelerating knowledge acquisition and knowledge discovery from the information sea.

  • PDF

트리 구조 데이터의 의미 기반 라벨 리스트 표현 정보 추출 (Semantic-Based Label Lists Represented Information Extraction from Tree Data)

  • 백주련
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.27-28
    • /
    • 2020
  • 이형 데이터 간의 정보 전송과 교환을 가능하게 하는 유연한 트리 구조의 특성은 인터넷 및 IoT 환경에서의 대량 데이터 저장·전송·교환 등에 있어서 XML이나 JSON에서 주요하게 사용된다. 사용성에 있어서는 수월한 반면에, 감추어져 있는 가치있는 정보들을 트리 구조의 대량 데이터들로부터 찾아내는 것은 일반 단순 구조의 데이터에 비해서 훨씬 어려우며 복잡하고 난해한 문제들을 발생시킨다. 이는 트리가 갖는 계층 구조 때문이다. 본 논문에서는 계층 구조를 갖는 대량 트리 데이터들을 보다 단순한 리스트 구조로 변형한 후 해당 구조로부터 가장 자주 발생하는 유용한 정보들을 추출하는 방법을 제시한다.

  • PDF

지식의 온톨로지화를 위한 관리 시스템 아키텍처 (The Conference Management System Architecture for Ontological Knowledge)

  • 홍현우;고광산;김창수;정재길;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.1115-1118
    • /
    • 2005
  • 인터넷 기술이 발전함에 따라 이를 이용한 온라인 회의 시스템이 개발되고 있다. 현재의 온라인 회의 시스템은 문자, 음성, 화상 등과 같은 멀티미디어 기술을 도입하여 기존의 오프라인 회의와 달리 공간의 제약에서 벗어날 수 있다는 장점이 있기 때문에 많은 기업과 조직에 도입되고 있다. 하지만 온라인 회의 시스템은 회의 시간이 길어질수록 발언 내용이 많아지고 회의 내용에 대한 일관된 인식이 떨어지기 쉽다는 단점이 있다. 이에 본 논문에서는 온톨로지(Ontology) 개념을 도입하여 회의 내용을 지식화 하고 이를 XML(Extensible Markup Language)로 구조화하여 요약 및 관리 할 수 있는 회의 관리 시스템 아키텍처를 제시였다. 또한 이렇게 제시된 아키텍처의 객관적인 검증과 체계적이고 시각화된 관리를 위해 지식기반 회의 관리 시스템을 설계 및 구현하였다.

  • PDF

A comparison of three design tree based search algorithms for the detection of engineering parts constructed with CATIA V5 in large databases

  • Roj, Robin
    • Journal of Computational Design and Engineering
    • /
    • 제1권3호
    • /
    • pp.161-172
    • /
    • 2014
  • This paper presents three different search engines for the detection of CAD-parts in large databases. The analysis of the contained information is performed by the export of the data that is stored in the structure trees of the CAD-models. A preparation program generates one XML-file for every model, which in addition to including the data of the structure tree, also owns certain physical properties of each part. The first search engine is specializes in the discovery of standard parts, like screws or washers. The second program uses certain user input as search parameters, and therefore has the ability to perform personalized queries. The third one compares one given reference part with all parts in the database, and locates files that are identical, or similar to, the reference part. All approaches run automatically, and have the analysis of the structure tree in common. Files constructed with CATIA V5, and search engines written with Python have been used for the implementation. The paper also includes a short comparison of the advantages and disadvantages of each program, as well as a performance test.

인공신경망 기반 웹서비스 분류체계 생성 프레임워크의 실증적 평가 (Facilitating Web Service Taxonomy Generation : An Artificial Neural Network based Framework, A Prototype Systems, and Evaluation)

  • 황유섭
    • 지능정보연구
    • /
    • 제16권2호
    • /
    • pp.33-54
    • /
    • 2010
  • 월드와이드웹(WWW)은 유용한 정보를 포함하는 자료들의 집합에서 유용한 작업을 수행할 수 있는 서비스들의 집합으로 변화하고 있다. 새롭게 등장하고 있는 웹서비스 기술은 향후 웹의 기술적 변화를 추구하며 최근의 웹의 변화에 중요한 역할을 수행할 것으로 기대된다. 웹서비스는 어플리케이션 간의 통신을 위한 호환성 표준을 제시하며 기업 내/외를 아우를 수 있는 어플리케이션 상호작용 및 통합을 촉진한다. 웹서비스를 서비스 중심 컴퓨팅환경으로서 운용하기 위해서는 웹서비스 저장소가 완성도 높게 조직화되어 있어야 할 뿐 아니라, 사용자들의 필요에 맞는 웹서비스 컴포넌트를 찾을 수 있는 효율적인 도구들을 제공하여야 한다. 서비스 중심 컴퓨팅을 위한 웹서비스의 중요성이 증대됨에 따라 웹서비스의 분류체계를 효율적으로 제공할수 있는 기법의 수요 또한 증대된다. 다수의 웹서비스 저장소들은 웹서비스 분류체계를 제안하여 왔지만, 대부분의 분류체계는 활용하기에는 제대로 발달하지 못하였거나 관리하기에 너무 어려운 단점을 갖고 있다. 이 논문에서는 인공신경망 기반 군집화 기법과 XML 기반의 웹서비스 기술표준인 WSDL의 의미적가치를 활용하여 웹서비스 분류체계 생성 프레임워크를 제안한다. 이 논문에서 인공신경망을 활용하여 제안하는 웹서비스 분류체계 생성 프레임워크를 프로토타입 시스템로 개발하였으며, 실제 운용되고 있는 웹서비스 저장소로부터 획득한 실제 웹서비스들을 사용하여 제안하는 웹서비스 분류체계 생성 프레임워크를 실증적으로 평가하였다. 또한 제안하는 방식의 효용성을 보여주는 실험결과를 보고한다.

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.