• Title/Summary/Keyword: web mining

검색결과 548건 처리시간 0.025초

An intelligent system for automatic data extraction in E-Commerce Applications

  • Cardenosa, Jesus;Iraola, Luis;Tovar, Edmundo
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.202-208
    • /
    • 2001
  • One of the most frequent uses of Internet is data gathering. Data can be about many themes but perhaps one of the most demanded fields is the tourist information. Normally, databases that support these systems are maintained manually. However, there is other approach, that is, to extract data automatically, for instance, from textual public information existing in the Web. This approach consists of extracting data from textual sources(public or not) and to serve them totally or partially to the user in the form that he/she wants. The obtained data can maintain automatically databases that support different systems as WAP mobile telephones, or commercial systems accessed by Natural Language Interfaces and others. This process has three main actors. The first is the information itself that is present in a particular context. The second is the information supplier (extracting data from the existing information) and the third is the user or information searcher. This added value chain reuse and give value to existing data even in the case that these data were not tough for the last use by the use of the described technology. The main advantage of this approach is that it makes independent the information source from the information user. This means that the original information belongs to a particular context, not necessarily the context of the user. This paper will describe the application based on this approach developed by the authors in the FLEX EXPRIT IV n$^{\circ}$EP29158 in the Work-package "Knowledge Extraction & Data mining"where the information captured from digital newspapers is extracted and reused in tourist information context.

  • PDF

부품 제조 산업에서의 e-Business 구축 사례(PCB 산업의 B2B) (A Case Study of e-Business Implementation in Part Manufacturing Industry(B2B in PCB Industry))

  • 배준수;배은해;정민창;신인기;박영철
    • 산업공학
    • /
    • 제13권3호
    • /
    • pp.503-511
    • /
    • 2000
  • The main theme of this research is a case of e-Business implementation in part manufacturing industry, especially in a PCB manufacturing company. The characteristics of part manufacturing industry are as follows. First, an ERP system runs as a legacy system that is ready to be combined with e-Business system. Secondly, the number of customers is very small. The customers are not many individuals but only a few big electronic enterprises that are strategically affiliated with the part manufacturing company. This means that the e-Business of the part manufacturing industry needs to focus on sharing pertinent information throughout the transactions with the customers, not on data-warehousing or data-mining customers' potential needs or requests. In this paper, we extracted e-Business opportunity domains from a PCB manufacturing company, a typical part manufacturing industry. We are intended to enhance information sharing between customers and the company, and provide functions of transactions necessary in the whole value chain from order to shipment. Implementing the e-Business system on the Web can increase the visibility of customers, and further, the company can be transformed into an extended enterprise where the relationship with the customers becomes very close and interleaved. Also, the Cyber Office functionality of the e-Business system can support the salespersons effectively, so that they can spend more time on customer satisfaction. Such efforts, in the future, can be a basis for active adaptation to the industry transformations such as forming e-community and participating in the marketplace.

  • PDF

공공 빅데이터의 시각화를 위한 InfograaS의 아이디어 제안 (Idea proposal of InfograaS for Visualization of Public Big-data)

  • 차병래;이형호;심수정;김종원
    • 한국항행학회논문지
    • /
    • 제18권5호
    • /
    • pp.524-531
    • /
    • 2014
  • 본 논문에서는 클라우드 컴퓨팅 자원을 이용하여 빅데이터의 일종인 LOD (linked open data)를 가공 및 분석하는 방법을 제안한다. LOD는 공공 데이터를 공유 및 재활용하기 위한 웹기반의 오픈 데이터이다. 특히 BA(business analytics)와 Info-graphic을 위한 시각화 (visualization) 기술을 제공하는 새로운 SaaS (software as a service) 비즈니스 영역을 InforgraaS (Info-graphic as a service)라고 정의한다. 본 연구의 목표는 시각화 및 비즈니스 전문가 없이 비전문가 또는 초보자가 사용할 수 있도록 하는 것이다. 데이터 시각화 (data visualization)는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정을 말한다. 데이터 시각화의 목적은 챠트와 그래프를 통해 정보를 명확하고 효과적으로 전달하는 것이다. 공공기관의 빅데이터를 클라우드 컴퓨팅 자원과 오픈 소스인 하둡, R, 기계학습, 데이터 마이닝 등을 이용하여 다양한 처리 결과를 이해하기 쉬운 그래픽 또는 챠트로 표현하고 공유한다.

EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템 (An Example-Based Natural Language Dialogue System for EPG Information Access)

  • 김석환;이청재;정상근;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.123-130
    • /
    • 2007
  • 본 논문에서는 EPG 정보 검색을 위한 자연어 대화 시스템에 대해 논한다. 자연어 대화 시스템 구축을 위한, 대화 예제를 이용한 상황 기반 대화 관리 방법론은, 효율적이고 실용적인 대화 시스템 구축을 가능하게 한다. 대화 시스템은 사용자 발화에 대해 적합한 시스템 응답 발화를 출력하는 과정으로 진행되며, 이를 위해, 사용자 발화 의미 분석, 대화 관리, 시스템 응답 발화 생성의 과정을 거친다. 정확하고 신속한 정보의 전달이 중요한 EPG 정보 검색 도메인의 특성상 EPG 데이타베이스의 관리 및 갱신이 중요한 요소로 작용한다. 이를 위해 웹마이닝 기반의 EPG 데이타베이스 관리자를 구현함으로써 데이타베이스 구축에 필요한 비용을 최소화하고, 신속하고 정확한 정보를 제공할 수 있었다. 실험 결과를 통해 본 시스템이 EPG 정보 검색을 위해 적은 비용으로 높은 성능을 보이고 있음을 확인한다.

사회 네트워크 분석에 기반한 도서관 학술DB 이용 패턴 연구: K대학도서관 학술DB 이용 사례 (A Usage Pattern Analysis of the Academic Database Using Social Network Analysis in K University Library)

  • 최일영;이용성;김재경
    • 정보관리학회지
    • /
    • 제27권1호
    • /
    • pp.25-40
    • /
    • 2010
  • 본 연구는 사회 네트워크 분석 기법을 통하여 K대학도서관의 학술DB 이용현황을 분석하고 이용자의 요구에 적합한 서비스를 개발 및 제공하고자 하는데 그 목적을 두고 있다. 이를 위하여 K대학 도서관의 학술DB 로그 데이터를 이용하여 학문분야별, 신분별, 학문분야 및 신분별 학술DB 네트워크를 구성하고 실증 분석하였다. 본 연구의 결과, 전임교원의 학술DB 네트워크와 박사과정의 학술DB 네트워크는 특화된 학술DB를 중심으로 강한 결속력을 보이고 있으며 다른 신분의 학술DB 네트워크보다 밀도, 연결정도 집중도 및 연결정도 중심성이 높게 나타났다.

테크놀로지 인텔리전스 서비스의 시각화 요소 평가 -사용자 평가를 통한 효용성 분석- (Usefulness Evaluation on Elements for Visualization of Technology Intelligence Service)

  • 이진희;김태홍;이미경;김진형;정한민;성원경;김도완
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.533-542
    • /
    • 2011
  • 정보 시각화 요소는 사용자에게 정보를 효율적으로 서비스하기 위한 기술로서, 웹의 진화 과정상에서 그 중요성을 높여가고 있다. 본 연구의 분석 대상인 InSciTe는 대용량의 논문과 특허 데이터를 시맨틱 웹 기술과 텍스트 마이닝 기술을 이용하여 R&D 전략 수립을 지원하는 테크놀로지 인텔리전스 서비스이다. 본 연구에서는 대용량의 논문과 특허 데이터를 대상으로 시맨틱 웹 기술과 텍스트 마이닝 기술을 이용하여 R&D 전략 수립을 지원하는 테크놀로지 인텔리전스 서비스인 InSciTe의 시각화 요소들에 대한 효용성 평가를 수행하고, 각각의 서비스 유형마다 정량적 및 정성적 분석을 통하여 사용자들이 선호하는 디자인과 적용 방법을 제안한다. 효용성 평가 결과, InSciTe 내의 시각화 요소들은 사용자의 인지력을 향상시키기 위하여 사용자 친화적으로 구현되었다는 결론을 얻었다.

질의응답 커뮤니티에서 문서 간 이독성 비교 (Comparison of Readability between Documents in the Community Question-Answering)

  • 문길성
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.25-34
    • /
    • 2020
  • 커뮤니티 질의응답 서비스는 다양한 목적으로 활용되고 있다. 질의응답 문서에서 정보의 품질은 질문의 명확성과 답변 내용의 적절성으로 결정되며 문서의 읽기 쉬운 정도를 나타내는 이독성(readability)은 문서가 가지고 있는 정보의 품질을 평가하기 위한 주요 요소이다. 본 연구의 목적은 국내의 CQA 사이트에서 제공되는 문서의 품질을 측정하는 것이다. 이를 위하여 네이버 지식iN의 '국민 신문고' 커뮤니티의 문서에서 사용된 어휘 수준별 사용 빈도를 비교하고, 작성 기관별 문서의 이독성 지수를 측정하였다. 이독성 지수의 측정은 어휘 수준과 문장 길이를 바탕으로 계산되는 Dale-Chall 공식을 사용하였다. 분석 결과, 답변에서 사용된 어휘는 질문에서 사용된 어휘보다 더 어려운 수준이고 문장 길이도 더 길어서 이독성이 더 낮은 것으로 나타났다. 또한, 질의응답간 이독성의 차이는 작성 기관별로도 차이가 있음을 파악할 수 있었다. 본 연구의 결과는 상담업무에 반영할 수 있는 유용한 정보를 도출하여 온라인상의 민원상담 개선에 활용할 수 있으며, 이독성 지수에 기반하여 문서 수준의 정량적 분석을 시도함으로써 텍스트 마이닝의 주제를 확장할 수 있을 것으로 기대한다.

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

빅데이터 분석을 활용한 인공지능 인식에 관한 연구 (A Study on Recognition of Artificial Intelligence Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.129-130
    • /
    • 2018
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2018년 5월 19일 시점 1개월 기간을 설정하여 "인공지능" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 인공지능에 대한 1위 연관 검색어는 중국(4,122)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

GIS기반 소수력 Package Tool 개발 (The Development of GIS-based Small Hydropower Package Tool)

  • 허준호;정상만;박완순;이철형
    • 한국태양에너지학회:학술대회논문집
    • /
    • 한국태양에너지학회 2009년도 춘계학술발표대회 논문집
    • /
    • pp.139-144
    • /
    • 2009
  • The generation of small hydropower as compared to other different developed environmental methods produces one of the clean energies. In such manner, various application system development through IT technique is being developed for an advanced small hydropower energy resources data mining. However, existing data analysis of New & Renewable Information System for small hydropower resources application is incomplete therefore it limits expressing these information on the Web. Thus for positive usage of small hydropower resources, a more systematic and precise analysis system should be built. This study seeks to develop a map of the domestic small hydropower resources problems to further improve small hydropower resources, developed through Package Tool which can accurately evaluate a wide range of small hydropower basin in a short period of time. Small hydropower Package Tool was calculated using existing Analysis System small hydropower resources which did not provide diverse capabilities resulting to 840 standard basin classified by A and facility capacity, etc., and to assume a 40% annual capacity, expected annual electricity production was calculated. Small hydropower for the national water system of small hydropower resources potential calculated in terms of resources for the development of small hydropower will be utilized as basic data.

  • PDF