• Title/Summary/Keyword: 정보 수집 및 추출

Search Result 756, Processing Time 0.029 seconds

Design and Implementation of Keywords Extraction System from CQI Reports by the Analysis of Graph Centrality (그래프 중심성 분석에 의한 CQI 보고서 핵심어 추출 시스템의 설계 및 개발)

  • Pheaktra, They;Lim, JongBeom;Lee, JongHyuk;Gil, Joon-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.256-259
    • /
    • 2019
  • 최근 대학교는 CQI(Continuous Quality Improvement) 등의 방대한 교육 관련 데이터를 수집하고 있고 이를 분석하여 교육 및 경영에 활용하고 있다. 핵심어는 텍스트의 내용을 간결하게 표현할 수 있는 단어이다. 그래서 CQI 보고서의 의미를 파악하기 위해서는 먼저 핵심어 추출이 필요하다. CQI 보고서에서 핵심어를 추출하면 이후 정보 검색, 인덱싱, 분류, 클러스터링, 필터링 등과 같은 많은 응용 작업을 용이하게 수행할 수 있다. 따라서 방대한 양의 CQI 보고서로부터 핵심어 추출을 자동화한다면 이후 요약 및 의미 파악에 많은 도움이 될 것이다. 이 논문에서는 CQI 보고서 요약을 위해 자동적으로 핵심어를 추출하는 방법을 제안한다.

A Multi-Agent System for Collecting Comparative Shopping System (비교 쇼핑 정보 수집을 위한 멀티 에이전트 시스템)

  • 신주리;전중남;이건명
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.154-156
    • /
    • 2001
  • 인터넷 상의 많은 전자 상거래 쇼핑몰에 있는 상품 정보에 대한 비교 서비스를 제공하는 시스템들이 개발되고 있다. 이러한 서비스를 위해서는 분산된 전자 상거래 쇼핑몰들의 정보를 수집하여 통합하는 노력이 필요하다. 이 논문에서는 멀티 에이전트 구조로 설계한 인터넷 상의 쇼핑몰들로부터 상품 정보를 수집하여 서비스하는 시스템에 대해서 소개한다. 이 시스템에서는 랩퍼 생성 서브시스템, 정보 수집 서브시스템, 카테고리 분석 서브시스템, 데이터 정제 서브시스템 등의 구성 요소들이 유기적으로 결합되어 동작한다. 이 논문에서는 전체적인 시스템의 구성에 대해서 살펴보고, 각 서브시스템의 기능 및 구조에 대해서 기술한다. 또한 쇼핑몰로부터 정보를 추출하기 위한 랩퍼 생성 기법과 상품 정보의 카테고리를 결정하는 방법에 대해서 소개한다.

  • PDF

Collecting and Analyzing Color Information for Constructing Semantic Information Model (의미정보모델 구축을 위한 색채정보의 수집과 정량적 분석)

  • Lyu, Ki-Gon;Sun, Dong-Eon;Kim, Hyeon-Cheol
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.232-235
    • /
    • 2011
  • 지식표현은 일반적으로 논리, 규칙, 프레임 또는 의미망 형태로 표현되며, 최근에는 의미망을 이용한 온톨로지 형태로 표현되고 있다. 이러한 지식표현 방법은 개념을 설명하는 문맥적인 정보나 개념들 간의 구조적인 정보를 이용하여 개념에 대한 지식을 논리적으로 표현하는데 중점을 두었다. 하지만, 지식표현에 사용되는 의미정보는 사람에 의해 수집되고 정제되기 때문에 많은 시간, 비용 및 인력이 필요하다는 한계가 있고, 새로운 의미를 추가하거나 기존의 의미를 수정하는 것이 매우 어렵다는 한계가 있다. 색채는 특정 대상이나 개념에 대한 의미, 연상, 상징 등 객관적인 특징 뿐 아니라 시대, 나라, 문화와 같은 사회적 배경을 반영하기 때문에, 정보를 제공하고 감성을 전달하는 효과적인 수단으로 사용되고 있다. 이에 본 논문은, 색채를 이용한 의미정보모델 구축을 위해, 색채정보를 수집하고 정량적으로 분석하는 방법을 제안한다. 긍정/부정/불안/중립으로 구성된 감성어휘 273개를 이용하여 이미지를 수집한 결과 총 130,944개의 이미지를 수집하였다. 이미지에는 여러 가지 사물, 행동, 배경, 색채 등 다양한 정보가 혼재되어 있어 감성어휘와 연관된 색채를 구별하기 어렵기 때문에 이미지를 직관적으로 설명할 수 있는 사용자 태그를 별도로 수집하였다. 태그는 총 2,836,395개를 수집하였고 각 이미지와 그룹에서의 가중치를 구하였다. 태그의 가중치를 통해 이미지가 그룹 내에서 갖는 중요도를 판별하였고, 각 그룹 별로 상위 30%의 이미지를 추출하여 대표 색채를 분석하였다.

Determination presence of people in accommodation using feature extraction and XGBoost method of energy data (전력 데이터의 특징 추출 및 XGBoost를 이용한 숙박 업소 재실 여부 판단)

  • Kim, Eden;Ko, Seok-Gap;Son, Seung-Chul;Lee, Hyung-Ok;Lee, Byung-Tak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.458-460
    • /
    • 2020
  • 스마트미터의 기술 발달과 보급으로 인해 전력데이터의 수집이 보다 수월 해짐에 따라 각 시스템에 효율적인 맞춤 서비스 제공을 위한 전력 데이터 분석 기술에 관한 다양한 연구가 활발하게 진행되고 있다. 관련하여 본 논문에서는 숙박업소의 각 방마다 전력소비량을 측정 및 수집하여 전력소비패턴을 분석하고 특징 추출 및 XGBoost 를 이용한 머신러닝 분석방법으로 각 방의 사람 재실 여부를 판별하는 방법을 소개한다. 이와 같은 연구를 통해 추후 숙박업소 혹은 숙박업소를 이용하는 소비자들의 맞춤 서비스 제공에 응용 및 적용 할 수 있다.

Development of Data Collection Application using Smart Phone (스마트 폰을 이용한 데이터 수집 어플리케이션 개발)

  • Jung, Yong-jin;Oh, Chang-heon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.10a
    • /
    • pp.664-666
    • /
    • 2014
  • Recently, it is issued that the big data collecting meaningless data, and then extracting meaningful data from analyzed relationship to provide various information for users. However, original data collecting methods have difficulty in collecting information Because they analyze data by using sensors installed at exterior and interior of buildings and information of users. In this paper, we develop a data collection application using smart phone to resolve this problem. Developed application transmits data about Wi-Fi and measured information such as temperature, humidity, acceleration, gyro to server through web. The data transmitted is used as a context inference for users. According to the inference result, it is possible to provide various services on user conditions.

  • PDF

A Case Study on The Establishment of Efficient Management of Academic Information and Services. (학술정보의 효율적 전주기 관리 및 서비스 체제 구축에 관한 사례 연구)

  • Cho, Sung-Nam;Seo, Tae-Sul;Kim, Wan-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.412-415
    • /
    • 2016
  • 본 연구에서는 학술정보의 효율적 관리 및 서비스 체제를 수립하고 활용성을 강화하기 위해 논문 자동 수집 및 구축, 논문 투고 및 심사, 전자출판, XML 자동 구축에 이르기까지 전주기 기능 구현에 방안을 제시하고 이를 구현한 사례를 소개하고자 한다. 기존 Peer-Review 시스템은 데이터 수집 및 변환파트와 투고 및 심사, 전자출판 파트, XML 구축 파트 등으로 분리되거나 별도로 운영되어 왔다. 본 연구에서는 이러한 기능을 통합적으로 구현하기 위해 KISTI의 Peer-Review 시스템인 ACOMS와 XML 기반 학술정보서비스 시스템(KpubS) 기능 및 프로세스를 통합한 구현 방안을 제시하고 이를 시스템으로 구현하였다. 그러나 아직까지 원문 PDF를 XML로 완전 자동 변환할 수 있는 기술은 없는 상태로써 반자동 변환 기능을 탑재하였다. 본 연구 내용은 다양한 수집 채널을 통해 입수된 학술정보 및 XML 자료에 대한 입력체계를 제공하고, XML 본문으로부터 메타데이터를 자동 식별 및 추출하여 학술정보 DB를 구축 저장하며, 구축된 DB 및 XML 기반의 전자출판 기능 제공과 함께 웹서비스 단계까지의 전주기 공정에 대한 프로세스 모델 및 시스템에 관한 것이다. 이에 데이터베이스 구축을 위한 시간 및 비용을 절감할 수 있을뿐만 아니라, 시맨틱 태깅 및 수식, 표, 그림 정보 제공 등 이용자에게 다양한 형태의 서비스를 제공할 수 있게 되었다.

A Recommendation System by Extracting Scholarship Information with a BERT's Q&A Model (BERT Q&A 모델을 활용한 장학금 정보 추출 및 추천 시스템)

  • Byeongjun Kang;Kyujin Kim;Jinah Park;Ijun Jang;Jaehyun Joo;Hyungjoon Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.288-289
    • /
    • 2023
  • 본 논문은 글로벌 이슈로 인한 인플레이션과 대학 등록금 인상 우려 등으로 인해 장학금의 중요성이 부각되고 있는 상황을 고려하여 기존의 장학금 공고 게시물을 수집한 후 BERT Q&A (Bidirectional Encoder Representations from Transformers Question & Answering) 모델을 이용해 개별 맞춤형 장학 공고를 추천하는 시스템을 제안한다. 우선 웹 크롤링을 통해 장학금 정보를 수집하고, BERT Q&A 모델과 사전에 정의한 규칙 기반으로 핵심 정보를 추출한다. 이후 분류 과정을 거쳐 사용자가 입력한 정보와 매칭하여 조건에 맞는 장학금 게시물을 추천할 수 있는 어플리케이션을 구현하였다.

Implementation and Design of Robot Engine for Web Collection (웹 수집 로봇 엔진의 설계 및 구현)

  • Kim, Dae-You;Kim, Jung-Tae
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.10a
    • /
    • pp.313-317
    • /
    • 2007
  • 인터넷의 이용이 활발해짐에 따라 수많은 정보들이 웹을 통하여 공개되고 있으며, 이용자는 웹 검색 서비스를 이용하여 이러한 정보들에 효과적으로 접근할 수 있다. 웹 검색 서비스의 구축을 위해서는 웹 로봇을 사용한 웹 문서 수집이 선행되어야 하며, 웹 문서들의 수가 급격히 증가하면서 양질의 웹 문서들을 효과적으로 수집할 수 있는 웹 로봇에 대한 필요성이 증가되고 있으며, 그에 따른 많은 웹 수집 로봇이 탄생되고 있다. 본 논문에서는 효과적인 웹 수집 로봇의 설계와 동적인 웹페이지에서 사용하는 자바스크립트의 링크 추출방안에 대하여 제시하고자 한다.

  • PDF

Design and Implementation for Extraction of Field-Associationed Terms (분야연상어 추출 방법의 설계 및 구현)

  • Lee, Won-Hee;Choi, Hyun;Lee, Samuel Sangkon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.651-654
    • /
    • 2004
  • 우리는 특정 문서를 읽을 때 문서 전체를 읽지 않더라도 대표적인 몇 개의 단어를 보는 것만으로 정치나 경제, 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체를 대상으로 하지 않고 부분텍스트에서 출현하는 소수의 단어정보에서 문서의 분야를 정확히 결정하기 위해 분야연상어의 구축은 중요한 연구과제이다. 인간이 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집문서의 분야를 정확히 지시하는 분야연상어를 자동으로 수집하는 시스템을 설계하고 구현하는데 목적이 있다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준, 안정성 랭크, 집중률, 빈도정보를 이용하여 단일 분야연상어를 수집하는 방법을 제안하고 구현한다.

  • PDF

Wi-Fi Fingerprint-based Data Collection Method and Processing Research (와이파이 핑거프린트 기반 데이터 수집 방법 및 가공 연구)

  • Kim, Sung-Hyun;Yoon, Chang-Pyo
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2019.05a
    • /
    • pp.319-322
    • /
    • 2019
  • There are many techniques for locating users in an indoor spot. Among them, WiFi fingerprinting technique which is widely used is phased into a data collection step and a positioning step. In the data collection step, all surrounding Wi-Fi signals are collected and managed as a list. The more data collected, the better the accuracy of the indoor position based on Wi-Fi fingerprint. Existing high-quality data collection and management methods are time consuming and costly, and many operations are required to extract and generate data necessary for machine learning. Therefore, we research how to collect and manage large amount of data in limited resources. This paper presents efficient data collection methods and data generation for learning.

  • PDF