• 제목/요약/키워드: Knowledge extraction

검색결과 384건 처리시간 0.032초

A Study On Extraction System Of Trackback Address For Knowledge Service Based On Using AJAX (AJAX를 이용한 웹 기반 지식 서비스의 트랙백 주소 추출 시스템에 관한 연구)

  • Ku, Min-O;Kyung, Min-Gi;Min, Dug-Ki
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2010년도 춘계학술대회
    • /
    • pp.547-552
    • /
    • 2010
  • 지식서비스에서는 최근 자사의 지식정보에 대해 대표적인 지식 구축 채널로 발전중인 블로그(Blog)와의 연계를 추구하기 위해 트랙백(Trackback) 서비스 제공하고 있으며 이를 통해 자사를 넘어 다양한 블로그 서비스를 통해 지식 정보를 제공하고 있는 블로그 사이트들 과의 지식 체인(Knowledge Chain)을 형성하고 있다. 본 논문에서는 지식 체인 서비스를 제공하고 있는 다음 커뮤니케이션사의 지식 서비스에 대한 트랙백 주소 확보를 위한 구조 및 환경에 대해 분석 제공하고 있으며, 앞서 언급한 지식서비스와 블로그간의 지식 체인 형성시 필수적으로 요구되는 트랙백 주소 확보를 보다 용이하게 할 수 있도록 웹 기반의 비동기적 통신 스크립트 기술인 AJAX를 이용하는 클라이언트 측의 웹 어플리케이션 형태의 "트랙백 주소 추출 시스템"을 제시 구현하고 있다.

  • PDF

Quantitative Analysis of Biological Models under the Internet Environment (인터넷 환경을 통한 생물학적 모델의 정량적 분석)

  • Yun, Choa-Mun;Lee, Dong-Yup;Cho, A-Youn;Lee, Sang-Yup;Park, Sun-Won
    • Journal of Institute of Control, Robotics and Systems
    • /
    • 제11권10호
    • /
    • pp.837-842
    • /
    • 2005
  • The computational modeling and simulation of complex biological systems are indispensable for new knowledge extraction from huge experimental data and ever growing vast amount of information in systems biology. Moreover, gathering and sharing of the existing information and newly-generated knowledge can speed up this research process. In this regard, several modeling projects have been undertaken for quantitatively analyzing the biological systems via the internet. They include Virtual Cell, JWS and OBIYagns. We also develop an integrated web-based environment, which facilitate investigation of dynamic behavior of cellular systems.

Keyword identifications on dimensions for service quality of Healthcare providers (헬스케어 서비스 리뷰를 활용한 서비스 품질 차원 별 중요 단어 파악 방안)

  • Lee, Hong Joo
    • Knowledge Management Research
    • /
    • 제19권4호
    • /
    • pp.171-185
    • /
    • 2018
  • Studies on online review have carried out analysis of the rating and topic as a whole. However, it is necessary to analyze opinions on various dimensions of service quality. This study classifies reviews of healthcare services into service quality dimensions, and proposes a method to identify words that are mainly referred to in each dimension. Service quality was based on the dimensions provided by SERVQUAL, and patient reviews have collected from NHSChoice. The 2,000 sentences sampled were classified into service quality dimension of SERVQUAL and a method of extracting important keywords from sentences by service quality dimension was suggested. The RAKE algorithm is used to extract key words from a single document and an index is considered to consider frequently used words in various documents. Since we need to identify key words in various reviews, we have considered frequency and discrimination (IDF) at the same time, rather than identifying key words based only on the RAKE score. In SERVQUAL dimension, we identified the words that patients mentioned mainly, and also identified the words that patients mainly refer to by review rating.

CR-M-SpanBERT: Multiple embedding-based DNN coreference resolution using self-attention SpanBERT

  • Joon-young Jung
    • ETRI Journal
    • /
    • 제46권1호
    • /
    • pp.35-47
    • /
    • 2024
  • This study introduces CR-M-SpanBERT, a coreference resolution (CR) model that utilizes multiple embedding-based span bidirectional encoder representations from transformers, for antecedent recognition in natural language (NL) text. Information extraction studies aimed to extract knowledge from NL text autonomously and cost-effectively. However, the extracted information may not represent knowledge accurately owing to the presence of ambiguous entities. Therefore, we propose a CR model that identifies mentions referring to the same entity in NL text. In the case of CR, it is necessary to understand both the syntax and semantics of the NL text simultaneously. Therefore, multiple embeddings are generated for CR, which can include syntactic and semantic information for each word. We evaluate the effectiveness of CR-M-SpanBERT by comparing it to a model that uses SpanBERT as the language model in CR studies. The results demonstrate that our proposed deep neural network model achieves high-recognition accuracy for extracting antecedents from NL text. Additionally, it requires fewer epochs to achieve an average F1 accuracy greater than 75% compared with the conventional SpanBERT approach.

A Feature Selection Technique for an Efficient Document Automatic Classification (효율적인 문서 자동 분류를 위한 대표 색인어 추출 기법)

  • 김지숙;김영지;문현정;우용태
    • The Journal of Information Technology and Database
    • /
    • 제8권1호
    • /
    • pp.117-128
    • /
    • 2001
  • Recently there are many researches of text mining to find interesting patterns or association rules from mass textual documents. However, the words extracted from informal documents are tend to be irregular and there are too many general words, so if we use pre-exist method, we would have difficulty in retrieving knowledge information effectively. In this paper, we propose a new feature extraction method to classify mass documents using association rule based on unsupervised learning technique. In experiment, we show the efficiency of suggested method by extracting features and classifying of documents.

  • PDF

A Study on the Extraction into the Logical Structure of a Specific Document using Knowledge (지식을 이용한 특정 문서의 논리 구조 추출에 관한 연구)

  • 손영우;남궁재찬
    • The Journal of Information Technology and Database
    • /
    • 제3권1호
    • /
    • pp.85-95
    • /
    • 1996
  • 본 논문은 특정문서에서 문서가 갖고 있는 일반적인 지식을 이용하여 논리적 항목을 추출하는 방법에 관한 연구이다. 먼저 입력된 문서의 영역 분할, 분리자 추출, 그리고 문자와 비문자를 구별하였다. 논리구조 추출단계에서는 구별된 요소의 상대적 크기, 위치 및 전후 블록들의 연관성에 관한 지식을 이용하여 각 블록들을 레이블링 하였고, 레이블된 항목들의 위치정보값을 이용하여 각 항목들을 자료화하였다. 마지막으로, 오분류된 항목에 대해서는 배치기술자를 이용한 검증을 통해 정정하였다. 본 논문에서 구현한 방법으로 실험한 결과 96.5%의 논리항목 추출율을 획득함으로써 그 유효성을 입증하였다.

  • PDF

Web Information Extraction for Expanding Knowledge Base of a Specific Domain Information Agent (특정 영역 정보 에이전트의 지식베이스 확장을 위한 웹 정보추출)

  • 조은휘;변영태
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.336-341
    • /
    • 2002
  • 현재 연구개발 중인 웹 정보 에이전트는 Agent Manager와 KB Manager. Web Manager로 구성되어 있다. 이 시스템은 동물영역에 관련된 정보를 영어로 서비스하고 있어 국내 접근보다는 외국에서의 접근이 더 많았다. 그러므로 국내 사용을 높이기 위해 애완용 동물을 위주로 한 정보추출(IE)을 수행하여 지식베이스(KB)의 확장을 시도하고 있다. 이를 위하여 태그(tag) 및 심볼(symbol)의 패턴(pattern) 유사성 정보를 찾아내고, 기존 KB와 연계하여 KB의 확장 및 수정에 이용하기 위한 유효 정보 패턴 결정에 활용함으로써 정보 추출의 새로운 방법을 고찰하고 그 가능성을 제시하고자 한다.

  • PDF

CiNet: GUI based Literature analysis tool using citation information

  • Lee, Se-Jun;Lee, Kwang-H.
    • Bioinformatics and Biosystems
    • /
    • 제2권1호
    • /
    • pp.33-36
    • /
    • 2007
  • Scientific literature is the most reliable and comprehensive source of knowledge for scientific and biomedical information. Citation information in the literature is also reliable source for linking between literatures. We proposed CiNet, a graphic user interface based tool that extracts the trend of the research using citation information. We can navigate related literatures and extract keywords from the linked literature using this tool. These extracted keywords will be helpful to researchers who want to survey the information.

  • PDF

Extraction of Data Quality Characteristics from Dirty Data (데이터 오류에서 추출한 데이터 품질 특성)

  • 김수경;최병주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.549-551
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제표준인 ISO/IEC 9126은 소프트웨어 품질 및 특성 및 측정 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 데이터 오류 형태를 분류하고, 이를 기반으로 데이트 품질 특성 및 부특성을 분류한다. 데이터 품질 특성 분류는 ISO/IEC 9126에 정의한 소프트웨어 품질 특성을 데이터 오류 형태에 대응시켜 추출한다. 본 논문에서 제시하는 데이트 품질특성 분류는 지식 공학(knowledge engineering)시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

A Study on a Motion Recognition from Moving Images with Camera Works

  • Murakami, Shin-ichi;Tomohiko-Shindoh
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 1998년도 Proceedings of International Workshop on Advanced Image Technology
    • /
    • pp.35-40
    • /
    • 1998
  • This paper describes an automatic recognition method of contents in moving images. The recognition process is carried out by the following two steps. At first, camera works in moving images are analyzed and moving objects are extracted from the moving images. Next, the motion of the object is recognized by pre-procured knowledge. These techniques will be applied to a construction of an efficient image database.

  • PDF