• 제목/요약/키워드: information extraction

검색결과 5,336건 처리시간 0.034초

재난 전조 정보 추출 알고리즘 연구 (A Study of the extraction algorithm of the disaster sign data from web)

  • 이창열;김태환;차상열
    • 한국재난정보학회 논문집
    • /
    • 제7권2호
    • /
    • pp.140-150
    • /
    • 2011
  • 지구 온난화로 생활 환경이 급격히 변화하고 있으며, 대형 재난이 증가하고 있다. 이러한 재난 발생시 복구에 많은 자원을 투입하고 있지만, 재난의 예방 만큼 효과적인 대책은 없을 것이다. 재난전조 정보란 하인리히 법칙에 따라 예고되는 재난에 대한 전조이며, 이에 대한 정보를 자동으로 추출하여 대비할 수 있게 하는 것이 본 논문의 초점이다. 웹에 산재된 정보로부터 전조 정보를 정확히 추출하기 위한 기반이 되는 단어(명사)를 구축하고 이를 기반으로 정확한 데이터를 추출할 수 있는 알고리즘을 연구하였다. 본 연구의 결과물로 도출된 단어는 분석적인 연구결과이기 때문에 장기적으로 실제 데이터를 적용하면서 지속적으로 보완되어야 할 것이다.

KOMPSAT-2 영상을 이용한 토지피복정보 자동 추출 (Automatic Extraction of Land Cover information By Using KOMPSAT-2 Imagery)

  • 이현직;유지호;유영걸
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2010년 춘계학술발표회 논문집
    • /
    • pp.277-280
    • /
    • 2010
  • There is a need to convert the old low- or medium-resolution satellite image-based thematic mapping to the high-resolution satellite image-based mapping of GSD 1m grade or lower. There is also a need to generate middle- or large-scale thematic maps of 1:5,000 or lower. In this study, the DEM and orthoimage is generated with the KOMPSAT-2 stereo image of Yuseong-gu, Daejeon Metropolitan City. By utilizing the orthoimage, automatic extraction experiments of land cover information are generated for buildings, roads and urban areas, raw land(agricultural land), mountains and forests, hydrosphere, grassland, and shadow. The experiment results show that it is possible to classify, in detail, for natural features such as the hydrosphere, mountains and forests, grassland, shadow, and raw land. While artificial features such as roads, buildings, and urban areas can be easily classified with automatic extraction, there are difficulties on detailed classifications along the boundaries. Further research should be performed on the automation methods using the conventional thematic maps and all sorts of geo-spatial information and mapping techniques in order to classify thematic information in detail.

  • PDF

Robust surface segmentation and edge feature lines extraction from fractured fragments of relics

  • Xu, Jiangyong;Zhou, Mingquan;Wu, Zhongke;Shui, Wuyang;Ali, Sajid
    • Journal of Computational Design and Engineering
    • /
    • 제2권2호
    • /
    • pp.79-87
    • /
    • 2015
  • Surface segmentation and edge feature lines extraction from fractured fragments of relics are essential steps for computer assisted restoration of fragmented relics. As these fragments were heavily eroded, it is a challenging work to segment surface and extract edge feature lines. This paper presents a novel method to segment surface and extract edge feature lines from triangular meshes of irregular fractured fragments. Firstly, a rough surface segmentation is accomplished by using a clustering algorithm based on the vertex normal vector. Secondly, in order to differentiate between original and fracture faces, a novel integral invariant is introduced to compute the surface roughness. Thirdly, an accurate surface segmentation is implemented by merging faces based on face normal vector and roughness. Finally, edge feature lines are extracted based on the surface segmentation. Some experiments are made and analyzed, and the results show that our method can achieve surface segmentation and edge extraction effectively.

컬러와 형태에 기반을 둔 상표 영상 검색 시스템 (The Brand Image Retrieval System Based on Color and Shape)

  • 신성윤;표성배
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.167-172
    • /
    • 2006
  • 영상 검색 시스템이란 영상이 갖는 다양한 특징을 바탕으로 똑같거나 유사한 영상을 검색하여 제공하는 시스템이다. 본 논문에서는 영상의 컬러와 형태를 기반으로 한 상표 영상 검색 시스템을 제시한다. 영상을 영역별로 분할하고 영역별 컬러 분포 히스토그램을 추출하여 컬러 정보로 이용한다. 경계면 추출, 무게 중심 추출, angular 샘플링 등의 전처리 과정과 무게 중심으로부터 경계면 까지 거리의 합, 표준 편차, 장/단축 비율을 계산하여 형태정보로 이용한다. 이렇게 추출된 컬러와 형태 정보를 이용하여 유사성 측정을 통한 검색을 수행한다.

  • PDF

Simplification of LIDAR Data for Building Extraction Based on Quad-tree Structure

  • Du, Ruoyu;Lee, Hyo Jong
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.355-356
    • /
    • 2011
  • LiDAR data is very large, which contains an amount of redundant information. The information not only takes up a lot of storage space but also brings much inconvenience to the LIDAR data transmission and application. Therefore, a simplified method was proposed for LiDAR data based on quad-tree structure in this paper. The boundary contour lines of the buildings are displayed as building extraction. Experimental results show that the method is efficient for point's simplification according to the rule of mapping.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

The study of Combination Texture Information and Knowledge Base Classification for Urban Paddy Area Extraction-Using High Resolution Satellite Image

  • Chou, Tien-Yin;Lei, Tsu-Chiang;Chen, Yan-Hung
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.807-810
    • /
    • 2003
  • This research uses high-resolution satellite images as a source of collecting farmland information. For effectively extract the paddy area, we use texture information and different classify methods to assist the satellite image classification. First, using maximum likelihood classifier to extract paddy information from images. The results show that User Accuracy and Procedure Accuracy of the paddy area can increase from 80.60% to 95.45% and 84.38% to 95.45%. Second, establishing a paddy Knowledge Base and using Knowledge Base Classifier to extract paddy area, and result shows the User Accuracy and Producer Accuracy to be 92.16% and 90.06%. Finally, The result shows we can effectively contribute to the paddy field information extraction from high-resolution satellite images.

  • PDF

Infrared Target Extraction Using Weighted Information Entropy and Adaptive Opening Filter

  • Bae, Tae Wuk;Kim, Hwi Gang;Kim, Young Choon;Ahn, Sang Ho
    • ETRI Journal
    • /
    • 제37권5호
    • /
    • pp.1023-1031
    • /
    • 2015
  • In infrared (IR) images, near targets have a transient distribution at the boundary region, as opposed to a steady one at the inner region. Based on this fact, this paper proposes a novel IR target extraction method that uses both a weighted information entropy (WIE) and an adaptive opening filter to extract near finely shaped targets in IR images. Firstly, the boundary region of a target is detected using a local variance WIE of an original image. Next, a coarse target region is estimated via a labeling process used on the boundary region of the target. From the estimated coarse target region, a fine target shape is extracted by means of an opening filter having an adaptive structure element. The size of the structure element is decided in accordance with the width information of the target boundary and mean WIE values of windows of varying size. Our experimental results show that the proposed method obtains a better extraction performance than existing algorithms.

Syntactic and semantic information extraction from NPP procedures utilizing natural language processing integrated with rules

  • Choi, Yongsun;Nguyen, Minh Duc;Kerr, Thomas N. Jr.
    • Nuclear Engineering and Technology
    • /
    • 제53권3호
    • /
    • pp.866-878
    • /
    • 2021
  • Procedures play a key role in ensuring safe operation at nuclear power plants (NPPs). Development and maintenance of a large number of procedures reflecting the best knowledge available in all relevant areas is a complex job. This paper introduces a newly developed methodology and the implemented software, called iExtractor, for the extraction of syntactic and semantic information from NPP procedures utilizing natural language processing (NLP)-based technologies. The steps of the iExtractor integrated with sets of rules and an ontology for NPPs are described in detail with examples. Case study results of the iExtractor applied to selected procedures of a U.S. commercial NPP are also introduced. It is shown that the iExtractor can provide overall comprehension of the analyzed procedures and indicate parts of procedures that need improvement. The rich information extracted from procedures could be further utilized as a basis for their enhanced management.

평면적 어휘 자질들을 활용한 확장 혼합 커널 기반 관계 추출 (Relation Extraction based on Extended Composite Kernel using Flat Lexical Features)

  • 최성필;정창후;최윤수;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.642-652
    • /
    • 2009
  • 본 논문에서는 기존의 관계 추출 성능을 향상시키기 위해서 기존의 자질 기반 방법에서 추구하였던 개체 주변 문맥 다양성 정보의 추출 및 적용과 커널 기반 방법의 강점인 관계 인스턴스에 대한 구문 구조적 자질 정보의 통합 활용을 통한 확장된 혼합 커널을 제안한다. ACE RDC 코퍼스를 활용한 실험에서, 기존의 합성곱 구문 트리 커널 기반 혼합 커널을 기반으로 총 9 종류의 평면적 어휘 자질 집합을 정의하고 이를 적용함으로써 성능 향상에 기여하는 어휘 자질 유형을 파악할 수 있었으며, 적은 규모의 학습 집합으로도 현재 최고 수준의 성능에 필적하는 결과를 얻을 수 있었다. 결론적으로 관계 추출을 위한 세 가지 핵심 정보, 즉 개체 자질, 구문 구조적 자질, 주변 문맥 어휘 자질을 통합 적용하면 관계 추출의 성능을 향상시킬 수 있음을 알 수 있었다.