• 제목/요약/키워드: Automatic Extraction Algorithm

검색결과 296건 처리시간 0.027초

An Automatic Construction for Class Diagram from Problem Statement using Natural Language Processing

  • Utama, Ahmad Zulfiana;Jang, Duk-Sung
    • 한국멀티미디어학회논문지
    • /
    • 제22권3호
    • /
    • pp.386-394
    • /
    • 2019
  • This research will describe algorithm for class diagram extraction from problem statements. Class diagram notation consist of class name, attributes, and operations. Class diagram can be extracted from the problem statement automatically by using Natural Language Processing (NLP). The extraction results heavily depends on the algorithm and preprocessing stage. The algorithm obtained from various sources with additional rules that are obtained in the implementation phase. The evaluation features using five problem statement with different domains. The application will capture the problem statement and draw the class diagram automatically by using Windows Presentation Foundation(WPF). The classification accuracy of 100% was achieved. The final algorithm achieved 92 % of average precision score.

그래픽이론적 알고리즘들을 이용한 2차원 지형도로 부터 DEM 의 자동생성방법 (Automatic Generation of Digital Elevation Model from 2D Terrain Map Using Graph-theoretic Algorithms)

  • 구자영
    • 대한원격탐사학회지
    • /
    • 제9권2호
    • /
    • pp.21-34
    • /
    • 1993
  • 디지탈화된 지형 정보는 조망분석, 토목계획이나 설계, 또는 지리정보시스템등 여러 분야 에 필요한 요소가 된다. 또한 컴퓨터에 적절한 형식으로 입력된 지형정보는 모의 비행훈련이나 무인비행장치에서도 사용될 수 있다. 지형정보는 지도위에 등고선을 비롯한 여러가지 기호들로 표시되어 있어서 훈련된 요원에 의해 분석된다. 자동분석을 위해서는 컴퓨터에 입력되어야 하는 데 디지타이징 타블렛과 같은 장비를 사용하여 수동으로 입력하는 것은 많은 시간과 인력을 필요 로 한다. 본 논문에서는 이차원 지형도로부터 삼차원 지형정보를 자동적으로 추출하는 방법을 다 루고 있다. 등고선 조각연결 알고리즘을 포함하는 몇 가지 알고리즘들이 제안되었고 실제 지형도 를 사용하여 실험되었다.

Automatic modal identification and variability in measured modal vectors of a cable-stayed bridge

  • Ni, Y.Q.;Fan, K.Q.;Zheng, G.;Ko, J.M.
    • Structural Engineering and Mechanics
    • /
    • 제19권2호
    • /
    • pp.123-139
    • /
    • 2005
  • An automatic modal identification program is developed for continuous extraction of modal parameters of three cable-supported bridges in Hong Kong which are instrumented with a long-term monitoring system. The program employs the Complex Modal Indication Function (CMIF) algorithm for identifying modal properties from continuous ambient vibration measurements in an on-line manner. By using the LabVIEW graphical programming language, the software realizes the algorithm in Virtual Instrument (VI) style. The applicability and implementation issues of the developed software are demonstrated by using one-year measurement data acquired from 67 channels of accelerometers permanently installed on the cable-stayed Ting Kau Bridge. With the continuously identified results, variability in modal vectors due to varying environmental conditions and measurement errors is observed. Such an observation is very helpful for selection of appropriate measured modal vectors for structural health monitoring use.

안테나 추출및 보정을 위한 영상처리 알고리즘 (Image Procession Algorithm For Antenna Extraction And Correction)

  • 곽내정;유성필;송특섭;김성민
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.546-555
    • /
    • 2009
  • 안테나의 다양한 응용과 더불어 안테나 제작에 필요한 안테나 특성 측정에 관한 관심이 증대됨으로 안테나 측정 시스템의 정밀도가 더욱 필요하게 되었다. 안테나 측정시 사용자의 수동작을 기반으로 하는 기존의 시스템은 사용자의 위치 보정 작업에 기반을 함으로 오차를 유발한다. 따라서 안테나 특성의 자동 측정 시스템 도입이 필요하다. 본 논문에서는 안테나 자동 측정 시스템을 위한 안테나 추출 알고리즘을 제안한다. 제안 알고리즘은 안테나 측정 시스템에서 안테나에 대한 영상 정보 획득하고 획득된 영상 정보로부터 안테나 객체를 추출하여 안테나의 기울어짐과 위치 파라메터를 추출한다. 추출된 파라메터는 위치 및 기울어짐 각도를 보정하는데 사용되며 안테나의 자동 측정을 위해 사용된다. 제안한 알고리즘은 다양한 안테나 중 패치 안테나를 중심으로 적용되며 패치 안테나 객체가 효율적으로 추출되고 왜곡 보정을 위한 각도도 측정됨을 보여준다.

A Distance Approach for Open Information Extraction Based on Word Vector

  • Liu, Peiqian;Wang, Xiaojie
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권6호
    • /
    • pp.2470-2491
    • /
    • 2018
  • Web-scale open information extraction (Open IE) plays an important role in NLP tasks like acquiring common-sense knowledge, learning selectional preferences and automatic text understanding. A large number of Open IE approaches have been proposed in the last decade, and the majority of these approaches are based on supervised learning or dependency parsing. In this paper, we present a novel method for web scale open information extraction, which employs cosine distance based on Google word vector as the confidence score of the extraction. The proposed method is a purely unsupervised learning algorithm without requiring any hand-labeled training data or dependency parse features. We also present the mathematically rigorous proof for the new method with Bayes Inference and Artificial Neural Network theory. It turns out that the proposed algorithm is equivalent to Maximum Likelihood Estimation of the joint probability distribution over the elements of the candidate extraction. The proof itself also theoretically suggests a typical usage of word vector for other NLP tasks. Experiments show that the distance-based method leads to further improvements over the newly presented Open IE systems on three benchmark datasets, in terms of effectiveness and efficiency.

단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법 (Automatic Keyword Extraction using Hierarchical Graph Model Based on Word Co-occurrences)

  • 송광호;김유성
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.522-536
    • /
    • 2017
  • 키워드 추출은 주어진 문서로부터 문서의 주제나 내용에 관련된 단어들을 추출해내는 방법으로 대량의 문서를 다루는 텍스트마이닝 연구들이 전처리에서 공통적으로 거치는 대표 자질 추출에서 중요하게 활용될 수 있다. 본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출하기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이를 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다. 그리고 제안한 방법의 정확성과 주제적 포괄성 검증을 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

Main Content Extraction from Web Pages Based on Node Characteristics

  • Liu, Qingtang;Shao, Mingbo;Wu, Linjing;Zhao, Gang;Fan, Guilin;Li, Jun
    • Journal of Computing Science and Engineering
    • /
    • 제11권2호
    • /
    • pp.39-48
    • /
    • 2017
  • Main content extraction of web pages is widely used in search engines, web content aggregation and mobile Internet browsing. However, a mass of irrelevant information such as advertisement, irrelevant navigation and trash information is included in web pages. Such irrelevant information reduces the efficiency of web content processing in content-based applications. The purpose of this paper is to propose an automatic main content extraction method of web pages. In this method, we use two indicators to describe characteristics of web pages: text density and hyperlink density. According to continuous distribution of similar content on a page, we use an estimation algorithm to judge if a node is a content node or a noisy node based on characteristics of the node and neighboring nodes. This algorithm enables us to filter advertisement nodes and irrelevant navigation. Experimental results on 10 news websites revealed that our algorithm could achieve a 96.34% average acceptable rate.

글꼴 유사도 판단을 위한 Faster R-CNN 기반 한글 글꼴 획 요소 자동 추출 (Automatic Extraction of Hangul Stroke Element Using Faster R-CNN for Font Similarity)

  • 전자연;박동연;임서영;지영서;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제23권8호
    • /
    • pp.953-964
    • /
    • 2020
  • Ever since media contents took over the world, the importance of typography has increased, and the influence of fonts has be n recognized. Nevertheless, the current Hangul font system is very poor and is provided passively, so it is practically impossible to understand and utilize all the shape characteristics of more than six thousand Hangul fonts. In this paper, the characteristics of Hangul font shapes were selected based on the Hangul structure of similar fonts. The stroke element detection training was performed by fine tuning Faster R-CNN Inception v2, one of the deep learning object detection models. We also propose a system that automatically extracts the stroke element characteristics from characters by introducing an automatic extraction algorithm. In comparison to the previous research which showed poor accuracy while using SVM(Support Vector Machine) and Sliding Window Algorithm, the proposed system in this paper has shown the result of 10 % accuracy to properly detect and extract stroke elements from various fonts. In conclusion, if the stroke element characteristics based on the Hangul structural information extracted through the system are used for similar classification, problems such as copyright will be solved in an era when typography's competitiveness becomes stronger, and an automated process will be provided to users for more convenience.

단순 전처리 방법과 수정된 지역적 피쳐 추출기법을 이용한 다중 적외선영상 자동 기하보정 (Automatic Registration between Multiple IR Images Using Simple Pre-processing Method and Modified Local Features Extraction Algorithm)

  • 김대성
    • 한국측량학회지
    • /
    • 제35권6호
    • /
    • pp.485-494
    • /
    • 2017
  • 본 연구는 단순 전처리 방법과 수정된 지역적 피쳐 추출기법을 이용하여 특성이 다른 적외선영상 자동 기하보정에 초점을 맞추고 있다. 입력영상은 히스토그램 평활화를 통해 중앙값과 절댓값을 이용하여 전처리를 수행하였으며, 추출 피쳐의 유사도를 거리가 아닌 각 개념으로 변경하여 적용함으로써, 영상간 밝기값 차이를 줄이는데 효과적으로 적용할 수 있도록 하였다. 기하보정 결과는 시각적인 방법과 Inverse RMSE 방식을 사용하여 평가하였으며, 영상의 특성 차이로 인해 기존의 지역적 피쳐 추출기법 적용으로 해결될 수 없었던 자동 기하보정이 본 알고리즘을 적용함으로써 높은 정합 신뢰도와 적용 편의성을 보임을 확인할 수 있었다. 이를 통해, 제안 방법이 특정 조건의 다중 센서 영상간 자동 기하보정 기법 중 하나로 사용될 수 있을 것으로 기대한다.

지리공간 웹 서비스 기반의 기준점 자동추출 기법 연구 (Automatic Extraction Method of Control Point Based on Geospatial Web Service)

  • 이영림
    • 대한공간정보학회지
    • /
    • 제22권2호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 지리공간 웹 서비스 기반의 기준점 자동 추출 기법을 제안한다. 제안하는 기법은 3단계로 구성된다. 1) 첫 번째 단계에서는 지리공간 웹 서비스를 통해 대상영상의 촬영지역에 해당하는 기준자료를 자동으로 획득하고, 2) 두 번째 단계에서는 획득된 기준자료와 대상영상에 SURF 알고리즘을 적용하여 후보 기준점을 찾는다. 3) 마지막 단계에서는 RANSAC 알고리즘을 이용하여 추출된 후보 기준점 중 정 정합점을 최종 기준점으로 산출한다. 제안하는 기법은 기준자료를 획득하기 위해 지리공간 웹 서비스를 활용하였다. 이를 통하여 제안하는 기법은 기준영상과 고도자료의 관리 및 획득 시 사용자 편의성을 증대 시켰고, 표준을 따르기 때문에 높은 확장성을 가진다. 본 논문에서는 제안하는 기법을 SPOT-1, SPOT-5, IKONOS 위성영상에 적용하여 실험을 수행하였다. 실험지역에 적용한 결과, 제안하는 기법은 대상영상의 촬영센서, 촬영일자, 해상도 변화에도 RMSE 5화소 미만의 일관된 정확도를 산출하였고, 대상영상의 해상도가 좋아짐에 따라 정확도의 지속적인 향상 가능성을 확인하였다. 또한 기준영상과 고도자료로 군 표준 자료를 사용함으로써 제안하는 기법의 군사적 활용가능성을 확인하였다.