• Title/Summary/Keyword: 자동추출

Search Result 2,631, Processing Time 0.031 seconds

Development of the Algorithm for the Automatic Extraction of Broad Term (상위어 자동추출 알고리즘 개발)

  • 최유미;사공철
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.227-230
    • /
    • 1998
  • 문헌정보학분야의 용어사전을 이용한 자동시소러스 구축을 위한 첫단계로$\ulcorner$문헌정보학 용어사전$\lrcorner$ MRD를 구성하고 이를 이용하여 상위어 자동 추출알고리즘을 개발하였다. MRD구성시 전처리과정을 통하여 상위어 추출에 불필요한 정보가 수록되는 것을 방지하였다. 상위어 추출을 위한 알고리즘 개발은 무작위 표본추출을 통하여 $\ulcorner$문헌정보학 용어사전$\lrcorner$에 기술된 문장의 구문적 특성을 분석한 후, 이 구문정보를 이용하여 수행하였다. 본 연구에서 제시된 알고리즘의 효율성 평가결과 89.4%의 정확도를 보였다.

  • PDF

Automatic Extraction of 2-Dimensional Finite Element Connectivities by Search Technique (탐색기법을 이용한 2차원 유한요소 연결관계의 자동추출)

  • 김한수
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.13 no.3
    • /
    • pp.329-336
    • /
    • 2000
  • A method for automatic extraction of 2-dimensional finite element connectivities by searching the shortest closed path from a certain node to the starting node was developed. Only the best path among the possible paths was probed. The uniqueness and validity of the extracted path were examined. The proposed method was proved to be complete. Examples show that the proposed method can extract elements exactly from the irregular mesh which can not be handled easily by the conventional automatic mesh generation.

  • PDF

LTAG Extraction from Treebank for Korean (트리뱅크를 사용한 TAG 문법 자동 구축)

  • 박정열
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.778-780
    • /
    • 2004
  • 문법 구축은 NLP 작업에서 중요한 역할을 한다. 이 논문에서는 트리뱅크 코퍼스에서 자동으로 어휘화 문법을 추출하는 시스템을 소개한다 문법 자동 추출 시스템에서 자동으로 추출한 어휘화 TAG 문법, CFG 문법, 의존관계 등 여러 정보는 이후 한국어 파서 구현 및 다양한 NLP 연구에 사용된다.

  • PDF

building Extraction from Im Resolution Satellite Images through Line Analysis and Matching (1m 해상도 위성영상으로부터 라인분석과 정합을 통한 반자동 건물추출연구)

  • 김태정;임영재;김경옥
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.301-306
    • /
    • 2004
  • 이 논문에서는 1m 해상도 위성영상에서 관측할 수 있는 여러 인공지물 중에서 아파트 및 산업용 건물 등, 비교적 중대형이고 사각형 형태인 건물들을 반자동으로 추출하기 위한 알고리즘을 소개한다. 기존에 연구된 건물추출을 위한 방식으로는 Perceptual Grouping, 스테레오 분석, LIDAR 센서 등에서 얻은 3 차원 정보를 이용하는 방식 등이 있다. 여기서는 단일영상 만을 이용하여 반자동으로 건물을 추출하는 알고리즘을 제안한다 이 알고리즘은 먼저 영상으로부터 라인을 추출한 후, 라인분석을 통하여 건물의 위치와 방향을 결정하고, 탬플릿 정합을 이용하여 이를 개선한다. 그리고 자동으로 추출된 건물외각선에 포함된 오류를 제거하기 위하여 수동편집 단계를 수행한다. 또한 먼저 수행한 건물추출 결과를 활용하여 주변에 유사한 형태의 건물외각선을 빠르게 추출하기 위해 기존에 추출된 건물 외각선 Polygon 을 탬플릿으로 정의하고 정합을 수행하여 건물 외각선을 추출한다. 개발된 알고리즘은 기존의 다른 방식들에 비해 추가적인 영상이나 정보를 요구하지 않고도 빠른 시간에 정확한 사각형형태의 건물을 추출할 수 있었다.

  • PDF

Semi-Automatic Object-Action Extractor to Build the Utterance Corpus for the Dialogue System (대화 시스템의 말뭉치 구축을 위한 Object-Action 반자동 추출기)

  • Yoon, JungMin;Hwang, Jaewon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.220-223
    • /
    • 2015
  • 본 논문은 대화 시스템에서 사용되는 말뭉치의 구축을 위해 Object와 Action을 반자동으로 추출하는 도구에 대해 기술한다. 제안하는 추출 도구는 형태소 분석과 의존 구문 분석의 결과를 기반으로 적절한 Object와 Action을 추출하는 것에 목표를 두고 있다. 그러나 형태소 분석과 의존 구문 분석의 결과는 여러 가지 오류가 포함될 수 있다. 이러한 오류는 잘못된 Object와 Action의 추출로 이어질 수 있다. 그리고 Object의 추출에 있어 해당 명사의 격이 중요한 정보를 가진다. 하지만 한국어의 특성한 조사의 생략 등으로 인해 격 태깅의 모호성이 발생하게 된다. 따라서 본 논문에서 제안하는 반자동 추출기는 형태소 분석과 의존 구문 분석의 잘못된 결과를 사용자가 손쉽게 수정할 수 있도록 하고 모호성이 발생할 수 있는 Object를 사용자에게 알려주어 올바른 Object와 Action의 추출을 가능하게 한다. 추출기를 이용한 말뭉치의 구축은 1) 형태소 분석 2) 의존 구문 분석 3) Object-Action 추출의 단계로 진행된다. 실험에서 사용된 발화는 관광 회화용 대화 시스템의 숙박, 공항 영역의 500개의 발화이며, 이 중 259개의 발화가 태깅 시 모호성이 발생하는 발화이다. 반자동 추출기를 통해 모호성이 발생한 발화를 태깅한 결과 전체 발화 중 51.8%의 발화를 빠르고 정확하게 태깅할 수 있었다.

  • PDF

Text Categorization Features Automatic Extraction Method Using Chi-squared Statistic (카이제곱 통계량을 이용한 문서분류 자질 자동추출 방법)

  • Park, Jong-Hyun;Park, So-Young;Chang, Ju-No;Kihl, Tae-Suk
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.10a
    • /
    • pp.695-697
    • /
    • 2010
  • 문서에 포함되는 어휘는 문서 분류의 정보를 가지므로 문서를 분석하여 유용한 단어를 추출하는 것은 다양한 서비스와 연계되어 사용될 수 있어 매우 유용한 일이다. 문서 자동 분류에서는 분류자질 선정 방식에 따라 분류정확도가 서로 달라질 수 있으며, 문서에서 추출되는 유용한 단어에 따라 인지되는 분야가 달라질 수 있다. 이에 본 논문에서는 각 문서에 포함되는 단어에 대한 카이제곱 통계량 점수를 사용하여 단어별 문서 분류에 대한 단어의 자질을 평가하고 문서의 분류별 유용한 단어를 자동 추출하는 방법을 제안하고 개발한다.

  • PDF

Performance Analysis of Automatic Target Extraction Algorithms by using SAR Images (SAR 영상을 이용한 자동표적추출 알고리즘의 성능 분석)

  • Hur, Dong-Seok;KIm, Tae-Jung
    • Proceedings of the KSRS Conference
    • /
    • 2007.03a
    • /
    • pp.61-64
    • /
    • 2007
  • SAR 영상에 존재하는 군사표적은 광학 영상에 있는 군사표적에 비하여 쉽게 구별하기 힘들다. 이는 전체 영상에서 군사표적을 구성하는 픽셀의 수가 매우 적기 때문이다. 이러한 문제 때문에 SAR 영상 분석가들은 영상을 분석하는 것이 어렵다. 이 문제를 해결하기 위해서는 자동화된 분석 시스템이 필요하다. 본 논문에서는 기존에 연구된 SAR 영상을 이용한 자동표적추출 시스템을 분석하고 구현하였다. 구현된 자동표적추출 시스템을 MSTAR 데이터 셋을 이용하여 실험하여 결과를 도출하고, 그 결과를 분석하여 자동표적추출 시스템 각 단계의 성능을 분석하였다. 분석 결과 각 단계별로 최적의 성능을 보여주는 임계값을 알아낼 수 있었다.

  • PDF

Question Similarity Analysis in dialogs with Automatic Feature Extraction (자동 추출 자질을 이용한 대화 속 질의 문장 유사성 분석)

  • Oh, KyoJoong;Lee, DongKun;Lim, Chae-Gyun;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.347-351
    • /
    • 2018
  • 이 논문은 대화 시스템에서 질의를 이해하기 위해 딥 러닝 모델을 통해 추출된 자동 추출 자질을 이용하여 문장의 유사성을 분석하는 방법에 대해 기술한다. 문장 간 유사성을 분석하기 위한 자동 추출 자질로써, 문장 내 표현 순차적 정보를 반영하기 위한 RNN을 이용하여 생성한 문장 벡터와, 어순에 관계 없이 언어 모델을 학습하기 위한 CNN을 이용하여 생성한 문장 벡터를 사용한다. 이렇게 자동으로 추출된 문장 임베딩 자질은 금융서비스 대화에서 입력 문장을 분류하거나 문장 간 유사성을 분석하는데 이용된다. 유사성 분석 결과는 질의 문장과 관련된 FAQ 문장을 찾거나 답변 지식을 찾는데 활용된다.

  • PDF

Extracting Comparative Elements from Comparative Sentences (비교 문장으로부터 비교 요소 자동 추출)

  • Yang, Seon;Ko, Young-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.225-228
    • /
    • 2011
  • 본 논문은 비교 마이닝(comparison mining) 의 일환인 비교 요소 자동 추출에 관하여 연구한다. 비교 마이닝은 텍스트 마이닝의 한 분야로서 대용량의 텍스트를 대상으로 비교 관계롤 자동 분석하며, 비교 문장인지 아닌지를 식별하는 단계, 비교 타입을 분류하는 단계, 다양한 비교 요소들을 추출하는 단계, 추출된 요소를 분석 및 요약하는 단계 등을 거치게 된다. 본 연구에서는 특정 타입의 비교 문장이 주어졌을때, 그 문장에서 비교 요소를 자동으로 추출하는 단계의 과제를 수행하며, 우열 비교 타입 및 최상급 타입 문장들을 대상으로 비교 주체, 비교 대상, 비교 술어를 추출한다. 실험 과정으로는, 우선 비교 요소 후보들을 선정하고, 그 후 각 요소별로 확률을 계산하여 가장 높은 수치를 기록한 요소를 정답으로 채택하게 된다. 확률 계산은 지지 벡터 기계 (Support Vector Machine)를 이용한다. 인터넷 상의 다양한 도메인에서 추출된 비교 문장들을 대상으로 비교 요소 추출을 수출한 결과, 정확도 86.81 %의 우수한 성능을 산출 할 수 있었다.

Automatic knowledgebase extraction based smishing SMS detection (자동 지식베이스 추출 기반 스미싱 SMS 탐지)

  • Baek, Seong-Bin;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.564-567
    • /
    • 2021
  • 스미싱은 SMS 문자를 통해 피해자를 현혹시켜 개인정보나 금전 등을 갈취하는 범죄이다. 발전하는 스미싱 범죄 수법에 대응하기 위해선 새로운 스미싱 범죄 사례에서 데이터를 추출하고, 추출한 데이터를 기존 시스템에 통합하여 빠르게 대응할 수 있어야 한다. 본 연구에서는 빠른 스미싱 대응을 위해 전처리를 하지 않은 SMS 문자 텍스트에서 지식베이스를 자동으로 추출하고 저장하는 자동 지식베이스 추출 모듈을 제안하며, 추출 시스템 지식베이스를 바탕으로 입력된 SMS가 스미싱인지 판별하는 스미싱 SMS 탐지 모듈을 통합한 자동 지식베이스 추출 기반 스미싱 SMS 탐지 시스템을 제시한다. 제시된 스미싱 SMS 탐지 모델은 UCI SMS Spam Collection Dataset을 기준으로 90.9 (F1 score)의 성능을 보여주었다.

  • PDF