• Title/Summary/Keyword: 반자동 추출기

Search Result 13, Processing Time 0.022 seconds

Semi-Automatic Object-Action Extractor to Build the Utterance Corpus for the Dialogue System (대화 시스템의 말뭉치 구축을 위한 Object-Action 반자동 추출기)

  • Yoon, JungMin;Hwang, Jaewon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.220-223
    • /
    • 2015
  • 본 논문은 대화 시스템에서 사용되는 말뭉치의 구축을 위해 Object와 Action을 반자동으로 추출하는 도구에 대해 기술한다. 제안하는 추출 도구는 형태소 분석과 의존 구문 분석의 결과를 기반으로 적절한 Object와 Action을 추출하는 것에 목표를 두고 있다. 그러나 형태소 분석과 의존 구문 분석의 결과는 여러 가지 오류가 포함될 수 있다. 이러한 오류는 잘못된 Object와 Action의 추출로 이어질 수 있다. 그리고 Object의 추출에 있어 해당 명사의 격이 중요한 정보를 가진다. 하지만 한국어의 특성한 조사의 생략 등으로 인해 격 태깅의 모호성이 발생하게 된다. 따라서 본 논문에서 제안하는 반자동 추출기는 형태소 분석과 의존 구문 분석의 잘못된 결과를 사용자가 손쉽게 수정할 수 있도록 하고 모호성이 발생할 수 있는 Object를 사용자에게 알려주어 올바른 Object와 Action의 추출을 가능하게 한다. 추출기를 이용한 말뭉치의 구축은 1) 형태소 분석 2) 의존 구문 분석 3) Object-Action 추출의 단계로 진행된다. 실험에서 사용된 발화는 관광 회화용 대화 시스템의 숙박, 공항 영역의 500개의 발화이며, 이 중 259개의 발화가 태깅 시 모호성이 발생하는 발화이다. 반자동 추출기를 통해 모호성이 발생한 발화를 태깅한 결과 전체 발화 중 51.8%의 발화를 빠르고 정확하게 태깅할 수 있었다.

  • PDF

Design and application of effective data extraction technique from Web databases (웹 기반 데이터베이스로부터의 유용한 데이터 추출 기법의 설계 및 응용)

  • Hwang, Doo-Sung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.6 no.4
    • /
    • pp.309-314
    • /
    • 2005
  • This paper analyzes techniques that extract objective information from distributed web databases for bioinformatics based on relationship among information. Moreover, we discuss the design and implementation of a method for knowledge enhancement in respect of protein information. Web data extractor can be constructed by using a manual, semi-automatic, or automatic way. Data extractor generally makes use of identifiers in order to search and extract targeting information from a specified web page. This paper presents a design and implementation for the protein databases of an organism by utilizing web data extraction techniques.

  • PDF

The Study on a Semi-automated Mapping System (반자동 지도입력 시스템기술 개발 연구)

  • 윤재경;이기혁;우창헌;이경자;김수용
    • Spatial Information Research
    • /
    • v.3 no.1
    • /
    • pp.19-27
    • /
    • 1995
  • In this paper, a semi-automated mapping system, which can produ¬ce digital maps by using information acquired from pre-processing procedure, was introduced. To get a binary edge image, which is very important in vectori¬zation process, we applied adaptive smoothing and connection preserving thresho¬Iding algorithm. In mapper program, binary images are converted to vectors and for in-core data structure, extended PR quad tree was used. These procedures are dispatched to personal computers and workstations and through network resource sharing, the whole process was unified and simplified.

  • PDF

Method of the Semi-Automation Camera Calibration for Noncontact Measure of Badly Illumination (불균등 조명에서 비접촉 계측을 위한 반자동 카메라 교정 방법)

  • Kim Jeong-Hyun;Lee Ju-Yong;Kim Dae-Gyung;Kim Min-Seong;Lee Se-Ho;Kang Dong-Joong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.673-676
    • /
    • 2006
  • 본 논문은 산업현장의 불균등한 조명 조건에서 정확한 카메라 교정을 수행할 수 있는 방법을 제안한다. 비접촉 계측을 위한 카메라 교정법은 패턴에서 교정점들을 정확하게 추출할 수 있어야 하며, 평면 패턴을 사용하는 교정 방법은 최소 7개의 교정점을 알아야 한다. 그러나 비접촉 치수 계측기가 설치된 산업현장에서 카메라 교정에 알맞은 조명을 기대하기 힘들다. 본 논문에서는 최적조명제어가 어려운 산업현장에서 치수계측을 위한 카메라 교정을 효과적으로 수행할 수 있는 반자동 카메라 교정방법을 제안한다. 교정패턴상의 최소 4점을 사용자가 지정함에 의해, 조명제어의 어려움으로 인해 교정점 추출이 실패한 교정패턴의 불완전 교정점을 사용하여 이상적인 조명상태에서의 교정점 정보를 예측하고, 이 정보로부터 다시 정확한 교정인자들을 반복적으로 추출하는 방법을 적용한다. 제시된 방법은 렌즈의 투사왜곡에 의한 교정패턴에서도 성공적으로 적용될 수 있음을 실험을 통해 확인하였다.

  • PDF

A Case Study on The Establishment of Efficient Management of Academic Information and Services. (학술정보의 효율적 전주기 관리 및 서비스 체제 구축에 관한 사례 연구)

  • Cho, Sung-Nam;Seo, Tae-Sul;Kim, Wan-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.412-415
    • /
    • 2016
  • 본 연구에서는 학술정보의 효율적 관리 및 서비스 체제를 수립하고 활용성을 강화하기 위해 논문 자동 수집 및 구축, 논문 투고 및 심사, 전자출판, XML 자동 구축에 이르기까지 전주기 기능 구현에 방안을 제시하고 이를 구현한 사례를 소개하고자 한다. 기존 Peer-Review 시스템은 데이터 수집 및 변환파트와 투고 및 심사, 전자출판 파트, XML 구축 파트 등으로 분리되거나 별도로 운영되어 왔다. 본 연구에서는 이러한 기능을 통합적으로 구현하기 위해 KISTI의 Peer-Review 시스템인 ACOMS와 XML 기반 학술정보서비스 시스템(KpubS) 기능 및 프로세스를 통합한 구현 방안을 제시하고 이를 시스템으로 구현하였다. 그러나 아직까지 원문 PDF를 XML로 완전 자동 변환할 수 있는 기술은 없는 상태로써 반자동 변환 기능을 탑재하였다. 본 연구 내용은 다양한 수집 채널을 통해 입수된 학술정보 및 XML 자료에 대한 입력체계를 제공하고, XML 본문으로부터 메타데이터를 자동 식별 및 추출하여 학술정보 DB를 구축 저장하며, 구축된 DB 및 XML 기반의 전자출판 기능 제공과 함께 웹서비스 단계까지의 전주기 공정에 대한 프로세스 모델 및 시스템에 관한 것이다. 이에 데이터베이스 구축을 위한 시간 및 비용을 절감할 수 있을뿐만 아니라, 시맨틱 태깅 및 수식, 표, 그림 정보 제공 등 이용자에게 다양한 형태의 서비스를 제공할 수 있게 되었다.

An improved automatic segmentation algorithm (자동 음성 분할 시스템의 성능 향상)

  • Kim Mu Jung;Kwon Chul Hong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.45-48
    • /
    • 2002
  • 본 논문에서는 한국어 음성 합성기 데이터베이스 구축을 위하여 HMM을 이용하여 자동으로 음소경계를 추출하고, 음성 파라미터를 이용하여 그 결과를 보정하는 반자동 음성분할 시스템을 구현하였다. 개발된 시스템은 16KHz로 샘플링된 음성을 대상으로 삼았고, 레이블링 단위인 음소는 39개를 선정하였고, 음운현상을 고려한 확장 모노폰도 선정하였다. 그리고 언어학적 입력방식으로는 음소표기와 철자표기를 사용하였으며, 패턴 매칭 방법으로는 HMM을 이용하였다. 유성음/무성음/묵음 구간 분류에는 ZCR, Log Energy, 주파수 대역별 에너지 분포 등의 파라미터를 사용하였다. 개발된 시스템의 훈련된 음성은 정치, 경제, 사회, 문화, 날씨 등의 코퍼스를 사용하였으며, 성능평가를 위해 훈련에 사용되지 않은 문장 데이터베이스에 대해서 자동 음성 분할 실험을 수행하였다. 실험 결과, 수작업에 의해서 분할된 음소경계 위치와의 오차가 10ms 이내가 $87\%$, 30ms 이내가 $91\%$가 포함되었다.

  • PDF

Building Modeling System on Satellite Image using Footprint and Shadow (Footprint 와 그림자를 이용한 위성영상의 건물 모델링 시스템)

  • Oh, Seon-Ho;Jang, Jae-Seok;Jang, Kyung-Ho;Jung, Soon-Ki
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02a
    • /
    • pp.807-812
    • /
    • 2008
  • 최근 고해상도 위성영상이 널리 보급됨에 따라 공간 영상 정보를 활용한 사업이나 다양한 응용 분야에서도 지형 또는 지물의 기하 정보의 필요성이 커지고 있다. 특히 공간 영상 정보 시스템에서는 지형 또는 지물에 대한 사실적인 정보를 제공하여 이를 이용한 도시 개발 계획의 수립이나 도로망의 개선 등 다양한 분야로 활용되고 있다. 본 논문은 단일 위성영상에서 건물의 footprint, rooftop 과 그림자 정보를 이용하여 건물을 효과적으로 모델링하기 위한 반 자동화 시스템을 제안한다. 위성영상으로부터 건물의 기하 정보의 추출 및 복원 시 고려할 것은 사용자의 조작을 최소화하면서도 보다 정확하고 빠르게 모델링 및 편집이 가능하여야 한다는 것이다. 이를 위해서 위성영상과 영상의 메타 정보의 활용과 효율적인 조작이 이루어 질 수 있는 인터페이스가 필요하다. 따라서 본 논문에서는 사용자의 입력에 의해 건물의 정보(rooftop, footprint)를 추출하고, 건물의 정보와 메타정보로부터 관심 건물영역에 대한 그림자 정보를 추출한 다음, 높이 정보를 자동적으로 추출해 냄으로써 최소한의 사용자 입력으로 건물을 효과적으로 모델링 할 수 있다.

  • PDF

Design and Implementation of an Automatic Scoring Model Using a Voting Method for Descriptive Answers (투표 기반 서술형 주관식 답안 자동 채점 모델의 설계 및 구현)

  • Heo, Jeongman;Park, So-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.18 no.8
    • /
    • pp.17-25
    • /
    • 2013
  • TIn this paper, we propose a model automatically scoring a student's answer for a descriptive problem by using a voting method. Considering the model construction cost, the proposed model does not separately construct the automatic scoring model per problem type. In order to utilize features useful for automatically scoring the descriptive answers, the proposed model extracts feature values from the results, generated by comparing the student's answer with the answer sheet. For the purpose of improving the precision of the scoring result, the proposed model collects the scoring results classified by a few machine learning based classifiers, and unanimously selects the scoring result as the final result. Experimental results show that the single machine learning based classifier C4.5 takes 83.00% on precision while the proposed model improve the precision up to 90.57% by using three machine learning based classifiers C4.5, ME, and SVM.

A Comparative Study of Feature Extraction Algorithm for unKnown Protocol Classification (비공개 프로토콜 분류를 위한 특징 추출 알고리즘 비교 연구)

  • Jung, YoungGiu;Jeong, Chang-Min
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.19 no.5
    • /
    • pp.251-255
    • /
    • 2019
  • On today, Protocol reverse-engineering technique can be used to extract the specification of an unknown protocol. However, there is no standardized method, and in most cases, the extracting process is executed manually or semi-automatically. If the information about the structure of an unknown protocol could be acquired in advance, it would be easy to conduct reverse engineering. the feature extraction is an important step in unknown protocol classification. However, in this paper, we present a comparison several feature extraction techniques and suggests a method of feature extraction algorithm for recognizing unknown protocol. In order to verify the performance of the proposed system, we performed the training using eight open protocols to evaluate the performance using unknown data.

Building Modeling and Terrain Integration System on Satellite Image (위성영상을 이용한 건물 모델링 및 지형 정합 시스템)

  • Oh, Seon-Ho;Jung, Soon-Ki;Kim, Sang-Hee;Kim, Jeong-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.549-554
    • /
    • 2008
  • 도시와 같은 광범위한 영역에 대한 지형, 지물의 기하 정보를 추출 또는 복원하는 기술은 공간 영상정보 시스템을 비롯한 다양한 응용분야에서 사용되고 있으며, 이러한 필요에 따라 중요성이 더욱 커지고 있다. 본 논문은 위성 영상에서 건물의 footprint와 rooftop, 그림자 정보를 이용하여 건물을 반 자동으로 모델링하고, 이를 지형에 정합하는 시스템을 제안한다. 제안하는 시스템은 사용자의 직접적인 조작과 자동으로 이루어는 부분을 조합하여, 최소한의 사용자 조작으로 건물을 모델링하고, 지형에 의한 요소를 고려하여 건물의 실제 위치를 보정하여 지형과 정합을 수행한다.

  • PDF