• 제목/요약/키워드: 반자동 추출기

검색결과 13건 처리시간 0.028초

대화 시스템의 말뭉치 구축을 위한 Object-Action 반자동 추출기 (Semi-Automatic Object-Action Extractor to Build the Utterance Corpus for the Dialogue System)

  • 윤정민;황재원;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.220-223
    • /
    • 2015
  • 본 논문은 대화 시스템에서 사용되는 말뭉치의 구축을 위해 Object와 Action을 반자동으로 추출하는 도구에 대해 기술한다. 제안하는 추출 도구는 형태소 분석과 의존 구문 분석의 결과를 기반으로 적절한 Object와 Action을 추출하는 것에 목표를 두고 있다. 그러나 형태소 분석과 의존 구문 분석의 결과는 여러 가지 오류가 포함될 수 있다. 이러한 오류는 잘못된 Object와 Action의 추출로 이어질 수 있다. 그리고 Object의 추출에 있어 해당 명사의 격이 중요한 정보를 가진다. 하지만 한국어의 특성한 조사의 생략 등으로 인해 격 태깅의 모호성이 발생하게 된다. 따라서 본 논문에서 제안하는 반자동 추출기는 형태소 분석과 의존 구문 분석의 잘못된 결과를 사용자가 손쉽게 수정할 수 있도록 하고 모호성이 발생할 수 있는 Object를 사용자에게 알려주어 올바른 Object와 Action의 추출을 가능하게 한다. 추출기를 이용한 말뭉치의 구축은 1) 형태소 분석 2) 의존 구문 분석 3) Object-Action 추출의 단계로 진행된다. 실험에서 사용된 발화는 관광 회화용 대화 시스템의 숙박, 공항 영역의 500개의 발화이며, 이 중 259개의 발화가 태깅 시 모호성이 발생하는 발화이다. 반자동 추출기를 통해 모호성이 발생한 발화를 태깅한 결과 전체 발화 중 51.8%의 발화를 빠르고 정확하게 태깅할 수 있었다.

  • PDF

웹 기반 데이터베이스로부터의 유용한 데이터 추출 기법의 설계 및 응용 (Design and application of effective data extraction technique from Web databases)

  • 황두성
    • 한국산학기술학회논문지
    • /
    • 제6권4호
    • /
    • pp.309-314
    • /
    • 2005
  • 본 논문에서는 생명공학 정보를 포함하는 분산 웹 데이터베이스들로부터 관련성에 기반하여 목표 데이터를 추출하는 기법들을 분석한다. 더불어 이 분석을 기본으로 단백질 데이터의 지식 확장 방법의 설계 및 구현을 제안한다. 웹 데이터베이스를 위한 데이터 추출기는 수동 추출, 반자동 추출, 자동 추출 방법 등의 구현방법이 가능하다. 웹 데이터 추출기는 해당 웹 페이지에서 목표 데이터를 검색 및 추출하기 위하여 식별자를 이용하는 것이 일반적이다. 본 논문은 웹 데이터 추출 기법을 이용한 유기체 단백질 관련 데이터베이스 시스템의 설계와 구현을 기술한다.

  • PDF

반자동 지도입력 시스템기술 개발 연구 (The Study on a Semi-automated Mapping System)

  • 윤재경;이기혁;우창헌;이경자;김수용
    • Spatial Information Research
    • /
    • 제3권1호
    • /
    • pp.19-27
    • /
    • 1995
  • 논문에서 다룰 시스템은 영상 처리를 이용한 전처리과정에서 사용자에게 필요한 정보를 얻은 뒤 이 자료를 상호교류적으로 입력하는 반자동 지도입력시스템이다. 영상 처리는 주로 중요한 정보의 하나인 외곽선 추출에 주력하였고 이를 위해 적응성 평활화 필터와 연결보존외곽선추출를 사용하였다. 외곽선 정보는 편집기에서 벡터화 하며 편집의 효율을 높이기 위해 내부 자료구조는 확장된 사진트리 구조를 사용하였다. 이러한 작업들은 그 특성에 따라 개인용 컴퓨터와 워크스테이션에 각각 분담시켰고 네트웍을 통해 저장기기를 공유하여 작업의 일관성및 단순화를 추구하였다.

  • PDF

불균등 조명에서 비접촉 계측을 위한 반자동 카메라 교정 방법 (Method of the Semi-Automation Camera Calibration for Noncontact Measure of Badly Illumination)

  • 김정현;이주영;김대광;김민성;이세호;강동중
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.673-676
    • /
    • 2006
  • 본 논문은 산업현장의 불균등한 조명 조건에서 정확한 카메라 교정을 수행할 수 있는 방법을 제안한다. 비접촉 계측을 위한 카메라 교정법은 패턴에서 교정점들을 정확하게 추출할 수 있어야 하며, 평면 패턴을 사용하는 교정 방법은 최소 7개의 교정점을 알아야 한다. 그러나 비접촉 치수 계측기가 설치된 산업현장에서 카메라 교정에 알맞은 조명을 기대하기 힘들다. 본 논문에서는 최적조명제어가 어려운 산업현장에서 치수계측을 위한 카메라 교정을 효과적으로 수행할 수 있는 반자동 카메라 교정방법을 제안한다. 교정패턴상의 최소 4점을 사용자가 지정함에 의해, 조명제어의 어려움으로 인해 교정점 추출이 실패한 교정패턴의 불완전 교정점을 사용하여 이상적인 조명상태에서의 교정점 정보를 예측하고, 이 정보로부터 다시 정확한 교정인자들을 반복적으로 추출하는 방법을 적용한다. 제시된 방법은 렌즈의 투사왜곡에 의한 교정패턴에서도 성공적으로 적용될 수 있음을 실험을 통해 확인하였다.

  • PDF

학술정보의 효율적 전주기 관리 및 서비스 체제 구축에 관한 사례 연구 (A Case Study on The Establishment of Efficient Management of Academic Information and Services.)

  • 조성남;서태설;김완종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.412-415
    • /
    • 2016
  • 본 연구에서는 학술정보의 효율적 관리 및 서비스 체제를 수립하고 활용성을 강화하기 위해 논문 자동 수집 및 구축, 논문 투고 및 심사, 전자출판, XML 자동 구축에 이르기까지 전주기 기능 구현에 방안을 제시하고 이를 구현한 사례를 소개하고자 한다. 기존 Peer-Review 시스템은 데이터 수집 및 변환파트와 투고 및 심사, 전자출판 파트, XML 구축 파트 등으로 분리되거나 별도로 운영되어 왔다. 본 연구에서는 이러한 기능을 통합적으로 구현하기 위해 KISTI의 Peer-Review 시스템인 ACOMS와 XML 기반 학술정보서비스 시스템(KpubS) 기능 및 프로세스를 통합한 구현 방안을 제시하고 이를 시스템으로 구현하였다. 그러나 아직까지 원문 PDF를 XML로 완전 자동 변환할 수 있는 기술은 없는 상태로써 반자동 변환 기능을 탑재하였다. 본 연구 내용은 다양한 수집 채널을 통해 입수된 학술정보 및 XML 자료에 대한 입력체계를 제공하고, XML 본문으로부터 메타데이터를 자동 식별 및 추출하여 학술정보 DB를 구축 저장하며, 구축된 DB 및 XML 기반의 전자출판 기능 제공과 함께 웹서비스 단계까지의 전주기 공정에 대한 프로세스 모델 및 시스템에 관한 것이다. 이에 데이터베이스 구축을 위한 시간 및 비용을 절감할 수 있을뿐만 아니라, 시맨틱 태깅 및 수식, 표, 그림 정보 제공 등 이용자에게 다양한 형태의 서비스를 제공할 수 있게 되었다.

자동 음성 분할 시스템의 성능 향상 (An improved automatic segmentation algorithm)

  • 김무중;권철홍
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.45-48
    • /
    • 2002
  • 본 논문에서는 한국어 음성 합성기 데이터베이스 구축을 위하여 HMM을 이용하여 자동으로 음소경계를 추출하고, 음성 파라미터를 이용하여 그 결과를 보정하는 반자동 음성분할 시스템을 구현하였다. 개발된 시스템은 16KHz로 샘플링된 음성을 대상으로 삼았고, 레이블링 단위인 음소는 39개를 선정하였고, 음운현상을 고려한 확장 모노폰도 선정하였다. 그리고 언어학적 입력방식으로는 음소표기와 철자표기를 사용하였으며, 패턴 매칭 방법으로는 HMM을 이용하였다. 유성음/무성음/묵음 구간 분류에는 ZCR, Log Energy, 주파수 대역별 에너지 분포 등의 파라미터를 사용하였다. 개발된 시스템의 훈련된 음성은 정치, 경제, 사회, 문화, 날씨 등의 코퍼스를 사용하였으며, 성능평가를 위해 훈련에 사용되지 않은 문장 데이터베이스에 대해서 자동 음성 분할 실험을 수행하였다. 실험 결과, 수작업에 의해서 분할된 음소경계 위치와의 오차가 10ms 이내가 $87\%$, 30ms 이내가 $91\%$가 포함되었다.

  • PDF

Footprint 와 그림자를 이용한 위성영상의 건물 모델링 시스템 (Building Modeling System on Satellite Image using Footprint and Shadow)

  • 오선호;장재석;장경호;정순기
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.807-812
    • /
    • 2008
  • 최근 고해상도 위성영상이 널리 보급됨에 따라 공간 영상 정보를 활용한 사업이나 다양한 응용 분야에서도 지형 또는 지물의 기하 정보의 필요성이 커지고 있다. 특히 공간 영상 정보 시스템에서는 지형 또는 지물에 대한 사실적인 정보를 제공하여 이를 이용한 도시 개발 계획의 수립이나 도로망의 개선 등 다양한 분야로 활용되고 있다. 본 논문은 단일 위성영상에서 건물의 footprint, rooftop 과 그림자 정보를 이용하여 건물을 효과적으로 모델링하기 위한 반 자동화 시스템을 제안한다. 위성영상으로부터 건물의 기하 정보의 추출 및 복원 시 고려할 것은 사용자의 조작을 최소화하면서도 보다 정확하고 빠르게 모델링 및 편집이 가능하여야 한다는 것이다. 이를 위해서 위성영상과 영상의 메타 정보의 활용과 효율적인 조작이 이루어 질 수 있는 인터페이스가 필요하다. 따라서 본 논문에서는 사용자의 입력에 의해 건물의 정보(rooftop, footprint)를 추출하고, 건물의 정보와 메타정보로부터 관심 건물영역에 대한 그림자 정보를 추출한 다음, 높이 정보를 자동적으로 추출해 냄으로써 최소한의 사용자 입력으로 건물을 효과적으로 모델링 할 수 있다.

  • PDF

투표 기반 서술형 주관식 답안 자동 채점 모델의 설계 및 구현 (Design and Implementation of an Automatic Scoring Model Using a Voting Method for Descriptive Answers)

  • 허정만;박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권8호
    • /
    • pp.17-25
    • /
    • 2013
  • 본 논문에서는 투표기법을 이용하여 서술형 주관식 문제에 대한 학습자 답안을 자동으로 채점하는 모델을 제안한다. 제안하는 방법은 모델 구축 비용을 줄이기 위해서, 문제 유형별로 세분화하여 서술형 주관식 답안 자동 채점 모델을 따로 구축하지 않는다. 제안하는 방법은 서술형 주관식 답안 자동 채점에 유용한 자질을 추출하기 위해서, 모범 답안과 학습자 답안을 비교한 결과를 바탕으로 다양한 자질을 추출한다. 제안하는 방법은 답안 채점 결과의 신뢰성을 높이기 위해서, 각 학습자 답안을 여러 기계학습 기반 분류기를 이용하여 채점하고, 각 채점 결과를 투표하여 만장일치로 선택한 채점 결과를 최종 채점 결과로 결정한다. 실험결과 기계학습 기반 분류기 C4.5만 사용한 채점 결과는 정확률이 83.00%인데 반해, 기계학습 기반 분류기 C4.5, ME, SVM에서 만장일치로 선택한 채점 결과는 정확률이 90.57%까지 개선되었다.

비공개 프로토콜 분류를 위한 특징 추출 알고리즘 비교 연구 (A Comparative Study of Feature Extraction Algorithm for unKnown Protocol Classification)

  • 정영규;정창민
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.251-255
    • /
    • 2019
  • 프로토콜 reverse-engineering 기술은 unknown protocol 의 스펙을 추출하기 위해서 보통 표준화된 방법이 없어서 대부분 수동으로 스펙을 분석하거나 반자동 방식으로 이를 분석한다. 만약 unknown protocol의 근간이 되는 프로토콜을 알 수 있다면, 이를 이용하여 스펙을 분석할 수 있으므로 자동화되고 정확한 분석이 가능할 것이다. 학습되지 않은 프로토콜을 분류하기 위해서는 특징추출은 매우 중요한 단계 중의 하나이다. 본 논문은 기존 프로토콜을 변형한 프로토콜에 대해서 높은 성능을 갖는 분류기를 개발하기 위해서 몇 가지 특징 추출 알고리즘을 제안하고, 프로토콜의 형태 변화에 강인한 특징추출 알고리즘을 제안한다. 성능 검증을 위해서 8개 공개 프로토콜을 대상으로 학습을 수행하고 이를 변형한 프로토콜을 대상으로 성능 측정을 진행하였다.

위성영상을 이용한 건물 모델링 및 지형 정합 시스템 (Building Modeling and Terrain Integration System on Satellite Image)

  • 오선호;정순기;김상희;김정환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.549-554
    • /
    • 2008
  • 도시와 같은 광범위한 영역에 대한 지형, 지물의 기하 정보를 추출 또는 복원하는 기술은 공간 영상정보 시스템을 비롯한 다양한 응용분야에서 사용되고 있으며, 이러한 필요에 따라 중요성이 더욱 커지고 있다. 본 논문은 위성 영상에서 건물의 footprint와 rooftop, 그림자 정보를 이용하여 건물을 반 자동으로 모델링하고, 이를 지형에 정합하는 시스템을 제안한다. 제안하는 시스템은 사용자의 직접적인 조작과 자동으로 이루어는 부분을 조합하여, 최소한의 사용자 조작으로 건물을 모델링하고, 지형에 의한 요소를 고려하여 건물의 실제 위치를 보정하여 지형과 정합을 수행한다.

  • PDF