• 제목/요약/키워드: 단계별추출

검색결과 483건 처리시간 0.026초

그래프 기반의 상호 중요도 측정 기법을 이용한 영역별 개체명 자동 추출 (Automatic Named Entities Extraction Using the Graph-based Measurement Technique of the Mutual Importance)

  • 배상준;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.17-22
    • /
    • 2008
  • 본 논문에서는 영역별로 자동으로 개체명을 추출하기 위하여 씨앗단어를 이용하고, 웹페이지와 개체명 후보들 간의 상호 중요도를 측정하여 개체명 후보들의 순위를 정하는 방식을 제안한다. 제안된 방식은 크게 세 단계에 의해서 수행되어 지는데 먼저 씨앗단어 정보를 이용하여 웹페이지를 검색하고, 검색되어진 웹 페이지와 씨앗단어 정보를 이용하여 패턴 규칙을 추출한다. 추출된 패턴 규칙을 웹페이지에 적용하여 개체명 후보들을 추출하고 추출된 후보들과 웹페이지 사이의 상호 중요도를 재귀적으로 계산하여 최종적으로 개체명 후보들의 순위가 정해 진다. 한국어와 영어 개체명 영역에 제안된 기법을 적용하여 실험한 결과 한국어에서는 78.72%의 MAP를 얻을 수 있었고, 영어에서는 96.48%의 MAP를 얻었다. 특히 영어 개체명 인식에서의 성능은 구글에서 제공하고 있는 구글셋의 결과보다도 높은 성능을 보였다.

  • PDF

한국어 비교 문장 유형 분류를 위한 변환 기반 학습 기법 (Transformation-based Learning for Korean Comparative Sentence Classification)

  • 양선;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.155-160
    • /
    • 2010
  • 본 논문은 비교마이닝(comparison mining)의 일환인 비교 문장 유형 자동 분류에 관하여 연구한다. 비교마이닝은 텍스트 마이닝의 한 분야로서 대용량의 텍스트를 대상으로 비교 관계를 분석하며, 크게 세 단계의 과정을 거치게 되는데 첫 번째 단계는 대용량의 문서에서 비교 문장만을 식별 후 추출해 내는 과정이고, 두 번째 단계는 추출된 비교 문장들을 비교 유형별로 분류하는 과정이며, 앞의 두 선행 과정이 끝나면 유형별로 비교 속성을 추출 및 비교 관계를 분석하는 세 번째 단계를 수행하게 된다. 본 연구에서는 변환 기반 학습(transformation-based learning) 기법을 이용하여 비교 문장들을 일곱 가지의 유형으로 자동 분류하는 두 번째 과제를 수행한다. 자연어 처리 분야 여러 부문에서 사용되고 있는 변환기반 학습은 오류를 감소시키는 최적의 규칙을 자동으로 생성하여 정답을 찾아가는 규칙 기반 학습 방법이다. 웹상의 다양한 도메인에서 추출된 비교 문장들을 대상으로 유형 분류를 수행한 결과 정확도 80.01%의 성능으로 일곱 가지 유형을 분류할 수 있었다.

이중 추출 방법을 이용한 단위 무응답의 가중치 조정방법에 관한 연구

  • 염준근;손창균;정영미
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.13-18
    • /
    • 2002
  • 이중추출(two-phase)접근방법 이용의 주목적은 관심변수와 보조변수사이의 관계를 이용해서 더 좋은 추정을 하고자 하는 것이다. 특히 이 방법은 층화, 무응답 문제에 적용하는 경우 상당히 효과적이다. 본 논문에서는 무시할 수 있는 무응답이 발생했을 때 이중추출기법을 이용해서 g-가중치와 응답확률을 각 단계별로 조정해줌으로써 무응답 보정추정량과 분산추정량을 구했다.

  • PDF

자동 지표화를 위한 감성공학 분야 코퍼스 분석- 전문적 문서의 특성 정보 추출 (Analysis of Human Sensibility Ergonomic Corpora for Automatic Indexation - Extraction of informative features -)

  • 배희숙;김관웅;곽현민;이상태
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2002년도 추계학술대회 논문집
    • /
    • pp.53-58
    • /
    • 2002
  • 본 논문은 감성공학 데이터의 지속적인 지표화를 위해 과정의 자동화를 제안하며 자동 지표화가 문서의 자동 요약과 유사하다는 점에 착안하여 문서 자동분류, 정보유형 추출, 특성언어 추출 및 문장 재구성이라는 단계별 기술의 기초가 되는 정보유형 및 핵심어, 그리고 특성표현을 통한 정보문 추출 방법에 대해 연구하였다. 감성공학 코퍼스 분석을 통한 본 연구는 감성공학 분야에서의 지식 관리 시스템과 자동 요약 시스템에 활용될 수 있다.

  • PDF

LDA 융합모델과 최소거리패턴분류법을 이용한 얼굴 표정 인식 연구 (A Study on Face Expression Recognition using LDA Mixture Model and Nearest Neighbor Pattern Classification)

  • 노종흔;백영현;문성룡;강영진
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.167-170
    • /
    • 2006
  • 본 논문은 선형분류기인 LDA 융합모델과 최소거리패턴분류법을 이용한 얼굴표정인식 알고리즘 연구에 관한 것이다. 제안된 알고리즘은 얼굴 표정을 인식하기 위해 두 단계의 특징 추출과정과 인식단계를 거치게 된다. 먼저 특징추출 단계에서는 얼굴 표정이 담긴 영상을 PCA를 이용해 고차원에서 저차원의 공간으로 변환한 후, LDA 이용해 특징벡터를 클래스 별로 나누어 분류한다. 다음 단계로 LDA융합모델을 통해 계산된 특징벡터에 최소거리패턴분류법을 적용함으로서 얼굴 표정을 인식한다. 제안된 알고리즘은 6가지 기본 감정(기쁨, 화남, 놀람, 공포, 슬픔, 혐오)으로 구성된 데이터베이스를 이용해 실험한 결과, 기존알고리즘에 비해 향상된 인식률과 특정 표정에 관계없이 고른 인식률을 보임을 확인하였다.

  • PDF

고차원을 갖는 생체 스펙트럼 데이터의 특징추출 및 분류기법 (Feature Extraction and Classification of High Dimensional Biomedical Spectral Data)

  • 조재훈;박진일;이대종;전명근
    • 한국지능시스템학회논문지
    • /
    • 제19권3호
    • /
    • pp.297-303
    • /
    • 2009
  • 본 논문에서는 비선형 변환에 의해 입력신호를 고차원의 확장공간으로 변환한 후, 주성분분석기법(PCA)에 의해 신호의 특징을 추출하는 기법을 제안한다. 특징추출을 위해 사용되는 기존의 주성분분석기법은 입력데이터가 비선형 특성을 갖는 경우 최적의 변환행렬을 구할 수 없다는 문제점을 가지고 있다. 이러한 문제점을 해결하기 위해, 확장공간상에서 구간별로 입력데이터를 분할한 후 주성분분석기법에 의해 구간별 특징을 추출하는 서브패턴기반 주성분분석기법(SpPCA)을 적용하였다. 다음 단계인 분류단계에서는 MLP 비선형분류기를 이용하여 구간마다 추출된 특징벡터를 이용하여 기준패턴과의 유사도를 산출한다. 최종 분류단계에서는 MLP에 의해서 산출된 유사도에 기반을 둔 융합법칙에 의하여 생체 스펙트럼 패턴을 분류한다. 제안된 방법의 유용성을 보이기 위한 실험결과에서 기존의 방법들에 비해서 향상된 인식결과를 보임을 확인하였다.

자동차 번호판 영상에서 효율적인 번호판 영역 검출 시스템의 설계 및 개발 (Design and Implementation of Efficient Plate Number Region Detecting System in Vehicle Number Plate Image)

  • 이현창
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.87-94
    • /
    • 2005
  • 본 논문은 자동차 차량의 컬러 영상 이미지에서 신속하고 효율적으로 번호판 영역을 찾는 방법에 대한 연구이다. 일반적으로 자동차 번호판 영역은 차량의 종류에 따라 일정한 색상을 가지고 있다. 이에 일정한 색상영역을 찾기 위해 HSI 컬러모델의 색상 성분 H와 YIQ 컬러 모델의 색상 성분 Q를 결합하는 방식을 사용한다. 그러나 이러한 방법을 사용하면 전체 연산시간이 많이 걸리게 되는 단점이 존재한다. 그러므로 본 논문에서는 차량 번호판 영역을 추출하는 단계들 중에서 H와 Q 색상 성분을 추출하면서 후보영역 추출 연산을 병행 수행한다. 이 단계가 끝나면 H와 Q성분을 결합하는 단계에서 전체 이미지 픽셀 정보를 대상으로 비교연산을 수행하지 않고 각 단계에서 추출된 후보영역들만을 비교 연산함으로써 영역 추출을 빠르게 수행할 수 있다 이에 대한 각 단계별 시스템 처리 결과 화면을 보이고 이미지 해상도에 따른 추출 시간을 비교하였다.

  • PDF

문제 유형별 약점정보를 이용한 학습시스템의 설계 (Design of Study System using Weak Point on Question Types)

  • 박현정;손지현;문상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.235-238
    • /
    • 2003
  • 기존 연구에서 원격교육은 위한 다양한 학습방법들이 제시되었지만 대부분이 학습자의 수준을 고려하여 단순히 평균 점수나 난이도의 조정으로 학습이 이루어진다. 또한, 학습자의 능력과 문제 유형에 따른 학습 평가가 이루어지기 어려우므로 학습자의 개인별 학습 능력을 정확히 평가할 수가 없는 문제점이 있다. 이러한 문제점을 해결하기 위하여, 본 논문에서는 학습자별로 개인적인 학습 능력에 따라 수행할 수 있는 학습 시스템을 제안한다. 세부적으로 문제 유형별에 따른 약점 정보를 평가 단계에서 추출 및 저장하여, 다음 단계의 학습에서 개인별 약점정보로서 활용하도록 한다. 따라서 이 시스템에서는 학습자별로 문제유형에 따른 개인별 약점정보를 활용하여 학습을 반복할 수 있으므로 더욱 효과적인 원격교육을 제공할 수 있다.

  • PDF

개인별 학습정보를 이용한 원격교육 시스템의 설계 (Design of System for Remote Instruction using Personal Study Information)

  • 손지현;문상호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.901-904
    • /
    • 2003
  • 최근에 웹을 이용한 원격교육에 대한 않은 학습 방법들이 제시되고 있으며, 단순히 학습만을 고려한 방법부터 실시간으로 원격시험을 치르는 방법까지 다양하다 웹 기반의 학습에서 많이 적용되는 방법이 문제를 통한 학습이며, 기존의 학습들은 학습자가 개인 수준에 안는 문제 난이도를 직접 선택하거나, 문제를 동적으로 추출하여 학습하는 방식이다. 그러나 이 방법들은 단순히 출제되는 문제 자체의 차별성을 기반으로 하므로 학습자의 능력별 학습이 이루어지기 어려운 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여, 개인의 문제유형별 약점정보를 기반으로 유형별 추출되는 문제에 난이도를 두어 개인별 학습 능력을 정확히 평가한다. 그리고 다음 단계의 학습에서 개인별 학습정보를 충분히 반영하여 문제들을 출제하므로 학습자의 학습효과를 높일 수 있다. 따라서 이 시스템은 문제유형과 문제난이도에 대한 개인의 정보를 반복적으로 적용하여 학습할 수 있으므로, 더욱 효과적인 원격학습을 제공할 수 있다.

  • PDF