• 제목/요약/키워드: 자동 계층정의

검색결과 47건 처리시간 0.025초

엔지니어링 문서의 문장 자동 계층정의 방법론 (The methodology of automatic hierarchical definition for the sentences in engineering documents)

  • 박상일;김봉근;김경환;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2009년도 정기 학술대회
    • /
    • pp.352-355
    • /
    • 2009
  • 본 연구에서는 토목분야의 엔지니어링 문서를 대상으로 자동으로 문장의 계층을 정의하여 비 구조화 문서를 준 구조화 문서로 변환하는 방법론을 제시하고, 이를 시범적으로 구현하였다. 이는 기본적으로 문장의 머리기호가 그 문서에서의 계층을 표현한다는 점을 바탕으로 연구가 이루어졌다. 이를 위하여 본 연구에서는 첫째, 문장을 머리기호와 내용으로 분리하는 방법을 개발하였고, 둘째, 분리한 머리기호를 바탕으로 머리기호간 상대적인 위치를 파악하여 문장의 계층을 정의하는 프로세스를 제안하였다. 또한 제안한 방법을 이용하여 구현한 시범 모듈을 실무에서 사용하는 엔지니어링 문서를 대상으로 성능을 평가하여 개발한 모듈의 효용성을 검증하였다.

  • PDF

엔지니어링 문서의 문장 자동 계층정의 방법론 (A Methodology for Automatic Hierarchy Definition of Sentences in Engineering Documents)

  • 박상일;김봉근;김경환;이상호
    • 한국전산구조공학회논문집
    • /
    • 제22권4호
    • /
    • pp.323-330
    • /
    • 2009
  • 본 논문은 엔지니어링 문서에서 각 제목의 머리기호가 그 문서의 논리적 계층 구조를 표현한다는 점을 이용하여 문서 내 각 제목의 계층을 자동으로 분류하는 방법론을 제시하였다. 제시한 방법론은 일반 텍스트 문서에서 세부 제목을 추출하는 방법과 추출된 제목의 계층을 정의하는 방법으로 구성된다. 문서의 세부 제목은 문장의 맨 앞에 위치한 머리기호의 형태를 미리 정의된 머리기호 그룹과 비교하여 추출하며, 추출된 제목의 계층은 머리기호 형태의 변화에 따라 각 제목간의 상대적 위치를 파악함으로써 정한다. 제시된 방법론을 이용하여 일반 텍스트 문서를 세부 제목에 따라 구조화된 XML 문서로 변환하는 시범 모듈을 개발하였으며, 20개의 엔지니어링 문서를 대상으로 그 성능을 분석하였다.

상위어 관계를 이용한 개념 계층의 생성 (Concept Hierarchy Creation Using Hypernym Relationship)

  • 신명근
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.115-125
    • /
    • 2006
  • 개념 계층은 지식을 그룹화하여 다단계로 표현하며, 이는 자료의 분류, 저장 및 검색을 효율적으로 지원해 준다. 일반적으로 도메인 전문가의 수작업을 통해 개념 계층이 생성되었으며, 이는 생성과 유지에 많은 비용이 소요되면서도 일관성 유지가 어려운 단점이 있다. 본 논문은 미리 정의된 상위어 관계를 이용하여 문자형 자료의 개념 계층을 자동으로 생성하는 방법에 대한 연구이다. 개념 계층의 자동 생성을 위해서는, 다중 의미로 사용되는 단어에서 적절한 의미를 찾아 내어 모호성을 제거해야 하며, 외부 정보를 이용하여 모호성이 제거된 단어를 그룹화하고 계층을 생성하는 작업이 필요하다. 우리는 워드넷 (WordNet)의 다중 의미에 대한 설명 및 상위어 관계를 이용하여 모호성을 제거하고 개념 계층을 생성하는 방법을 제안 한다.

  • PDF

계층구조 카테고리를 가지는 텍스트 분류 시스템 (A Text Classification System for Hierarchical Categories)

  • 박지호;김진상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.128-130
    • /
    • 2000
  • 인터넷의 발전으로 온라인 문서들의 양이 급증하여 문서의 자동 분류 기술의 중요성이 증대되고 있다. 문서를 미리 정의된 카테고리로 분류할 때 카테고리는 평면구조보다 계층구조를 갖도록 하는 것이 사용자의 측면에서 볼 때 훨씬 더 자연스럽다. 본 논문에서는 계층구조 카테고리를 가지는 문서를 분류하는 방법을 연구하고 실제 20개의 유스넷 뉴스그룹 문서들을 분류하도록 시험하였다. 여기서 사용한 알고리즘은 하이퍼링크 정보를 이용하여 웹 문서분류를 목적으로 개발된 IBM의 TAPER(taxonomy and path enhanced retrieval system) 알고리즘을 변형한 것이다.

  • PDF

다중계층 프로토콜 시험 방법 (Multi-protocol Test Method:MPTM)

  • 이수인;박용범;김명철
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권3호
    • /
    • pp.377-388
    • /
    • 2001
  • 하나의 시험 스위티를 가지고 다중 계층 프로토콜 시험대상(Implementation Under Test: IUT)을 시험하는 방안이 제안되었다[1] 기존 방법과 비교하여 이방법은 상위 프로토콜에 적용하는 단일 계층 시험 방법과 하위 프로토콜에 적용하는 내포 시험 방법을 조합하여 적용함으로써 다중 계층 프로토콜 시험 대상을 시험한다. 그러나 논문[1]은 접근 방법만 제시하였을뿐 어떻게 시험 경우를 자동으로 도출할 것인지에 대해서는 고려하지 않고 있다. 본 논문은 논문[1]에 기초하여 다중 계층 프로토콜 시험 경우 자동 생성알고리즘을 제안한다. 이를 위해 시험대상 프로토콜을 두 개의 FSM으로 정의하고 두 FSM에 대하여 pre-execution 과 carried-by 로 구성되는 트랜지션의 수행 관계를 정의한다. 제안한 알고리즘을 구현하여 간략화한 TCP/IP와 B-ISDN Signaling/Service Specific Connection Oriented Protocol (SSCOP)에 적용한다. 본논문의 다중 계층 프로토콜 시험방법은 프로토콜 사이의 인터페이스가 개방되지 않은 경우에도 시험이 가능하며 기존 시험방법에 비해서 적은 시험 경우로 동이한 커버리지를 갖는다

  • PDF

패싯 분류를 이용한 객체지향 컴포넌트의 계층구조화 (A Hierarchy of Object-Oriented Component Using Facet Classification)

  • 한정수;김귀정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.321-324
    • /
    • 2004
  • 본 연구는 재사용이 가능한 객체지향 컴포넌트의 효율적인 검색을 위해 클래스 개념 범주(CCC)를 정의하고 클래스의 상속 관계를 이용한 CCC 상속을 제안하였다. CCC의 상속은 클래스 간 상속관계를 인지한 후, 하위 클래스는 상위 클래스의 모든 CCC를 자동 상속받게 되며, 클래스 구문분석에 의해 객체지향 코드로부터 자동 인식된다. 본 연구는 모든 용어에 대한 범주를 수동으로 할당해주는 기존 방법의 단점을 극복할 수 있으며, 시소러스를 자동으로 갱신할 수 있다는 장점이 있다.

  • PDF

MPEG-7을 이용한 하이라이트 인덱싱과 브라우징 (Highlight Indexing and Browsing Based on MPEG-7)

  • 이창윤;임화영;김혁만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.217-219
    • /
    • 2002
  • 스포츠 경기의 하이라이트(highlight) 브라우징을 위해 하이라이트 이벤트(주요 사건)와 하이라이트 객체(선수)를 묘사하는 하이라이트 테마를 계층구조로 정의하고, 이를 이용해 하이라이트 세그먼트를 설정하고, 자동적으로 계층구조의 하이라이트 메타데이타를 생성하는 하이라이트 인덱싱 방법을 제안하였다. 하이라이트에 관련된 모든 메타데이타는 MPEG-7으로 기술하였다. 그리고 제안한 방법으로 생성된 메타데이타를 이용한 set-top box용 하이라이트 브라우저를 구현하였다.

  • PDF

시소러스 자동 구조화 (Automatic Structuralization of Thesaurus)

  • 김해수;이남경;이원규
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.97-100
    • /
    • 1994
  • 정보과학 분야에서 필요로 하는 의미해석 기술 개발에 중요한 역할을 하는 것이 시소러스이다. 정확한 관계 정의 및 대량정보 수용의 필요성은 시소러스 구축의 커다란 장애 요인이다. 시소러스 구축에은 다방면의 전문지식 활용과 막대한 비용 및 시간 투자가 요구된다. 기계적으로 관리 운영이 가능한 시소러스내의 관계는 BT, NT로 표현되는 계층관계와 USE, UF로 표현되는 등가관계로 이루어 진다. 본 연구는 개념적인 관계를 정의하는 두 관계를 기계적으로 추출하고, 기존의 평면적인 시소러스 구조를 실세계의 정보 구조에 적합하게 조직화하여 시소러스 구축에 있어서의 문제점을 개선하는데 그 목적이 있다. 제시되는 알고리즘은 단일 언어내의 시소러스 구축 뿐만 아니라, 구축된 시소러스들의 융합 및 다국어 시소러스 구축에도 적용된다.

  • PDF

위키피디아 링크를 이용한 랭크 기반 개념 계층구조의 자동 구축 (Automated Development of Rank-Based Concept Hierarchical Structures using Wikipedia Links)

  • 이가희;김한준
    • 한국전자거래학회지
    • /
    • 제20권4호
    • /
    • pp.61-76
    • /
    • 2015
  • 흔히 대용량 텍스트 데이터의 분류를 위한 인덱싱 데이터 구조로서 계층 개념 트리가 활용된다. 본 논문은 개념 계층구조를 자동적으로 구축하기 위해 위키피디아를 이용한 일반성 랭크 기반 기법을 제안한다. 이것의 목적은 위키피디아 문서를 하나의 개념으로 정의하여 이들 간의 계층적 위상관계를 생성하는 것이다. 이를 위해 위키피디아 문서들 간의 링크 개수를 주요 인자로 하여 개념 일반성을 가늠하는 랭킹함수를 고안하였으며, 이를 활용하여 개념 간 확률적 포함관계를 산출함으로써 안정적인 개념 간 계층 구조를 생성한다. 결과적으로 계층적 관계를 담은 개념쌍은 DAG 구조로 시각화 된다. Open Directory Project 계층구조를 사용한 성능 분석을 통해 제안 기법이 기준 기법에 비해 성능이 우수하며 고품질 계층 관계를 안정적으로 추출할 수 있음을 확인하였다.

한국어 오픈 워드넷 (KWN) : 사전 기반의 반자동 구축 (Open Korean WordNet (KWN): Dictionary-based Semi-Automatic Development)

  • 이인근;황도삼;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.193-196
    • /
    • 2014
  • 본 논문에서는 사전자원에 기반한 한국어 워드넷(Open Korean WordNet: KWN)의 반자동 구축 방법을 제안한다. 제안한 방법에서는 각 전문분야별로 분류된 영어-한국어 대역사전, 일본어-한국어 대역사전을 이용하여 영어 워드넷(Princeton WordNet 3.0)과 일본어 워드넷(Japanese WordNet 1.1)의 어휘를 번역하였다. 그리고 번역 결과의 애매성을 해소하기 위하여, (1)영어와 일본어에 대한 한국어 대역어의 중복 여부, (2)사전의 분야 정보와 워드넷의 계층구조를 고려하였다. 제안한 방법으로 117,659 개의 워드넷 synset 중 63,221 개(약 54 %)의 synset에 대한 자동번역을 수행하여 한국어 워드넷을 구축하였다. 그리고 워드넷 synset의 정의문은 한국어 사전의 정의문을 참조하여 한글화 할 수 있도록 하고, 이 과정을 지원하기 위한 정의문 추천 알고리즘을 제안한다. 제안한 방법에 기반하여 전문가들이 상호 협력하여 한국어 워드넷을 구축할 수 있는 시스템을 개발한다.

  • PDF