• 제목/요약/키워드: 의미계층구조

검색결과 208건 처리시간 0.03초

HTML 테이블의 논리적 구조분석을 위한 효율적인 방법 (An Efficient Method for Logical Structure Analysis of HTML Tables)

  • 김연석;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제9권9호
    • /
    • pp.1231-1246
    • /
    • 2006
  • 시각적 렌더링 포맷인 HTML은 연관된 정보를 간결하게 표현하기 위하여 테이블을 사용한다. 그러나 HTML은 컴퓨터로 하여금 정의를 처리 및 가공하게 한다는 측면에서 한계를 갖기 때문에 논리적 구조정보의 표현이 가능한 XML 문서로의 변환이 필요하다. 본 논문에서는 웹으로부터 정보를 추출하기 위한 목적의 일환으로 HTML 테이블의 논리적인 구조를 추출하여 XML 문서로 변환하는 효율적인 방법을 제안한다. 제안된 방법은 영역구분과 구조분석의 두 단계로 구성된다. 영역구분 단계에서는 잡음영역을 제거하며 시각적 및 의미적 일관성 검사를 통하여 테이블에 존재하는 속성과 값 영역을 구분한다. 이후 구조분석 단계에서는 구분된 영역에 제안된 테이블 모델을 적용하여 계층구조를 추출하며, 이로부터 XML 문서를 생성한다. 제안된 영역구분 방법의 성능을 평가하기 위하여 1,180개의 테이블을 대상으로 실험한 결과, 평균적으로 86.7%의 정확도를 보여 기존 연구보다 우수하였다.

  • PDF

MPLS 인터넷 트래픽 엔지니어링 기술 (MPLS Internet Traffic Engineering in IP Network)

  • 장희선;신현철
    • 정보학연구
    • /
    • 제5권4호
    • /
    • pp.155-164
    • /
    • 2002
  • MPLS(Multiprotocol Label Switching)는 네트워크 계층에서의 라우팅 기능과 레이블 교환(label swapping) Framework을 통합한 기술을 의미한다. 기존의 FEC(Forwarding Equivalence Classes) 개념을 이용하며, 기본적인 아이디어는 MPLS 도메인의 Ingress에서 패킷에 고정된 길이의 레이블을 추가하는 것이다.이에 따라 라우팅을 위해 원래의 패킷 헤더에 의존하지 않고, MPLS 도메인 내부에서 패킷에 추가된 레이블을 이용하여 Forwarding Decisions에 사용한다. 본 논문에서는 MPLS 인터넷 망에서의 트래픽 엔지니어링을 위한 요구사항을 정리한다. 이들 요구사항들을 만족시키기 위해서는 망 관리 구조와 연계하여 트래픽 엔지니어링 기능이 수행되어야 한다. 아울러 본 논문에서는 MPLS를 이용한 IP 망 구조 및 기능을 제시하고 MPLS 신호 프로토콜과 주요 특징을 요약한다.

  • PDF

한국어 대화체 음성언어 번역시스템에서의 개념기반 번역시스템 (Concept-based Translation System in the Korean Spoken Language Translation System)

  • 최운천;한남용;김재훈
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2025-2037
    • /
    • 1997
  • 대화체 음성언어번역시스템의 일부인 개념기반 번역시스템은 음성인식의 결과를 이용하여 다른 언어로 번역해 주는 시스템이다. 본 논문은 여행계획 영역에 대해 한국어를 해석하여 영어, 일본어, 한국어로 번역해 주는 시스템에 대해 기술한 것이다. 개념기반 번역은 비정형 문장이 많은 대화체 문장을 처리하기 위해 형태소 분석 등의 구문정보를 이용하지 않고, 의미단위의 번역을 시도한 것으로 화자의 의도를 정확히 번역해 주는 것을 목표로 한다. 개념기반 번역은 280여개의 개념과 개념간의 계층구조에 의해, 인식결과를 개념구조로 변환한 후 다른 언어로 생성해 준다. 효율적인 한국어 처리를 위해 기준단어를 이용한 토큰분리기와 문법자동 수정기를 개발하였다. 그리고 자연스러운 생성문을 위해 각 언어에 대한 후처리기를 개발하였다.

  • PDF

문화산업디자인 분야 분류체계(CIDC) 제안 (A Planning and Design for the Culture Industrial Design Classification)

  • 진미자;한석우
    • 디자인학연구
    • /
    • 제17권3호
    • /
    • pp.71-80
    • /
    • 2004
  • 문화산업디자인은 미래 산업의 선진화를 이룩할 수 있는 핵심적인 계기와 수단은 물론, 다양한 역량으로 발전되어 새로운 가치변화를 촉진시키며 기업과 국가의 경쟁력을 극대화시키는 주요 요인이다. 따라서 이에 대한 새로운 패러다임 변화를 이해하고 구조적 특성을 재 조망하는 것은 매우 중요한 의미를 지닌다. 그러므로 문화산업디자인 정책 및 전략수립, 진단지표의 체계구성과 평가에 필요한 객관적인 자료를 확보하기 위해서는 기본이 되는 분류체계 구축이 선행적으로 이뤄져야 한다. 본 연구의 문화산업디자인 분류체계(CIDC)는 크게 3영역으로 구분하였고 각각 중, 소, 세 분류의 계층적 구조와 레이어 기호로 표기하였다. CIDC는 이 분야의 기초적인 언더데이터로서의 역할을 담당할 뿐만 아니라 연관 디자인 분야 분류체계와 비교를 통한 차별성과 연계성을 검색할 수 있도록 구성하였다.

  • PDF

재미 감성 주제 온톨로지를 이용한 질의어 확장 멀티미디어 데이터 검색 시스템 구현 (Implementation of Query Expansion Multimedia Data Retrieval System using "FUN" Based Ontology of Emotion)

  • 이정송;변동률;박순철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.279-284
    • /
    • 2010
  • 최근 컴퓨터와 네트워크의 기술 발달로 멀티미디어 데이터가 폭발적으로 증가하고 있다. 따라서 정보검색 시스템도 텍스트 데이터 위주에서 벗어나 멀티미디어 데이터 검색이 큰 비중을 차지하고 있다. 또한 멀티미디어 데이터 질의어처리도 기술적인 변화와 함께 다양한 질의어 확장으로 검색의 정확성을 높이고 있다. 본 논문에서는 인간의 감성에 대한 '재미' 주제 온톨로지를 구축하여 질의어 확장에 응용하였고, 한편의 동영상에서 재미 요소를 찾아내는 멀티미디어 데이터 검색 시스템을 구축하였다. 온톨로지 구축은 한글 워드넷(KorLex)에서 "재미"라는 특정 감소 요소의 의미 계층 구조를 파악하고 토픽맵을 이용하여 구축하였다. 또한, 온톨로지에 정의된 용어들 사이의 가중치는 실시간으로 계산하여 질의어를 확장에 적용하였으며, 따라서 검색의 효율성과 질을 높였다. 검색방법은 사용자가 질의어를 직접 입력하는 텍스트 입력 검색과 온톨로지 구조를 이용한 GUI 인터페이스 검색방법으로 나누어 사용자의 편의성을 증대시켰다.

  • PDF

온톨로지 기술 융합을 통합 교수학습 시맨틱 모델 설계 (Design of Semantic Models for Teaching and Learning based on Convergence of Ontology Technology)

  • 정현숙;김정민
    • 한국융합학회논문지
    • /
    • 제6권3호
    • /
    • pp.127-134
    • /
    • 2015
  • 본 논문에서는 시맨틱웹의 온톨로지 기술과의 융합을 통한 시맨틱 강의계획서 템플릿을 정의하고 있다. 교수학습 설계도로서 강의계획서는 매우 중요한 의미를 가지고 있으나 이질적인 비구조화, 단편적인 내용구조, 타 서비스와의 연계 부족, 재사용성 부족 등으로 인해 실제로는 단순한 조회에 그치고 있다. 본 논문에서는 강의계획서 기반의 교수학습 정보시스템 구축을 위해 보다 구조화된 의미기반의 강의계획서 템플릿을 설계한다. 제안하는 기법은 강의계획서 계층구조 정의, Bloom 인지 분류 모형을 적용한 학습활동, 능력 및 학습성과 모델링, 학습주제 온톨로지 설계 등을 포함함으로써 강의계획서 중심의 학습연계 서비스를 가능하게 한다. 실제 자바 프로그래밍 강의에의 적용 및 실험을 통해 제안한 템플릿의 유용성과 신뢰성을 보인다.

MIRAGE-III 디지털도서관에서 가상문서 검색 서버의 설계 및 구현 (Design and Implementation of a Retrieval Server for Virtual Documents in the MIRAGE-III Digital Library)

  • 이용배;맹성현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권2호
    • /
    • pp.219-230
    • /
    • 2002
  • 인터넷이용의 급증에 따라 지식정보화사회 전반의 작업들이 분산환경의 디지털도서관에 저장되어 있는 멀티미디어 컨텐츠를 쉽고 신속하게 찾아 새로운 정보를 생성 또는 공유하는 작업을 통해 이루어진다. 이를 위해 핵심적으로 연구해야 할 부분은 원격지에 흩어져 있는 정보를 효과적으로 연결시켜서 의미있고 일관된 형태로 보여지도록 하는 것이다. 이 목적을 달성하기 위해 디지털도서관에서는 물리적으로 홑어져 있는 정보들이 논리적으로 일관되게 표현될 수 있는 가상공간을 제공해야 하며 가상공간에서 정보가 표현되었을 때 사용자가 원하는 정보를 신속하게 수집하여 제시할 수 있어야 한다. 가상문서(Virtual Document)란 특정 저장장소에 저장되어 존재하던 물리적 문서(Physical Document)들을 대상으로 사용자에게 필요한 일부분 또는 전체를 동적으로 연결하여 통합한 문서를 의미한다. MIRAGE-III 디지털도서관에서는 일반 텍스트문서와 XML로 기술된 구조화된 가상문서를 대상으로 내용기반 검색을 수행한다. 이 시스템에서는 XML 문서구조를 기반으로 부분문서의 검색이 가능하며 문서의 속성 및 계층구조에 대한 검색과 문서간의 링크관계를 이용한 검색도 가능하다. 본 논문에서는 MIRAGE-III 디지털도서관에서의 질의어처리기 및 검색기를 설계하고 구현한 방법론에 대하여 기술한다.

차상위 계층 우울 독거노인 삶의 경험: 현상학적 연구 (A Study on the Experience of Life in Near Poor Elderly Living Alone in Depression: Phenomenological Study)

  • 김재은;이미형;이채원;이상은;박시현
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.759-771
    • /
    • 2020
  • 연구의 목적은 차상위 계층 우울 독거노인 삶의 경험을 통하여 삶의 의미를 파악하고 어떠한 삶을 살아가는지 본질적 구조를 알아보고자 함에 있다. 연구 대상은 인천광역시 A 정신건강복지센터에 등록된 65세 이상 노인으로, 한국형 노인우울척도(KGDS) 9점 이상, 현재 독거생활 1년 이상 된 의사소통의 어려움이 없는 차상위 계층 8명이다. 연구방법은 개인 심층 인터뷰를 통하여 2018년 5월부터 2019년 10월까지 Colaizzi 분석방법을 적용한 질적 연구이다. 연구결과 48개의 주제와 19개의 주제모음, 6개의 범주가 도출되었다. 참여자들이 차상위 계층 우울 독거노인으로 살아가는 경험은 '도움 없이 살수 없는 초라한 삶', '몸과 마음이 병든 삶', '자립하고 싶은 삶', '감사하는 삶', '내면의 평화가 있는 삶', '제도적 보완이 필요한 삶'으로 나타났다. 연구를 통해 차상위 계층 우울 독거노인을 위한 지역사회의 정서적 지지 프로그램 개발을 위한 정보를 제공하고 국가적인 차원의 다양한 복지 정책을 위한 근거 자료의 기초가 되고자 한다.

정제된 의미정보와 시소러스를 이용한 동형이의어 분별 시스템 (A Korean Homonym Disambiguation System Using Refined Semantic Information and Thesaurus)

  • 김준수;옥철영
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.829-840
    • /
    • 2005
  • 단어 의미 중의성 해소는 자연언어처리 분야에 매우 중요한 부분이다. 본 논문에서는 사전 뜻풀이 특성을 이용해 기존의 의미정보를 정제하고 유용한 정보인 확률정보, 거리정보 및 격정보 등을 추가한 WSD 모델을 제안하였으며, 사전을 기반으로 구축된 "울산대학교 어휘 지능망(UOU-Word Intelligent Network: U-WIN)" 상의 단어 계층적 구조(시소러스)를 이용하여 의미정보의 자료 부족 문제를 해소하는 모델을 제시하였"다. "21세기 세종 계획"에서 제공하는 150만 어절 규모의 의미 태그 말뭉치를 대상으로 한 실험에서 최다 빈도 의미 결정(Maximum Frequence Class, MFC, 정확률 베이스라인)에 비해 $18.97\%$(명사 $21.73\%$, 동사 $17.11\%$) 정확률 향상을 보였으며, 기존의 확률 가중치와 어절 거리 가중치를 이용한 모델에 비해서는 $10.49\%$(명사 $8.84\%$, 동사 $11.51\%$)의 정확률 향상되었다. 또한 시소러스를 사용하지 않고 확률정보, 거리정보, 격정보 만을 이용한 모델에 비해 $6.12\%$(명사 $5.29\%$, 동사 $6.64\%$) 높은 정확률을 보였다.

중복을 허용한 계층적 클러스터링에 의한 복합 개념 탐지 방법 (Hierarchical Overlapping Clustering to Detect Complex Concepts)

  • 홍수정;최중민
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.111-125
    • /
    • 2011
  • 클러스터링(Clustering)은 유사한 문서나 데이터를 묶어 군집화해주는 프로세스이다. 클러스터링은 문서들을 대표하는 개념별로 그룹화함으로써 사용자가 자신이 원하는 주제의 문서를 찾기 위해 모든 문서를 검사할 필요가 없도록 도와준다. 이를 위해 유사한 문서를 찾아 그룹화하고, 이 그룹의 대표되는 개념을 도출하여 표현해주는 기법이 요구된다. 이 상황에서 문제점으로 대두되는 것이 복합 개념(Complex Concept)의 탐지이다. 복합 개념은 서로 다른 개념의 여러 클러스터에 속하는 중복 개념이다. 기존의 클러스터링 방법으로는 문서를 클러스터링할 때 동일한 레벨에 있는 서로 다른 개념의 클러스터에 속하는 중복된 복합 개념의 클러스터를 찾아서 표현할 수가 없었고, 또한 복합 개념과 각 단순 개념(Simple Concept) 사이의 의미적 계층 관계를 제대로 검증하기가 어려웠다. 본 논문에서는 기존 클러스터링 방법의 문제점을 해결하여 복합 개념을 쉽게 찾아 표현하는 방법을 제안한다. 기존의 계층적 클러스터링 알고리즘을 변형하여 동일 레벨에서 중복을 허용하는 계층적 클러스터링(Hierarchical Overlapping Clustering, HOC) 알고리즘을 개발하였다. HOC 알고리즘은 문서를 클러스터링하여 그 결과를 트리가 아닌 개념 중복이 가능한 Lattice 계층 구조로 표현함으로써 이를 통해 여러 개념이 중복된 복합 개념을 탐지할 수 있었다. HOC 알고리즘을 이용해 생성된 각 클러스터의 개념이 제대로 된 의미적인 계층 관계로 표현되었는지는 특징 선택(Feature Selection) 방법을 적용하여 검증하였다.