• 제목/요약/키워드: multiple entity model

검색결과 37건 처리시간 0.025초

A Muti-Resolution Approach to Restaurant Named Entity Recognition in Korean Web

  • Kang, Bo-Yeong;Kim, Dae-Won
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제12권4호
    • /
    • pp.277-284
    • /
    • 2012
  • Named entity recognition (NER) technique can play a crucial role in extracting information from the web. While NER systems with relatively high performances have been developed based on careful manipulation of terms with a statistical model, term mismatches often degrade the performance of such systems because the strings of all the candidate entities are not known a priori. Despite the importance of lexical-level term mismatches for NER systems, however, most NER approaches developed to date utilize only the term string itself and simple term-level features, and do not exploit the semantic features of terms which can handle the variations of terms effectively. As a solution to this problem, here we propose to match the semantic concepts of term units in restaurant named entities (NEs), where these units are automatically generated from multiple resolutions of a semantic tree. As a test experiment, we applied our restaurant NER scheme to 49,153 nouns in Korean restaurant web pages. Our scheme achieved an average accuracy of 87.89% when applied to test data, which was considerably better than the 78.70% accuracy obtained using the baseline system.

시각예술기록정보 관리를 위한 데이터모델 설계 KS X ISO 23081 다중 엔티티 모델의 적용을 중심으로 (A study on Multiple Entity Data Model Design for Visual-Arts Archives and Information Management in the case of the KS X ISO 23081 Multiple Entity Model)

  • 황진현;임진희
    • 기록학연구
    • /
    • 제33호
    • /
    • pp.155-206
    • /
    • 2012
  • 1999년 "공공기관의기록물관리에관한법률"이 제정되고 난 후 10년이 지난 현재, 기록관리에 대한 관심은 공공분야에서 문화예술분야로 점차 넓어지고 있다. 그러나 아직까지 문화예술분야 기록의 중요성에 대한 인식이 부족하여 정보의 산재, 기록의 유실 등이 빈번하게 일어나고 있다. 하나의 예로, 국내의 많은 문화재는 정확한 매매계약이나 증여증서가 없어 이를 추적하기가 매우 어려운 현실이고, 이러한 문화예술 창작품은 도굴이나 비공개 경매, 공식적이지 않은 유통경로를 통해 떠돌아다니고 있다. 문화예술 창작품은 그 나라의 문화수준을 반영하기에, 유통경로를 아는 것은 그 나라의 문화수준을 가늠하는 척도가 된다고 할 수 있다. 본 연구는 이러한 문제점에서 출발하였다. 경제의 성장과 문화예술에 대한 관심의 증대로 시각예술작품에 대한 중요성 인식이나 가치를 인정하는 사회가 되었으나, 작품에 대한 미적가치만을 앞세우는 작품만능주의 팽배로 시각예술작품의 맥락을 보여주거나 사회와의 소통 과정에서 생산된 기록정보들은 도외시 되었다. 문화예술 선진국에 비하여 국내에서는 유명 작가에 관한 기록, 작품에 녹아 있는 철학 담론에 대한 기록정보들은 흔히 찾아볼 수 없다. 작품을 전시하고 난 후 생산된 기록정보 또한 전시에 앞서 홍보자료나 참고자료로만 이용될 뿐 이를 남기려는 노력은 부족하다. 이에 시각예술기록정보에 대한 중요성을 인식하고, 후대에 예술사적 가치뿐만 아니라 역사적 가치를 전해주기 위해 체계적인 관리가 필요하다고 판단하였다. 최근 시각예술작품이나 시각예술기록정보가 전자적으로 생산된 것이 아니라 하더라도, 작품이나 기록에 대한 관리는 모두 기관의 시스템에서 이루어지고 있기 때문에 메타데이터는 체계적 관리의 필수적인 방안이라 할 수 있다. 본 연구에서는 시각예술기록정보의 특성을 반영한 다중 엔티티 데이터모델 설계로 시각예술기록을 체계적으로 관리하려 하였다. 메타데이터는 기록이 입수되는 시점부터 관리, 보존 및 활용되는 기록의 모든 과정에서 필요로 한다. 시각예술기록은 객체, 행위주체, 업무, 규정 등과 유기적인 관계를 가질 때 그 가치가 풍부해지진다. 시각예술기록정보 관리를 위한 다양한 맥락정보는 다양한 엔티티들과 함께 관계를 맺는 다중 엔티티 모델로 설계되어야 관리의 효율성이 높아지고, 기록정보에 대한 설명성 또한 높아진다. 때문에 이들을 각자 독립적인 엔티티로 설계하고, 이들의 관계를 지정해주는 방식으로 데이터모델을 설계하여 체계적으로 시각예술기록정보를 관리할 수 있는 방안을 마련하고자 하였다.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

건설 분야 전자도면의 모델 기반 교환을 위한 IFC2.x2모델의 2차원 형상정보모델의 확장 개발에 관한 기초 연구 (Development of Two Dimensional Extension Model far IFC2.x2 Model in the Construction Field)

  • 김인한;서종철
    • 한국CDE학회논문집
    • /
    • 제10권2호
    • /
    • pp.121-132
    • /
    • 2005
  • There have been several efforts for the investigation of the formal development team which was formed in the IAI to develop a common 2D standard specification between ISO/STEP and IAI/IFC since 2002. As a result, a drafting model has been included in the IFC2.x2 model. However, to be used actively in the construction practice for construction drawing exchange, the IFC model should be extended to the paper space for multiple views, drawing output, and delivery of drawings. Therefore, in this paper, the methodology of relating STEP and IFC has been investigated and schema extension of paper space(drawing sheet, presentation view, view pipeline), complex entity(leader), and dimension(associative) have been achieved. The resulting, IFC model will enable a basic harmonization with KOSDIC. SCADEC, and STEP-CDS by retaining the current IFC architecture. In addition, IT systems for the construction industry can be beneficial from the developed data model.

RiC-CM을 적용한 영구기록물 기술방안 연구 (A Study on Archive Description Using RiC-CM)

  • 김수현;이성숙
    • 한국기록관리학회지
    • /
    • 제20권1호
    • /
    • pp.115-137
    • /
    • 2020
  • 본 연구는 영구기록물기술규칙 기반의 기술현황이 갖는 한계점을 살펴보고, 이에 대한 해결방안으로 RiC-CM(Record in Context - Conceptual model)을 적용한 영구기록물 기술방안을 제안하는데 그 목적을 두었다. 이를 위해 문헌연구와 사례연구를 진행하였다. 국가기록원 영구기록원 기술현황의 한계에 대한 RiC-CM 기반의 해결방안과 그에 대한 효과는 다음과 같다. 첫째, RiC-CM는 특정 영구기록물이 복수 출처맥락을 반영하는 것이 가능하다. 이는 기록물과 각각의 출처를 개체로 정의하고 이들의 연관성을 관계로 표현하는 방식으로 해결할 수 있다. 기록물 개체들의 관계를 맺어주는 것만으로도 특정 영구기록물과 관련된 출처정보를 보다 정확히 표현 가능하고, 전체적인 생산맥락을 파악하기 용이하다. 둘째, RiC-CM는 연관이 있는 기록물 철·건 정보를 연계하는 것이 가능하다. 특정 기록물 군(퐁)에 속하는 하위 기록물 철·건들은 각각 개체로 지정하고, 생산맥락에 따른 관계를 부여하는 방식으로 해결할 수 있다. 이를 통해 실제 서비스를 제공할 때 연관된 영구기록물들의 정보를 한데모아 서비스하는 것이 가능하다. 그리고 이용자 입장에서는 영구기록물 검색의 폭을 넓힐 수 있다. 셋째, RiC-CM은 특정 생산기관과 연관된 모든 생산기관 정보를 연계하는 것이 가능하다. 만약 복수의 생산기관들이 서로 연관되어 있다면, 생산기관들을 각각의 개체로 정의하고 이들 간의 관계를 '연관이 있다(associated with)'로 표현할 수 있다. 이를 통해 생산기관의 맥락정보, 즉 기록의 출처맥락을 종합적으로 살펴보는데 도움이 된다. 본 연구를 통해 전자기록 관리환경의 패러다임 변화에 대응하여, 차세대 영구기록물 기술규칙인 RiC-CM에 대한 연구에 활용될 수 있기를 기대한다.

생의학 분야 학술 논문에서의 개체명 인식 및 관계 추출을 위한 언어 자원 수집 및 통합적 구조화 방안 연구 (A Study on Collecting and Structuring Language Resource for Named Entity Recognition and Relation Extraction from Biomedical Abstracts)

  • 강슬기;최윤수;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.227-248
    • /
    • 2017
  • 본 논문에서는 급격히 증가하는 생의학 분야 비정형 텍스트에서 핵심적 내용을 추출할 수 있는 기계학습 기반 정보 추출시스템을 구축하기 위한 언어자원 수집 및 통합적 구조화 방안을 제안한다. 제안된 방법은 정보 추출 시스템을 크게 개체명 인식과 개체명 간 관계 추출 시스템으로 구분하고, 각각의 시스템에 적합한 학습데이터를 구성하기 위해 생의학 분야 개체명 사전과 학습 집합을 수집한다. 그리고 수집된 해당 자원들의 특성을 분석하여 개체 구별을 위해 필수적으로 포함시켜야 할 항목들을 도출하고 이를 통해 시스템 학습과정에서 사용될 학습 데이터를 구성하기 위한 항목을 선정한다. 이와 같이 선정된 학습데이터의 구성 내용에 따라 수집된 자원들을 가공하여 학습 데이터를 구축한다. 본 연구에서는 생의학 분야의 하위 분야인 유전자, 단백질, 질병, 약물 4개 분야에 대한 개체명 사전과 학습 집합을 수집하여 각각을 학습 데이터로 구축하였으며, 개체명 사전을 통해 구축된 개체명 인식용 학습 데이터를 대상으로 개체명 수용 범위를 측정하기 위한 검증 과정을 수행하였다.

A Trust Management Model for PACS-Grid

  • Cho, Hyun-Sook;Lee, Bong-Hwan;Lee, Kyu-Won;Lee, Hyoung
    • Journal of information and communication convergence engineering
    • /
    • 제5권2호
    • /
    • pp.144-149
    • /
    • 2007
  • Grid technologies make it possible for IT resources to be shared across organizational and security domains. The traditional identity-based access control mechanisms are unscalable and difficult to manage. Thus, we propose the FAS (Federation Agent Server) model which is composed of three modules: Certificate Conversion Module (CCM), Role Decision Module (RDM), and Authorization Decision Module (ADM). The proposed FAS model is an extended Role-Based Access Control (RBAC) model which provides resource access capabilities based on roles assigned to the users. FAS can solve the problem of assigning multiple identities to a shared local name in grid-map file and mapping the remote entity's identity to a local name manually.

문화유산 아카이브 통합 서비스에 관한 연구 (A Study on the Integrated Services for Cultural Heritage Archives)

  • 박희진
    • 한국기록관리학회지
    • /
    • 제19권1호
    • /
    • pp.117-136
    • /
    • 2019
  • 본 연구의 목적은 문화유산 관련 기관에서 개별적으로 관리하고 있는 문화유산 정보자원을 보다 일반인에게 쉽게 접근하고 활용성을 높일 수 있는 문화유산 아카이브 통합 서비스 방안을 제시하는데 있다. 이를 위해 본 연구는 국내 문화유산을 관리, 보존하고 있는 문화재청 소속기관의 아카이브 현황을 분석하고 활용가치가 높은 문화유산 정보자원의 통합 서비스를 위해 다중개체 모형의 문화유산 메타데이터 모델을 제안하고 국내외 데이터 연계 모델 표준의 적용가능성을 검토하였다.

개별관리 대통령기록물의 연계관리를 위한 통합 메타데이터 설계 방안 연구 (A Study on Designing the Metadata for Integrated Management of Individually Managed Presidential Records)

  • 조현양;장보성
    • 한국문헌정보학회지
    • /
    • 제47권1호
    • /
    • pp.105-124
    • /
    • 2013
  • 국내 대통령기록물의 연구 및 활용, 서비스를 위해서는 다양한 대통령기록물의 유형과 포맷에 대한 통합 메타데이터 설계 및 운영이 필요하며, 상이한 메타데이터 구조를 가지고 있는 대통령기록관과 민간 대통령도서관 기념관의 메타데이터 표준화가 요구된다. 이에 이 연구에서는 국내 대통령기록물의 메타데이터 통합 운영을 위하여 통합 메타데이터 설계 원칙과 메타데이터 속성 및 관계를 제안하였다. 메타데이터 설계 원칙은 '대통령기록물 간의 관계 설정 및 설계', '다중 개체 모형을 적용한 대통령기록물 각 개체별 설계', '다양한 유형의 대통령기록물을 기술할 수 있도록 설계', '소장기관의 업무 전주기를 반영한 메타데이터 설계', '하이브리드형 장기보존 메타데이터 설계'이다. 메타데이터 요소는 모든 유형의 대통령기록물들이 공통적으로 지니고 있는 공통속성 요소, 특정 대통령기록물만이 갖는 고유속성 요소, 대통령기록물 생산에 관련된 타 기록물간의 연관 및 참조정보 요소이다.

UMA를 위한 유틸리티 기반 MPEG-21 비디오 적응 (Utility-Based MPEG-21 Video Adaptation for Universal Multimedia Access)

  • 김재곤;강경옥;김진웅;김형명
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1491-1494
    • /
    • 2003
  • Video adaptation in response to dynamic resource conditions and user preferences is required as a key technology to enable universal multimedia access (UMA) through heterogeneous networks by a multitude of devices in a seamless way. Although many adaptation techniques exist, selections of appropriate adaptations among multiple choices are often ad hoc. To provide a systematic solution, we present a general conceptual framework to model video entity, adaptation, resource, utility, and relations among them. It allows for formulation of various adaptation problems as resource-constrained utility maximization. We apply the framework to a practical case of dynamic bit rate adaptation. Furthermore, we present a description tool, which has been accepted as a part of the MPEG-21 Digital Item Adaptation (DIA), along with a brief overview of the .elated descriptors to support terminal and network quality of service (QoS).

  • PDF