• 제목/요약/키워드: 정보 모델

검색결과 23,503건 처리시간 0.053초

한국어 품사 및 동형이의어 태깅을 위한 마르코프 모델과 은닉 마르코프 모델의 비교 (Comparison between Markov Model and Hidden Markov Model for Korean Part-of-Speech and Homograph Tagging)

  • 신준철;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.152-155
    • /
    • 2013
  • 한국어 어절은 많은 동형이의어를 가지고 있기 때문에 주변 어절(또는 문맥)을 보지 않으면 중의성을 해결하기 어렵다. 이런 중의성을 해결하기 위해서 주변 어절 정보를 입력받아 통계적으로 의미를 선택하는 기계학습 알고리즘들이 많이 연구되었으며, 그 중에서 특히 은닉 마르코프 모델을 활용한 연구가 높은 성과를 거두었다. 일반적으로 마르코프 모델만을 기반으로 알고리즘을 구성할 경우 은닉 마르코프 모델 보다는 단순하기 때문에 빠르게 작동하지만 정확률이 낮다. 본 논문은 마르코프 모델을 기반으로 하면서, 부분적으로 은닉 마르코프 모델을 혼합한 알고리즘을 제안한다. 실험 결과 속도는 마르코프 모델과 유사하며, 정확률은 은닉 마르코프 모델에 근접한 것으로 나타났다.

  • PDF

개별 이동성 모델부터의 집단 이동성 모델 도출 (Modeling Group Mobility from Individual Mobility Model)

  • 김동엽;최동연;송하윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.376-379
    • /
    • 2014
  • 본 논문에서는 사람의 이동정보인 위치데이터를 바탕으로 위치분석(Location Analysis)을 통해 나타난 개개인의 이동성 모델을 바탕으로 각 개인의 이동성 모델에서 나타난 군집들의 관계를 분석해 개인이 속한 집단의 이동성 모델을 만든다. 집단 이동성 모델은 개인의 모델에서 나타난 군집을 이용하는데, 각 군집을 만드는데 필요한 위치 정보들과 군집의 중심, 군집간의 거리의 값을 계산하여 새로운 통합 군집을 만든다. 새로 만드는 군집은 각 특징에 따라 Micro Cluster, Macro Cluster의 2가지로 분류하였다. 실제 수년간 수집한 2명의 통합 개인 이동성 모델을 바탕으로 집단 이동성 모델을 생성한다. 집단 이동성 모델 생성에는 R Language를 사용하였고 결과 모델을 지도상에 표시할 수 있다.

제품라인모델로부터 제품모델을 추출하는 기법 및 도구의 일반화 (Generalization of methods and tools for extracting product models from product line models)

  • 이지원;이관우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1555-1558
    • /
    • 2012
  • 제품 라인 공학의 핵심은 여러 제품 개발에 쉽게 재사용 될 수 있는 핵심 자산의 개발과 산출된 핵심자산을 이용하여 원하는 제품을 생산함에 있다. 그렇기 때문에 제품 라인 공학에서 원하는 제품 모델을 적기에 생산해내도록 도와주기 위하여, 제품 라인 모델의 자산으로부터 제품 모델을 추출해주는 도구를 필요로하게 된다. 사용자가 필요로하는 제품 라인 산출물의 추출을 도와주기 위해서는 제품 라인 모델로 산출될 수 있는 모든 모델을 고려할 필요가 있다. 하지만 모든 제품 라인 모델로부터 제품 모델을 추출하는 모듈을 개별적으로 구현하는 것은 비생산적이다. 따라서 본 연구에서는 사용자 맞춤형 제품 모델 추출 도구의 구현을 위해, 오픈 소스인 StarUML을 이용하여 제품 모델 추출 기법의 일반화를 제안한다.

임상 문서에서 서로 떨어진 개체명 간 전이 관계 표현을 위한 조건부무작위장 내 라벨 유도 기법 연구 (A label induction method in the conditional random fields expressing long distance transition between separate entities in clinical narratives)

  • 이왕진;최진욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.172-175
    • /
    • 2018
  • 환자의 병력을 서술하는 임상문서에서 임상 개체명들은 그들 사이에 개체명이 아닌 단어들이 위치하기 때문에 거리상으로 서로 떨어져 있고, 임상 개체명인식에 많이 사용되는 조건부무작위장(conditional random fields; CRF) 모델은 Markov 속성을 따르기 때문에 서로 떨어져 있는 개체명 라벨 간의 전이 정보는 모델의 계산에서 무시된다. 본 논문에서는 라벨링 모델에 서로 떨어진 개체명 간 전이 관계를 표현하기 위하여 CRF 모델의 구조를 변경하는 방법론을 소개한다. 제안된 CRF 모델 디자인에서는 모델의 계산효율성을 빠르게 유지하기 위하여 Markov 속성을 유지하는 1차 모델 구조를 유지한다. 모델은 선행하는 개체명의 라벨 정보를 후행하는 개체명 엔터티에게 전달하기 위하여 선행 개체명의 라벨을 뒤 따르는 비개체명 라벨에 전이시키고 이를 통해 후행하는 개체명은 선행하는 개체명의 라벨 정보를 알 수 있게 된다. 라벨의 고차 전이 정보를 전달함에도 모델의 구조는 1차 전이 구조를 유지함으로 n차 구조의 모델보다 빠른 계산 속도를 유지할 수 있게 된다. 모델의 성능 평가를 위하여 서울대학교병원 류머티즘내과에서 퇴원한 환자들의 퇴원요약지에 병력과 관련된 엔터티가 태깅된 평가 데이터와 i2b2 2012/VA 임상자연어처리 shared task의 임상 개체명 추출 데이터를 사용하였고 기본 CRF 모델들(1차, 2차)과 비교하였다. 피처 조합에 따라 모델들을 평가한 결과 제안한 모델이 거의 모든 경우에서 기본 모델들에 비하여 F1-score의 성능을 향상시킴을 관찰할 수 있었다.

  • PDF

확장된 이차오차 척도를 이용한 개선된 메쉬 간략화 (Enhanced Mesh Simplification using Extended Quadric Error Metric)

  • 한태화;전준철
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.365-372
    • /
    • 2004
  • 최근 복잡한 3차원 모델의 활용 범위가 확대됨에 따라 메쉬 모델의 간략화에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 기존의 모델 간략화 과정에서 널리 사용되는 모델의 정점에 대한 위치 정보에 근거한 기하 정보 기반의 간략화 방법에 모델의 속성 정보를 동시에 이용한 새로운 간략화 방법을 제시한다. 대부분의 3차원 메쉬 모델의 정보에는 기하 정보뿐만 아니라 모델의 색상, 질감, 그리고 곡률 등과 같은 속성 정보가 포함되며, 기존의 간략화 방법은 통상적으로 기하학적 정보나 속성 정보를 개별적으로 적용하여 메쉬를 간략화 한다. 본 논문에서 제시된 간략화 방법은 모델의 기하학 정보와 속성 정보를 동시에 적용하여 메쉬 간략화를 수행하였다. 특히 본 논문에서는 메쉬의 간략화에 상대적으로 수행 시간과 충실도에 장점을 지닌 이차 오차 척도(quadric error metric)를 확장하여 일반적인 기하학적 정보에 속성 정보를 추가하였다. 따라서, 제안된 메쉬 간략화 방법은 기하 정보기반으로 간략화를 수행하는 이차 오차 척도에 속성 정보가 추가된 간단한 이차식으로 확장하여 표현할 수 있다. 이는 기하 정보만을 이용하였을 때의 이차식의 공간 차수를 m=0으로 두었을 때 추가된 속성 정보의 특성에 따라 차수를 확장 함(m>0)으로서 계산이 가능하다. 실험 결과, 제안된 방법에 의한 모델의 간략화 결과를 원 모델과 비교 시 기하 정보만을 이용한 기존의 간략화 방법의 수행 결과에 비하여 모델의 전체적인 외형 등 특성 정보의 충실도가 높다는 것을 입증할 수 있었다.

TTA 교통모델 기반의 GML 응용 시스템 실험 구축

  • 김학훈;이기원
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 GIS/RS 공동 춘계학술대회
    • /
    • pp.101-104
    • /
    • 2005
  • TTA(Telecommunications Technology Association: 한국정보통신기술협회)에서는 2004년 말에 우리나라 교통 분야 지리정보 데이터 표준 모델을 발표한 바 있다. 이 TTA 모델은 지리정보의 수요증대와 더불어 적절한 교통 분야 지리정보 데이터의 공유, 교환 및 활용을 도모하기 위하여 구축뿐만 아니라 응용측면을 고려한 데이터 모델이므로 본 연구에서는 TTA 교통데이터 모델을 기반으로 국제적 지리정보 엔코딩 표준방식인 Geography Markup Language (GML) 처리가 가능한 시험적인 응용 시스템을 구축하여 웹 기반에서의 TTA 교통모델의 실무적 적합성을 검토해 보고자 한다. 본 연구 결과로 응용 도메인에서의 OGC 국제 표준인 GML의 적합성을 검증해 볼 수 있었고, 이러한 결과는 인터넷을 통한 응용 분야에서 별도로 구축된 지리정보의 공유 및 교환이 손쉽게 이루어지기 때문에 각각의 주요 응용 분야에서의 GIS 데이터의 공유를 위한 기반 구조가 될 것으로 생각한다.

  • PDF

OGC-GML 기반 표준 교통 데이터 모델의 영상정보 연계 활용 시스템 설계 및 구현 (Design and Implementation of Application System with TTA-standard Transportation Data Model linked Imagery Data Sets)

  • 김학훈;이기원
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.45-48
    • /
    • 2006
  • 지리정보 분야에서 다양한 지리정보를 공유 및 교환, 전송하기 위해서는 데이터 스트리밍 관점에서의 일관성과 무결성을 유지 할 수 있는 지리정보 모델이 필요하다. OpenGIS Consortium, Inc.(OGC)에서 제안한 국내외 지리정보 엔코딩 표준 방식인 Geography Markup Language(GML)은 상호운영을 전제로 이러한 목적에 부합되는 모델이다. 본 연구에서는 한국정보통신기술협회(TTA)에서 공표한 우리나라 표준 교통데이터 모델인 TTA 교통모델을 기반으로 하여 이 데이터 모델을 수용하는 GML 응용 시스템을 설계 및 구현하였다. 또한 OGC 그리드 커버리지의 관점에서 영상 정보의 활용이 증가함에 따라 영상 정보의 엔코딩 과정을 부가하여 시스템의 확장 가능성을 검토하고자 하였다.

  • PDF

KorBERT와 Popularity 정보에 기반한 한국어 개체연결 (Korean Entity Linking based on KorBERT and Popularity )

  • 허정;배경만;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.502-506
    • /
    • 2022
  • 본 논문에서는 KorBERT와 개체 인기정보(popularity)를 이용한 개체연결 기술을 소개한다. 멘션인식(mention detection)은 KorBERT를 이용한 토큰분류 문제로 학습하여 모델을 구성하였고, 개체 모호성해소(entity disambiguation)는 멘션 컨텍스트와 개체후보 컨텍스트 간의 의미적 연관성에 대한 KorBERT기반 이진분류 문제로 학습하여 모델을 구성하였다. 개체 인기정보는 위키피디아의 hyperlink, inlink, length 정보를 활용하였다. 멘션인식은 ETRI 개체명 인식기를 이용한 모델과 비교하였을 경우, ETRI 평가데이터에서는 F1 0.0312, 국립국어원 평가데이터에서는 F1 0.1106의 성능 개선이 있었다. 개체 모호성해소는 KorBERT 모델과 Popularity 모델을 혼용한 모델(hybrid)에서 가장 우수한 성능을 보였다. ETRI 평가데이터에서는 Hybrid 모델에서의 개체 모호성 해소의 성능이 Acc. 0.8911 이고, 국립국어원 평가데이터에서는 Acc. 0.793 이였다. 최종적으로 멘션인식 모델과 개체 모호성해소 모델을 통합한 개체연결 성능은 ETRI 평가데이터에서는 F1 0.7617 이고, 국립국어원 평가데이터에서는 F1 0.6784 였다.

  • PDF

토목 프로젝트 통합 관리 시스템 구축을 위한 정보 모델 설계 (Design of Information Model for an Integrated Management System of Civil Projects)

  • 정선화;강형석;노상도;이창우;이광명
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2010년도 정기 학술대회
    • /
    • pp.365-368
    • /
    • 2010
  • 건설 프로젝트 단계별로 생산되는 다양하고 방대한 정보에 대한 효율적인 관리와 정보의 상호 교환 및 공유는 건설 산업의 생산성을 좌우하는 중요한 요소이다. 최근 건설 정보 통합에 대한 관심이 높아짐에 따라, 기획, 설계, 시공, 유지보수 등의 프로세스 및 엔지니어링 어플리케이션 간의 정보 통합에 대한 연구가 수행되고 있다. 하지만 BIM(Building Information Model)과 같은 정보 모델을 활용하여 정보를 통합 관리하는 것에 대한 연구는 상대적으로 건축 분야에 집중적으로 이루어지고 있다. 따라서 토목 분야에서 프로젝트 정보의 통합적인 관리와 업무 프로세스 별 엔지니어링 어플리케이션 간의 교환 및 공유를 위한 통합관리 시스템이 필요하다. 본 연구에서는 토목 프로젝트 통합 관리 시스템 구축을 위하여 토목 프로젝트 정보를 담을 수 있는 정보 모델을 설계하고, 토목 구조물 가운데 교량을 대상으로 하는 토목 프로젝트를 정보 모델에 적용해 보았다.

  • PDF

의미 정보와 BERT를 결합한 개념 언어 모델 (A Concept Language Model combining Word Sense Information and BERT)

  • 이주상;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-7
    • /
    • 2019
  • 자연어 표상은 자연어가 가진 정보를 컴퓨터에게 전달하기 위해 표현하는 방법이다. 현재 자연어 표상은 학습을 통해 고정된 벡터로 표현하는 것이 아닌 문맥적 정보에 의해 벡터가 변화한다. 그 중 BERT의 경우 Transformer 모델의 encoder를 사용하여 자연어를 표상하는 기술이다. 하지만 BERT의 경우 학습시간이 많이 걸리며, 대용량의 데이터를 필요로 한다. 본 논문에서는 빠른 자연어 표상 학습을 위해 의미 정보와 BERT를 결합한 개념 언어 모델을 제안한다. 의미 정보로 단어의 품사 정보와, 명사의 의미 계층 정보를 추상적으로 표현했다. 실험을 위해 ETRI에서 공개한 한국어 BERT 모델을 비교 대상으로 하며, 개체명 인식을 학습하여 비교했다. 두 모델의 개체명 인식 결과가 비슷하게 나타났다. 의미 정보가 자연어 표상을 하는데 중요한 정보가 될 수 있음을 확인했다.

  • PDF