• 제목/요약/키워드: 데이터기반 모델

검색결과 6,209건 처리시간 0.031초

3차원 공간질의를 위한 효율적인 위상학적 데이터 모델의 검증 (Validation of Efficient Topological Data Model for 3D Spatial Queries)

  • 이석호;이지영
    • Spatial Information Research
    • /
    • 제19권1호
    • /
    • pp.93-105
    • /
    • 2011
  • 최근 들어 건축과 IT 기술이 발전함에 따라서 대규모의 복잡한 3차윈 공간이 증가하고 있고, 사람들 또한 이러한 공간에서 생활하는 시간이 늘어나고 있는 추세이다. 이에 따라 복잡한 3차원 공간 내에서 유사시를 대비한 또는 편의 정보를 제공하기 위한 서비스가 필요하게 되었고, 이러한 서비스를 제공하기 위해서는 복잡한 공간에서의 효율적인 위상학적 관계성 파악이 기본적으로 뒷받침이 되어야 한다. 공간의 관계성 파악은 위상학적 관계를 저장하고 표현하는 각각의 데이터 모델에 따라 그 방법과 효율성이 달라진다. 위상학적 관계성 저장과 표현에 있어서 가장 널리 사용되어 왔던 데이터 모델은 B-rep 기반의 데이터 모델이고, 2000년대 초반에 들어서는 네트워크 기반 위상학적 데이터 모델에 관한 연구가 많이 진행되었다. 본 연구에서는 데이터 저장 용량 및 공간질의에 대하여 두 데이터 모델의 효율성을 검증한다. 효율성은 데이터의 저장용량, 인접성 및 연결성 질의 응답속도를 기준으로 하여 수행한다. 효율성 검증의 결과로써 네트워크 기반 위상학적 데이터 모델이 3차원 공간질의에 있어서 B-rep 기반 데이터 모델 보다 효율성이 높음을 제시한다.

SVM을 이용한 3차원 해마의 지능적 형상 분석 (Intelligent Shape Analysis of the 3D Hippocampus Using Support Vector Machines)

  • 김정식;김용국;최수미
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1387-1392
    • /
    • 2006
  • 본 논문에서는 SVM (Support Vector Machine)을 기반으로 하여 인체의 뇌 하부구조인 해마에 대한 지능적 형상분석 방법을 제공한다. 일반적으로 의료 영상으로부터 해마의 형상 분석을 하기 위해서는 충분한 임상 데이터를 필요로 한다. 하지만 현실적으로 많은 양의 표본들을 얻는 것이 쉽지 않기 때문에 전문가의 지식을 기반으로 한 작업이 수반되어야 한다. 결국 이러한 요소들이 분석 작업을 어렵게 한다. 의학 기술이 복잡해 지면서 최근의 형상 분석 연구는 점차 통계적 모델을 기반으로 진행되고 있다. 본 연구에서는 해마로부터 고해상도의 매개변수형 모델을 만들어 형상 표현으로 이용하고, 집단간 분류 작업에 SVM 알고리즘을 적용하는 지능적 분석 방법을 구현한다. 우선 메쉬 데이터로부터 물리변형모델 기반의 매개변수 모델을 구축하고, PDM (point distribution model) 방법을 적용하여 두 집단을 대표하는 평균 모델을 생성한다. 마지막으로 SVM 기반의 이진 분류기를 구축하여 집단간 분류 작업을 수행한다. 구현한 모델링 방법과 분류기의 성능을 평가하기 위하여 본 연구에서는 네 가지 커널 함수 (linear, radial basis function, polynomial, sigmoid)들을 적용한다. 본 논문에서 제시한 매개변수형 모델은 다양한 형태의 의료 데이터로부터 보편적인 3차원 모델을 생성하고, 또한 모델의 전역적, 국부적인 특징들을 복합적으로 표현할 수 있기 때문에 통계적 형상분석에 적합하다. 그리고 SVM 기반의 분류기는 적은 수의 학습 데이터로부터 정상인 해마 집단과 간질 환자 집단간의 정확한 분류를 가능하게 한다.

  • PDF

구조화 된 데이터 기반의 웹 온톨로지 학습 및 확장 모델 설계 (A Design of Web Ontology Learning and Population Model based on Structured Data)

  • 정혜진;정동원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.329-332
    • /
    • 2009
  • 이 논문에서는 보다 풍부하고 정확한 정보를 제공하기 위한 구조화 된 데이터를 이용한 웹 온톨로지 확장(Population) 모델을 제안한다. 시맨틱 웹이 등장하면서 웹 온톨로지의 구축이 필수 요소가 되었으며, 더욱 정확하고 보다 풍부한 정보를 제공하기 위한 웹 온톨로지 생성 모텔에 관한 연구의 필요성이 증가하였다. 이러한 요구 사항을 충족시키기 위해서는 첫 번째로, 일관성 있고 보편적인 개념을 이용한 웹 온톨로지 스키마 생성과 이를 기반으로 한 온톨로지 간 상호운용성 향상이 요구된다. 두 번째로, 보다 풍부한 정보 제공을 위해 정의된 온톨로지를 확장할 수 있는 방법 개발이 요구된다. 이 논문에서는 메타데이터 레지스트리 (MDR, Metadata Registry)를 이용하여 생성된 구조화 된 데이터 기반의 온톨로지 학습 및 확장 모델을 제안한다. 된 데이터에 대한 개념과 이를 기반으로 한 학습 및 확장의 특징 등에 대하여 기술하고 제안 모델을 위한 시스템 구조에 대하여 기술한다.

  • PDF

GIS 기반의 3차원 시각화 모델의 설계 (A Design of 3D Visualization Model based on GIS)

  • 한정규;황수찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.27-29
    • /
    • 1999
  • 가상현실 시스템에 대한 연구들은 대부분 현실세계 데이터를 컴퓨팅 세계의 데이터로 변환하기 위한 효율적인 방법론에 대한 연구가 주를 이루고 있다. 지리정보시스템(GIS)의 경우 정확한 실사를 통한 지리정보의 확보와 그래픽 시각화를 통한 신뢰성 있는 데이터의 제공을 주요 목적으로 삼는다. 본 논문은 지리정보시스템의 데이터모델을 기반으로 3차원 시각화를 위한 지형 데이터 모델과 가상 이미징 객체모델을 소개한다.

  • PDF

문서 구조 정의 언어를 이용한 XML 문서 변환 시스템의 설계 및 구현 (Design and Implementation of XML Translator Using XMeta Language)

  • 조영환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.823-826
    • /
    • 2003
  • 최근 들어 인터넷 기반의 B2B 전자상거래가 확산되고 데이터 교환을 위한 전자문서 형식으로 XML의 효용성에 대한 인식이 높아지면서, 전통적인 방식의 B2B 전자거래 모델인 EDI의 한계를 극복한 XML/EDI, ebXML통의 전자상거래 모델이 등장하게 되었다. 또한 이러한 XML기반 전자상거래 모델에서는 XML 전자문서를 활용한 데이터 교환을 기반으로 하고 있다 하지만 아직까지 각 기업에서 관리되고 있는 전자상거래 데이터의 대부분이 비 XML 데이터 형식으로 이루어져 있어 XML 전자문서를 활용하는데 현실적으로 어려움이 있다. 따라서 이러한 문제를 해결하기 위해서 본 논문에서는 기존의 전자상거래 데이터를 XML기반 전자상거래 시스템에서 활용하기 위해서 비 XML데이터의 구조를 기술하는 XMeta 언어를 정의하여, 이를 기반으로 다양한 데이터 포맷을 원활히 지원할 수 있는 XML 문서변환기를 설계 및 구현하였다.

  • PDF

DECO-LGG 반자동 증강 학습데이터 활용 멀티태스크 트랜스포머 모델 기반 핀테크 CS 챗봇 NLU 시스템 (Multitask Transformer Model-based Fintech Customer Service Chatbot NLU System with DECO-LGG SSP-based Data)

  • 유광훈;황창회;윤정우;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.461-466
    • /
    • 2021
  • 본 연구에서는 DECO(Dictionnaire Electronique du COreen) 한국어 전자사전과 LGG(Local-Grammar Graph)에 기반한 반자동 언어데이터 증강(Semi-automatic Symbolic Propagation: SSP) 방식에 입각하여, 핀테크 분야의 CS(Customer Service) 챗봇 NLU(Natural Language Understanding)을 위한 주석 학습 데이터를 효과적으로 생성하고, 이를 기반으로 RASA 오픈 소스에서 제공하는 DIET(Dual Intent and Entity Transformer) 아키텍처를 활용하여 핀테크 CS 챗봇 NLU 시스템을 구현하였다. 실 데이터을 통해 확인된 핀테크 분야의 32가지의 토픽 유형 및 38가지의 핵심 이벤트와 10가지 담화소 구성에 따라, DECO-LGG 데이터 생성 모듈은 질의 및 불만 화행에 대한 양질의 주석 학습 데이터를 효과적으로 생성하며, 이를 의도 분류 및 Slot-filling을 위한 개체명 인식을 종합적으로 처리하는 End to End 방식의 멀티태스크 트랜스포머 모델 DIET로 학습함으로써 DIET-only F1-score 0.931(Intent)/0.865(Slot/Entity), DIET+KoBERT F1-score 0.951(Intent)/0.901(Slot/Entity)의 성능을 확인하였으며, DECO-LGG 기반의 SSP 생성 데이터의 학습 데이터로서의 효과성과 함께 KoBERT에 기반한 DIET 모델 성능의 우수성을 입증하였다.

  • PDF

과거 상담대화를 활용한 개인화 대화생성을 위한 프롬프트 기반 데이터 증강 (Prompt-based Data Augmentation for Generating Personalized Conversation Using Past Counseling Dialogues)

  • 임채균;이혜우;오경진;성주원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-213
    • /
    • 2023
  • 최근 자연어 이해 분야에서 대규모 언어모델 기반으로 프롬프트를 활용하여 모델과 상호작용하는 방법이 널리 연구되고 있으며, 특히 상담 분야에서 언어모델을 활용한다면 내담자와의 자연스러운 대화를 주도할 수 있는 대화생성 모델로 확장이 가능하다. 내담자의 상황에 따라 개인화된 상담대화를 진행하는 모델을 학습시키려면 동일한 내담자에 대한 과거 및 차기 상담대화가 필요하지만, 기존의 데이터셋은 대체로 단일 대화세션으로 구축되어 있다. 본 논문에서는 언어모델을 활용하여 단일 대화세션으로 구축된 기존 상담대화 데이터셋을 확장하여 연속된 대화세션 구성의 학습데이터를 확보할 수 있는 프롬프트 기반 데이터 증강 기법을 제안한다. 제안 기법은 기존 대화내용을 반영한 요약질문 생성단계와 대화맥락을 유지한 차기 상담대화 생성 단계로 구성되며, 프롬프트 엔지니어링을 통해 상담 분야의 데이터셋을 확장하고 사용자 평가를 통해 제안 기법의 데이터 증강이 품질에 미치는 영향을 확인한다.

  • PDF

유전자 발현량 데이터 증대를 위한 Conditional VAE 기반 생성 모델 (Conditional Variational Autoencoder-based Generative Model for Gene Expression Data Augmentation)

  • 봉현수;오민식
    • 방송공학회논문지
    • /
    • 제28권3호
    • /
    • pp.275-284
    • /
    • 2023
  • 유전자 발현 데이터는 질병의 예후 예측, 약물 반응성 예측 등 질병에 대한 이해와 정밀 의료 실현을 위한 연구들에 활용될 수 있지만 충분한 양의 데이터를 수집하는 데 많은 비용적 문제가 있다. 본 논문에서는 Conditional VAE에 기반한 유전자 발현 데이터 생성 모델을 제안하였다. 이전 연구인 WGAN-GP기반의 유전자 발현 생성 모델과 정형 데이터 생성 모델인 CTGAN, TVAE와 비교하여 본 논문의 Conditional VAE기반 모델이 생물학적, 통계학적으로 더 유의미한 합성 데이터를 생성할 수 있음을 보였다.

교량 모니터링 빅데이터를 이용한 광안대교의 교통량 의존 변위 추정 모델 (Traffic Volume Dependent Displacement Estimation Model for Gwangan Bridge Using Monitoring Big Data)

  • 박지현;신성우;김수용
    • 대한토목학회논문집
    • /
    • 제38권2호
    • /
    • pp.183-191
    • /
    • 2018
  • 본 연구에서는 차종별 교통량 데이터와 연직 변위 데이터의 상관관계를 바탕으로 광안대교의 차종별 교통량 데이터를 이용한 연직 변위 추정 모델을 개발하였다. 추정 모델의 개발 과정에서 구조화 회귀 분석에 기반한 모델링 방법과 주성분 분석법에 기반한 모델링 방법이 적용되었으며, 각각의 방법으로 개발된 모델의 변위 추정 성능을 비교 분석하였다. 개발된 모델을 이용하여 추정된 변위는 실측 변위와 유사한 것으로 분석되었으며, 이로부터 차종별 교통량 데이터를 광안대교의 교통량 의존 변위 추정에 적용 가능한 것을 알 수 있었다. 또한, 구조화 회귀 분석에 기반한 모델과 주성분 분석에 기반한 모델의 변위 추정 성능은 상호간에 큰 차이가 없다는 것을 알 수 있었다. 결론적으로 본 연구에서 개발한 차종별 교통량 데이터를 이용한 연직 변위 추정 모델은, 광안대교의 교통하중에 따른 거동 분석 등에 유효하게 활용될 수 있을 것으로 사료된다.

주요 국가별 표준 도서관 RFID 데이터 모델의 비교 및 분석 (Comparison and Analysis of Library RFID Data Model for Major National Standards)

  • 최재황
    • 한국도서관정보학회지
    • /
    • 제40권2호
    • /
    • pp.87-110
    • /
    • 2009
  • 본 연구의 목적은 이미 국가적으로 도서관 RFID 데이터 모델을 발표한 덴마크, 핀란드, 네덜란드, 프랑스, 미국, 호주, 우리나라의 도서관 RFID 데이터 모델을 분석하고, 비교하는 것이다. 유럽의 4개국 즉, 덴마크, 네덜란드, 핀란드, 프랑스와 우리나라는 고정길이 부호화 방식인 규정 데이터 모델을 채택하고 있고, 미국과 호주는 ISO 15962에 기반 하는 부호화 방식인 객체기반 데이터 모델을 따르고 있다. 본 연구는 앞으로 우리나라 도서관계에서 RFID 데이터 모델을 재정립할 때 토론의 중요한 발판이 될 것으로 기대한다.

  • PDF