• 제목/요약/키워드: 산업도메인

검색결과 125건 처리시간 0.031초

베이지안 망을 이용한 온톨로지의 구축에 관한 연구

  • 장성원;이건창
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2008년도 춘계학술대회
    • /
    • pp.288-293
    • /
    • 2008
  • 의미적 지식기반인 온톨로지(ontology)에 대한 관심이 높아지고 있다. 온톨로지란 어휘나 개념의 정의 또는 명세로서, 인간과 컴퓨터의 의사소통 또는 지식의 표현과 저장, 활용 및 재사용을 위해 이용된다. 그러나 온톨로지를 구축하는 대부분의 방법은 체계적이거나 자동적이지 못하다. 도메인 전문가에 의존하는 전통적인 온톨로지 구축 방법은 시간과 비용이 많이 소요된다. 온톨로지 구축 툴은 많이 있지만 아직 인간의 노력을 필요로 한다. 또한 변화하는 도메인 지식을 온톨로지에 신속하게 반영하는 것은 어려운 일이다. 본 연구는 이러한 한계를 해결하기 위해, 도메인 전문가의 지식이나 경험을 최소화하면서 자동적으로 도메인 지식을 얻을 수 있는 방법을 제시하였다. 이 방법은, 데이터 기반의 도메인 지식을 대상으로, 베이지안 망(Bayesian network)이 갖고 있는 데이터 분석에서의 장점과 온톨로지와의 관련성을 이용하여 온톨로지를 자동적으로 구축하는 것이다. 평판(flat panel) TV 경기예측 사례를 통하여 온톨로지를 구축하는 과정을 알아보았다. 구축과정의 타당성을 확보하기 위하여 디스플레이 산업 전문가들과의 인터뷰를 통하여 온톨로지를 완성하고, 해당 온톨로지의 타당성 검증을 위하여 멤버체크를 한 결과 매우 높은 타당성을 얻을 수 있었다. 본 연구에서 제안하는 온톨로지는, 실제로 산업경기 예측을 계획하고 구축하며 미래 의사결정지원시스템을 설계하기 위한 주요 구성요인으로 제공될 수 있을 것이다.

  • PDF

금융권에 적용 가능한 금융특화언어모델 구축방안에 관한 연구 (A Study on the Construction of Financial-Specific Language Model Applicable to the Financial Institutions)

  • 배재권
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.79-87
    • /
    • 2024
  • 최근 텍스트분류, 감성분석, 질의응답 등의 자연어 처리를 위해서 사전학습언어모델(Pre-trained Language Model, PLM)의 중요성은 날로 강조되고 있다. 한국어 PLM은 범용적인 도메인의 자연어 처리에서 높은 성능을 보이나 금융, 제조, 법률, 의료 등의 특화된 도메인에서는 성능이 미약하다. 본 연구는 금융도메인 뿐만 아니라 범용도메인에서도 우수한 성능을 보이는 금융특화 언어모델의 구축을 위해 언어모델의 학습과정과 미세조정 방법을 제안하는 것이 주요 목표이다. 금융도메인 특화언어모델을 구축하는 과정은 (1) 금융데이터 수집 및 전처리, (2) PLM 또는 파운데이션 모델 등 모델 아키텍처 선정, (3) 도메인 데이터 학습과 인스트럭션 튜닝, (4) 모델 검증 및 평가, (5) 모델 배포 및 활용 등으로 구성된다. 이를 통해 금융도메인의 특성을 살린 사전학습 데이터 구축방안과 효율적인 LLM 훈련방법인 적응학습과 인스트럭션 튜닝기법을 제안하였다.

제한된 도메인에 특화된 기계번역 기술 개발 - 특허 전문 영한 번역기를 중심으로 - (Development of Machine Translation Technology Customized at Restricted Domain - Focusing on English-Korean Patent Translator -)

  • 최승권;박은진;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.687-689
    • /
    • 2007
  • 본 논문은 2005 년부터 2006 년도까지 정보통신부의 지원 하에 한국전자통신연구원 언어처리연구팀에서 성공적으로 개발하여 현재 산업자원부 특허지원센터에서 대용량의 영어 특허문서를 대상으로 한국어 자동번역 서비스를 제공하고 있는 특허 전문 영한 번역기에 대해 기술한다. 특히 본 논문에서는 일반 도메인을 대상으로 한 기존의 영한 번역기를 제한된 도메인을 대상으로 한 영한번역기로 개량하고자 할 때, 개량하는 방법으로써 제한된 도메인에 대한 특화 절차에 대해서 기술한다. 이와 같이 특화 절차에 따라 구축된 특허 전문 영한 번역기 번역률을 특허 분야 중에 주요 5개 분야(기계, 전기전자, 화학일반, 의료위생, 컴퓨터)에 대해 특허전문번역가가 평가한 결과, 평균 82.43%가 나왔다. 또한 전기전자 분야 특허문서를 대상으로 특허 전문 영한 번역기와 일반 도메인을 대상으로 한 영한 번역기와의 번역률을 평가한 결과, 특허 전문 영한 번역기는 82.20%, 일반 도메인 대상 영한 번역기는 54.25%의 번역률을 내어, 특허에 특화된 특허 전문 영한 번역기가 특화되지 않은 일반 도메인의 영한 번역기에 비해 27.95%나 더 높은 결과를 알 수 있었다.

정보보호 전문 인력 양성을 위한 교육과정 모델에 관한 연구 (A study on a curriculum for information protection specialty manpower training)

  • 이문구
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권8호
    • /
    • pp.811-818
    • /
    • 2004
  • 인터넷의 보급과, 산업 및 생활 전반에 걸쳐 전산화가 이루어지면서 사생활 보호 및 정보보호에 대한 요구가 증가하고 있지만 정보보호 산업분야의 전문 인력의 부족으로 많은 어려움이 있다. 때문에 본 논문에서는 정보보호 전문 인력 양성을 위한 교육과정을 제안하였다. 제안하는 교육과정은 필수 1,2 와 선택 1,2로 분류하였다. 정보보호 응용분야를 9개의 도메인으로 세분화 하여 시행되어야 할 교육과정을 링 구조로 제시하였다. 정보보호 응용분야의 9개 도메인에 따른 현장 실무 프로젝트와 연계된 교육 과정과 졸업 후 전공심화를 위한 강좌가 도메인별로 이루어져서 정보보호 심화과정을 지속적으로 진행한다.

  • PDF

FiD를 이용한 멀티 모달 오픈 도메인 질의 응답 (Fusion-in-Decoder for Open Domain Multi-Modal Question Answering)

  • 박은환;이성민;서대룡;전동현;강인호;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.95-99
    • /
    • 2022
  • 오픈 도메인 질의 응답 (ODQA, Open-Domain Question Answering)은 주어진 질문에 대한 답을 찾는 과업으로서 질문과 관련있는 지식을 찾는 "검색" 단계를 필요로 한다. 최근 이미지, 테이블 등의 검색을 요구하는 멀티 모달 ODQA에 대한 연구가 많이 진행되었을 뿐만 아니라 산업에서의 중요도 또한 높아지고 있다. 본 논문은 여러 종류의 멀티 모달 ODQA 중에서도 테이블 - 텍스트 기반 멀티 모달 ODQA 데이터 집합으로 Fusion-in-Decoder (FiD)를 이용한 멀티 모달 오픈 도메인 질의 응답 연구를 제안하며 베이스라인 대비 최대 EM 20.5, F1 23.2 향상을 보였다.

  • PDF

머신러닝을 이용한 빅데이터 도메인 자동 판별에 관한 연구 (A Study of Big Data Domain Automatic Classification Using Machine Learning)

  • 공성원;황덕열
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.11-18
    • /
    • 2018
  • 본 연구는 빅데이터 품질 진단의 핵심 요소인 도메인 기반 품질 진단을 위한 도메인 자동 판별에 관한 연구다. 빅데이터의 가치와 활용도의 증가와 4차 산업혁명의 대두로, 법률, 의료, 금융 등 IT와 융합된 다양한 분야에서 빅데이터를 활용하여 새로운 가치를 창출하려는 노력을 진행중이다. 하지만, 신뢰도가 낮은 데이터에 기반한 분석은 과정과 결과 모두에서 치명적인 문제를 발생하며, 분석 결과에 따른 판단 또한 신뢰하기 어려워 진다. 이처럼 신뢰도가 높은 데이터의 필요성 또한 증가하였지만, 데이터의 품질 확보에 대한 연구와 그에 대한 결과는 미비하다. 본 연구는 데이터 품질 향상을 위한 진단 평가의 핵심적 요소인 도메인 기반 품질 진단에서, 수작업으로 진행되었던 도메인 판별 작업을 머신러닝을 이용하여 자동화 함으로써, 작업시간을 단축하는 것을 목표로 한다. 데이터 베이스에 저장된, 도메인이 판별되어 있는 데이터의 특성에 관한 정보들을 추출하여 변수화하고, 이를 머신러닝을 이용하여 도메인 판별을 자동화 한다. 이를 빅데이터 품질 진단에 활용하고, 품질 향상에 기여하도록 한다.

사용자 제어 기반 다중 도메인 접근 제어에 대한 연구 (Research on User-Centric Inter-Organizational Collaboration (UCICOIn) framework)

  • 홍성혁
    • 산업융합연구
    • /
    • 제21권12호
    • /
    • pp.37-43
    • /
    • 2023
  • 현대의 비즈니스 환경에서는 협업과 상호 운용성이 조직의 성공과 수익성에 있어 중요하다. 그러나 다양한 조직 간의 작업 통합은 Identity and Access Management (IAM)의 역할과 정책의 차이로 인해 많은 커스터마이징이 필요하다. 사용자 중심의 신원 (UCI)은 사용자를 중심으로 한 분산 액세스 솔루션을 제공하여 이러한 문제를 해결할 수 있다. 이 연구는 다양한 조직 간의 IAM 역할 및 프로토콜의 충돌 속에서 자원 액세스를 간소화하는 UCI의 능력을 깊게 조사한다. 이 연구는 UCI 기반의 다중 도메인 액세스 제어 (MDAC) 프레임워크를 제시하며, 이는 온톨로지, 도메인 간의 액세스 역할 및 정책을 표현하기 위한 통합된 방법, 그리고 UCI 인프라와 통합되는 소프트웨어 서비스를 포함한다. 목표는 다양한 도메인에서의 액세스 역할 및 정책 관리에 대한 명확한 지침을 제공함으로써 조직의 자원 관리와 의사 결정을 강화하고, 궁극적으로 기업의 투자 수익률을 향상시키는 것이다.

제한된 라벨 데이터 상에서 다중-태스크 반 지도학습을 사용한 동작 인지 모델의 성능 향상 (Improving Human Activity Recognition Model with Limited Labeled Data using Multitask Semi-Supervised Learning)

  • ;;이석룡
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.137-147
    • /
    • 2018
  • 기계 학습을 통한 인간 동작 인지 (human activity recognition) 시스템에서 중요한 요소는 충분한 양의 라벨 데이터 (labeled data)를 확보하는 것이다. 그러나 라벨 데이터를 확보하는 일은 많은 비용과 시간을 필요로 한다. 매우 적은 수의 라벨 데이터를 가지고 있는 새로운 환경 (타겟 도메인)에서 동작 인지 시스템을 구축하는 경우, 기존의 환경 (소스 도메인)의 데이터나 이 환경에서 학습된 분류기(classifier)를 사용하는 것은 도메인이 서로 다르기 때문에 바람직하지 않다. 기존의 기계 학습 방법들이 이러한 문제를 해결할 수 없으므로 전이 학습 (transfer learning) 방법이 제시되었으며, 이 방법에서는 소스 도메인에서 확보한 지식을 활용하여 타겟 도메인에서의 분류기 성능을 높이도록 하고 있다. 본 논문에서는 다중 태스크 신경망 (multitask neural network)을 사용하여 매우 제한된 수의 데이터만으로 정확도가 높은 동작 인지 분류기를 생성하는 전이 학습방법을 제안한다. 이 방법에서는 소스 및 타겟 도메인 분류기의 손실 함수 최소화가 별개의 태스크로 간주된다. 즉, 하나의 신경망을 사용하여 두 태스크의 손실 함수를 동시에 최소화하는 방식으로 지식 전이(knowledge transfer)가 일어나게 된다. 또한, 제안한 방법에서는 모델 학습을 위하여 비지도 방식(unsupervised manner)으로 라벨이 부여되지 않은 데이터를 활용한다. 실험 결과, 제안한 방법은 기존의 방법에 비하여 일관적으로 우수한 성능을 보여주고 있다.

밀도기반 선박 도메인을 이용한 안전 성능 지표 활용성 연구 (A Study on the Applicability of Safety Performance Indicators using the Density-Based Ship Domain)

  • 한영재;심성현;배혜림
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.89-97
    • /
    • 2022
  • 선박 충돌 사고는 경제적 손실, 인명피해 등 다양한 부정적 상황을 초래할 수 있기 때문에 사고를 예방하기 위한 다각적인 노력이 필요하다. 따라서 사고 예방을 위한 연구가 활발히 이루어고 있으며, 본 연구에서는 선박 충돌 사고 예방을 위한 새로운 선행 지표를 제안한다. 기존 연구에서는 특정 해역에서 선박들간의 거리를 고려하여 충돌위험을 표현하였지만 이를 다른 해역에 적용하기 위해서는 모델을 새로 개발해야하는 단점이 존재한다. 본 연구에서는 선박 운항 정보인 AIS(Automatic Identification System) 데이터를 활용하여 해역의 환경과 운항의 특징을 포함한 밀도기반 선박 도메인 DESD(Density based Empirical Ship Domain)을 정의하였다. 각 해역별로 만들어진 2차원의 DESD를 대상으로 Deep Clustering을 적용하여 유사한 운항 환경을 가진 해역들을 군집화 한다. 군집화된 해역과 선박 충돌 사고의 연관성 분석을 통해 해역의 특징별로 사고의 발생여부가 달라짐을 통계적으로 검정하여 DESD가 사고의 선행 지표로서 활용될 수 있음을 증명하였다.

계층형 관리 도메인을 위한 프록시 기반의 이동 에이전트 모델의 성능 평가 ((Performance Evaluation of Proxy-based Mobile Agent Model for Hierarchical Management Domains))

  • 박상윤
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권8호
    • /
    • pp.1049-1062
    • /
    • 2002
  • 네트워크 상의 분산 자원이 급증하면서 분산 자원에 대한 접근이 활성화되고 있다. 특히, 이동 에이전트 기술을 이용한 분산 자원의 접근은 고정 네트워크 상의 자원들에 대한 동적인 접근 뿐 아니라 이동 네트워크상의 사용자를 위한 이동성 지원 메커니즘을 제공한다. 프록시 기반의 이동 에이전트 모델은 동적으로 변화하는 분산 자원들에 대하여 계층적으로 도메인을 할당하고 도메인 별로 프록시 서버를 배치하여 이동 에이전트의 관리와 이동 에이전트간의 상호작용을 촉진시킬 수 있는 이동 에이전트 네트워크 모델이라고 할 수 있다. 본 논문에서는 계층적인 관리 분야에 적합한 프록시 기반의 이동 에이전트 모델의 구조 및 동작 시나리오를 소개하고 시뮬레이션을 통해서 프록시 서버의 경로 최적화 기능과 이동 에이전트의 실행 시간 단축 성능을 평가한다.

  • PDF