• 제목/요약/키워드: 데이터모델

검색결과 12,590건 처리시간 0.037초

인적 모델 개발에 필요한 통계 데이터 고찰 (Review On the Statistical Data to Implement Human Model)

  • 조수산;장은진;임정빈
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 추계학술대회
    • /
    • pp.193-195
    • /
    • 2015
  • 해양사고 원인의 70 % 이상을 차지하는 인적오류 예방은 해양안전에 가장 중요한 이슈이다. 인적오류는 확률기반의 인적 모델을 구축하여 평가함으로써 예상되는 위기의 수준을 과학적으로 예측할 수 있다. 확률기반 인적 모델을 구축하기 위해서는 사건의 원인과 결과 사이에 연계성을 갖고 있는 통계 데이터가 필요하다. 본 연구에서는 이러한 연계 데이터 확보를 위한 것으로, 해양안전심판원의 통계 데이터 사이의 연계성 확보 방안을 주로 검토하였다. 그리고 이러한 통계 데이터를 인적 모델에 적용하는 방법과 전략도 검토하였다. 인적 모델은 회사, 선박, 해기사 관련 요소들이 총체적으로 반영될 필요가 있음을 알았고, 이러한 세 가지 요소로 구성된 통합 모델을 설계하기 위한 방안도 검토하였다. 특히, 각 요소들에 포함될 데이터 사이의 연계성 확보를 위해서 해양사고 연계 체인(Chain)을 도입하였다. 확보한 데이터는 사고의 가장 근본원인인 Hazard부터 사고의 영향을 나타내는 Impact까지의 6 단계 분석 방법을 적용하여 통계 데이터에 결합되어 있는 원인과 결과 사이의 연계성을 확보할 수 있는 방안을 수립하였다. 본 연구는 중장기적으로 추진할 과제이기 때문에 향후 본 연구 내용을 토대로 인적 모델을 개발하여 해양사고 예방에 적극 기여하고자 한다.

  • PDF

자기 학습 방법을 이용한 음성 대화 시스템의 슬롯 교정 (Self-learning Method Based Slot Correction for Spoken Dialog System)

  • 최태균;김민경;이인재;이지은;박규연;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-360
    • /
    • 2021
  • 음성 대화 시스템에서는 사용자가 잘못된 슬롯명을 말하거나 음성인식 오류가 발생해 사용자의 의도에 맞지 않는 응답을 하는 경우가 있다. 이러한 문제를 해결하고자 말뭉치나 사전 데이터를 활용한 질의 교정 방법들이 제안되지만, 이는 지속적으로 사람이 개입하여 데이터를 주입해야하는 한계가 있다. 본 논문에서는 축적된 로그 데이터를 활용하여 사람의 개입 없이 음악 재생에 필요한 슬롯을 교정하는 자기 학습(Self-learning) 기반의 모델을 제안한다. 이 모델은 사용자가 특정 음악을 재생하고자 유사한 질의를 반복하는 상황을 이용하여 비지도 학습 기반으로 학습하고 음악 재생에 실패한 슬롯을 교정한다. 그리고, 학습한 모델 결과의 정확도에 대한 불확실성을 해소하기 위해 질의 슬롯 관계 유사도 모델을 이용하여 교정 결과에 대한 검증을 하고 슬롯 교정 결과에 대한 안정성을 보장한다. 모델 학습을 위한 데이터셋은 사용자가 연속으로 질의한 세션 데이터로부터 추출하며, 음악 재생 슬롯 세션 데이터와 질의 슬롯 관계 유사도 데이터를 각각 구축하여 슬롯 교정 모델과 질의 슬롯 관계 유사도 모델을 학습한다. 교정된 슬롯을 분석한 결과 발음 정보가 유사한 슬롯 뿐만 아니라 의미적인 관계가 있는 슬롯으로도 교정하여 사전 기반 방식보다 다양한 유형의 교정이 가능한 것을 보였다. 3 개월 간 수집된 로그 데이터로 학습한 음악 재생 슬롯 교정 모델은 일주일 동안 반복한 고유 질의 기준, 음악 재생 실패의 12%를 개선하는 성능을 보였다.

  • PDF

전자상거래 상에서의 실시간 데이터 마이닝 활용 모델 (Real-time Data Mining application Model In Electronic Commerce)

  • 김고은;옥지웅;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.155-158
    • /
    • 2007
  • 현재 전자상거래는 우리의 생활과 밀접히 연관되어 있다. 최근 인터넷을 기반으로 전자조달, 수출입 브로커 등과 같은 유형의 B2B 전자상거래가 활발히 이루어지고 있으며, 소비자를 대상으로 하는 전자상거래 또한 점차 확산되는 시장을 형성하고 있다. 국제적으로도 전자상거래 시장 규모가 급속도로 증가할 것이라는 전망은 자명한 사실이다. 전자상거래에 대한 의존도가 높아지면서 관리해야 하는 데이터의 양 또한 급속도로 증가하고 있다. 본 논문에서는 실시간으로 유입되는 데이터를 효율적으로 활용하기 위챈 실시간 데이터 마이닝 활용 모델을 제안한다. 이 실시간 데이터 마이닝 모델은 지속적으로 유입되는 데이터의 규칙화를 통해 저장 공간의 효율성을 극대화하고 중요도 분석을 통한 총체적인 접근 방법을 시도함으로써 전자상거래 상에서 유용하게 쓰일 수 있는 활용 모델이다. 이 실시간 데이터 마이닝 모델의 바탕은 데이터 마이닝의 기법인 SEMMA를 따르며, 그 특징에 따라 규칙 추출과 의사 결정 나무 기법을 이용하여 전자상거래 상에서 유용하게 사용될 수 있는 모델을 제시하고자 한다.

  • PDF

강건한 질의응답 모델을 위한 데이터셋 증강 기법 (Adversarial Examples for Robust Reading Comprehension)

  • 장한솔;전창욱;최주영;심묘섭;김현;민경구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-46
    • /
    • 2021
  • 기계 독해는 문단과 질문이 주어질 때에 정답을 맞추는 자연어처리의 연구분야다. 최근 기계 독해 모델이 사람보다 높은 성능을 보여주고 있지만, 문단과 질의가 크게 변하지 않더라도 예상과 다른 결과를 만들어 성능에 영향을 주기도 한다. 본 논문에서는 문단과 질문 두 가지 관점에서 적대적 예시 데이터를 사용하여 보다 강건한 질의응답 모델을 훈련하는 방식을 제안한다. 트랜스포머 인코더 모델을 활용하였으며, 데이터를 생성하기 위해서 KorQuAD 1.0 데이터셋에 적대적 예시를 추가하여 실험을 진행하였다. 적대적 예시를 이용한 데이터로 실험한 결과, 기존 모델보다 1% 가량 높은 성능을 보였다. 또한 질의의 적대적 예시 데이터를 활용하였을 때, 기존 KorQuAD 1.0 데이터에 대한 성능 향상을 확인하였다.

  • PDF

지능형 시스템기반의 침입탐지모델 (Intrusion Detection Model based on Intelligent System)

  • 김명준;양지흥;한명묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.243-248
    • /
    • 2002
  • 빠르게 변해 가는 정보화사회에서 침입 탐지 시스템은 정밀성과 적웅성, 그리고 확장성을 필요로 한다. 또한 복잡한 Network 환경에서 중요하고 기밀성이 유지되어야 할 리소스를 보호하기 위해, 더욱 구조적이고 지능적인 IDS(Intrusion Detection System)개발의 필요성이 요구되고 있다. 본 연구는 이를 위한, 지능적인 IDS를 위해 침입패턴을 생성하기 위한 모델을 도출함에 목적이 있다. 침입 패턴은 방대한 양의 데이터를 갖게 되고, 이를 정확하고 효율적으로 관리하기 위해서 데이터마이닝의 주요 2분야인 Link analysis와 Sequence analysis를 이용하여 정확하고 신뢰성 있는 침입규칙을 생성하기 위한 모델을 도출해낸다 이 모델은 "Time Based Traffic Model", "Host Based Traffic Model", "Content Model"로 각각 상이한 침입 패턴을 생성하게 된다. 이 모델을 이용하면 좀더 효율적이고 안정적으로 패턴을 생성 할 수 있다, 즉 지능형 시스템기반의 침입 탐지 모델을 구현할 수 있다. 이러한 모델로 생성한 규칙은 침입데이터를 대표하는 규칙이 되고, 이는 비정상 사용자와 정상 사용자를 분류하게 된다 모델에 사용된 데이터는 KDD컨테스트의 데이터를 이용하였다. 사용된 데이터는 KDD컨테스트의 데이터를 이용하였다.

이상 탐지 모델을 활용한 사용자 행위 기반의 VR기기 사용자 인증 모델 연구 (A Study on VR Device User Authentication Model based on User Behavior using Anomaly Detection Model)

  • 전우진;김형식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.856-858
    • /
    • 2024
  • VR 기술의 발전은 다양한 분야에서 사용자에게 몰입감 있는 가상 현실 경험을 제공하지만, VR기기 내부에 사용자의 생체 데이터 및 금융정보와 같은 민감한 정보들이 저장되어 새로운 보안 문제를 야기하고 있다. 이에 따라 PIN, 패스워드 등과 같은 기존의 인증 방식이 VR 기기에 적용되고 있지만 이들은 shoulder-surfing attack 공격 취약하며 VR 환경에서 사용하기에 불편한 인터페이스를 가지고 있다. 따라서 본 논문에서는 이상 탐지 모델을 활용하여 외부 추론 공격에 강인하며 VR 환경에 적합한 사용자 행위 기반의 VR기기 사용자 인증 모델을 구현한다. 특정 task를 수행하는 동안 사용자의 행위 데이터를 수집 및 feature 데이터를 추출하고, 정상으로 라벨링 된 사용자의 데이터로 이상 탐지 머신러닝 모델들을 학습 후 정상 데이터와 비정상 데이터를 이용하여 인증 모델의 성능을 평가하였다. OC-SVM이 87.72%의 F1-score로 세 모델 중 가장 높은 성능을 보임을 확인하였으며, 향후 인증 모델 성능 향상을 위한 계획을 제시하였다.

이미지 생성 모델을 이용한 패턴 결함 데이터 증강에 대한 연구 (A Study of Pattern Defect Data Augmentation with Image Generation Model)

  • 김병준;서용덕
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.79-84
    • /
    • 2023
  • 이미지 생성 모델은 다양한 분야에 적용되어 데이터 부족 문제와 시간 및 비용 문제를 극복하고 있다. 그러나 규칙적 패턴 이미지에서의 이미지 생성과 해당 데이터의 결함 검출에는 한계를 가진다. 본 논문에서는 이미지 생성 모델의 패턴 이미지 생성의 가능성을 확인하고 OLED 패널의 결함 검출을 위한 데이터 증강에 적용하였다. OLED 결함 검출 모델을 학습하기 위해 필요한 데이터는 OLED 패널의 높은 비용 문제로 실제 데이터 세트를 확보하기 어렵다. 그렇기 때문에 해당 데이터 세트를 확보한다 하더라도 여러가지 결함 유형을 정의하고 분류하는 작업이 필요하다. 이를 위한 가상의 기반 데이터 세트를 획득할 OLED 패널 결함 데이터 획득 시스템을 소개하고, 이미지 생성 모델로 해당 데이터를 증강한다. 또, 확산모델에서의 패턴 이미지 생성의 어려움을 확인하여 가능성을 제안하고, 이미지 생성 모델 이용한 데이터 증강 및 결함 검출 데이터 증강의 제한 사항을 개선하였다.

딥러닝 회귀 모델 개발을 위한 센서 데이터 윈도우 사이즈 최적화 기법 (Optimization of Sensor Data Window Size for Deep Learning Regression Model)

  • 최민서;유동연;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.610-613
    • /
    • 2022
  • 센서 데이터의 중요성이 커지면서 센서 데이터 처리 연구의 수요가 증가하고 있다. 센서 데이터 기반의 딥러닝 모델 개발 시, 센서 데이터 단일 값에 의한 출력이 아닌 시계열적인 특성을 반영하여 연속적인 데이터 간의 연관성을 파악할 수 있는 슬라이딩 윈도우 기법을 통해 효율적으로 데이터를 분석하고 처리할 수 있다. 하지만, 기존의 방법들은 학습 성능(학습 시간 및 모델 성능)에 미치는 영향을 평가하는 기준 없이 입력 데이터의 윈도우 사이즈를 임의로 설정하여 데이터를 처리해 왔다. 따라서, 본 논문은 학습 시간과 모델 성능을 기준으로 센서 데이터의 윈도우 사이즈 최적화 기법을 제안한다. 제안한 방법은 전류를 이용하여 스위치와 다이오드 온도를 추정하는 가상 센서(virtual sensor) 실험 테스트베드에 적용하여, 학습 시간 중심으로는 5%의 윈도우 사이즈를, 모델 성능 중심으로는 R2 SCORE 의 값을 0.9295 로 갖는 8%의 윈도우 사이즈가 최적으로 도출되었다.

EJB 기반의 워크플로우 모델 데이터 관리 기술 (EJB-based Workflow Model Data Management Mechanism)

  • 김민홍
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.19-28
    • /
    • 2004
  • 기업의 비즈니스 프로세스를 관리하는 워크플로우 시스템에서 대용량의 비즈니스 업무를 처리하기 위한 워크플로우 시스템을 구성하고자 할 때 중요한 문제 중의 하나는 대량의 데이터 관리의 문제이다. 본 논문에서는 워크플로우 시스템에서 사용되는 데이터 종류들의 특성을 파악 및 분석하여 워크플로우 데이터 중 모델 데이터에 초점을 맞춘다. 논문의 연구를 통하여 워크플로우의 모델 데이터는 변경이 없고 워크플로우 시스템에 자주 참조되는 특성을 고려하여 모델 데이터 관리는 워크플로우 시스템에 높은 성능을 제공할 것으로 예측되어서 본 논문에서는 워크플로우 시스템을 위한 모델 데이터 관리를 위한 시스템을 설계 및 개발한다. 모델 데이터 관리 시스템은 버전 관리, 모델 데이터의 일관성, 동적 변경 등의 중요한 요소를 고려하여 설계 및 개발된다.

  • PDF

iSTORM에서의 공간 객체-관계 데이터 모델 (Spatial Object-Relational Data Model in iSTORM)

  • 박경현;남광우;박성희;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.24-26
    • /
    • 2000
  • 공간 데이터는 복합적인 속성들의 조합으로 이루어지며 연산 또한 복합적이라는 점에서 일반 데이터와 다른 특성을 갖는다. 따라서 공간 데이터는 일반 속성 데이터와 구별되는 파일이나 별도의 저장 구조를 사용하여 관리되어야 한다. 이것은 비공간 데이터와 공간 데이터간의 상호 동기화 문제와 트랜잭션의 처리 등에서 많은 문제점을 발생시키며 이를 해결하기 위해서는 공간 데이터와 비공간 데이터를 단일 데이터베이스화하여야 한다. 이 논문에서는 이러한 단일화된 데이터베이스 시스템을 지원하기 이한 공간 객체-관계 데이터 모델을 정의하고 이 모델을 구현하기 위한 타입 저장 방법들에 대해 기술한다.

  • PDF