• 제목/요약/키워드: 데이터 추론기법

검색결과 288건 처리시간 0.025초

WSN환경에서 은닉 마코프 모텔 기반의 분산추론 기법 적용한 행위인지 알고리즘 (An Activity Recognition Algorithm using a Distributed Inference based on the Hidden Markov Model in Wireless Sensor Networks)

  • 김홍섭;한만형;임거수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.231-236
    • /
    • 2009
  • 본 연구에서는 집이나 사무실과 같은 일상 공간에서 발생할 수 있는 연간의 일상생활행위 (ADL: Activities of Daily Living) 들을 인지하는 분산 모델을 제시한다. 사용자의 환경 정보, 위치 정보 및 행위 정보를 간단한 센서들이 부착된 가정용 기기들과 가구, 식기들을 통해 무선 센서 네트워크를 통해 수집하며 분석한다. 하지만 이와 같은 다양한 기기의 활용과 충분히 분석되어지지 않은 데이터들은 본 논문에서 제시하는 일상 환경에서 고차원의 ADL 모델을 구축하기 어렵게 한다. 그러나 ADL들이 생성하는 센서 데이터들과 센서 데이터들의 순서들은 어떤 행위가, 이루어지고 있는지 인지할 수 있도록 도와준다. 따라서 이 센서 데이터들의 순서를 특정 행위 패턴을 분석하는 데 활용하고, 이를 통해 분산 선형 시간 추론 알고리즘을 제안한다. 이 알고리즘은 센서 네트워크와 같은 소규모 시스템에서 행위를 인지하는 데 적절하다.

  • PDF

효율적인 릴레이션 생성과 제약조건 보존을 위한 새로운 Inlining 기법 (New Inlining Method for Effective Creation of Relations and Preservation of Constraints)

  • 안성철;김영웅
    • 한국멀티미디어학회논문지
    • /
    • 제9권7호
    • /
    • pp.773-781
    • /
    • 2006
  • XML (eXtensible Markup Language)은 웹 상의 데이터를 표현하고, 교환하기 위한 표준 언어로써, XML로 표현된 문서를 관계형 데이터베이스 관리시스템(RDBMS)에 저장하고 관리하는 기법에 대한 연구가 활발히 진행되어 왔다. 이러한 연구들은 입력으로 DTD(Document Type Definition) 문서를 받는 기법을 사용하고, 그것으로부터 관계형 스키마를 추론하는 기법을 사용한다. 하지만, 기존의 연구들은 DTD 간소화 절차 때문에 semantic 보존을 고려하지 않는다. 더 나아가서, 기존의 연구들은 XML 데이터의 내용(content)와 구조(structure) 정보만을 저장하는데 초점이 맞춰져 있기 때문에, XML문서 저장 시 데이터의 무결성을 보장하기 위해 저장 프로시져나 트리거를 사용해야 하는 번로움이 생긴다. 본 논문에서는 [1]의 연구에서 제시한 Inlining 기법을 기반으로 기존의 Inlining 기법의 문제점인 DTD에서 추론할 수 있는 의미적인 정보의 손실을 관계형 스키마로 보존하는 방법과 효율적인 릴레이션 생성을 위해 개선된 Inlining 기법을 제시한다.

  • PDF

차세대 침입탐지에서 이상탐지를 위한 추론 기반 데이터 융합 알고리즘 (Data Fusion Algorithm based on Inference for Anomaly Detection in the Next-Generation Intrusion Detection)

  • 김동욱;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제26권3호
    • /
    • pp.233-238
    • /
    • 2016
  • 본 논문은 차세대 침입탐지 시스템을 위해서 데이터 융합에서의 불확실한 데이터 처리의 알고리즘을 제안한다. 차세대 침입탐지는 사이버 공간에서 생성되어지는 정보를 지식으로 만들어내기 위해 수많은 네트워크 센서로부터의 데이터가 수집되어진다. 수집된 센서 정보를 지식의 수준으로 이끌어내기 위해서 데이터 융합의 과정이 필요하다. 이를 위해 본 논문에서는 Demster-Shafer 증거이론 추론적 기법을 통하여 서로 다른 데이터들의 특징을 분석하여 불확실한 데이터가 어느 구간에서 신뢰구간을 갖는지를 분류하여, 불확실한 데이터에 대한 표현을 이루어낸다. 본 실험내용에서는 이러한 불확실성 데이터에 대한 이상탐지를 위해 iris plant 데이터세트를 이용한 신뢰구간에 따른 분류를 실행하였다. 이에 대해 각 신뢰구간을 통해서 데이터 분류가 가능하다는 것을 검증하였다.

클러스터링 기반 사례기반추론을 이용한 추천시스템 개발 (The Development of Recommender System Using Clustering-based CBR)

  • 이희정;홍태호
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.519-522
    • /
    • 2004
  • 웹의 급격한 확산과 더불어 고객에게 맞춤화된 정보 제공의 필요성이 높아지고 있다. 또한 전자상거래 기업은 맞춤화와 개인화 서비스를 실현하기 위해서 웹 기반의 추천시스템에 많은 관심을 가지고 있다. 협업필터링(Collaborative filtering)은 개인화된 정보필터링 기법으로 추천시스템에서 가장 많이 사용되고 있다. 본 연구에서는 MovieLens 데이터 셋의 아이템속성을 고려하여 클러스터링 기반의 사례기반추론을 통한 협업필터링 추천시스템을 개발하고 기존의 방법과 제안된 모델의 성과를 비교 분석하였다.

  • PDF

연관성규칙 발견을 위한 데이터마이닝 알고리즘 설계 (An Efficient Data Mining Algorithm For An Association Rule Discovery)

  • 이해각
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.587-591
    • /
    • 2004
  • 수많은 데이터로부터 우리가 이용할 수 있는 의미 있는 연관성 규칙을 찾는 것은 대단히 중요하다. 연관성 규칙은 데이터베이스의 각 트랜잭션을 분석하여 이에 대한 각종 측정치를 수집하여 이루어지는데 대단히 많은 시간과 노력을 요한다. 본 논문에서는 통계적 추론을 이용하여 탐색도중 주어진 조건을 만족하는 항목에 대하여 의사결정을 내려 탐색시간은 단축할 수 있는 알고리즘을 제안한다. 또한 추론에 따른 오류발생을 최소화 할 수 있는 기법을 제시한다.

  • PDF

정교한 데이터 분류를 위한 방법론의 고찰 (A Review of the Methodology for Sophisticated Data Classification)

  • 김승재;김성환
    • 통합자연과학논문집
    • /
    • 제14권1호
    • /
    • pp.27-34
    • /
    • 2021
  • 전 세계적으로 인공지능(AI)을 구현하려는 움직임이 많아지고 있다. AI구현에서는 많은 양의 데이터, 목적에 맞는 데이터의 분류 등 데이터의 중요성을 뺄 수 없다. 이러한 데이터를 생성하고 가공하는 기술에는 사물인터넷(IOT)과 빅데이터(Big-data) 분석이 있으며 4차 산업을 이끌어 가는 원동력이라 할 수 있다. 또한 이러한 기술은 국가와 개인 차원에서 많이 활용되고 있으며, 특히나 특정분야에 집결되는 데이터를 기준으로 빅데이터 분석에 활용함으로써 새로운 모델을 발견하고, 그 모델로 새로운 값을 추론하고 예측함으로써 미래비전을 제시하려는 시도가 많아지고 있는 추세이다. 데이터 분석을 통한 결론은 데이터가 가지고 있는 정보의 정확성에 따라 많은 변화를 가져올 수 있으며, 그 변화에 따라 잘못된 결과를 발생시킬 수도 있다. 이렇듯 데이터의 분석은 데이터가 가지는 정보 또는 분석 목적에 맞는 데이터 분류가 매우 중요하다는 것을 알 수 있다. 또한 빅데이터 분석결과 통계량의 신뢰성과 정교함을 얻기 위해서는 각 변수의 의미와 변수들 간의 상관관계, 다중공선성 등을 고려하여 분석해야 한다. 즉, 빅데이터 분석에 앞서 분석목적에 맞도록 데이터의 분류가 잘 이루어지도록 해야 한다. 이에 본 고찰에서는 AI기술을 구현하는 머신러닝(machine learning, ML) 기법에 속하는 분류분석(classification analysis, CA) 중 의사결정트리(decision tree, DT)기법, 랜덤포레스트(random forest, RF)기법, 선형분류분석(linear discriminant analysis, LDA), 이차선형분류분석(quadratic discriminant analysis, QDA)을 이용하여 데이터를 분류한 후 데이터의 분류정도를 평가함으로써 데이터의 분류 분석률 향상을 위한 방안을 모색하려 한다.

사례 기반 추론을 이용한 선박 USN 위험 상황 인식 시스템 구현 및 설계 (A Design and Implement Vessel USN Risk Context Aware System using Case Based Reasoning)

  • 송병호;이성로
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.42-50
    • /
    • 2010
  • 기존의 선박 USN 관련 시스템은 선박 USN에서 획득한 데이터를 단순히 모니터링 하는 데 그치고 있으므로 해양의 특성을 고려한 지능적인 의사 결정 알고리즘을 갖는 시스템 구현이 필요하다. 본 논문에서는 사례 기반 추론 기법을 이용하여 디지털 선박의 화재, 파손에 관한 사례를 지식 베이스로 구축하고 추론하는 시스템을 설계하였다. 가장 유사한 사례 추천을 위해 KNN 알고리즘을 이용하였고 화재 상황과 파손 상황 사례 베이스를 구축하기 위하여 각 상황별로 3,000 건의 데이터를 입력받아 실험하였다. 실험 결과 화재 사례와 파손 사례에 대한 평균 정확도는 약 82.5%, 80.1%를 나타냈고 유사도 분류 k 개수가 7인 경우에 최적의 수행 결과를 나타냈다. 또한, 추론된 결과를 이용하여 선박 모니터링 시스템을 구현하였다.

토익 문제 풀이 모델 학습을 위한 유의어/반의어 기반 데이터 증강 기법 (Synonyms/Antonyms-Based Data Augmentation For Training TOEIC Problems Solving Model)

  • 이정우;;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-335
    • /
    • 2023
  • 최근 글을 이해하고 답을 추론하는 연구들이 많이 이루어지고 있으며, 대표적으로 기계 독해 연구가 존재한다. 기계 독해와 관련하여 다양한 데이터셋이 공개되어 있지만, 과거에서부터 현재까지 사람의 영어 능력 평가를 위해 많이 사용되고 있는 토익에 대해서는 공식적으로 공개된 데이터셋도 거의 존재하지 않으며, 이를 위한 연구 또한 활발히 진행되고 있지 않다. 이에 본 연구에서는 현재와 같이 데이터가 부족한 상황에서 기계 독해 모델의 성능을 향상시키기 위한 데이터 증강 기법을 제안하고자 한다. 제안하는 방법은 WordNet을 이용하여 유의어 및 반의어를 기반으로 굉장히 간단하면서도 효율적으로 실제 토익 문제와 유사하게 데이터를 증강하는 것이며, 실험을 통해 해당 방법의 유의미함을 확인하였다. 우리는 본 연구를 통해 토익에 대한 데이터 부족 문제를 해소하고, 사람 수준의 우수한 성능을 얻을 수 있도록 한다.

  • PDF

적응형 미들웨어의 자가 진단을 위한 베이지안 네트워크를 사용한 진단엔진 (A Diagnosis Engine Using Bayesian Network for Self-management of Adaptive Middleware)

  • 최보윤;김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.220-222
    • /
    • 2006
  • 분산 어플리케이션은 동시에 여러 사용자가 각기 다른 환경에서 동기화된 프로세서를 사용하기 때문에 일정 한 성능을 유지하는 것이 무엇보다 중요하다. 진단엔진은 시스템을 진단하여 시스템 결함의 원인을 발견하여 시스템이 자가치료가 가능하게 한다. 적응형 미들웨어는 진단엔진을 사용해서 분산 어플리케이션이 로컬환경에 맞는 고른 서비스를 유지 할 수 있도록 한다. 본 논문은 베이지안 네트워크를 사용한 적응형 미들웨어의 진단엔진을 제안한다. 베이지안 네트워크는 상황인지분야에서 널리 사용되는 추론기법으로서, 수집 된 데이터를 통해서 그 구조를 학습하고 데이터를 증거 값으로 시스템 진단을 한다. 본 논문은 실험 대상자로부터 윈도우시스템에서 두 시간 동안 데이터를 수집하여 한 시간은 베이지안 네트워크 학습에 사용하고, 나머지는 베이지안 네트워크 성능평가에 사용하였다. 실험 결과 학습된 두 개의 베이지안 네트워크 모델은 각각 95.41%, 99.77%의 정확성을 보였다.

  • PDF

점진적 전방향 추론을 이용한 DQL 검색 인터페이스 (DQL Search Interface Using Incremental Forward Chaining)

  • 김제민;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.100-102
    • /
    • 2003
  • 인터넷의 등장 이후 폭발적으로 증대되는 웹 정보를 효율적으로 사용하기 위한 방안이 연구되고 있다. 현재, 웹 서비스에서 사용하고 있는 키워드 기반 검색은 syntactic 정보만을 제공하므로 원하는 서비스를 받고자하는 사용자의 의도와 상관없는 정보를 탐색하여 서비스한다. 그러나 시멘틱 웹을 기반으로 만들어진 시스템들은 서비스 정보의 질을 향상시키기 위하여 DQL(Daml Query Language)을 이용한 시멘틱 서치(Semantic search)기법을 이용하고 있다. 시멘틱 서치는 사용자가 입력한 질의들을 의미상으로 해석하고, 이를 통하여 사용자의 원하는 정보와 의미가 같은 해답을 얻어내는 것이다. 그러나 기존의 시멘틱 서치는 사용자가 복잡한 질의들을 수작업으로 처리하여 원하는 정보를 탐색해야하고 DQL(Daml Query Language)은 자체 추론 기능을 갖지 않기 때문에 DQL엔진에서 각각의 메타데이터들을 비교하여 사용자의 질의에 맞는 해답을 찾아내야 함으로 시스템 과부하 현상이 일어나게 된다. 본 논문은 이러한 기존의 시멘틱 서치 방식의 효율성과 속도를 놀이기 위하여, 사용자 중심의 키워드 형태 질의를 시스템 중심의 DQL로 변환하는 DQL 컨버터 시스템과 추론엔진을 불러내어 전방향 추론과 단일화를 실행하는 DQL 엔진을 제안한다.

  • PDF