• 제목/요약/키워드: 통계기법

검색결과 2,510건 처리시간 0.032초

웹 마이닝 시스템 설계 및 유용한 접근 패턴 정의 (Design of the web data mining system and definition of useful access patterns)

  • 김종달;김성민;남도원;이동하;이전영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.283-291
    • /
    • 2000
  • 인터넷 서비스 제공자들이 관심을 가지고 있는 것 중 하나는 인터넷 사용자들의 서비스 이용 패턴과 경향을 분석하는 것이다. 이를 통해 매출 증대와 실제 경영에 도움이 되는 사용자의 특성을 이해할 수 있기 때문이다. 이와 관련된 기본적인 접근방법은 사용자가 웹 서버에 접근했을 때 서버에 남는 웹 로그를 분석하여 사용자 패턴을 분석하는 것이다. 웹 로그 분석에 전형저인 통계기법이 사용되고 있다. 그러나 단순 통계 기법만으로는 알려지지 않는 데이터들 사이에 숨겨진 유용한 정보를 찾는 데에는 한계가 있다. 최근에는 이러한 한계를 극복하기 위해 데이터 마이닝 기술을 이용한 새로운 접근 방법이 시도되고 있다. 그러나 실제로 웹 로그에서부터 데이터 마이닝 기술을 이용하는 데에는 전처리 과정의 어려움과 실제 유용한 패턴을 어떻게 정의하는 가가 어려운 문제이다. 본 연구에서는 로(raw) 데이터인 웹 로그에서 유용한 패턴을 찾기 위한 전처리 과정을 알아보고, 웹 마이닝 시스템에 적합한 트랜잭션의 데이터 구조를 제시한다. 그리고 정의된 데이터 구조를 통한 패턴 발견 과정인 웹 사이트의 개념계층을 이용한 통계 기법과 연관규칙(Association Rules) 탐사에 대해 알아본다. 마지막으로 정의된 데이터 구조를 통한 새로운 유용한 패턴을 정의한ㄷ.

  • PDF

다중 시기/센서 원격탐사 자료의 통계비 기반 분류 (Statistical ratio based classification of multi-temporal/sensor remote sensing data)

  • 박노욱;지광훈
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.3-6
    • /
    • 2006
  • 이 연구에서는 다중 센서 융합과 시간적 문맥 정보의 결합을 통한 분류 정확도 향상을 목적으로 통계비 기반 결정수준 융합 기법을 제안하였다. 다중 센서 융합을 목적으로 개별 센서 자료로부터 얻어진 사후 확률의 결합에 기존 확률론적 자료 융합에서 널리 사용되어온 조건부 독립의 가정을 완화한 통계비 기반 결합 규칙을 적용하였다. 그리고 시간적 문맥 정보를 새로운 정보 근원으로 간주하고 이전 시기 자료의 분류결과로부터 추출 및 결합하였다. 이 제안기법은 통계비 기반의 틀 안에서 다중 센서의 분광정보 및 시간적 문맥 정보의 결합이 용이한 장점이 있다 제안기법의 적용성 평가를 위해 다중 시기/센서 융합의 사례연구를 수행하였다.

  • PDF

동적 윈도우와 토크나이저를 이용한 영-중 음차표기 대역쌍 자동 추출 (Automatic Extraction of English-Chinese Transliteration Pairs using Dynamic Window and Tokenizer)

  • 김성국;나승훈;김동일;이종혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권6호
    • /
    • pp.417-421
    • /
    • 2007
  • 인터넷의 발달로 대량의 이중언어 문서 구축이 가능해짐에 따라 이런 언어자원을 이용하여 음차표기 대역쌍을 추출하는 연구가 활발히 진행되고 있다. 이런 연구들은 대부분 통계기반 음차표기 모델을 기반으로 하고 있다. 본 논문에서는 기존의 통계기반 음차표기 모델의 문제점에 대하여 분석하고 동적 윈도우와 토크나이저 기법을 제안하여 약 99%의 단어 정확률을 나타냈으며 그 결과 기존의 통계기반 음차표기 모델에 비하여 약 23%정도의 성능 향상을 보였다.

통계단위를 활용한 도시지역 상세 토지이용 분류기법 (A Method of Detailed Urban Land Use Classification Using a Statistical Unit)

  • 민숙주;김계현
    • 한국지형공간정보학회:학술대회논문집
    • /
    • 한국지형공간정보학회 2004년도 추계학술발표대회 논문집
    • /
    • pp.103-106
    • /
    • 2004
  • 토지이용정보는 토지이용계획, 도시계획, 환경관리 등을 위한 기초자료로 사용되고 있으며, 최근에는 인구가 밀집된 도시지역에서 환경문제를 고려한 정책 수립을 위하여 상세한 토지이용정보를 필요로 하고 있다. 그러므로 본 연구에서는 작은 공간단위로 토지이용을 구분하기 위하여 통계단위자료와 기 제작된 수치지형도를 활용하여 도시지역의 토지이용 분류기법을 제시하였다. 제시된 분류기법의 활용 가능성을 확인하기 위하여 서울시 일부지역을 대상으로 실험분석 하였으며, 그 결과 산림지역을 제외하고 전체적으로 높은 정확도를 보였다. 향후 산림지역에 대한 토지이용정보 취득 방법을 보완할 경우 본 연구에서 제시한 방법은 도시지역 토지이용정보 취득에 효율적으로 사용될 수 있을 것으로 판단된다. 또한 통계단위와 토지이용정보 구분단위가 일치하므로 다양한 통계집계자료와 함께 분석하는데 유용하게 활용될 수 있을 것으로 사료된다.

  • PDF

Kano 모델과 통계 기법을 이용한 요구사항 분류 및 협상을 위한 정보 생성 기법 (A Technique for Classifying Requirement/Stakeholder and Generating Information for Negotiation Using Kano Model and Statistical Method)

  • 변정원;김지혁;류성열;황만수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.161-169
    • /
    • 2010
  • 요구사항 추출 활동은 다양한 이해당사자의 요구를 요구사항으로 추출하고 협상을 위한 정보를 생성하는 사전 준비 작업이다. 그러나 현재 고객으로부터 요구사항 수집을 위한 기법은 다수 존재하고 있으나, 요구사항 분류와 협상을 위한 정보 제공에 대한 연구는 부족한 실정이다. 본 연구는 요구사항을 분류하고, 협상을 위한 정보를 식별하는 기법에 대한 연구이다. 본 연구는 요구사항 분류를 위해 Kano 모델과 통계 기법을 활용하였으며, 협상을 위한 정보를 생성하기 위해 요구사항과 문제의 관계를 고려하였다. 제안한 기법에 대한 시뮬레이션, Rough Set Theory, 사례 검증을 수행하여 제안한 방법의 타당성을 검증하였다.

모바일 스마트 장치 배터리의 남은 시간 예측에 적용 가능한 통계 기법들의 평가 (Performance Evaluation of Statistical Methods Applicable to Estimating Remaining Battery Runtime of Mobile Smart Devices)

  • 탁성우
    • 한국정보통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.284-294
    • /
    • 2018
  • 모바일 스마트 장치 배터리의 남은 시간 예측에 통계적 기법이 많이 사용되고 있다. 그러나 특정 통계 기법만을 사용한 기존 연구들의 결과만으로는, 통계적 기법이 배터리의 남은 시간 예측에 적합한지가 판단하기 어렵다. 이에 본 논문에서는 스마트 장치 배터리의 남은 시간 예측에 적용 가능한 다양한 통계 기법들의 성능을 평가하였다. 평가에 사용된 통계 예측 기법은 단순 및 이동 평균, 선형 회귀, 다변수 적응 회귀, 자기 회귀, 다항식 회귀, 이중 및 삼중 지수평활 기법이다. 분석 결과는, 향후 통계적 기법을 배터리 남은 사용 시간 예측에 적용하려는 IT 엔지니어에게 중요한 자료로 활용될 수 있다.

U-health 환경에 부합하는 통계기반의 질환 유무 판별 기법 (A Statistical Method for Disease Identification in u-Health)

  • 송지수;한동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.470-474
    • /
    • 2007
  • U-healthcare는 종래의 헬스케어 영역에 유비쿼터스 기술을 접목하여 개인의 건강상태 관리를 도와주는 서비스이다. 이의 기반이 되는 기술인 질환 유무를 판별하는 기법은 그 동안 헬스케어 영역에 적용시켜 왔다. 하지만, 적시에 언제 어디서나 지속적인 모니터링이 요구되는 U-health환경에서는 기존의 기계학습기법을 그대로 적용하는 데에는 어려움이 있다. 본 논문에서는 통계기반의 질환 유무 판별 기법을 제안한다. 본 판별 기법은 질환 판별에 이용되는 생체신호와 신체증상의 종류로 배열 구조를 설정하고 축적된 데이터로부터 생체신호와 신체증상간의 쌍에 누적 빈도 수를 기록하여 학습한 뒤 고안한 판별식을 적용시켜 사용자의 질환을 판별하는 기법이다. 제한적인 검증이지만 약 360명의 실제 환자 데이터를 이용하여 기법을 검증하였고, 빠른 속도와 지속적인 개선이 가능한 기법임을 알 수 있었다. 추후 정확한 데이터를 기반으로 다른 기법과의 비교 검증으로 엄밀한 검증이 요구된다.

  • PDF

지구통계기법과 GIS를 이용한 연안지역 해수침투 분포 파악 (Analysis of the Distribution Pattern of Seawater Intrusion in Coastal Area using the Geostatistics and GIS)

  • 최선영;고와라;윤왕중;황세호;강문경
    • Spatial Information Research
    • /
    • 제11권3호
    • /
    • pp.251-260
    • /
    • 2003
  • 본 연구에서는 지구통계기법과 GIS를 이용하여 Cl/sup -/ 농도 분포도를 작성하고 이를 통해 해수침투 분포 양상을 파악하였다. 분포도는 탐색적 공간자료 분석을 통해 자료의 분포 패턴을 파악한 후에 정규크리깅과 공동크리깅을 이용하여 작성하였다. 지구통계기법인 크리깅은 시ㆍ공간적인 자료의 분포특성과 상관관계를 이용하여 신뢰할 만한 결과를 제공한다. 공동크리깅의 이차변수는 상관분석을 통해 Cl/sup -/과의 상관성이 큰 TDS, Na/sup +/, Br/sup -/을 선정하였다. Cl/sup -/ 농도 분포도를 분석한 결과 공동크리깅에 의한 분포도가 정규크리깅의 분포도보다 더욱 정밀하게 나타났으며, 전반적으로 이민촌 일대와 해안가 지역에서 높은 농도 이상대를 보이고 있음을 확인할 수 있었다.

  • PDF

Bootstrap을 이용한 강우빈도해석에서의 매개변수 추정에 대한 불확실성 해석 (Uncertainty Analysis for Parameter Estimation in Rainfall Frequency Analysis using Bootstrap)

  • 서영민;지홍기;이순탁
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1406-1411
    • /
    • 2009
  • Bootstrap 기법은 통계학적 추정치의 정확도 또는 불확실성을 평가하기 위한 컴퓨터 기반 리샘플링 기법으로서 플러그인 원칙을 이용하여 요약통계치의 표준오차 및 신뢰구간을 추정하며, Bootstrap 기법 중 BCa 기법은 다른 Bootstrap 기법들에 비해 적합도 기준면에서 훨씬 우수한 결과를 나타내는 것으로 알려져 있다. 본 논문에서는 강우빈도해석에서 확률분포의 매개변수 추정에 대한 불확실성 고려한 확률강우량의 산정 및 불확실성의 영향을 평가하기 위하여 Bootstrap 기법 중 비매개변수적 BCa 기법에 기반한 불확실성을 고려한 강우빈도해석모델 구축 및 적용을 통해 홍수위험평가 및 수자원 계획 등에 있어서 불확실성 표현 및 처리기법을 제시하였다.

  • PDF

스마트 헬스케어 서비스를 위한 통계학적 개인 맞춤형 질병예측 기법의 개선 (An Improvement of Personalized Computer Aided Diagnosis Probability for Smart Healthcare Service System)

  • 민병원
    • 중소기업융합학회논문지
    • /
    • 제6권4호
    • /
    • pp.79-84
    • /
    • 2016
  • 본 논문에서는 스마트 헬스케어 서비스 시스템의 바이오 데이터 분석 과정을 프로세스로 해석하기 위하여, 온톨로지 기반 통계학적 개인 맞춤형 질병예측 기법인 PCADP(Personalized Computer Aided Diagnosis Probability)를 제안하였다. 또한 이러한 개인 맞춤형 질병예측 기법을 바탕으로 스마트 헬스케어 데이터 및 헬스케어 서비스 명세의 의미 있는 표현을 위하여 헬스케어 온톨로지 프레임워크를 시맨틱스형으로 모델링하였다. PCADP 기법은 스마트 헬스케어 환경에서 개인 맞춤형 판별 기법이 갖추어야 할 조건인 실시간 처리, 유연한 구조, 판별과정의 모니터링, 지속적인 개선 등에 부합하는 통계학적 질병예측 기법임을 확인하였다.