• 제목/요약/키워드: 통계적 정보

검색결과 2,116건 처리시간 0.031초

퍼지 분류기를 위한 통계적 정보 기반의 퍼지 함수 설정 기법 (Creation Methods of Fuzzy Membership Functions Based on Statistical Information for Fuzzy Classifier)

  • 신상호;한수환;우영운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.379-382
    • /
    • 2009
  • 패턴 인식에서 분류기 모형으로 많이 사용되는 퍼지 분류기는 퍼지 소속 함수를 적절히 설정함으로써 보다 향상된 분류 성능을 얻을 수 있다는 장점이 있다. 그러나 일반적으로 함수 설정은 인식문제 분야의 특성이나 해당 전문가의 지식과 주관적 경험을 기반으로 설정되므로 설정된 소속도 함수의 일관성과 객관성을 보장하기가 어려운 문제점을 갖고 있다. 따라서 이 논문에서는 퍼지 분류기의 소속도 함수를 설정하기 위한 객관적 기준을 제시하기 위하여 특징값들 간의 통계적 정보를 이용한 소속도 함수 설정 기법들을 제안하였다. 제안한 기법들을 이용하여 UCI machine learning repository 사이트에서 제공되는 표준 데이터 중에 Iris 데이터 세트를 이용하여 실험하고 그 결과를 비교, 분석하였다.

  • PDF

정보검색(情報檢索)에 있어서 용어(用語)의 통계적(統計的) 관련성(關聯性)을 응용(應用)한 클러스터링기법(技法) (A Study on the Clustering Technique Associated with Statistical Term Relatedness in Information Retrieval)

  • Jeong, Jun-Min
    • 정보관리연구
    • /
    • 제18권4호
    • /
    • pp.98-117
    • /
    • 1985
  • 본(本) 논문(論文)에서는 통계적(統計的) 용어조합(用語組合)과 클러스터링기법(技法)에 관한 문헌(文獻)을 간단히 살펴보았다. 선행연구(先行硏究)들로부터 통계적(統計的) 용어조합(用語組合)은 조합기법(組合技法)의 비효율성(非效率性)때문이 아니라 문헌집단(文獻集團)의 이질성(異質性) 때문에 검색(檢索)과 분류(分類)에 적당치 않다는 사실(事實)을 발견(發見)할 수 있다. 그 결과(結果)로부터 정보검색(情報檢索)의 최적화(最適化)를 위한 조합기법(組合技法)으로서 클러스터링과 통계적(統計的) 색인(索引)의 개념(槪念)을 이용(利用)할 수 있다. 본(本) 논문(論文)의 가설(假說)은 클러스터파일내(內)에서 통계적(統計的) 용어조합(用語組合)을 사용(使用)함으로써 정보검색(情報檢索)시스템의 성능(性能)을 상당히 향상(向上)시킬 수 있다는 것이다. 달리말해서, 파일들을 모으고 의미적(意味的)으로 관련(關聯)있는 모든 문헌(文獻)들을 함께 모아줌으로써, 유사조합(類似組合)(spurious association)의 문제(問題)를 상당히 해결(解決)할 수 있을 것이다. 실제적(實際的)으로, 본(本) 논문(論文)에서는 조합기법(組合技法)의 방법론(方法論)을 어떻게 생성(生成)할 수 있을 것인가를 고려했다. 자동용어(自動用語) 상관성(相關性)을 위하여 스타일(stiles)의 조합인자(組合因子)를 이용(利用)했으며 클러스터링 환경(環境)을 위해 커널기법(技法)(kernel method)을 사용(使用)했다.

  • PDF

통계적 기상예측정보를 이용한 경안천 유출량 장기 전망 (Long-term runoff prediction of Gyeongan-cheon watershed using statistically forecasted weather information)

  • 김철겸;이정우;이정은;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.413-413
    • /
    • 2022
  • 본 연구에서는 통계적 방법으로 도출된 장기 기상예측정보를 이용하여 유역에서의 유출량 전망 가능성을 검토하였다. 먼저 한강권역의 월 강수량과 기온에 대해 글로벌 기후지수와의 원격상관성을 기반으로 다중회귀모형 기반의 통계적 예측모형을 구성하여 미래기간(1~12개월)에 대한 월 단위 기상예측정보를 도출하였다. 월 단위로 도출된 강수량과 기온은 통계적 상세화 기법을 통해 한강권역 주요 ASOS 관측소 지점별로 일 단위 강수량과 기온자료로 변환하였으며, 상세화된 일 자료를 유역모형인 SWAT의 입력자료로 활용하여 경안천 유역의 미래기간에 대한 유출량을 도출하였다. 유출량 예측성을 평가하기 위하여 과거기간(2003~2021년)을 대상으로 관측유출량과 예측기상정보로부터 산출된 예측유출량을 비교하였다. 각 월별로 예측된 유출량의 중앙값과 관측값의 적합도를 분석한 결과, PBIAS는 -5.2~-2.7%, RSR은 0.79~0.91, NSE는 0.34~0.38, r은 0.59~0.62로 강수량 및 기온의 예측성에 비해 낮게 나타났다. 전 기간에 대해 월별로 분석한 예측결과에 대한 3분위 확률은 5월, 6월, 7월, 9월, 11월은 평균 42.8%로 예측성이 충분한 것으로 나타났으나, 나머지 월에서의 평균 예측성은 17.3%로 매우 낮게 나타났다. 상세화된 기상정보를 이용하여 유역모델링을 통해 산정한 유출량에 대한 전망 결과는 기상예측결과에 비해 상대적으로 예측성이 낮은 것으로 분석되었다. 이는 관측값 자체에서 나타날 수 있는 불확실성에 기인할 수도 있으며, 유출량에 지배적인 영향을 주는 강수량의 예측성에 대한 문제가 유역 모델링 과정에서 증폭되어 나타나는 문제일 수도 있다. 또한 지점별 일 자료로 상세화되는 과정에서의 불확실성, 우리나라 여름철 유출량 변동성 등 여러 가지 요인이 복합적으로 영향을 주어 나타나는 것으로 생각된다. 향후 다양한 대상유역에 대한 검토와 기상예측모형의 보완, 상세화 과정에서의 불확실성 해소 등을 통해 예측성을 개선할 계획이다.

  • PDF

통계적 기법을 이용한 정보기술 서비스 수준관리: H 기업 사례 (IT Service Level Management Using Statistical Method: A Case of H Company)

  • 양동구;김기윤
    • 경영정보학연구
    • /
    • 제8권2호
    • /
    • pp.211-234
    • /
    • 2006
  • 서비스수준관리(Service Level Management)의 목적이 단순한 재무적 계약(서비스 수준협약의 계약 자체)에서 고객의 기대와 제공자의 서비스에 대한 관리 시스템(서비스 수준협약에 대한 관리시스템)으로 최근 변해가고 있다. 본 논문의 목적은 통계적 기법을 이용해서 체계적인 정보기술 서비스 수준관리 방안을 제시하는 것이다. 본 연구는 통계적 기법과 서비스 수준관리 라는 두 가지 관점에서 서비스 수준을 다루고 있다. 첫째, 통계적 기법을 이용해서 목표 서비스 수준을 설정한다. 둘째, 전체 서비스 수준에 대한 평가방법을 제시한다. 이와 같이 제시된 방법을 이용해서 기업 전략 측면에서 정보기술 아웃소싱 성과로서 종합 서비스 수준을 계량적으로 측정하는 것이 가능하다.

POP시스템 환경하의 자동차부품 제조업체의 SPC시스템 개발 (Developing SPC System of an Automobile Parts Manufacturing Firm under POP System Environment)

  • 이진춘;김정만;김오환
    • 한국산업정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.8-14
    • /
    • 1999
  • 통계적 공정관리(SPC)는 공정에서 수집된 데이터를 통계적으로 분석함으로써 모든 변환공정의 품질을 관리할 수 있는 객관적 수단을 제공하는데, 실시간으로 공정검사의 결과를 피드백하는 수단이라는 점을 고려하면, 통계적 공정관리를 실시간 생산정보관리(POP)의 1개 모듈로 구축하는 것이 실질적이다. 이러한 맥락에서 본 연구는 자동차 부품업체의 통계적 공정관리시스템을 실시간 생산정보관리(POP)환경에서 구축하여 제시한다.

  • PDF

통계적 방법에 의한 후처리 (Postprocessing with statistical methods)

  • 박진우;이일병
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.518-526
    • /
    • 1994
  • 본 논문에서는 통계적 방법을 이용한 후처리기를 설계하고, 구현하여 평가하였다. 통계적인 방법은 처리 속도보다는 공간 효율을 높임으로써 후처리의 성능을 높일 수 있다는 가정에서, 후처리의 성능을 향상시키기 위해서 다음의 3가지 방법을 제안한다. 첫째, 전이 확률에서 중복 표현되는 정보를 정의하고, 제거할 수 있는 방법을 제안한다. 둘째, 정수인 순위값으로부터 실수인 전이 확률의 근사값을 추정해 냄으로써 공간 효율을 높일 수 있는 방법을 제안한다. 셋째, 위의 두가지 방법을 복합적으로 적용하여 공간 효율을 높은 오류 탐지와 오류 교정 방법을 제안한다.

  • PDF

Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상 (Improving the Performance of Statistical Context-Sensitive Spelling Error Correction Techniques Using Default Operation Algorithm)

  • 이정훈;김민호;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-170
    • /
    • 2016
  • 본 논문에서 제안하는 문맥의존 철자오류 교정은 통계 정보를 이용한 방법으로 통계적 언어처리에서 가장 널리 쓰이는 샤논(Shannon)이 발표한 노이지 채널 모형(noisy channel model)을 기반으로 한다. 선행연구에서 부족하였던 부분의 성능 향상을 위해 교정대상단어의 오류생성 및 통계 데이터의 저장 방식을 개선하여 Default 연산을 적용한 모델을 제안한다. 선행 연구의 모델은 교정대상단어의 오류생성 시 편집거리의 제약을 1로 하여 교정 실험을 하지만 제안한 모델은 같은 환경에서 더욱 높은 검출과 정확도를 보였으며, 오류단어의 편집거리(edit distance) 제약을 넓게 적용하더라도 신뢰도가 있는 검출과 교정을 보였다.

  • PDF

네트워크 기반의 침입을 탐지하기 위한 통계적 분석 기법 (Statistical Analysis Methods For Network Based Intrusion Detection)

  • 박찬이;홍선호;위규범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1001-1004
    • /
    • 2001
  • 현재 네트워크 기반의 침입 탐지는 대부분 오용 탐지 기법을 사용한다. 하지만 이는 알려지지 않은 침입을 탐지하는 능력이 떨어지는 기법으로서 이를 보완할 수 있는 비정상행위 탐지 기법을 찾는 것이 필요하다. 따라서 수집된 감사 자료로부터 정상행위를 프로파일링하고 침입임을 판정하는데 통계적인 기법을 사용하였다. 수집된 로그로부터 통계적인 방법으로 정상행위를 프로파일링하기 위해 우선 패킷으로부터 수집되는 감사 자료의 통계적인 특성을 대변하는 분포와 파라미터를 추정하고 카이스퀘어 검정법을 사용하여, 감사 자료가 가설하는 이론적인 분포의 특성을 가지고 있다고 판정되면 이를 정상행위의 기준으로 삼는다. 이후에 수집되는 감사자료를 감시하기 위해 추정된 분포와 파라미터를 따르고 있는지의 여부를 Kolmogorov-Smirnov 적합도 검정을 이용하여 판별하고, 이를 벗어나는 경우 침입으로 판정할 수 있도록 한다.

  • PDF

한국어 텍스트 내 용어연관성 분석을 위한 기초 연구 (Preliminary Study on the Analysis of Term Associations in Korean Text)

  • 정영미;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.243-246
    • /
    • 1998
  • 텍스트 자동분석을 통해 얻어진 통계적인 용어연관성은 정보검색 및 언어 처리와 관련된 여러 분야에서 폭넓게 이용되고 있다. 용어연관성을 구하기 위한 연관계수는 여러 가지가 있지만 적용분야에 관계없이 유사계수 공식이나 상호정보량 공식이 주류를 차지하고 있다. 이런 공식들은 그 통계적 특성이 서로 다르기 때문에 알맞은 적용분야를 파악할 필요가 있다. 이 연구에서는 필요 연관계수 공식의 특성을 이론적으로 파악하였고, 실험으로 검증하기 위하여 240만 어절 분량의 실험용 한국어 신문기사 데이터베이스를 구축하였다.

  • PDF

대학수학능력시험에서 통계적 소양 평가의 가능성 모색 - SAT 통계 문항과의 비교를 중심으로 (A Study on KSAT for Assessing Statistical Literacy by a Comparative Analysis with SAT)

  • 이정무;유진수;이정아;이경화
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제26권3호
    • /
    • pp.527-542
    • /
    • 2016
  • 통계 정보에 대한 비판적 이해 능력을 강조하는 통계적 소양이 통계 교육의 목표로 주목받고 있다. 통계적 소양 교육을 위해서는 평가의 역할이 중요하다. 특히 대학수학능력시험이 우리나라 학교 수업에 미치는 영향을 고려할 때, 대학수학능력시험에서 통계적 소양을 평가할 수 있는 문항이 출제될 필요가 있다. 이를 확인하기 위하여 PISA 평가틀(OECD, 2013)을 이용하여 대학수학능력시험의 통계 문항이 통계 정보에 대한 비판적 이해 능력을 측정하는지, 다양한 맥락을 활용하는지를 분석하였다. 대학입학시험에서 통계적 소양의 평가와 측정을 반영하기 위한 시사점을 도출하고자, 미국의 대학입학시험인 SAT의 통계 문항과 비교 또한 시도하였다. 분석 결과 수능과 SAT 모두 다양한 유형의 맥락을 활용하고 있었으나, 수능에 출제된 통계 문항들은 비판적 이해 능력을 평가하는 것에 있어 제한적인 것으로 나타났다. SAT에 출제된 통계 문항에는 비판적 이해 능력을 평가하는 것이 상당수 포함되어 있다. 이를 포함하여 통계적 소양을 평가하기 위한 다양한 문항들이 있다. 이 문항들을 참고하여 우리나라의 교육과정에서 제시하는 통계교육의 목표, 내용, 방법에 적합한 통계적 소양 평가문항을 개발할 필요가 있다.