• 제목/요약/키워드: 이용통계

검색결과 12,084건 처리시간 0.03초

Categorical Data Analysis by Using Spatial Scan Statistics and Echelon Analysis

  • 문승호;신재경
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2004년도 춘계학술대회
    • /
    • pp.183-194
    • /
    • 2004
  • 본 연구에서는 공간 검색 통계량(spatial scan statistics)과 에셜론 해석법을 이용한 범주형 자료분석을 다룬다. 이를 위해 우선, 에셜론 덴드로그램을 이용하여 주어진 분활표의 계층적 구조(hierarchical structure)를 결정하고서 이로부터 핫스팟(hotspot)의 후보를 검출한다. 다음으로 우도비(likelihood ratio)를 기초로 유의하게 높거나 낮게 나타나는 지역에 대한 공간 검색 통계량을 산출한다. 마지막으로, 이 통계량을 바탕으로 핫스팟을 검출한다.

  • PDF

통계해석에 의한 정수 중 저항추진성능 추정

  • 김은찬
    • 대한조선학회지
    • /
    • 제31권4호
    • /
    • pp.18-21
    • /
    • 1994
  • 시제품을 만들어 본 후 대량 생산에 들어가는 여느 공업과는 달리, 조선공업에서는 시제품을 미리 만들어 볼 수가 없으므로 실선의 성능을 미리 추정하는 것은 참으로 중요한 과제 중의 하 나이다. 그 가운데 하나인 저항추진성능을 추정하는 데에는 통계해석 방법이 널리 쓰이고 있다. 여기서 통계해석은 모형시험 결과를 표본자료로 한 통계해석을 말한다. 실선의 저항추진성능을 추정하는 것이므로 실선 속력시운전 자료를 사용하는 것이 좋겠으나, 실선 속력시운전에서 정 확한 값을 얻는다는 것이 거의 불가능하므로 대부분 모형시험 값을 이용하곤 한다. 본 고에서는 기존에 발표된 여러 가지 도표와 회귀식을 요약하여 본 후, 표본자료를 이용하여 새로운 회귀 식을 만드는 과정을 소개하고자 한다.

  • PDF

토픽 모형을 이용한 텍스트 데이터의 단어 선택 (Feature selection for text data via topic modeling)

  • 장우솔;김예은;손원
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.739-754
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 변수를 포함하고 있으며 변수들 사이의 연관성도 높아 통계 분석의 정확성, 효율성 등에서 문제가 생길 수 있다. 이러한 문제점에 대처하기 위해 목표 변수가 주어진 지도 학습에서는 목표 변수를 잘 설명할 수 있는 단어들을 선택하여 이 단어들만 통계 분석에 이용하기도 한다. 반면, 비지도 학습에서는 목표 변수가 주어지지 않으므로 지도 학습에서와 같은 단어 선택 절차를 활용하기 어렵다. 이 연구에서는 토픽 모형을 이용하여 지도 학습에서의 목표 변수를 대신할 수 있는 토픽을 생성하고 각 토픽별로 연관성이 높은 단어들을 선택하는 단어 선택 절차를 제안한다. 제안된 절차를 실제 텍스트 데이터에 적용한 결과, 단어 선택 절차를 이용하면 많은 토픽에서 공통적으로 자주 등장하는 단어들을 제거함으로써 토픽을 더 명확하게 식별할 수 있었다. 또한, 군집 분석에 적용한 결과, 군집과 범주 사이에 높은 연관성을 가지는 군집 분석 결과를 얻을 수 있는 것으로 나타났다. 목표 변수에 대한 정보없이 토픽 모형을 이용하여 선택한 단어들을 분류 분석에 적용하였을 때 목표 변수를 이용하여 단어들을 선택한 경우와 비슷한 분류 정확성을 얻을 수 있음도 확인하였다.

어가경제조사 표본설계에 관한 연구 (A study on the sample design of the fishery household economy survey)

  • 김규성;전종우;박홍래
    • 응용통계연구
    • /
    • 제8권2호
    • /
    • pp.43-54
    • /
    • 1995
  • 어가경제조사는 우리나라 어가의 어가경제 및 어업경영에 관한 사항을 조사하는 통계조사이다. 본 연구는 어가경제통계를 생산할 수 있는 표본설계를 제안한다. 연구의 기초 자료로 1990년 어업총조사 자료를 이용하였으며, 시.도별 통계를 위하여 시.도를 부차 모집단으로 하여 설계를 하였다. 표본은 층화 2단 추출을 하였으며, 층화를 위하여 어가소득의 소득함수를 추정하여 이용하였다. 어가의 소득은 선형 추정량을 이용하여 추정하였다.

  • PDF

메타 데이타베이스와 관리기의 설계 및 구현-통계 데이타베이스를 중심으로 (The Design and Implementation of Meta database and manager)

  • 안성욱
    • 자연과학논문집
    • /
    • 제8권1호
    • /
    • pp.109-114
    • /
    • 1995
  • 통계 데이타베이스의 효율적 이용을 위해 통계 분석을 위한 요약 정보를 미리 계산하여 저장함으로써 사용자에게 빠른 응답시간내에 통계 정보를 제공하려는 요약 데이타베이스와 이의 효율적인 관리와 사용의 편리를 위한 메타 데이타베이스가 생성되고 관리되어야만 한다. 요약 데이타베이스를 효율적으로 이용한 통계 분석 작업의 환경과 사용자의 편이성을 지원하기 위하여 계층 구조 형태인 데이타 사전/디렉토리의 형태로 독립적으로 운영되는 메타 데이타베이스와 관리기의 설계 및 구현 작업과 이를 이용한 운영 방법 등이 제시되었다.

  • PDF

통계적 수정규칙을 이용한 한국어-중국어 단어정렬 개선방법 (Using Statistical Correction Rule to Improve Word Alignment)

  • 김장호;이금희;나휘동;김동일;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.231-236
    • /
    • 2009
  • 본 논문에서는 통계적으로 추출한 수정규칙을 이용하여 구 기반 한-중 통계기계번역 시스템(PBSMT)의 단어정렬 결과를 개선하는 방법을 제안한다. 논문에서 제안하는 수정규칙은 단어정렬의 결과를 사람이 만든 정답과 비교하여 통계적으로 추출하였다. 본 논문에서는 위에서 추출한 수정규칙을 이용하여 한-중 통계기계번역 시스템의 단어정렬의 결과에서 한국어 기능어(functional word)에 나타나는 오류를 수정함으로써 단어정렬의 결과를 개선하였고 최종적으로 기계번역의 성능을 제고하였다.

  • PDF

웹 상에서 자바와 데이터베이스를 이용한 통계정보시스템 -사례연구- (An implementation of statistical information system on the database interface using Java on the www)

  • 이경자;박희창;박진표
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권1호
    • /
    • pp.261-269
    • /
    • 1999
  • 정보통신 기술의 급격한 발전과 경영 환경의 변화는 기업업무의 근본적인 변화와 함께 컴퓨팅 환경도 사용자 중심의 정보시스템으로의 이행이 심화되고 있다. 특히, 클라이언트/서버 환경의 분산 컴퓨팅과 인터넷을 기반으로 한 정보시스템 구축은 기업경쟁력 강화와 새로운 부가가치 측면에서도 발상의 전환을 요구하고 있다. 본 논문에서는 단위별로 처리해야 할 다양하고 방대한 정보들을 통계처리하고 그래프를 이용해서 효율적으로 정보를 표현한다. 이를 위해 해마다 발간되는 창원시의 통계정보를 웹 상에서 자바와 오라클 데이터베이스를 이용해서 시스템을 구현하였다. 사용자는 보편적인 인터페이스인 웹을 통해 지역의 통계정보를 제공받을 수 있다.

  • PDF

공간자기회귀모형을 이용한 고속도로 교통사고 분석 (Traffic Accidents Analysis on Expressway using Spatial Autoregressive Model)

  • 강경우
    • 대한교통학회지
    • /
    • 제15권1호
    • /
    • pp.5-15
    • /
    • 1997
  • 공간통계분석은 공간적으로 연계된 변수들간의 관계를 분석하는 통계분야이다. 일 반적으로 공간적으로 연계된 변수들간의 관계는 각 변수간의 공간적 분포정도에 따라서 영 향을 받는다. 전통적인 통계 분석의 방법은 동질의 자료발생과정에 의하여 확률적으로 축출 된 표본자료를 가정하고 있으나, 공간적인 자료는 이와 같은 동질의 자료발생과정의 가정을 부정한다. 교통류 및 교통사고 등과 같은 교통분야의 자료는 대부분 공간적인 상관관계에 의하여 축출된 이질적인 표본자료이며 따라서 공간상관관계를 동질적으로 가정한 전통적인 통계적 분석 방법은 오류를 범할 수 있다. 본 논문은 공간적인 관계를 고려한 공간자기상관 분석기법을 이용하여 고속도로상의 교통사고에 관하여 분석하였다. 분석의 결과에 의하면 4 개 고속도로 중 경인고속도로를 제외한 3개의 고속도로상의 교통사고건수는 통계적으로 현 저한 양의 공간적 상관관계가 있음을 알 수 있었다. 이에 따라 공간적 상관관계를 고려한 교통사고분석을 위하여 종속변수로 단위구간별 교통사고건수를 그리고 설명변수로서는 단위 구간별 교통량, I.C. 유무 및 화물차량비율을 이용하여 공간 자기회귀분석을 시도하였다. 분 석의 분석에서는 구간별 교통량과 화물차량의 비율이 호남/남해 고속도로의 경우에는 구간 별 교통량과 I.C. 유무가 통계적으로 유의한 것으로 분석되었다.

  • PDF

EXCEL을 이용한 통계교육용 통계소프트웨어의 개발

  • 성병찬;송대건;조신섭
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2004년도 춘계학술대회
    • /
    • pp.79-82
    • /
    • 2004
  • 본 발표에서는 1998년 서울대학교 통계학과에서 개발한 KESS(Korean Educational Statistical System; http://stats.snu.ac.kr/time)의 추가로 개발된 내용을 소개하기로 한다 (조신섭 외, 1999). 추가로 개발된 모듈(module)들은 통계교육에서 필요로 하는 분석법들 중에서 회귀분석, 시계열분석과 연관된 내용들이다. 기존의 여러 가지 통계패키지와 비교해 보아 효율적인 통계교육을 위한 필수적인 옵션 및 분석 결과를 제공하도록 하였다.

  • PDF

AVL을 이용한 구간통행시간 산출기법 개발 (A new approach to estimate the link travel time by using AVL technology)

  • 김성인;이영호;남기효
    • 대한교통학회지
    • /
    • 제17권2호
    • /
    • pp.91-103
    • /
    • 1999
  • 이 연구는 자동 차량위치 측정기법(Automatic Vehicle Location, AVL)을 이용해서 수집한 교통상황자료를 가지고 구간 통행시간을 산출하는 알고리즘을 개발한다. AVL기법을 이용하는 경우, 처리해야 할 자료량이 많아서 실시간에 정보를 산출하는 것이 힘들다. 따라서 이 연구는 처리해야 할 자료량을 가능한 한 줄이고 자료량이 적은 경우에도 효율적인 구간통행시간을 산출하는 알고리즘을 제시한다. 이 연구의 방법론은 크게 4가지인데, 첫째, 해석 기법, 둘째, 회귀분석, 셋째, 인공지능 및 전문가 시스템, 넷째, 통계분석이다. 이 방법론을 이용해서 세 단계 알고리즘을 개발하는데, 첫째는 실시간 분석통계 알고리즘, 둘째는 과거자료분석 알고리즘, 셋째는 자료응합 알고리즘이다. 이 알고리즘 가운데 자료융합 알고리즘 결과가 산출하고자 하는 구간 통행시간이다. 실시간 분석통계 알고리즘은 연속하는 세 개 구간의 통행 패턴을 이용해서 가운데 구간의 통행시간을 산출하는 방법을 제시한다. 또 실시간 분석통계 알고리즘으로 산출하지 못한 구간은 인접구간 상관도 정보를 이용해서 구간통행시간을 추정한다. 과거자료분석 알고리즘은 회귀분석을 이용해서 시간대별 통행시간 평균과 분산을 구하고, 이 결과를 바탕으로 인접구간 상관도 정보를 오프라인으로 구하는 알고리즘이다. 자료융합 알고리즘은 2가지 단계를 거치는데, 그것은 실시간 자료융합과 최종 자료융합이다. 실시간 자료융합은 실시간에 가까운 자료원의 실시간 분석통계 알고리즘 결과 패턴과 인접구간 상관도 정보를 이용한 구간통행시간 추정 결과를 이용해서 패턴에 따라 다른 방법으로 융합을 하는 알고리즘을 개발한다. 최종 자료융합은 실시간 자료융합 결과와 회귀분석 결과의 패턴을 이용해서 구간 통행시간을 산출한다. 이 연구를 기존 연구와 비교할 때, 세 가지 독차성이 있다. 첫째는 연속하는 세 구간 통행 패턴을 분석하였기 때문에 기존의 노드의존 방식을 탈피하였다는 점이다. 따라서 자료량이 적은 경우도 믿을만한 통행시간을 산출할 수 있다는 것이다. 둘째는 인접구간 상관도 정보를 구간통행시간 산출에 이용하였기 때문에 자료를 효율적으로 이용할 수 있다는 점이다. 셋째는 자료원 패턴을 분류하고 전문가 시스템을 이용하여 자료융합 하였기 때문에 수행속도가 빠르고, 신뢰성있는 정보를 제공한다는 점이다. 이 연구는 개발한 알고리즘 정확도를 검증하기 위해서 두 가지 검증방법을 이용하였다. 첫째는 시뮬레이션을 이용한 것이고, 둘째는 실제 주행조사 분석을 이용한 것이다. 두 가지 검증 결과는 알고리즘 정확도를 보여준다.

  • PDF