• 제목/요약/키워드: 이용통계

검색결과 12,084건 처리시간 0.036초

카이제곱 통계량을 이용한 이슈 단어 추출 (Issue Word Extraction Using Chi-square Statistics)

  • 신준수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-227
    • /
    • 2014
  • 최근 온라인 뉴스는 대중의 관심사 및 트렌드에 따라서 다양한 종류의 기사들이 작성된다. 이러한 관심사 및 트렌드는 시간의 흐름에 따라 계속 변한다. 본 논문에서는 온라인 뉴스의 기사 제목을 이용하여 시간에 따라 변하는 관심사 및 트렌드와 관련된 단어를 추출하는 방법을 제안한다. 특정 기간 별 출현하는 뉴스들을 하나의 카테고리로 가정하고 자질 선택 방법에서 널리 사용되는 카이제곱 통계량을 이용하여 각 카테고리의 주요 단어를 추출한다. 실험 결과 특정 기간 별 관심사 및 트렌드와 관련된 단어들이 출현하는 것을 확인하였다.

  • PDF

지구통계학적 시뮬레이션을 이용한 지화학 자료의 공간통합에서의 불확실성 추정

  • 박노욱;지광훈;권병두
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2006년도 춘계학술발표회 논문집
    • /
    • pp.213-218
    • /
    • 2006
  • 이 논문에서는 지구통계학적 시뮬레이션을 이용하여 자료 표현에서의 불확실성이 최종적인 공간통합에 미치는 영향을 정량적으로 분석하고자 하였다. 광물자원 탐사를 위한 공간통합 사례연구를 통해 시뮬레이션 결과에 따라 예측 능력의 차이가 나타남을 확인 할 수 있었으며, 결론적으로 지구통계학적 시뮬레이션이 공간 자료의 불확실성 모델링에 효율적으로 이용될 수 있을 것으로 판단된다.

  • PDF

기초 통계량을 이용한 저작자 진위 추론

  • 이근무;이근우
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.69-73
    • /
    • 2001
  • 이 논문에서 문장특성을 파악하는 방법으로 주로 이용한 것은 특정문자의 출현율이다. 어떤 사람이나 그 글 속에는 자신의 개성이 들어있다. 문장의 길이를 비롯하여 문장의 구조나 어휘량, 유의어 중에서 선호하는 글자, 평서문이나 의문문의 사용, 품사의 사용, 문두나 문말에 오는 글자 등에서 각각의 개성이 드러난다. 그 중에서도 접속사나 조사, 접두어, 접미어 등 상대적으로 의미적인 요소보다는 형식적인 요소에 가까운 영역에서 문장의 특성이 두드러지는 것으로 보고되어 있다, 이런 특징을 이용하여 화랑세기의 저작자의 진위를 추론하고자 한다.

  • PDF

통계 정보를 이용한 한국어 자동 띄어쓰기 시스템의 성능 개선 (Improving Korean Word-Spacing System Using Stochastic Information)

  • 최성자;강미영;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.883-885
    • /
    • 2004
  • 본 논문은 대용량 말뭉치로부터 어절 unigram과 음절 bigram 통계 정보를 추출하여 구축한 한국어 자동 띄어쓰기 시스템의 성능을 개선하는 방법을 제안한다 어절 통계를 주로 이용하는 기법으로 한국어 문서를 처리할 때, 한국어의 교착어적인 특성으로 인해 자료부족 문제가 발생한다 이물 극복하기 위해서 본 논문은 음절 bigram간 띄어쓸 확률 정보를 이용함으로써 어절로 인식 가능한 추가의 후보 어절을 추정하는 방법을 제안한다. 이와 글이 개선된 시스템의 성능을 다양한 실험 데이터를 사용하여 평가한 결과, 평균 93.76%의 어절 단위 정확도를 얻었다.

  • PDF

공간통계량을 활용한 베이지안 자기 포아송 모형을 이용한 소지역 통계 (Small Area Estimation Using Bayesian Auto Poisson Model with Spatial Statistics)

  • 이상은
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.421-430
    • /
    • 2006
  • 표본조사에서는 일반적으로 지형학적 범위가 넓거나 흔히 우리가 알고 있는 지형적 범위 즉시 또는 도 단위로 표본설계가 이루어진다. 그러므로 지형학적 범위가 작은 소지역은 충분한 표본의 확보가 불가능하며 따라서 정확한 소지역 통계를 얻는 것은 매우 어렵다. 이러한 문제로 정확한 소지역 통계를 얻기 위한 연구가 활발히 진행되고 있다. 최근 신기일과 이상은(2003)은 공간통계 모형을 이용한 소지역 추정을 연구하였다. 본 논문은 신기일과 이상은(2003)의 공간자기회귀(Spatial Autoregressive: SAR) 모형을 확장한 모형인 베이지안 자기 포아송 모형 (Bayesian Auto-Poisson Model: BAPM)을 이용한 소지역 추정에 관하여 연구하였다. 분석에 사용된 자료는 호주의 1998년 장애인 통계 (Survey of Disability, Aging and Cares:SDAC)이 며 MSE, MB 그러고 회귀 분석을 이용한 편의 분석기법이 비교에 사용되었다.

가이드 맵과 인터랙티브 시각화를 이용한 의료 통계분석 시스템 (A System for Medical Statistical Analysis Using Guide Maps and Interactive Visualization)

  • 이돈수;최수미
    • 한국멀티미디어학회논문지
    • /
    • 제8권7호
    • /
    • pp.1000-1011
    • /
    • 2005
  • 본 논문에서는 통계에 대한 지식이 부족한 임상 의학자들이 보다 쉽고 정확하게 데이터를 분석할 수 있도록 표본 데이터의 분포에 따라 적절한 분석 방법을 제시해주고, 분석 과정을 아이콘들의 트리로 구성한 가이드맵을 제공하는 의료 통계분석 시스템을 개발하였다. 개 발 시스템은 일반적으로 활용되는 통계 방법, 반복측정자료에 활용되는 통계 방법, 생존분석 등 의료 분야에서 자주 사용되는 분석법들을 포함하고 있다. 또한 3차원 글리프를 이용하여 결과를 인터랙티브하게 보여주고, 불확실성을 시각화함으로써 분석된 결과를 더욱 쉽게 이해할 수 있도록 하였다.

  • PDF

Confounder를 고려한 3단계의 logistic regression model을 통한 노인인구에 있어서의 치주질환과 뇌경색 경험 유무와의 상관관계에 대한 연구 (Relationship between periodontal disease and stroke history in the geriatric population - Using logistic regression model with 3-step adjustment considering effect of confounder)

  • 이효정
    • 대한치과의사협회지
    • /
    • 제44권10호통권449호
    • /
    • pp.658-670
    • /
    • 2006
  • 1980년대 후반기부터 치주질환과 뇌경색(ischemic stroke)자료의 연관성을 모색하는 시도가 있어왔다. 이번 연구의 목적은 치주질환과 뇌경색 유무와의 어떤 관계가 있는지를 60세 이상의 노인을 대상으로 조사, 통계 분석하였다. 자료는 미국의 총 국민조사 격인 The Third Nation Health and Nutrition Examination Survey (NHANES III)를 이용하였다. 이번 연구에서 unadjusted logistic model 통계법을 이용하여 치아 상실수와 뇌경색 경험이 통계학적으로 유의한 수치의 상관성이 있음을 알게 되었다. 또한 나이와 흡연유무를 고려, 조정한 후 multiple logistic model 통계법으로 잔존치아가 적을수록 더욱 뇌경색에 걸릴 확률이 높음을 보였다. 그러나 두 질병에 동시에 선택된 중요한 위험인자 (risk factor)를 모두 고려, 조정 한 후에는 통계학적인 유의성을 찾지 못했다. 치은퇴축, 치주낭 깊이, 치석, 탐침시 출혈과 뇌경색 경험은 각각의 비교법에서 약간의 상관성을 보이나, 모든 통계법을 통해 일괄된 결과를 얻을 수는 없었다.

  • PDF

통계 조사의 환경과 전망 (Current Situation of Statistical Surveys in Korea Its Prospects)

  • 이계오
    • 한국조사연구학회지:조사연구
    • /
    • 제1권1호
    • /
    • pp.1-19
    • /
    • 2000
  • 정보화와 지방화 시대에서 통계 이용 실태와 문제점을 요약하고 컴퓨터를 이용한 통계 조사의 발달 과정을 살펴보았다. 앞으로도 도래할 인터넷 시대에서 전화 조사에 대체될 인터넷 조사의 특징과 발전 방안을 알아보았고 지방화 시대에서 필요한 지역 통계의 생산 기법으로 소지역 추정법을 소개하였으며, 다양한 학문 분야에서 통계 활용촉진과 혼란을 방지하기 위해서 통계의 표준화 방안을 제시하였다.

  • PDF

통계계산에서의 갱신 알고리즘에 관한 연구 (Updating algorithms in statistical computations)

  • 전홍석
    • 응용통계연구
    • /
    • 제5권2호
    • /
    • pp.283-292
    • /
    • 1992
  • 개인용 컴퓨터의 보급이 급격히 늘어남에 따라 자료의 통계분석에 개인용 컴퓨터가 많이 이용되고 있다. 컴퓨터의 하드웨어가 하루가 다르게 발전하고 있음으로 웬만큼 많은 양의 자료를 분석하는 데에는 컴퓨터의 기억용량이나 처리속도등이 문제되지는 않는다. 자료가 축차적(sequentially)으로 주어질 때 어떤 통계량을 계산하기 위하여 매번 전체 자료를 다시 읽어야 한다면 이는 번거로운 작업이 될 것이며 기억용량의 낭비임에 틀림없다. 이러한 문제점을 S/W 적인 입장에서 해결하고자 하는 노력이 바로 갱신 알고리즘(Updating Algorithm)이다. 이 연구에서는 몇가지 통계량에 대한 갱신 알고리즘들을 알아보고 그들의 특성을 밝힘으로써 소형 및 개인용 컴퓨터를 이용하여서도 많은 양의 자료분석이 가능하도록 하고자 한다.

  • PDF

양쪽중단된 지수분포의 모수와 신뢰도에 대한 계층적 베이즈추정 (Hierarchical Bayes Estimation of Parameter and Reliability Function in Doubly Censored Exponential Distribution)

  • 조장식;강상길
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.405-414
    • /
    • 1999
  • 양쪽중단(doubly censored)된 지수분포에서 모수와 신뢰도함수를 계층적 베이지안(hierarchical Bayesian)방법을 이용하여 추정하였다. 베이즈 계산은 깁스표본기법(Gibbs sampler)을 이용하고 또한 완전조건부 분포(full conditional distribution)의 정량화 상수를 모르는 경우에는 적합기각방법(adaptive rejection sampling)을 이용하였다. 그리고 실제자료를 이용하여 분석을 하였다.

  • PDF