• Title/Summary/Keyword: 통계 처리

검색결과 3,103건 처리시간 0.031초

대화처리를 위한 통계기반 한국어 음성언어이해 시스템 (Statistical Korean Spoken Language Understanding System for Dialog Processing)

  • 노윤형;양성일;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-218
    • /
    • 2012
  • 본 논문에서는 한국어 대화 처리를 위한 통계기반 음성언어이해 시스템에 대해 기술한다. 음성언어이해시스템은 대화처리에서 음성 인식된 문장으로부터 사용자의 의도를 인식하여 의미표현으로 표현하는 기능을 담당한다. 한국어의 특성을 반영한 실용적인 음성언어이해 시스템을 위해서 강건성과 적용성, 확장성 등이 요구된다. 이를 위해 본 시스템은 음성언어의 특성상 구조분석을 하지 않고, 마이닝 기법을 이용하여 사용자 의도 표현을 생성하는 방식을 취하고 있다. 또한 한국어에서 나타나는 특징들에 대한 처리를 위해 자질 추가 및 점규화 처리 등을 수행하였다. 정보서비스용 대화처리 시스템을 대상으로 개발되고 있고, 차량 정보서비스용 학습 코퍼스를 대상으로 실험을 하여 문장단위 정확률로 약 89%의 성능을 보이고 있다.

  • PDF

데이터 스트림에서 다중 연속질의의 선택 조건에 대한 실행 순서 결정 (Run-time Evaluation of Selection Predicates in Multiple Continuous Queries over Data Streams)

  • 윤은원;이원석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.25-28
    • /
    • 2007
  • 무한히 연속적으로 발생하는 데이터 스트림에서의 연속 질의 처리는 빠른 처리 시간과 적은 메모리 사용량을 요구한다. 이런 제약 사항을 만족하기 위해 연속 질의의 선택 조건절에 사용된 같은 속성들로 그룹화하여 해당 속성들을 처리함으로써 빠르게 질의를 처리할 수 있다. 그리고 더 효율적으로 질의를 처리하기 위해 초기에 일정 기간 동안 데이터 스트림에 대한 통계 정보를 수집한다. 실행 시 통계 정보를 수집하는 이유는 데이터 스트림의 특성을 예측할 수 없기 때문에 데이터 특성에 대한 정보를 수집하고 수집된 정보를 가지고 가장 좋은 질의 처리 순서를 결정함으로 써 전체적인 질의 처리 성능을 향상 시킬 수 있고 실험을 통해 이를 검증한다.

  • PDF

통계계산분야의 현재와 미래

  • 김병천
    • Journal of the Korean Statistical Society
    • /
    • 제20권
    • /
    • pp.105-110
    • /
    • 1991
  • 통계계산, Statistical Computing, 또는 Numerical Computation for Statistics라고 불리우는 통계의 한 분야는 컴퓨터 산업에 의한 제3의 산업혁명이 일고 있는 현대에서 매우 중요한 위치를 차지하고 있음은 두말 할 것도 없다. 특히 통계학이 컴퓨터가 발전하면서 더욱 더 학문적 발전에 박차를 가하고 있다는 것도 의심할 여지가 없다. 통계가 다루는 데이터는 적은 양으로부터 방대한 양을 다루고 있기 때문에 컴퓨터는 필수불가결한 파트너가 되었다. 1980년 초반에 16비트 컴퓨터가 개발되면서, 통계를 처리하는 장소가 전자계산소로부터 사무실로 옮겨 오기 시작했고, 최근에는 70MIPS이상의 속도를 갖고 있는 탁상용 Workstation이 개발되어 통계학자들의 마음을 설레게 하고 있다. 또한 대량의 데이터를 저장할 수 있는 Laser Compact Disk들이 개발되어 통계분야 및 통계계산분야의 발전에 기대가 더 모아지게 되었다. 그러면 컴퓨터가 발전되고 있는데 왜 통계계산분야의 발전이 필요하며, 현재까지 통계계산분야는 어느 단계까지 와 있으며, 미래를 위한 통계계산분야는 어떻게 변화할 것인지를 한국의 실정에 기초를 두고 논해 보고자 한다.

  • PDF

제주 버스 환승지점 추천 서비스 설계 (Design of a recommendation service for transfer locations in Jeju bus system.)

  • 변세정;김지환;강민주;이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.526-527
    • /
    • 2020
  • 본 연구는 대중교통 활용도를 높이고자 효율적인 버스 환승지 추천 서비스를 설계한다. 제주데이터 허브에서 입수한 승하차데이터를 처리하여 승객수와 버스의 정류장 도착시간 등을 예측함은 물론 인터넷 연결을 통해 버스정보시스템과 연동하여 현재의 교통상황을 실시간으로 입수하여 효율적인 환승지를 추천한다. 승객은 변동되는 교통상황에 따라 이동중에도 더 좋은 환승 노선으로 변경할 수 있으며 데이터센터 관점에서는 축적되고 있는 버스 데이터의 활용도도 높일 수 있다.

인공신경망에 기반한 제주시 신재생 에너지 발전량 예측 모델 (A forecast model of renewable energy generation based on artificial neural networks in Jeju city)

  • 강민주;변세정;김지환;이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.583-584
    • /
    • 2020
  • 본 논문은 신재생에너지와 전기자동차의 보급이 활발한 제주시에서 태양광 발전량과 기후변화 기록들을 활용할 수 있는 데이터처리 프레임워크를 구축하고 인공신경망으로 태양광 발전량 예측모델을 구축한다. 이 인공신경망 모델은 일조시간, 일사량, 전운량 등을 입력 노드로 설정하고 일별 생산량을 출력 노드로 설정한다. 가장 상관관계가 높은 발전기 3개에서 학습 패턴을 추출하였으며, 모든 대상 발전기에 대해 최대 평균 오류율은 평균 36.7 %를 보이고 있다.

전기자동차 충전기록 데이터 처리에 관한 연구 (A study on data processing of electric vehicle charging archives)

  • 황윤영;진효정;김소연;이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.337-338
    • /
    • 2022
  • 본 논문에서는 환경공단이 제공하는 전기자동차 충전기의 운영기록 분석하는 과정에서 주기적으로 공개 데이터를 수집하여 지역 데이터베이스에 저장하고 데이터의 오류를 정제하는 방안에 대해 연구한다. 전력시스템 부하에 직접적으로 영향을 주는 급속충전기 운영기록만을 추출하고 날짜필드에서의 오류 혹은 역전을 포함하는 트랜잭션을 제거한 후 일차적으로 충전시간길이를 히스토그램으로 분석한다. 대부분의 충전이 20분 이내에 완료되었지만 23%는 충전완료 후에도 충전기에서 플러그를 제거하지 않은 것으로 보인다.

텔레매틱스 네트워크에서 노변-차량 통신방식 분석에 관한 연구 (A Study on the Analysis of Roadside-Vehicle Communication on the Telematics Network)

  • 이정훈;홍영신;박경린
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.816-817
    • /
    • 2008
  • 본 논문은 제주 택시 텔레매틱스 시스템에 축적되고 있는 택시들의 실제 이동 히스토리 정보를 이용하여 노변-차량 네트워크를 설계하는데 필요한 통신 분석기를 구현한다. 구현된 분석기는 지도처리, 좌표변환, 거리 환산 등 기본적인 사용자 인터페이스와 함께, DSRC 프로토콜에 따르는 전송 거리 등과 같이 노변-차량 통신에 있어서의 분석에 필요한 환경인자를 설정할 수 있다. 히스토리에 포함된 이동객체 위치 정보를 기반으로 현재의 RSU 배치에 대해 연결성을 계산함은 물론 각 객체의 시간적인 이동에 따라 객체들이 RSU에 연결되는 시간과 연결이 불가능한 시간 간격 등을 측정하여 현재의 배치가 시스템의 요구사항에 부합하는지 결정할 수 있다. 결국, 본 시스템은 RSU 들간의 연결성을 실제 데이터를 기반으로 분석할 수 있도록 하여 설계자로 하여금 효율적인 RSU 배치, 연결성 예측, 추후계획 등을 가능하게 한다.

온라인 시스템에 의한 난류의 통계학적 해석력법

  • 노병준;;최유진
    • 기계저널
    • /
    • 제25권3호
    • /
    • pp.216-224
    • /
    • 1985
  • 최근에는 온라인 시스템(on-line system)에 의하여 난류의 신호를 직접 신호분석기에서 받아 분석하여 컴퓨터에 의해 데이터를 처리하고, 풀롯터(plotter)에 의해 도시함으로서 유동의 특성을 통계학적인 방법으로 해석해 나가고 있다. 본 해설에서는 온라인시스템에 의한 난류의 통계 학적 측정방법과 기본적인 이론 및 측정도시에 예를 제시하고자 한다.

  • PDF

반복이 없는 이원배치에서 분포의 동일성 검정에 대한 비모수적 검정법

  • 이기훈
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.765-774
    • /
    • 1997
  • 본 논문에서는 반복이 없는 이원배치에서 교호작용의 존재를 가정하고 처리수준간의 모집단 분포의 동일성을 검정하는 비모수적 검정법을 제안하였다. 검정통계량의 구성을 위하여 순위벡터를 그 구조의 형태별로 정리한 순위위치벡터를 제안하고, 이의 특성과 응용가능성을 연구하였다. 또한 모의 검정력 연구를 통하여 기존의 비모수적 방법이 갖는 약점과 제안한 통계량의 우수함을 실증하였다.

  • PDF

Tests for equivalence/non-inferiority based on odds ratio in matched-pair design

  • 고혜정;이재원
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.319-324
    • /
    • 2003
  • 본 논문에서는 matched-pair design에서의 두 처리간 동등성/ 비열등성 검정에 대해 고려하였다. 기존에 비율차이나 risk ratio관점에서 동등성/비열등성 검정을 시행한 것과는 달리, 본 논문에서는 odds ratio에 기초하여 두 가지 검정통계량을 유도하였다. (1) constrained maximum likelihood estimator(mle)를 이용한 fieller type 통계량 (2) 제약없이 구한 mle를 사용한 wald-type 통계량). 비율 차이나 risk ratio에 기초한 기존의 통계적 방법들(비율차이에 근거한 (3) score-type 통계량과 (4) wald-type 통계량, risk ratio에 기초한 (5) fieller-type 통계량과 (6) wald-type 통계량)과 본 논문에서 제시한 두가지 통계량의 성능을 비교하기 위해 모의실험을 시행하였다. 모의실험 결과, 본 논문에서 제안한 constrained mle를 사용한 fieller type 통계량은 empirical type I error 측면에서 매우 만족스러운 결과를 보이고 있으며, 특히 비대각 셀의 확률이 작아질 경우에도 안정적인 성능을 보여준다.

  • PDF