• 제목/요약/키워드: 통계구축

검색결과 1,531건 처리시간 0.027초

말뭉치 자동 확장을 통한 SMT 성능 향상에 대한 연구 (Research about SMT Performance Improvement Through Automatic Corpus Expansion)

  • 최규현;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.296-299
    • /
    • 2016
  • 현재 자동번역에는 통계적 방법에 속하는 통계기반 자동번역 시스템(SMT)이 많이 사용되고 있지만, 학습 데이터로 사용되는 대용량의 병렬 말뭉치를 수동으로 구축하는데 어려움이 있다. 본 연구의 목적은 통계기반 자동번역의 성능을 향상시키기 위해 기존 다른 언어쌍의 말뭉치와 SMT 자동번역 기술을 이용하여 대상이 되는 언어쌍의 SMT 병렬 말뭉치를 자동으로 확장하는 방법을 제안한다. 제안 방법은 서로 다른 언어 B와 C의 병렬 말뭉치를 얻기 위해, A와 B의 SMT 자동번역 시스템을 구축하고 기존의 A-C 말뭉치의 A를 SMT를 통해 B로 번역하여 B와 C의 말뭉치를 자동으로 확장한다. 실험을 통해 확장한 병렬 말뭉치가 통계기반 자동번역 시스템의 성능을 향상시킬 수 있음을 확인한다.

  • PDF

다변량 정규성과 이상치 검정을 위한 통계 시스템 개발 (Development of Statistical System for Checking Multivariate Normality and Outliers)

  • 최용석;김종건;강명래
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.223-231
    • /
    • 2001
  • 다변량분석 기법을 위해서는 자료가 정규성(normality)가정을 만족해야한다. 본 연구에서는 GUI환경에서 일변량 및 다변량자료의 정규성검정, 이상치제거 및 변수변환을 하는 시스템을 Visual Basic 언어로서 구축하여 사용자들이 보다 편리하게 사용할 수 있음을 소개 하고자 한다.

  • PDF

마이크로타겟의 구축과 그 활용

  • 최종후;서문택;박정윤
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.219-222
    • /
    • 2003
  • 본 연구는 2000년 인구주택총조사에 기반하여, 국내 3,516개 읍면동 단위의 소지역을 마케팅 의사결정 활용의 관점에서, 유사한 인구${\cdot}$사회${\cdot}$경제${\cdot}$소비행태를 가지는 26개의 마이크로타겟(Micro Target) 군집으로 구축하는데 그 초점을 두고 있다. 마이크로타겟 군집은 고객분류, 상권분석, 광고전략 수립, 타겟마케팅(Target Marketing)등의 마케팅 의사결정과 마케팅 전략수립에 있어 핵심적 요건으로 기능하게 된다.

  • PDF

표준 기반의 통계지리정보 참조모렐 개발에 관한 연구 (A study on the reference model for statistical geographic information system based on the GIS standards)

  • 하수욱;남광우;류근호
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 춘계학술대회
    • /
    • pp.258-260
    • /
    • 2010
  • 통계지리정보는 기존의 텍스트 기반 통계정보를 공간정보와 결합한 정보로서 공공 민간 분야의 다양한 의사결정을 위한 핵심 기반 정보로 그 활용성이 주목받고 있다. 본 논문은 통계지리 정보와 이를 이용한 서비스 구축 및 유지 관리 과정에서 발생하는 상호운용성 문제의 해결을 위한 접근방법으로 기존의 공간정보 표준 참조 모델들을 기반으로 통계지리 정보 및 서비스 참조모델을 제안하고, 각각의 정보 및 서비스 분류에 해당하는 표준화 요구사항을 제시한다.

  • PDF

관광통계 프로세스 설계 지원 도구 개발에 관한 연구 (A Study on the Development of Supporting Tool for Tourism Statistics Process Design)

  • 한경진
    • 한국콘텐츠학회논문지
    • /
    • 제4권3호
    • /
    • pp.1-11
    • /
    • 2004
  • 본 연구는 관광통계 프로세스 설계 지원 도구 개발을 통하여 업무 프로세스를 설계하고, 시스템을 구축함으로써, 관광통계를 체계적이고, 통합적으로 관리할 수 있도록 하고 관광개발계획 의사결정 지원도구로 활용하는데 목적이 있다. 이러한 목표하에 정보공급자, 정보생산자, 정보활용자의 3가지 요소로 이루어진 관광통계 프로세스 설계 지원 도구를 개발하였다. 이러한 프로세스 설계 지원 도구는 기존의 개발계획지표가 관광 관련 정책결정 및 개발계획수립에 효율적의 활용될 수 있도록 업무프로세스를 개선하고 시스템 구조를 합리화시킬 수 있다. 프로세스 설계 지원 도구를 활용하여,49개의 업무 프로세스를 설계하였고, 외부 기관과 연계되는 합리적인 데이터베이스를 설계하여, 관광통계정보시스템을 구축하였다. 그 결과 관광개발계획 수립시, 보다 합리적인 의사결정을 지원할 수 있게 되었다.

  • PDF

버스정보시스템(BIS) 운행데이터를 이용한 실시간 지체시간 산정모형 구축 (A Study on the Estimate Real Time Delay Model using BIS Data)

  • 이영우;권혁준
    • 한국ITS학회 논문지
    • /
    • 제10권5호
    • /
    • pp.14-22
    • /
    • 2011
  • 본 연구는 버스정보시스템(BIS)의 운행데이터를 이용하여 신호교차로에서의 지체시간을 추정하기 위한 연구이다. 기존의 버스시스템에 첨단정보통신 기술을 접목한 BIS는 많은 지방자치단체에서 구축하여 운영 중에 있다. 그러나 기존에 구축된 BIS의 운영을 통해 실시간으로 수집되고 있는 운행데이터의 활용은 활발히 이루어지지 못하고 있다. 본 연구에서는 BIS 운행데이터를 이용하여 실시간으로 지체시간을 산정하여 도시교통관리, 교통정보를 제공에 활용하기 위한 기초적인 연구를 수행하고자 하였다. VISSIM 5.20을 활용하여 시뮬레이션 모형을 구축하였으며 버스정류장에서의 서비스 시간을 제외한 버스 통행시간과 일반차량 지체시간 간의 상관관계가 유의한 것으로 분석되어 거시적 통계모형인 회귀모형으로 구축하여 분석한 결과 직선회귀모형의 결정계수가 0.826으로 가장 높게 나타났다. 구축된 모형을 통계적으로 검증하기 위하여 현장조사 값과 모형추정 값으로 T-test를 실시한 결과 95% 신뢰수준에서 통계적으로 유의한 것으로 분석되었다.

행정구역기반 환경지리정보시스템 구축방안 (The Building of the Environmental and Geographic Information System Based upon the Administrative Boundary)

  • 조덕호;배민기
    • 한국지리정보학회지
    • /
    • 제8권1호
    • /
    • pp.96-113
    • /
    • 2005
  • 본 연구의 목적은 환경통계자료와 지리정보체계가 통합되지 않음으로 발생하는 문제점을 해결하기 위해 경상북도 안동시를 사례로 행정구역기반 환경지리정보체계를 구축하는 것이다. 이를 위해 본 연구는 국가지리정보체계, 환경주제도, 환경통계자료의 특성을 고찰한 후, 지역의 환경주제도와 환경통계자료에 행정구역코드를 부여하여 행정구역기반 환경지리정보체계 구축 방안을 제시하였다. 본 연구결과는 지역 환경정책수립을 위한 기초자료를 제공하며, 환경정책의 결과를 지역행정구역별로 표시할 수 있기 때문에 정책의 효과를 쉽게 파악할 수 있게 된다. 또한 환경정보뿐만 아니라 다른 지역속성정보에 지리참조코드를 부여할 수 있는 방안을 제시하기 때문에 지방자치단체의 환경관리시스템 개선뿐만 아니라 다른 속성정보의 데이터베이스 구축에도 기여할 수 있을 것이다.

  • PDF

대용량 전자사전 구축을 위한 국어 대사전의 통계 정보 (Statistical Information of Korean Dictionary to Construct an Enormous Electronic Dictionary)

  • 김철수;김양범
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.60-68
    • /
    • 2007
  • 언어 정보 처리 응용 분야는 정보검색, 형태소분석, 철자검색, 음성인식, 문자 인식 등 다양하다. 이러한 정보처리 과정은 전자 사전이 필수적이다. 본 논문에서는 국어대사전에 대한 기본적인 통계 정보들을 살펴보고, 전자사전 구축에 대하여 알아보았다. 대상 정보는 고어 및 불완전음절을 포함하는 단어를 제외한 표제어들에 대하여, 대사전의 표제어수, 전자사전의 엔트리수, 사용된 전체음절수, 서로 다른 음절수, 엔트리들의 평균 길이, 품사별 분포, 전자사전을 트라이로 구축할 때 사용되는 노드 수 등 이다. 전자사전의 전체 엔트리 수는 361,980개, 사용된 음절수는 1,289,659개로 엔트리들의 평균 길이는 3.56이었으며 서로 다른 음절수는 2,463개였다. 이러한 통계 정보들은 전자사전 구축 및 한국어 정보처리에 도움이 될 것이다.