• 제목/요약/키워드: 사전확률

검색결과 416건 처리시간 0.031초

다양한 지식을 사용한 영한 기계번역에서의 대역어 선택 (Target Word Selection for English-Korean Machine Translation System using Multiple Knowledge)

  • 이기영;김한우
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.75-86
    • /
    • 2006
  • 일반적으로 영어를 한국어로 번역할 때, 대부분의 영어 명사 어휘들은 해당 어휘가 사용되는 문맥에 따라 다양한 한국어 명사로 번역될 수 있다. 따라서 영어 원문이 갖는 의미를 손실 없이 번역문으로 전달하기 위해서는 문맥에 맞는 올바른 한국어 대역어를 선택할 수 있어야 한다. 본 논문에서는 동사구패턴, 공기 정보에 기반한 의미벡터, 공기 품사 정보 및 한국어 문맥 통계 정보 등의 다양한 지식을 사용하여 영어 명사 어휘의 대역어를 올바로 선택하는 방안을 제공한다. 동사구 패턴은 사전과 코퍼스를 사용하여 구축되었으며, 의미 벡터는 영어 어휘가 특정 한국어 어휘로 번역될 때 공기하는 정보들의 조건부 확률을 나타낸다. 한국어 문맥 통계 정보는 한국어 코퍼스로부터 추출된 N-그램 정보를 나타내며, 품사 공기 정보는 대역어 선택 모호성을 지니는 영어 어휘와 통계적으로 깊은 관련성을 지니는 품사를 나타낸다. 마지막으로 본 논문에서 제안한 대역어 선택 모호성 해소 방안을 평가하기 위한 실험을 수행하였으며, 실험 결과, 제안하는 방법이 기존의 방법보다 성능이 좋다는 것을 확인할 수 있었다.

  • PDF

이동통신 시스템에서 입력 메시지 분리제어 방식을 통한 제어국의 성능 개선 (Performance Improvement of Base Station Controller using Separation Control Method of Input Messages for Mobile Communication Systems)

  • 원종권;박우구;이상호
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.1058-1070
    • /
    • 1999
  • 이 논문은 이동통신 시스템의 제어국에 순간적으로 가해지는 다량의 입력 메시지에 대하여 효율적이고 신뢰성 있는 제어를 위하여 입력 메시지를 메시지 특성에 따라 분리한 다음 다중 프로세서를 사용하여 제어하는 모델을 제안한다. 제안 모델의 성능 개선에 필요한 요소들의 특성을 사전에 파악하기 위하여 M/M/c/K 큐잉 모델을 이용한다. 이 결과를 토대로 SLAM II를 이용한 시뮬레이션에 의해 입력 메시지에 대한 손실확률, 큐의 평균점유 길이의 분포, 프로세서 관리기(서버)의 점유율, 큐에서의 평균 대기 시간에 대하여 제안 모델과 기존 모델의 성능을 비교한다. 또한 과도한 입력 메시지로 인하여 과부하가 발생할 경우 두 입력 메시지에 대한 부하 제어 기능을 추가한 모델을 제안하고, 시뮬레이션에 의해 성능을 분석한다.

  • PDF

북한 지역에서의 30년 동안의 평균 바람 지도

  • 서은경;윤준희;박영산
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2010년도 춘계학술발표회 논문집
    • /
    • pp.79-79
    • /
    • 2010
  • 이 연구는 북한지역의 풍력 자원을 조사하기 위한 사전 연구로 30년간의 북한 지역의 27개 지상 관측소의 풍속 (고도 10 m)을 수집하였다. 이 풍속을 고도 50 m로 환산하였으며, 풍속의 확률밀도함수를 Weibull 함수로 가정하여 분석하였다. 30년 동안의 지상 관측 자료를 바탕으로 볼 때, 대체적으로 황해도 해안지역과 개마고원지역에서 평균 풍속이 북한 전역에서의 평균 풍속 4.0 m/s 보다 큰 지역이 나타났다. 따라서, 해안지역에서 바람 자원이 풍부함을 알 수 있었다. 지역의 차이는 있으나, 봄철 동안의 주풍은 북서풍과 남풍계열이 대등하게 나타나고 있으며, 여름은 남풍계열의 바람이 주풍으로 변하며, 가을과 겨울 동안 북서풍 계열이 주된 바람이었다. 고도 80 m 에서 풍속이 5 m/s 이상 지속되는 기간이 연간 30% 이상인 주요 6지점 중 장진을 제외한 나머지 네 곳은 해안에 위치함을 알 수 있다. 북한 지역 내륙의 중심부인 장진에서 연간 평균풍속 4.7 m/s 이상으로 관측 되었다. 이 지역은 개마고원 일대로 낭림산맥과 함경산맥의 두줄기가 만나는 곳으로 산맥에 의해 뒤쪽이 막혀있어 바람이 집중되어 높은 풍속을 나타낸 것으로 보인다. 또한 이 지역은 고원지대에 위치하여 북쪽에서 고도 1 km 이상에서 강하게 불어오는 북서풍의 영향으로 풍속이 높게 나타나는 것으로 보인다. 이 연구에서 사용한 관측자료는 단순히 지상의 풍속과 풍력으로만 분석한 것이므로 몇 가지 제약성을 가지고 있어 추후 보강이 필요하다. 관측지점의 지리적 위치나 주변의 환경에 따라 풍황의 변화가 크게 달라질 수 있으므로, 북한의 지형적인 요인을 고려한 정확한 실측을 통해 정확도를 높이는 풍력 자원 조사가 뒷받침 되어야 한다. 이 연구의 가치는 30년간의 바람 자료를 이용하였기 때문에 북한 지역에서의 풍황을 보는데 중요한 정성적 자료로 쓰여질 수 있으리라 본다. 또한, 이 자료를 바탕으로 풍력에너지 발전의 후보지 선정에 유용하게 활용되기를 기대하며, 더 나아가 두 나라 간에 에너지 교류가 활발히 이루어지기를 바란다.

  • PDF

군집분석과 베이지안 학습을 이용한 웹 도서 동적 추천 시스템 (Dynamic Recommendation System for a Web Library by Using Cluster Analysis and Bayesian Learning)

  • 최준혁;김대수;임기욱
    • 한국지능시스템학회논문지
    • /
    • 제12권5호
    • /
    • pp.385-392
    • /
    • 2002
  • 기존의 동적 추천 시스템에서 사용하는 개인화 기법은 주로 혈업 필터링 방식으로서 다른 사용자들에 대한 평가 정보를 이용하여 동적 링크를 제공하기 때문에 사용자가 고려하지 못한 아이템들을 추천한다는 장점을 갖고 있다. 그러나 협업필터링 과정은 현재 사용자와 가장 유사한 패턴을 보이는 사용자를 선택하기 위해 전체 사용자와의 유사도를 재 계산해야 한다는 계산의 복잡성과 사용자 프로화일의 정보가 현 사용자의 키워드 입력 시점에서 동적으로 갱신되지 않기 때문에 오류정보가 포함될 수 있다는 문제점이 있다. 보 논문에서는 유사한 선호도를 보이는 사용자를 대상으로 군집분석을 수행함으로서, 이웃 사용자를 선택하는 과정을 단순화할 수 있고 또한 베이지안 학습을 이용하여 사용자의 선호도를 동적으로 갱신할 수 있는 알고리즘을 설계하고 구현하였다. 사용자의 키워드가 입력되는 순간 사전 데이터와 사후 데이터가 선호도 확률에 동적으로 반영됨으로써 오류정보를 최소화한다. 이렇게 설계된 시스템은 실험을 통해 웹 도서 추천시스템에 적용되어 사용자의 만족도를 증가시킬 수 있음을 보인다.

유연성 다중 회귀 모델을 활용한 보행자 이상 행동 예측 모델 연구 (Study on abnormal behavior prediction models using flexible multi-level regression)

  • 정유진;윤용익
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.1-8
    • /
    • 2016
  • 최근 강력 범죄 및 우발 범죄가 끊이지 않고 있으면서 사회적 불안감이 고조되고 있다. 이에 따라 방범용 카메라, CCTV (Closed Circuit Television)가 범죄 증거 확보와 치안을 위해 사용되고 있다. 그러나 CCTV는 주로 사후 처리 기능으로 사용하고 있으며 사전에 범죄를 예방하기는 힘들다. 본 연구에서는 CCTV로부터 수집된 보행자 데이터를 이용하여 객체의 행동을 분석하고 위험 행동 여부를 추정하기 위한 유연성 다중 회귀 모델을 제안한다. 유연성 다중 회귀 모델은 필터링, 상황분석, 예측 단계로 구성되어 있다. 먼저 보행자에 대한 환경과 상황에 대해 필터링한 후 상황분석에 대한 정보를 구축하고 관찰 객체에 이상 행동이 결정된다. 마지막으로 연관분석을 통해 객체의 행동이 예측되어 위협 상황을 통지한다. 이를 통해 다중 지역에서 객체의 행동을 추적하여 객체 행동의 위험여부를 알 수 있으며, 행동 예측을 통해 범죄 발생을 예측 가능하다.

블럭정렬과 VF형 산술부호에 의한 오류제어 기능을 갖는 데이터 압축 (Data Compression Capable of Error Control Using Block-sorting and VF Arithmetic Code)

  • 이진호;조숙희;박지환;강병욱
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.677-690
    • /
    • 1995
  • 본 논문에서는 블럭정렬과 선두 이동법에 의해 처리된 계열을 VF(Variable to Fixed)형 산술부호로 압축하는 방법을 제시한다. 길이 N으로 분해된 부분열을 1기호씩 순회시킨 후 사전식 순서로 정렬한다. 순회정렬된 부분열은 국소적으로 유사기호가 밀 집되기 때문에 이 성질을 활용하기 위하여 선두 이동법을 적용한다. 이와 같이 전처리 된 계열에 대해 오류전파를 1 부호어 이내로 제한할 수 있는 VF형 산술부호 로 엔트 로피 부호화한다. VF형 산술부호의 효율은 고정 크기의 부호어 집합을 어떻게 분할하 는가가 관건이다. 제안하는 VFAC(VF Arithmetic Code)는 새로 설정되는 정보원 기호에 대하여 완전분할을 이루게 하고, 반복적인 그레이 변환을 이용하여 발생기호의 확률을 효과적으로 나타낸다. 제안 방식의 성능을 컴퓨터 시뮬레이션을 통하여 엔트로피, 압 축율 및 처리속도의 측면에서 기존의 방식과 비교 분석한다.

  • PDF

뇌 정위 방사선수술의 선량 계산을 위한 몬테카를로 시뮬레이션 코드 개발 (Development of Monte Carlo Simulation Code for the Dose Calculation of the Stereotactic Radiosurgery)

  • 강정구;이동준
    • 한국의학물리학회지:의학물리
    • /
    • 제23권4호
    • /
    • pp.303-308
    • /
    • 2012
  • 뇌정위 방사선수술의 선량계산을 위해 Geant4 기반의 응용 프로그램을 개발 하였다. 선형가속기에서 발생하는 방사선의 스펙트럼을 입력하기 위하여 사전에 실행하여 구한 스펙트럼에 각 에너지별로 구한 가중치를 곱하여 확률밀도를 구하였다. 이를 누적밀도로 변환하여 입력하도록 하였다. 메신저 클래스를 이용하여 다양한 형태의 MLC 조사면을 설정할 수 있도록 하였다. 갠트리와 테이블의 회전을 모사하기 위하여 rotateX와 rotateY라는 회전행렬을 사용하였다. 월드좌표 속에서 갠트리와 테이블을 정의하여 각각 회전을 구현하였다. 실제 환자의 자료는 CT의 dicom 파일에서 픽셀 크기, 매트릭스 크기 등의 정보와 픽셀의 HU를 밀도로 변환한 파일을 생성한 다음 이 파일을 이용 환자의 모델링에 이용 하였다. 환자의 모델링은 팬텀월드 안에 픽셀의 크기에 해당하는 복셀을 정의하고 이 복셀에 픽셀의 밀도와 이 밀도에 해당하는 물질을 할당해주었다.

인도부페 프로세스의 소개: 이론과 응용 (Introduction to the Indian Buffet Process: Theory and Applications)

  • 이영선;이경재;이광민;이재용;서진욱
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.251-267
    • /
    • 2015
  • 인도부페 프로세스는 유한개의 행과 무한개의 열로 이루어진 이진행렬의 분포와 관련된 확률과정이다. 무한특성모형을 유한개의 행과 무한개의 열로 이루어진 이진행렬을 이용해서 표현할 때, 이진행렬에 대한 사전분포로써 인도부페 프로세스가 이용될 수 있다. 본 논문에서는 인도부페 프로세스를 유한특성모형과 연관지어서 유도하는 방법을 소개하고, 베타프로세스와의 관련성을 간략히 설명한다. 실제 모형의 추론에 인도부페 프로세스가 이용되는 예제를 살펴보기 위해서 가우시안 선형모형에 인도부페 프로세스를 적용한 모형화 방법을 언급하고, 깁스표집 알고리즘, 막대 자르기 알고리즘, 변분방법을 이용한 추론방법을 설명한다. 그리고 이 세 가지 알고리즘을 이용하여 이미지 자료를 분석하는데 적용해본다. 나아가 쌍자료 분석, 네트워크 분석, 독립성분 분석에서 인도부페 프로세스가 어떻게 이용될 수 있는지도 알아본다.

적응 변조 시스템에서 최적의 터보 부호화된 V-BLAST 기법의 성능 분석 (Performance Analysis of the Optimal Turbo Coded V-BLAST technique in Adaptive Modulation System)

  • 이경환;최광욱;류상진;강민구;홍대기;유철우;황인태;김철성
    • 한국정보통신학회논문지
    • /
    • 제11권2호
    • /
    • pp.385-391
    • /
    • 2007
  • 본 논문에서는 V-BLAST (Vertical-Bell-lab Layered Space Time)의 두 디코딩 과정인 ordering과 slicing에 사전 확률 (a priori probability)로 사용하기 위해서 반복 디코딩 (iterative decoding)을 사용한 MAP (Maximum A Posteriori) 디코더의 외부 정보 (extrinsic information)를 이용한 최적의 터보 부호화된 (Turbo Coded) V-BLAST 기법을 적용한 적응 변조 시스템 (adaptive modulation system)을 제시 후 성능을 관찰한다. 또한 적응 변조 시스템에서 간단하게 V-BLAST 시스템과 터보 부호화 (Turbo Coding) 기법이 결합된 기존의 터보 부호화된 V-BLAST 기법을 적용한 경우에 비하여 어느 정도 전송률 (throughput)향상이 있는가를 살펴본다. 실험결과, 적응 변조 시스템에서 최적의 터보 부호화된 V-BLAST 기법을 적용한 경우가 기존의 터보 부호화된 V-BLAST 기법을 적용한 경우에 비하여 전송률 성능이 우수함을 보였다. 특히, 실험 결과는 2.5 Mbps의 전송률에서 1.5 dB의 SNR 이득을 보인다.

농업용 저수지 이상거동 탐지를 위한 시계열 수위자료 특성 분석 (Time Series Analysis of Agricultural Reservoir Water Level Data for Abnormal Behavior Detection)

  • 이성학;이상현;홍민기;최진용
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.275-275
    • /
    • 2015
  • 최근 기후변화에 따른 극한 강우사상의 증가로 인하여 농업용 저수지의 재해 위험도가 증가하고 있는 추세이며, 사고가 발생할 때 마다 파손/붕괴된 시설물을 보수하는 대응형 유지관리체계에서 벗어나 기반시설의 성능과 생애주기 등을 고려하여 재해 발생을 사전에 예보 및 경보를 알릴 수 있는 예방적 관리체계로의 전환이 필요하다. 한국농어촌공사는 전국 1,500개 저수지에서 10분 단위 수위자료를 측정하고 있으며, 이를 분석하여 재해예방에 활용할 수 있는 기반이 조성되어 있으나 이에 대한 관리가 이루어지지 않고 있고 수집된 자료를 활용하여 재해 징후를 분석할 수 있는 재해 예방적 분석기술이 마련되어 있지 않은 실정이다. 본 연구에서는 농업용 저수지 수위자료를 이용한 저수지 이상거동을 판별하기 위하여 전국 34개 한국농어촌공사 관할 저수의 시계열 수위자료의 특성(Feature)을 분석하고자 한다. 시계열 자료의 시계열 특성을 분석하기 위하여 한국농어촌공사 관할의 전국 34개 저수지를 선정하여 분석을 실시하였다. 대상저수지는 지역별, 저수용량, 안정등급, 붕괴발생, 1개 지사관할 저수지로 각각 구분하여 선정하였으며, 각 저수지의 수위 측정기간(최소 5개년)에 대한 자료를 수집하였다. 농업용 저수지의 시계열 수위 자료의 특성을 분석하기 위하여 자료의 전처리를 수행하였다. 자료의 전처리는 시계열 수위자료의 잡음 특성, 기상자료 관련 변동특성 등 분류(Classification)에 영향을 미치는 노이즈 요소를 제거하는 과정이다. 전처리과정을 거친 자료는 특징(Feature) 추출 과정을 거치게 되고, 추출된 특징의 적합성에 따라 분류 알고리듬 성능에 많은 영향을 미친다. 따라서 시계열 자료의 특성을 파악하고 특징을 추출하는 것은 이상치 탐지에 있어 매우 중요한 과정이다. 본 연구에서는 시계열 자료 특징 추출 방법으로 물리적인 한계치, 확률적인 문턱값(Threshold), 시계열 패턴, 주변 저수지와의 시계열 상관분석 등을 적용하였으며, 이를 데이터베이스로 구축하여 이후 분류알고리듬 학습에 적용하여 정상치와 이상치를 판별하는데 이용될 수 있도록 하였다. 따라서 본 연구에서 제시되는 농업용 저수지의 시계열 특성은 다양한 분류알고리듬에 적용할 수 있으며, 이를 통하여 저수지 이상거동 판별을 위한 최적을 분류알고리듬의 선택에 도움이 될 것이다.

  • PDF