• 제목/요약/키워드: 확률적 거리

검색결과 369건 처리시간 0.028초

조건부 확률에 기반한 범주형 자료의 거리 측정 (A distance metric of nominal attribute based on conditional probability)

  • 이재호;우종하;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.53-56
    • /
    • 2003
  • 유사도 혹은 자료간의 거리 개념은 많은 기계학습 알고리즘에서 사용되고 있는 중요한 측정개념이다 하지만 입력되는 자료의 속성들중 순서가 정의되지 않은 범주형 속성이 포함되어 있는 경우, 자료간의 유사도나 거리 측정에 어려움이 따른다. 비거리 기반의 알고리즘들의 경우-C4.5, CART-거리의 측정없이 작동할 수 있지만, 거리기반의 알고리즘들의 경우 범주형 속성의 거리 정보 결여로 효과적으로 적용될 수 없는 문제점을 갖고 있다. 본 논문에서는 이러한 범주형 자료들간 거리 측정을 자료 집합의 특성을 충분히 고려한 방법을 제안한다. 이를 위해 자료 집합의 선험적인 정보를 필요로 한다. 이런 선험적 정보인 조건부 확률을 기반으로한 거리 측정방법을 제시하고 오류 피드백을 통해서 속성 간 거리 측정을 최적화 하려고 노력한다. 주어진 자료 집합에 대해 서로 다른 두 범주형 값이 목적 속성에 대해서 유사한 분포를 보인다면 이들 값들은 비교적 가까운 거리로 결정한다 이렇게 결정된 거리를 기반으로 학습 단계를 진행하며 이때 발생한 오류들에 대해 피드백 작업을 진행한다. UCI Machine Learning Repository의 자료들을 이용한 실험 결과를 통해 제안한 거리 측정 방법의 우수한 성능을 확인하였다.

  • PDF

한국어의 정보이론적 연구 방향 (On Information Theoretical Research of the Korean Language)

  • 이재홍;이재학
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.367-375
    • /
    • 1992
  • 한국어는 다른 언어와는 달리 초성, 중성, 종성의 자소가 모여서 한 음절을 이룬다. 음절을 이루는 자소는 그 발생의 확률적 성질에 따라 확률변수로 간주된다. 음절 안에서 자소간의 발생의 상관관계는 자소간 조건부 확률 및 엔트로피로 표시된다. 음절이 모여서 단어를 이루고 단어를 이루는 음절은 그 발생의 확률적 성질에 따라 확률변수로 간주된다. 한국어 단어안에서 음절간의 발생의 상관관계는 음절간 조건부 확률 및 엔트로피로 표시된다. 수 있다. 그런데 가능한 음절의 종류가 매우 많기 때문에 음절 발생의 상관관계를 표시하는 지표로서 음절간 조건부 확률 대신 초성, 중성, 종성 단위의 조건부 확률을 사용하는 것이 음절간의 발생의 상관관계를 표시하는데 효과적이다. 이러한 한국어의 정보이론적 연구를 위하여서는 기초자료로서 한국어 단어의 빈도분포가 필요하다. 한국어 단어의 빈도분포의 포괄적인 조사는 1956년의 "우리말 말수 사용의 잦기 조사"가 유일한 실정이다. 시간 경과에 따른 한국어의 정보이론적 특성 변화의 분석을 위하여서는 한국어 단어 빈도의 주기적인 조사가 필요하다. 한국어에서 초성, 중성, 종성단위의 정보이론적 연구결과는 한국어 음성인식 및 함성, 자연언어처리, 암호법, 언어학, 음성학, 한국어부호 표준화 연구등에 이용될 것으로 기대된다. 남북한의 언어는 분단이 지속됨에 따라 상호 이질화가 진행되고 있다. 이러한 이질화를 극복하려는 부분적인 노력으로 남북한 언어의 한국어 영문표기의 단일화 등이 있었다. 이러한 노력에 병행하여 남한과 북한의 언어에 대한 정보이론적 비교 연구도 있어야 할 것이다. 정보를 효과적으로 캐싱할 수 있도록 인접한 데이터를 클러스터링해서 브로드캐스팅하여 이동 호스트의 구성 시간(setup time)을 최소화하였다. 그리고, 맨하탄거리(Manhattan Distance)를 사용해서 위치 의존 질의에서 사용하는 데이타를 캐싱하고 질의를 처리하는 방법을 제안한다. 맨하탄 거리를 이용해서 캐싱하면 도로에 인접해서 위치한 데이타를 효과적으로 캐싱할 수 있다. 또한, 거리 계산 방법으로 맨하탄 거리를 사용하면 도심에서 실제 이동 거리와 비슷한 값을 알 수 있고, 직선 거리 계산식에 비해서 계산식도 간단하기 때문에 시스템 계산량도 줄일 수 있다. 기준으로 라이신 부산물은 어분 단백질을 40%까지 대체가 가능하였으며, 아울러 높은 라이신 부산물의 대체 수준에 있어서 사료효율과 단백질 전환효율을 고려한다면 아미노산 첨가(라이신과 아르지닌)와 중화 효과에 좋은 결과가 있을 것으로 사료된다.의한 적정 양성수용밀도는 각고 5~6cm 크기의 경우 10~15개체가 적합하였다. 수증별 성장은 15~20 m 수층에서 빨랐으며, 성장촉진과 폐사를 줄이기 위해서는 고수온이 지속되는 7~10월에는 20~30m수층으로 채롱을 내려 양성하고 그 외 시기에는 15 m층 내외가 좋은 것으로 나타났다. 상품으로 출하 가능한 크기 인 각고 10 cm이상, 전중량 140 g 내외로 성장시 키기까지는 채묘후 22개월이 소요되었고, 출하시기는 전중량 증가가 최대에 이르는 3월에서 4월 중순이 경제적일 것으로 판단된다.er 90 % of good relative dynamic modulus of elasticity due

  • PDF

한국어 음소 HMM 모델 결정을 위한 파라미터 비교 연구 (A Comparative Study on Parameter for Korean Phoneme-based HMM Model Decision)

  • 권혁제
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.302-305
    • /
    • 1998
  • 음소의 확률적 분포를 이용하는 음소 HMM 모델을 결정하기 위한 여러 가지 거리 측정방법에 대한 연구이다. 음소 HMM 모델 결정을 위해서 LPC 계수를 이용하고, 거리 측정자를 LPC 계수, LPC 스첵트럼, LPC 켑스트럼 등의 파라미터를 이용하고, 또한 양자화 과정은 k-means 와 LBG 알고리즘을 혼합한 하이브리드 알고리듬을 사용하였다. LPC 코드북을 구성하기 위해 세 가지 파라미터를 유클리디안 거리로 거리측정에 이용하였다. 이렇게 양자화한 파라미터의 평균과 분산을 구하고, 양자화한 파라미터 코드북의 확률갑승ㄹ 비교해 한국어 음소 HMM 모델 결정을 위한 거리 측정 파라미터를 비교하였으며, 그 결과 LPC 계수를 주파수 영역으로 변환하여 유클리디안 거리를 이용한 코드북의 분산이 작으므로 상대적으로 높은 확률을 가짐을 보았다.

  • PDF

정보보호 의사결정에서 정보보호 침해사고 발생가능성의 심리적 거리감과 상대적 낙관성의 역할 (The Role of Psychological Distance and Relative Optimism in Information Security Decision Making)

  • 김종기;김지윤
    • 경영정보학연구
    • /
    • 제20권3호
    • /
    • pp.51-71
    • /
    • 2018
  • 많은 정보보호 분야 연구들은 인식을 높여야 할 필요성을 밝히고 있다. 그러나 정보보호에 대한 인식이 상당한 수준으로 높아졌음에도 실제 보호행동은 최근까지 그에 미치지 못하고 있다. 이에 인식수준과는 별개로 정보보호 의사결정에 심리적 요인이 작용할 것으로 가정하고 정보보호에 대한 인식에 차이가 없는 실험상황에서 심리적 거리감과 낙관편향에 따른 차이를 확인하고 정보보호 행동에 대한 영향을 확인하고자 하였다. 연구결과 모바일 기기 사용자의 확률적 거리감에 따라 정보보호 위험의 지각에 차이가 있었으며, 사회적 거리감에 따라 상대적 낙관성의 정도에 차이가 있었다. 이를 바탕으로 상대적 낙관성을 개념화하고 정보보호 행동의도와의 관계를 분석한 결과 자신과 가까운 사람과 비교해 더 낙관적이라 생각했을 때 정보보호 위험의 수준을 낮게 평가하고 확률적 거리감에 따라 영향력이 달라짐을 확인했다. 본 연구는 방법론적 측면에서 의미 있는 시도를 하였고, 정보보호와 관련한 행동에 있어 심리적 요인을 고려함으로써 실질적 위험지각에 영향을 미치는 상대적 낙관성의 범위를 좁혔다는 데 의의가 있다. 정보보호를 위한 의사결정 과정에 다각도로 접근할 필요성을 실증적으로 규명함으로써 궁극적으로 정보기술 사용자의 정보보호 수준 향상과 정보자산의 보호에 기여할 것으로 기대한다.

탐색 레이다에서 누적확률에 기인한 탐지거리 계산에 관한 연구 (Calculation of the Detection Range for a Given Cumulative Probability in Airborne Surveillance Radars)

  • 김은희;노지은
    • 한국전자파학회논문지
    • /
    • 제29권1호
    • /
    • pp.24-27
    • /
    • 2018
  • 항공기용 레이다의 성능을 나타내는 최대 탐지 거리는 누적 탐지 확률로 규정된다. 이는 지상클러터에 의해 단일 탐지 확률이 거리에 따라 오르내리기 때문에 단일 탐지 확률로 탐지거리를 규정하기 어렵기 때문이다. 따라서 단조 증가하는 누적 탐지 확률을 이용하여 규정한다. 본 논문에서는 일정한 주기를 가지는 탐색 레이다에서 탐색 빔의 위치와 표적의 거리를 고려한 평균 누적 탐지 확률 계산법을 제시하며, 몬테카를로 시뮬레이션의 결과와 비교하여 동일함을 보였다. 수치적 계산에 의해 검증된 몬테카를로 시뮬레이션 모델은 추후 다양한 시나리오에 대한 시스템의 성능을 평가하는 데에 사용될 수 있을 것이다.

확률적 거리함수를 활용한 지역별 에너지효율성 추정 (An Estimation of Domestic Regional Energy Efficiency Using Stochastic Distance Function)

  • 정다솜;강상목
    • 자원ㆍ환경경제연구
    • /
    • 제30권4호
    • /
    • pp.581-605
    • /
    • 2021
  • 본 연구의 목적은 전통적 에너지효율의 지표인 에너지원단위(Energy Intensity)를 넘어 확률적 프런티어 접근으로 우리나라의 지역별 에너지효율성을 추정하고 이를 에너지효율 개선을 위한 기초적 자료로 제공하고자 함이다. 이를 위해 1998 - 2018년 기간 동안의 우리나라 16개 시·도의 에너지효율성 및 에너지원단위 효율성을 확률적 거리함수를 활용하여 추정한다. 부가적으로 선행연구에서 혼재하고 있는 자본스톡 추계방법들에 따른 에너지효율성 순위의 강건성을 살펴본다. 분석 결과 첫째, 세 가지 에너지효율의 지표에 따라 지역의 순위에 상당한 변동이 있었으므로 이들을 상호보완적으로 사용해야 할 것이다. 둘째, 에너지효율성은 시간이 지남에 따라 미미하지만 조금씩 개선된 반면, 에너지원단위 효율성은 미미하지만 하락했다. 마지막으로 자본스톡 추계방법에 따른 지역별 에너지효율성은 강건하지 않았다. 경제분석에서 중요한 자본스톡 추정 시 신중을 기해야 할 것이다.

지배가능 경로 문맥을 이용한 의존 구문 분석의 수식 거리 확률 모델 (Modification Distance Model for Korean Dependency Parsing Using Headible Path Contexts)

  • 우연문;송영인;박소영;임해창;정후중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-47
    • /
    • 2006
  • 본 논문에서는 한국어 의존 구문 분석을 위한 새로운 확률 모델을 제안한다. 한국어가 자유 어순 언어라 할지라도 지역적 어순은 존재하기 때문에 의존관계를 결정하기 위해 의존하는 두 어절인 의존소와 지배소 사이의 수식 거리가 유용하다는 것은 이미 많은 연구를 통해 밝혀졌다. 본 연구에서는 수식 거리의 정확한 수식 거리의 추정을 위해 지배가능경로 문맥을 이용한 수식 거리 확률 모델을 제안한다. 제안하는 모델의 구문 분석 성능은 86.9%이며, 기존에 제안된 구문 분석 모델과 비교하여 높은 구문 분석 결과를 보이며, 특히 원거리 의존관계에 대하여 더욱 향상된 성능을 보인다.

  • PDF

적외선 스테레오 카메라를 이용한 고속 이동객체의 위치에 대한 확률모델 (Statistical Model of 3D Positions in Tracking Fast Objects Using IR Stereo Camera)

  • 오준호;이상화;이부환;박종일
    • 전자공학회논문지
    • /
    • 제52권1호
    • /
    • pp.89-101
    • /
    • 2015
  • 본 논문에서는 비냉각방식 적외선 스테레오 카메라 시스템을 이용하여 고속으로 이동하는 고온의 소형 물체의 3차원 위치를 추정함에 있어서 무작위로 추정되는 그 위치를 확률 모델로 표현하는 방법을 제안한다. 본 논문에서 제안하는 확률적 위치 모델은 디지털 영상으로 인한 픽셀위치의 오차(pixel position error)와 비냉각식 적외선 카메라에서 영상을 취득하는 순간의 차이에 의한 지터오차(jitter error)로부터 유도되는데, 두 가지 오차를 결합한 통합 오차확률모델을 수학적으로 제시하고 실험을 통하여 그 효용성을 보여준다. 우선 본 논문에서 고안한 적외선 카메라의 지터 측정기를 이용하여 적외선 카메라에서 발생하는 타이밍 지터를 통계적으로 관찰하여 확률모델을 설정한다. 또한 디지털 영상의 스테레오 정합 과정에서 발생하는 픽셀 오차에 의하여 정확도가 떨어지는 측정거리를 확률모델로 정의한다. 실험 측정 결과, 지터는 가우시안 확률분포로 모델링하는 것이 가능하며, 픽셀오차는 균일 확률분포로 모델링된다. 이 두 가지 확률분포를 갖는 오차는 상호 독립으로서 선형 결합되는데, 전체 오차에 대한 확률분포는 지터오차 변수의 확률분포와 픽셀위치오차 변수의 확률분포를 컨볼루션함으로써 유도된다. 실제 고속 이동체에 대하여 정밀한 3차원 궤적측정기와 자체 구현한 적외선 스테레오 카메라 시스템을 이용하여 제안한 확률모델을 3차원 위치추적 실험에 적용한 결과 95% 신뢰도 구간에서 물체의 위치를 추정하는 것을 확인하였다. 즉, 물체의 위치를 정확하게 측정하는 것은 이론적으로는 불가능하며, 확률모델을 통하여 물체의 위치를 표현하는 것이 타당함을 확인할 수 있다. 본 논문에서 제안한 확률모델은 적외선 스테레오 카메라를 이용한 거리측정에서 부정확함을 확률적으로 모델링하여 위치정보에 대한 불확실성을 보정해주며, 특히 적외선 스테레오 카메라를 이용한 고속 물체의 위치추적 및 거리측정에서 이론적, 실험적 토대를 제공할 것으로 기대된다.

확률론적 지진위험도의 불확실성 영향인자의 단계별 범위 영향 분석

  • 김준경;윤철호;이성규;임창복;김문수
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1996년도 춘계학술발표회논문집(4)
    • /
    • pp.405-409
    • /
    • 1996
  • 본 연구는 일정 지역의 확률론적 지진위험도 (Probabilistic Seismic Hazard) 평가와 관련하여 전문가가 제시한 제1차 입력자료를 이용하여 제2차 입력자료를 도출할 때 입력자료의 다단계화를 통하여 각 단계별 구간의 입력자료가 확률론적 지진위험도 불확실성에 미치는 상대적 영향을 분석하였다. 확률론적 지진위험도 분석을 위하여 미국지질조사연구소 (USGS) 및 미국 로렌스리버모어 연구소(LLNL)가 개발한 전산코드를 각각 이용하였고 또한 전문가가 제시한 제 1차 입력자료는 기존 연구보고서에서 주어진 자료를 이용하였다. 분석결과 지진활동도 변수 특히 지진규모의 각 단계 및 감쇠특성함수의 진앙거리 단계에 따라서 확률론적 지진위험도의 절대값 및 불확실성에 미치는 영향의 차이가 상대적으로 크다는 것이 확인되었다. 또한 부지별로 이러한 분석을 함으로서 확률론적 지진 위험도 곡선에 영향을 미치는 임의 부지에 고유한 임계 지진규모 및 임계 진앙거리에 대한 분석을 통하여 전반적으로 불확실성을 감소시킬 수 있다.

  • PDF

확률난수를 이용한 공간자료가 생성과 베이지안 분석 (Computing Methods for Generating Spatial Random Variable and Analyzing Bayesian Model)

  • 이윤동
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.379-391
    • /
    • 2001
  • 본 연구에서는 관심거리가 되고 있는 마코프인쇄 몬테칼로(Markov Chain Monte Carlo, MCMC)방법에 근거한 공간 확률난수 (spatial random variate)생성법과 깁스표본추출법(Gibbs sampling)에 의한 베이지안 분석 방법에 대한 기술적 사항들에 관하여 검토하였다. 먼저 기본적인 확률난수 생성법과 관련된 사항을 살펴보고, 다음으로 조건부명시법(conditional specification)을 이용한 공간 확률난수 생성법을 예를 들어 살펴보기로한다. 다음으로는 이렇게 생성된 공간자료를 분석하기 위하여 깁스표본추출법을 이용한 베이지안 사후분포를 구하는 방법을 살펴보았다.

  • PDF