• 제목/요약/키워드: 사전확률

검색결과 416건 처리시간 0.027초

정제된 의미정보와 시소러스를 이용한 동형이의어 분별 시스템 (A Korean Homonym Disambiguation System Using Refined Semantic Information and Thesaurus)

  • 김준수;옥철영
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.829-840
    • /
    • 2005
  • 단어 의미 중의성 해소는 자연언어처리 분야에 매우 중요한 부분이다. 본 논문에서는 사전 뜻풀이 특성을 이용해 기존의 의미정보를 정제하고 유용한 정보인 확률정보, 거리정보 및 격정보 등을 추가한 WSD 모델을 제안하였으며, 사전을 기반으로 구축된 "울산대학교 어휘 지능망(UOU-Word Intelligent Network: U-WIN)" 상의 단어 계층적 구조(시소러스)를 이용하여 의미정보의 자료 부족 문제를 해소하는 모델을 제시하였"다. "21세기 세종 계획"에서 제공하는 150만 어절 규모의 의미 태그 말뭉치를 대상으로 한 실험에서 최다 빈도 의미 결정(Maximum Frequence Class, MFC, 정확률 베이스라인)에 비해 $18.97\%$(명사 $21.73\%$, 동사 $17.11\%$) 정확률 향상을 보였으며, 기존의 확률 가중치와 어절 거리 가중치를 이용한 모델에 비해서는 $10.49\%$(명사 $8.84\%$, 동사 $11.51\%$)의 정확률 향상되었다. 또한 시소러스를 사용하지 않고 확률정보, 거리정보, 격정보 만을 이용한 모델에 비해 $6.12\%$(명사 $5.29\%$, 동사 $6.64\%$) 높은 정확률을 보였다.

확률적 교차 연산을 이용한 보편적 관계 추출 (General Relation Extraction Using Probabilistic Crossover)

  • 이제승;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.371-380
    • /
    • 2023
  • 관계 추출은 텍스트로부터 개체(named entity) 사이의 관계를 추출하는 과정이다. 전통적으로 관계 추출 방법은 주어와 목적어가 미리 정해진 상태에서 관계만 추출한다. 그러나 종단형 관계 추출에서는 개체 쌍마다 주어와 목적어의 위치를 고려하여 가능한 모든 관계를 추출해야 하므로 이 방법은 시간과 자원을 비효율적으로 사용한다. 본 논문에서는 이러한 문제를 완화하기 위해 문장에서 주어와 목적어의 위치에 따른 방향을 설정하고, 정해진 방향에 따라 관계를 추출하는 방법을 제안한다. 제안하는 방법은 기존의 관계 추출 데이터를 활용하여 문장에서 주어가 목적어를 가리키는 방향을 나타내는 방향 표지를 새롭게 생성하고, 개체 위치 토큰과 개체 유형 정보를 문장에 추가하는 작업을 통해 사전학습 언어모델 (KLUE-RoBERTa-base, RoBERTa-base)을 이용하여 방향을 예측한다. 그리고 확률적 교차 연산을 통해 주어와 목적어 개체의 표상을 생성한다. 이후 이러한 개체의 표상을 활용하여 관계를 추출한다. 실험 결과를 통해, 제안 모델이 하나로 통합된 라벨을 예측하는 것보다 3 ~ 4%p 정도 더 우수한 성능을 보여주었다. 또한, 제안 모델을 이용해 한국어 데이터와 영어 데이터를 학습할 때, 데이터 수와 언어적 차이로 인해 한국어보다 영어에서 1.7%p 정도 더 높은 성능을 보여주었고, 최상의 성능을 내는 매개변수의 값이 다르게 나타나는 부분도 관찰할 수 있었다. 제안 모델은 방향에 따른 경우의 수를 제외함으로써 종단형 관계 추출에서 자원의 낭비를 줄일 수 있다.

가상적인 재판 쟁점에서의 현역판사의 판단과 모의배심의 집단판단에 대한 인지적 방략의 효과 (Effects of Cognitive Heuristics on the Decisions of Actual Judges and Mock Jury Groups for Simulated Trial Issues)

  • 박광배;김상준;한미영
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제11권1호
    • /
    • pp.59-84
    • /
    • 2005
  • 보통 사람들이 보이는 인지적 방략(cognitive heuristic)인 정박 방략(anchoring heuristic), 대표성 방략(representativeness heuristic), 그리고 사고 틀 효과(framing effect)가 고도의 판단 전문가인 현역 판사들의 의사결정 과정과 대학생들로 구성된 집단의 의사결정 과정에서도 발견되는지를 알아보기 위해 세 개의 연구가 수행되었다. 연구1에서는 한국의 법률상황에 맞는 시나리오를 구성하여, 전문영역에서 많은 경험과 정형화된 훈련을 통해 증거를 평가하는 고도의 판단 전문가인 158명의 현역판사들의 의사결정 과정에서도 이러한 인지적 방략이 발견되는지를 알아보고자 하였다. 연구 2에서는 토의과정을 거쳐서 만장일치에 의해 도출되는 집단적 판단에서도 인지적 방략의 효과가 발생할 것인가를 검증해 보고자 하였다. 연구 3에서는 연구 2의 집단판단에 관한 결과를 보다 명확히 해석하기 위한 목적으로 일반인들의 개인판단을 알아보았다. 연구 1의 결과, 현역 판사들의 판단에서는 '저 정박점'에 의한 정박 방략 효과가 강하게 나타나는 것이 확인되었으나, '고 정박점'에 의한 정박 방략 효과는 나타나지 않았다. 사고 틀 효과는 전혀 발견되지 않았으며, 판사들의 사후확률 추론은 조건확률보다는 사전확률에 의해 더 크게 영향을 받는 것으로 나타났다. 연구 2와 연구3의 결과에 따르면, 정방 방략 효과는 개인판단과 집단판단에서 모두 나타났으나, 개인판단보다 집단판단에서 더 크게 나타났다. 사고 틀 효과는 개인판단에서 부분적으로 나타났으나, 집단판단에서는 전혀 나타나지 않았다. 대표성 방략 효과는 현역판사의 판단과 모의배심 판단에서 모두 발견되지 않았다. 각 연구의 결과가 사법제도에 대하여 가지는 시사점이 논의되었다.

  • PDF

속성 값 빈도 기반의 전문가 다수결 분류기 (Committee Learning Classifier based on Attribute Value Frequency)

  • 이창환;정인철;권영식
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권4호
    • /
    • pp.177-184
    • /
    • 2010
  • 센서 정보, 물류/유통정보, 신용 정보, 주식 정보 등이 과거보다 다양하면서 대용량의 연속 발생 형태 데이터가 발생하고 있다. 이러한 데이터는 대용량의 특의 변화가 빠른 특징들을 가지고 있기 때문에 학습이 어렵다. 이러한 문제점을 해결하기 위해 일정 윈도우 크기의 최근 데이터를 연속적으로 학습시킴으로써 전체 모형을 새롭게 만들거나 모형의 일부분을 대체 하는 방법을 사용하여 왔다. 그러나 이러한 방법은 계속해서 새로운 학습모형을 만들어야 하므로 대용량의 연속 데이터를 학습시키는데 많은 시간과 비용이 든다. 따라서, 이러한 특성에 대비하기 위하여 추가적인 학습 데이터가 발생할 때 마다, 점진적이며 지속적으로 학습을 할 수 있는 학습 기법이 필요하다. 보다 빠른 속도로 학습 모형의 변화 없이 분류를 하기 위하여 대표적인 점진적 학습 방법으로 베이지안 분류기를 사용할 수 있지만, 사전확률을 알고 있다는 가정으로부터 시작을 하게 되어 일정량 이상의 학습데이터가 필요하다. 따라서 본 연구에서는 베이지안 분류기와 같이 점진적으로 학습을 할 수 있지만, 사전 확률을 알지 못하더라고 학습을 할 수 있는 새로운 점진적 학습 알고리즘을 제안하고자 한다. 본 연구에서 제안하는 알고리즘의 기본 개념은 여러 전문가의 의견을 종합하는 방식이다. 여기서는 속성값(attribute value)을 한명의 전문가로 보고 전문가 집단의 의사 결정이 맞을 경우에는 가점을 주고 틀릴 경우에는 감점을 하는 방식으로 학습을 하게 된다. 실험결과 이 방법은 의사결정나무나 베이지언 분류기와 비교해 비슷한 성능을 나타내었으며, 향후에 스트림 데이터 분석에 사용할 가능성을 보였다.

은닉 마코프 모형을 이용한 한강유역 수문학적 가뭄의 확률론적 평가 (Probabilistic Assessment of Hydrological Drought Using Hidden Markov Model in Han River Basin)

  • 박예준;유지영;권현한;김태웅
    • 한국수자원학회논문집
    • /
    • 제47권5호
    • /
    • pp.435-446
    • /
    • 2014
  • 지금까지 많은 연구를 통하여 제안된 다양한 가뭄지수들은 사전에 정의된 등급을 통하여 가뭄을 평가하기 때문에 가뭄현상에 내재된 불확실성을 고려하지 못하고 있다. 본 연구에서는 월 유출량 자료에 내재되어 있는 불확실성을 고려하기 위해 은닉 마코프 모형(HMM) 기반의 가뭄지수(HMDI)를 제안하고, 이를 이용하여 수문학적 가뭄에 대한 확률론적 평가를 수행하였다. WAMIS에서 제공하는 한강유역의 평창강과 남한강상류의 월평균 유출량 자료(1966~2009)를 이용하여 3, 6, 12개월씩 누적시킨 후, HMM에 적용하여 은닉상태의 사후확률을 계산하였다. 연구방법의 검증을 위해 HMM을 이용하여 추정된 각 은닉상태 별 사후확률(HMDI)과 기준값에 의해 가뭄을 평가하는 방법 중 하나인 표준유출지수(SSI)와 비교를 하였다. 분석결과, 기존 가뭄지수(SSI)를 사용하였을 때는 하나의 지수로 특정 시점에서의 가뭄 상태를 판단하였지만, HMDI는 자료에내재된 불확실성을 이용하여 가뭄의 상태를 분류하였고, 이는 특정 시점에서 가뭄 상태들이 나타날 확률로 표현되었다. 또한, 실제 가뭄사례와의 비교를 통해서 HMDI가 SSI에 비하여 가뭄에 대한 재현능력이 우수한 것으로 나타났다.

서비스 품질의 확률적 특성에 기초한 예방적 경로 부하 밸런싱 (A Preventive Intra-Path Load Balancing Based on the Probabilistic Characteristics of the Quality-of-service)

  • 김태준;서봉수
    • 한국멀티미디어학회논문지
    • /
    • 제13권2호
    • /
    • pp.279-286
    • /
    • 2010
  • 서비스 품질을 보장하는 네트워크에서 경로를 구성하는 노드에 가해지는 부하의 불균형은 경로의 트래픽 흐름 수락 능력을 저해하는 주요 요인으로 알려져 있다. 이러한 문제를 해결하기 위해 다양한 경로 부하 밸런싱 방법이 개발되었으며, 이들은 모두 경로의 가용 자원 상황에 따라 각 노드에 할당되는 흐름의 지연한계를 재조정하는 피드백 부하 밸런싱 방법을 사용하였다. 이들 방법은 트래픽 부하의 서비스 품질의 확률적인 특성을 전혀 고려하지 않아 부하 불균형을 사전에 예방할 수 없으므로 수락 능력 저하를 개선하는데 있어 근본적인 한계가 있다. 본 연구에서는 트래픽 부하의 서비스 품질의 확률적 특성에 기초한 예방적 부하 밸런싱을 모색하고 RSVP에 적용할 수 있는 구체적 방법을 제안한다. 간단한 평가 네트워크를 대상으로 제안한 방법의 성능을 평가한 결과 기존 방식 대비 4~22% 정도 높은 흐름 수락 능력을 제공함을 확인하였다.

미계측 유역에서의 확률강우에 대한 돌발홍수지수 산정 (Estimation of the Flash Flood Index by the Probable Rainfall Data for Ungauged Catchments)

  • 김응석;최현일;지홍기
    • 한국방재학회 논문집
    • /
    • 제10권4호
    • /
    • pp.81-88
    • /
    • 2010
  • 최근 들어 기상 이변에 따라 단시간 동안에 특정 소유역에 집중하는 호우 또는 초과우량에 의한 국지성 돌발홍수가 빈번히 발생함에 따라, 이로 인한 인명과 재산의 상당한 위험과 손실은 전 세계적인 것으로서 우리나라도 증가일로에 있다. 돌발홍수는 일반적으로 급경사 소유역에서 집중적인 강우에 의해 발생하여 빠른 유출과 토석류를 동반하기 때문에, 홍수피해를 대비하기 위한 사전 홍수예보시간이 부족할 정도로 급격히 빠른 홍수의 특성을 보인다. 본 연구의 목적은 대상유역의 확률강우량으로부터 돌발홍수지수(flash flood index, FFI)를 산정하여 돌발홍수의 심각성 정도를 정량적으로 분석하고자 한다. 특히 미계측 유역하천에서의 지역 홍수예 경보를 위한 기초자료를 제공할 수 있도록, 대상유역에 대하여 상대적인 돌발홍수심도를 제시할 수 있는 FFI-D-F(돌발홍수지수-지속시간-빈도) 관계곡선을 개발하였다. 또한 FFI-D-F 관계곡선은 현존 및 계획 방재시설물의 돌발홍수 대응능력 및 잔여홍수위험 평가에 활용될 수 있을 것으로 기대된다.

가우스 가중치를 이용한 돌출 값 추정을 위한 방법 (The Method to Estimate Saliency Values using Gauss Weight)

  • 유영중
    • 한국정보통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.965-970
    • /
    • 2013
  • 이미지로부터 돌출 영역을 추출하는 것은 이후의 다양한 이미지 처리를 위한 사전 작업으로서 중요한 의미를 가진다. 이 논문에서는 하나의 이미지에서 각 픽셀의 돌출 값을 추정하기 위한 개선된 방법을 소개한다. 논문에서 제안되는 방법은 이전에 연구된 색상과 통계적 방법을 이용한 돌출 값 추정 방법을 개선한 방법이다. 먼저 이미지에서 픽셀들의 색상관계를 이용해 각 픽셀의 돌출 값을 계산하고, 이 값을 근거로 중심 돌출 픽셀을 추정한다. 추정된 중심 돌출 픽셀을 기준으로 가우스 가중치를 적용하여 각 픽셀의 돌출 값을 재추정하고, 통계적 돌출 값 추정에 적용할 초기 확률을 위해 각 픽셀의 돌출 여부가 결정된다. 마지막으로 각 픽셀의 돌출 값은 베이즈 확률을 사용하여 계산된다. 실험결과는 본 논문의 적용 방법이 적정한 크기의 돌출 영역을 가진 이미지에 대해 이전의 방법보다 우수한 결과를 보임을 보여준다.

베이지안 추론법을 이용한 부식된 배관의 통계적 수명예측 (Statistical Life Prediction of Corroded Pipeline Using Bayesian Inference)

  • 노유정
    • 한국산학기술학회논문지
    • /
    • 제16권4호
    • /
    • pp.2401-2406
    • /
    • 2015
  • 배관은 대형기계설비에서 다양한 작동유체를 운반하는데 사용되는데, 대형시스템의 성능을 유지하기 위해서는 부식된 배관의 잔존 수명을 정확히 예측될 필요가 있다. 하지만, 배관 형상, 물성치, 부식률 등 배관의 수명에 영향을 미치는 요인들의 불확실성이 크기 때문에 부식 잔존 수명을 정확히 예측하기 힘들다. 본 연구에서는 통계적인 접근방법인 베이지안 추론법을 이용하여 부식 잔존 수명을 예측하는 방법을 제안하였다. 여기서, 배관의 파손 확률은 베이지안 법칙을 기반으로 시간에 따른 배관 파손 압력에 관한 사전 정보와 실험데이터를 이용하여 계산되고, 부식 잔존 수명은 10%의 파손 확률을 갖는 경과시간으로 계산되었다. 예제에서는 부식에 영향을 미치는 주요인자로부터 10개와 50개의 데이터를 생성하여 배관의 파손 확률 및 배관의 잔존수명을 예측하였으며 가정한 실제 잔존수명과의 비교를 통해 제안한 방법을 검증하였다.

고장 데이터의 확률 분석을 적용한 항공기 시스템 안전성 평가 수행 방안 연구 (A Study on the Implementation of Aircraft System Safety Assessment using Probabilistic Analysis of Failure Data)

  • 유승우;김인걸
    • 항공우주시스템공학회지
    • /
    • 제14권spc호
    • /
    • pp.31-38
    • /
    • 2020
  • 항공기의 개발 및 인증 과정에서 중요성이 강조되고 있는 시스템 안전성 평가는 고장 또는 결함으로 인해 발생할 수 있는 위험을 사전에 식별하고, 이에 대한 영향성을 판단하여 요구되는 수준의 안전성을 확보하기 위해 적용하는 시스템 엔지니어링 기법이다. 항공기 시스템이 복잡해지고, 통합적인 기능 및 성능이 요구되면서 항공기 개발 초기부터 적절한 안전성 목표를 수립하고, 체계적인 평가를 통해 이에 대한 검증 및 후속 조치를 이행하여야 한다. 본 논문에서는 고장 데이터의 확률 분석을 수행하는 방안을 제시하여 항공기의 전체 수명주기에 걸쳐 리스크를 진단하고 효율적인 안전성 평가를 수행하기 위한 방법론을 제시하였고, 항공기 인증 및 안전성 확보를 위해 고려해야 할 사항을 제시하였다.