• 제목/요약/키워드: Bayesian information

검색결과 1,224건 처리시간 0.028초

스팸메일 필터링을 위한 한글 변칙어 인식 방법 (Recognition Method of Korean Abnormal Language for Spam Mail Filtering)

  • 안희국;한욱표;신승호;양동일;노희영
    • 한국항행학회논문지
    • /
    • 제15권2호
    • /
    • pp.287-297
    • /
    • 2011
  • 전자메일은 사용의 편리성과 정보전달의 신속성 때문에 널리 사용되고 있지만, 광고목적이나 악의성을 갖는 스팸메일의 양도 증가하여 사회적 경제적으로 큰 문제를 야기한다. 스팸메일을 필터링하기 위한 방법은 수용 전 단계와 수용 후 단계로 나누어서 접근할 수 있는데, 수용 후 접근의 경우는 메시지로부터 단어나 문장 단위로 자질을 추출하고 그로부터 학습이나 매칭방법을 통하여 필터링을 하는 과정을 포함한다. 하지만, 필터링을 우회하기위해 스패머는 계속적으로 단어를 변형시켜 메일을 발송시키고 있다. 특히 한국어의 경우는 특성상 한 음절을 이루는 음소의 변화로부터 변형이 가능하기 때문에 그 변칙적 사용이 더 다양하다고 할 수 있다. 따라서, 기존의 정규식이나 학습알고리즘은 대처에 한계를 갖게 된다. 이에 본 논문에서는 한글의 변칙어를 인식할 수 있는 방법을 제안함으로서 스팸메일분류 시스템의 성능을 향상시키고자 한다. 이를 위해, 자소접근방법을 사용하고, Smith-Waterman알고리즘을 적용하였다. 메일서버로부터 추출한 필터키워드와 메일로부터 제안한 방법을 실험한 결과 유사도 수준에 따라 한글 변칙어들을 정확히 인지해 낼 수 있었다. 실험을 통해 소요 공간 및 시간은 허용될 수 있는 수준임을 확인하였다.

멀티모달 개념계층모델을 이용한 만화비디오 컨텐츠 학습을 통한 등장인물 기반 비디오 자막 생성 (Character-based Subtitle Generation by Learning of Multimodal Concept Hierarchy from Cartoon Videos)

  • 김경민;하정우;이범진;장병탁
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.451-458
    • /
    • 2015
  • 기존 멀티모달 학습 기법의 대부분은 데이터에 포함된 컨텐츠 모델링을 통한 지식획득보다는 이미지나 비디오 검색 및 태깅 등 구체적 문제 해결에 집중되어 있었다. 본 논문에서는 멀티모달 개념계층모델을 이용하여 만화 비디오로부터 컨텐츠를 학습하는 기법을 제안하고 학습된 모델로부터 등장인물의 특성을 고려한 자막을 생성하는 방법을 제시한다. 멀티모달 개념계층 모델은 개념변수층과 단어와 이미지 패치의 고차 패턴을 표현하는 멀티모달 하이퍼네트워크층으로 구성되며 이러한 모델구조를 통해 각각의 개념변수는 단어와 이미지패치 변수들의 확률분포로 표현된다. 제안하는 모델은 비디오의 자막과 화면 이미지로부터 등장 인물의 특성을 개념으로서 학습하며 이는 순차적 베이지안 학습으로 설명된다. 그리고 학습된 개념을 기반으로 텍스트 질의가 주어질 때 등장인물의 특성을 고려한 비디오 자막을 생성한다. 실험을 위해 총 268분 상영시간의 유아용 비디오 '뽀로로'로부터 등장인물들의 개념이 학습되고 학습된 모델로부터 각각의 등장인물의 특성을 고려한 자막 문장을 생성했으며 이를 기존의 멀티모달 학습모델과 비교했다. 실험결과는 멀티모달 개념계층모델은 다른 모델들에 비해 더 정확한 자막 문장이 생성됨을 보여준다. 또한 동일한 질의어에 대해서도 등장인물의 특성을 반영하는 다양한 문장이 생성됨을 확인하였다.

마이크로 BGA 패키지의 볼 형상 시각검사를 위한 모아레 간섭계 기반 3차원 머신 비젼 시스템 (Three-dimensional Machine Vision System based on moire Interferometry for the Ball Shape Inspection of Micro BGA Packages)

  • 김민영
    • 마이크로전자및패키징학회지
    • /
    • 제19권1호
    • /
    • pp.81-87
    • /
    • 2012
  • 본 논문에서는 마이크로 BGA 패키지 내외부의 마이크로 볼의 3차원 형상을 측정하는 광학 측정 시스템을 제안하고 이를 구현한다. 대부분의 시각 검사 시스템은 마이크로 볼의 복잡한 반사 특성 때문에 검사에 어려움을 겪고 있다. 정확한 형상의 측정을 위해서, 특별히 설계된 시각 센서 시스템을 제안하고, 위상이송 모아레 간섭계의 측정원리에 기반한 형상측정 알고리즘을 제안한다. 센서 시스템은 4개의 서브시스템을 보유한 패턴 투사 시스템과 영상획득 시스템으로 구성된다. 패턴 투사용 서브시스템은 공간상으로 서로 상이한 투사 방향을 가지며, 이는 측정 물체에 각기 다른 입사 방향을 가지는 패턴 조명이 투사될 수 있도록 하는 것을 목적으로 한다. 위상이송 모아레 간섭계의 구현을 위한 정밀 위상이송을 위해서, 각 서브시스템의 패턴 격자는 PZT 구동기를 이용하여 일정 간격으로 이송한다. 최종적으로 측정되는 마이크로 볼의 경면반사와 그림자 영역을 효과적으로 제거하기 위해서, 다중 패턴 투사 시스템과 영상획득 시스템을 구현하고, 이를 테스트한다. 특히, 다중 프로젝션을 이용하여 획득되는 다중 높이 정보를 효과적으로 융합하기 위하여, 베이지안 센서 융합 이론을 기반으로한 센서 융합 알고리즘이 제안된다. 제안되는 시스템의 원리검증과 성능확인을 위해, 마이크로 BGA볼과 기판 범프의 측정대상물에 대해서, 측정 반복성을 중심으로 실험이 수행되었으며, 획득된 실험 결과를 분석하고 논의한다.

FISH 세포영상에서의 군집세포 분할 기법 (Segmentation Method of Overlapped nuclei in FISH Image)

  • 정미라;고병철;남재열
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.131-140
    • /
    • 2009
  • 본 논문에서는 입력된 FISH 세포영상을 군집세포영역과 독립세포영역으로 분류하고, 군집세포영역에 대해서는 하나의 세포를 분리하는 알고리즘을 제안한다. 먼저 입력된 영상에 대해서 가우시안혼합모델과 세포의 명암도 값에 대한 최대 우도 함수를 사용하여 세포영역과 배경영역을 분할해줄 임계값을 정의하게 된다. 이렇게 얻어진 전경세포영역에 대해서 보다 정확한 세포 분석을 위해서 군집세포와 독립세포를 분류하게 된다. 세포 영역의 분류과정을 위해서는 베이지안 네트워크와 확률밀도함수를 사용한다. 학습데이터로부터 밀집도(compactness), 평활도(smoothness), 후-모멘트(Hu-moment)에 대한 형태학적 특징값을 추출하여 확률밀도함수를 구성하고, 이를 기반으로 베이지안 네트워크를 사용하여 두 영역을 분류하게 된다. 군집세포로 분류된 영역에 대해서는 그 군집세포를 구성하고 있는 독립세포로 각각 분리한다. 먼저, 명암도 기울기 변환(intensity gradient transform) 영상과 워터쉐드 알고리즘을 이용하여 군집세포 영역을 작은 영역으로 분할하게 된다. 작게 분할된 영역을 하나의 세포영역으로 병합시키기 위해서, 군집세포에 존재하는 독립세포의 수만큼의 마커를 결정 침식 연산을 사용하여 추출하고, 추출된 마커를 중심으로 단계적 병합 알고리즘을 제안한다. 본 논문에서 제안한 방법은 166개의 FISH 세포를 사용하여 테스트한 결과 99.29%의 정확한 분리결과를 보여줬으며 기존의 다른 알고리즘보다도 뛰어난 성능과 빠른 실행시간을 보여주었다.

삼척오십천 상.하류에 분포하는 황어, Tribolodon hakonensis (잉어과) 집단의 유전적 분화 (Genetic Differentiation between Up- and Downstream Populations of Tribolodon hakonensis (Pieces: Cyprinidae))

  • 이신애;이완옥;석호영
    • 한국환경생태학회지
    • /
    • 제26권4호
    • /
    • pp.475-483
    • /
    • 2012
  • 잉어목(Cypriniformes) 황어아과(Leuciscinae)의 황어(Tribolodon hakonensis)는 회유성 어류로서 일생의 대부분을 바다에서 보내고 산란기인 3월 중순경부터 물이 맑은 하천으로 소상하여 자갈이나 모랫바닥에 집단으로 알을 낳는다. 본 연구의 목적은 5개의 microsatellite 유전자 분석을 통하여 단편화된 하천에서 황어 집단 간 유전자 흐름과 다양성을 측정하는 것이다. 강원도 삼척 오십천은 여러 대형 보에 의해 부분적으로 단편화되어 있는 중형 하천으로, 본 연구에서 하류지역과 대형 보를 여러 번 지나야 다다를 수 있는 상류지역에서 채집한 황어 개체들의 유전자형을 비교, 분석하였다. 유전자 분석 결과 상, 하류 집단들은 많은 대립인자를 공유하지만 그 빈도에 있어 다소 큰 차이를 보였다. 상류와 하류 간 유전적 분화($F_{ST}$)는 0.083 정도로 두 집단 간에는 제한된 유전적 흐름만이 존재한다고 볼 수 있다. 상류집단이 유전적으로 고립이 되어 있지만 뚜렷한 유전적 다양성의 감소나 집단의 크기 감소가 관찰되지는 않았다. 이러한 양상을 개체 수준에서 증명하기 위해 Bayesian 통계를 이용, 집단의 유전적 구조를 파악하였다. 분석 결과 삼척 오십천 개체들은 2개의 유전적 cluster로 구분할 수 있으며, 상류 집단 개체들은 모두 cluster 1에 해당하는 등 단일하게 나타났으나 하류 집단 개체 중 65 % 정도가 cluster 2에 그리고 나머지 개체들은 cluster 1에 해당하는 다양한 양상이 나타났다. 이로 미루어 두 집단은 유전적으로 분화되어 있고, 상류의 집단이 하류에 흘러들어가는 경우는 있지만 하류로부터 유전적 공급은 거의 전무한 형태로 볼 수 있고, 인위적 구조물들이 이러한 집단 구조에 영향을 미쳤을 가능성이 있다. 본 연구에서 제시된 자료들은 향후 황어 집단의 보전 정책 등을 수립하는데 필요한 정보를 제시할 수 있을 것이다.

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상 (Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood)

  • 정경용;김진수;김태용;이정현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.287-296
    • /
    • 2003
  • 추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

무제약 필기 숫자를 인식하기 위한 다수 인식기를 결합하는 의존관계 기반의 프레임워크 (Dependency-based Framework of Combining Multiple Experts for Recognizing Unconstrained Handwritten Numerals)

  • 강희중;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권8호
    • /
    • pp.855-863
    • /
    • 2000
  • K개의 인식기로부터 관찰된 K개 결정을 결합하는 결합 방법론 중의 하나인 BKS (Behavior-Knowledge Space) 방법은 아무런 가정 없이 이들 결정을 결합하지만, 관찰된 K개 결정을 저장하고 관리하려면 이론적으로 기하학적인 저장 공간을 만들어야 한다. 즉, K개의 인식기 결정을 결합하기 위하여 (K+1)차 확률 분포를 필요로 하는데, 작은 K라 할지라도 그 확률 분포를 저장하거나 평가하는 것이 어렵다는 것은 이미 잘 알려져 있다. 그러한 문제점을 극복하기 위해서는 고차 확률 분포를 몇 개의 구성 분포로 나누고, 이들 구성 분포의 곱(product)으로 고차 확률 분포를 근사시켜야 한다. 그러한 이전 방법 중의 하나는 그 확률 분포에 조건부 독립 가정을 적용하는 것이고, 다른 방법으로는 [1]에서와 같이 그 확률 분포를 단지 트리 의존관계 또는 2차 구성 분포의 곱으로 근사하는 것이다. 본 논문에서는, 구성 분포의 곱으로 근사하는 방법에서, 2차 이상의 고차 구성 분포까지 고려하여 (K+1)차 확률 분포를 d차 ($1{\le}d{\le}K$) 의존관계에 의한 최적의 곱으로 근사하고, 베이지안 방법과 그 곱을 기반으로 다수 인식기의 결정을 결합하는 의존관계 기반의 프레임워크를 제안한다. 이 프레임워크는 표준 CENPARMI 데이타베이스로 실험되어 평가되었다.

  • PDF

재생에너지 사업 참여에 대한 국민 선호와 수용성 분석 - 태양광 발전을 중심으로 (Assessing the public preference and acceptance for renewable energy participation initiatives - focusing on photovoltaic power)

  • 함애정;강승진
    • 에너지공학
    • /
    • 제27권4호
    • /
    • pp.36-49
    • /
    • 2018
  • 본 연구에서는 일반인을 대상으로 일반 설문과 선택형 컨조인트 분석(Choice Based Conjoint Analysis: CBC Analysis)을 통해 태양광 발전을 중심으로 신재생에너지와 신재생에너지 사업 전반에 대한 인식을 파악하고, 계층적 베이지안 모형(Hierarchical Bayesian Model)을 이용하여 신재생에너지 사업에 대한 일반 국민의 선호를 정량적으로 분석하였다. 그 결과, 응답자들은 신재생에너지 사업에 참여하게 될 경우 누가 사업을 주도 하는가, 즉 사업을 주도하는 주체에 대해 가장 중요하게 생각하며, 그 뒤를 이어 발전소의 위치와 국민들의 참여 방식과 이익배분에 대해서 중요하게 생각하였고, 상대적으로 사업에 대한 국민들의 의사결정 참여는 중요하지 않은 것으로 나타났다. 또한 응답자들은 신재생에너지 사업에 참여할 경우, 정보 공유나 의사 개진, 협조, 조율과 같은 사업에 대한 지원 활동(volunteering) 보다는 대출이나 지분 소유를 통한 투자 참여를 선호하였고, 따라서 의사 결정 참여와 같은 사업의 절차적(procedural justice) 측면 보다는 이익의 배분과 같은 분배적(distributional justice) 측면에 관심이 더 높았다. 각 사업의 속성 수준별 부분 효용의 크기에 따른 분석에서는, 지방자치단체 주도 하에 국민들이 신재생에너지 사업에 대해 주식을 소유하고 사업의 수익률에 연동하여 배당을 받는 방식으로 참여하고 산지나 해변보다는 지붕에 발전 시설을 설치하는 것을 선호하였고, 반대로 전문 개발회사와 투자회사 주도로 정보공유, 협의, 조율과 모니터링에 참여하고 이익의 일부를 마을 복지나 발전 기금으로 받으며, 발전소를 산지나 임야에 짓는 경우를 선호하지 않았다. 본 연구는 직접적인 설문과 면담 등의 질적 연구만으로는 밝혀내기 어려웠던 국민 참여를 전제한 신재생에너지 사업 속성의 영향력을 계량화된 모형을 통해 입증하였다는 점에서 의의를 가지며, 따라서 본 연구에서 나타난 신재생에너지 사업에 대한 일반인의 인식과 선호 분석의 결과는 향후 국민 참여형 신재생에너지 사업의 방향 수립 시 주민 수용성을 높이는 기초 자료로 활용될 수 있을 것이다.

점진적 기계학습 기반의 레이더 위협체 역추정 모델 생성 및 갱신 (Managing the Reverse Extrapolation Model of Radar Threats Based Upon an Incremental Machine Learning Technique)

  • 김철표;노상욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권4호
    • /
    • pp.29-39
    • /
    • 2017
  • 다양한 전자전 상황에서 단위 위협체에 대하여 전자전 모델링과 시뮬레이션을 수행할 수 있는 통합 전자전 시뮬레이터의 개발 필요성이 대두되고 있다. 본 논문에서는 전자전 상황에서 전자정보 수집신호의 변수를 기반으로 전자파 신호를 발산하는 레이더 위협을 역추정하기 위한 시뮬레이션 시스템의 구성요소를 분석하고, 역추정 모델을 점진적으로 유지할 수 있는 방법을 제안한다. 또한, 실험을 통하여 점진적 역추정 모델 갱신 기법의 유효성 및 개별 역추정 결과의 통합 기법을 평가한다. 개별 역추정 모델의 생성을 위하여 의사결정트리, 베이지안 분류기, 인공신경망 및 유클리디안 거리 측정방식과 코사인 유사도 측정방식을 활용하는 군집화 알고리즘을 이용하였다. 첫 번째 실험에서 레이더 위협체에 대한 역추정 모델을 구축하기 위한 위협 예제의 크기를 점진적으로 증가시키면 역추정 모델의 정확도는 향상되었으며, 이러한 과정이 반복되면 역추정 모델에 대한 정확도는 일정한 값으로 수렴하였다. 두 번째 실험에서는 개별 역추정 모델의 결과를 통합하기 위하여 투표, 가중투표 및 뎀스터-쉐이퍼 알고리즘을 이용하였으며, 역추정 모델의 통합 결과는 뎀스터-쉐이퍼 알고리즘에 의한 역추정 정확도가 가장 좋은 성능을 보였다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.