• 제목/요약/키워드: Entropy-based Model

검색결과 227건 처리시간 0.036초

최대 엔트로피 모텔 기반 품사 태거의 성능 향상 기법 (Techniques for improving performance of POS tagger based on Maximum Entropy Model)

  • 조민희;김명선;박재한;박의규;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.73-81
    • /
    • 2004
  • 한국어에서의 품사 결정 문제는 형태론적 중의성 문제도 있지만, 영어에는 발생하지 않는 동품사 중의성 문제로 더 까다롭다. 이러한 문제들은 어휘 문맥을 고려하지 않고서는 해결하기 어렵다. 통계 자료 부족 문제에 쉽게 대처하는 모델이 필요하며 문맥에 따른 품사를 결정하고자 할 때 서로 다른 형태의 여러 가지 어휘 문맥 정보를 반영할 수 있는 모델이 필요하다. 본 논문에서는 이런 점에 가장 적합한 최대 엔트로피(maximum entropy : ME) 모델을 품사태깅 작업에 이용하는 문제에 대해 다룬다. 어휘 문맥 정보를 이용하기 위한 자질함수가 매우 많아지는 문제에 대처하기 위해 필요에 따라 어휘 문맥 정보를 사전화 한다. 본 시스템의 특징으로는 어절 단위 품사 태깅을 위한 처리 기법. 어절의 형태소 분석열에 대한 어절 내부 확률 계산. ME 모델의 정규화 과정 생략에 의한 성능 향상, 디코딩 경로의 확장과 같은 점들이 있다. 실험을 통하여 본 연구의 기법이 높은 성능의 시스템을 달성할 수 있음을 알게 되었다.

  • PDF

적대적 공격을 방어하기 위한 StarGAN 기반의 탐지 및 정화 연구 (StarGAN-Based Detection and Purification Studies to Defend against Adversarial Attacks)

  • 박성준;류권상;최대선
    • 정보보호학회논문지
    • /
    • 제33권3호
    • /
    • pp.449-458
    • /
    • 2023
  • 인공지능은 빅데이터와 딥러닝 기술을 이용해 다양한 분야에서 삶의 편리함을 주고 있다. 하지만, 딥러닝 기술은 적대적 예제에 매우 취약하여 적대적 예제가 분류 모델의 오분류를 유도한다. 본 연구는 StarGAN을 활용해 다양한 적대적 공격을 탐지 및 정화하는 방법을 제안한다. 제안 방법은 Categorical Entropy loss를 추가한 StarGAN 모델에 다양한 공격 방법으로 생성된 적대적 예제를 학습시켜 판별자는 적대적 예제를 탐지하고, 생성자는 적대적 예제를 정화한다. CIFAR-10 데이터셋을 통해 실험한 결과 평균 탐지 성능은 약 68.77%, 평균정화성능은 약 72.20%를 보였으며 정화 및 탐지 성능으로 도출되는 평균 방어 성능은 약 93.11%를 보였다.

Group Contribution Method for Group Contribution Method for Estimation of Vapor Liquid Equilibria in Polymer Solutions

  • Oh, Suk-Yung;Bae, Young-Chan
    • Macromolecular Research
    • /
    • 제17권11호
    • /
    • pp.829-841
    • /
    • 2009
  • This study introduces a specified group-contribution method for predicting the phase equilibria in polymer solutions. The method is based on a modified double lattice model developed previously. The proposed model includes a combinatorial energy contribution that is responsible for the revised Flory-Huggins entropy of mixing, the van der Waals energy contribution from dispersion, a polar force and specific energy contribution. Using the group-interaction parameters obtained from data reduction, the solvent activities for a large variety of mixtures of polymers and solvents over a wide range of temperatures can be predicted with good accuracy. This method is simple but provides improved predictions compared to those of the other group contribution methods.

예쁜꼬마선충의 수영 행동 영상과 기계학습 모델을 이용한 수질 오염 물질 구분 방법 (A Method for the Classification of Water Pollutants using Machine Learning Model with Swimming Activities Videos of Caenorhabditis elegans)

  • 강승호;정인선;임형석
    • 한국정보통신학회논문지
    • /
    • 제25권7호
    • /
    • pp.903-909
    • /
    • 2021
  • 예쁜꼬마선충(Caenorhabditis elegans)은 염기서열이 완전히 밝혀진 동물로 유전자 기능 분석, 동물 행동 연구 등 다양한 연구 분야에 사용되는 대표적인 생물 종이다. 그동안 선충을 이용해 물의 오염 여부를 판별하기 위한 바이오 모니터링 시스템에 대한 여러 연구들이 있었다. 본 논문은 하천의 수질 오염의 원인이 되는 화학물질을 식별하기 위해 선충의 수영 행동이 활용 가능한 지를 보여주기 위해 기계학습 기반의 바이오 모니터링 시스템을 제안한다. 선충의 수영 행동을 대표하기 위해 선충을 대상으로 가지 길이 유사성(Branch Length Similarity) 엔트로피를 계산한다. 그리고 BLS 엔트로피의 조합인 BLS 엔트로피 프로파일을 클러스터링 알고리즘을 사용해 몇 가지 패턴으로 유형화하여 데이터 집합을 만든다. 0.1ppm 농도의 포름알데히드, 벤젠, 톨루엔이 첨가된 아레나에서 선충의 수영 행동을 촬영하고 개발한 히든 마코프 모델(Hidden Markov Model: HMM)의 성능을 검증한다.

MaxEnt 모형과 고라니의 이동행태를 고려한 수변지역 이동통로 적지선정 (Selecting Suitable Riparian Wildlife Passage Locations for Water Deer based on MaxEnt Model and Wildlife Crossing Analysis)

  • 정승규;이화수;박종훈;이동근;박종화;서창완
    • 대한공간정보학회지
    • /
    • 제23권1호
    • /
    • pp.101-111
    • /
    • 2015
  • 최근 우리나라는 하천정비사업으로 인해 수변생태계는 큰 위협을 받고 있으며, 수변의 야생동물은 고립되고 이동의 영향을 받고 있다. 본 연구의 목적은 수변지역을 대상으로 이동통로 적지를 선정하는 것이다. 목표종은 고라니를 대상으로 하였으며 Maximum Entropy 모형과 눈길위흔적조사 자료를 이용하여 최소비용거리에 따른 야생동물의 행동생태학적인 관점에서 수변지역의 이동통로 적지를 선정하였다. 연구결과 첫째, 수변인접서식지 분석에서 고라니의 잠재서식지 영향을 주는 중요요소는 수계와의 거리, 영급, 토지피복, 경사, 향, 고도, 밀도, 도로와의 거리순으로 나타났으며, 수변에서는 토지피복, 수변면적, 지류와의 거리, 시가지와의 거리가 주요 변수로 나타났음을 알 수 있었다. 둘째, 적지선정 지점은 수변과 인접지역의 각각의 서식지에서 적합도가 높은 지점과 이동경로를 고려하는 것이 바람직한 것으로 판단된다. 적지선정 지점들은 수변의 산림, 초지 및 농경지가 고라니의 주요 서식지이나 도로나 제방으로 인해서 연결성이 저하된 곳이었으며, 이동에 영향을 받아 우회하는 것을 눈길위흔적조사를 통해 확인하였다. 마지막으로 고라니는 수변지역에서 지류를 통해서 수변과 인근의 좋은 서식지를 선호하는 것으로 유추되었다. 본 연구에서 제시한 적지 선정 방법은 구조적이고 기능적인 분석을 통합한 방법으로 적지선정에 적용한다면 시간적 경제적인 소모를 줄일 수 있을 것이다.

두영역 모델과 직렬두요소 모델의 변수에 의한 원심 압축기 탈설계 성능의 민감도 분석 (Sensitivity Analysis on Off-Design Performance of Centrifugal Compressor Due to the Parameters of Two-zone Model and TEIS Model)

  • 윤성호;백제현
    • 대한기계학회논문집B
    • /
    • 제24권6호
    • /
    • pp.834-844
    • /
    • 2000
  • In this study, an off-design performance analysis procedure is developed based on Two-zone model and TEIS model. In Two-zone model, there are both primary zone and secondary zone for an isentropic core flow and an average of all non-isentropic streamtubes respectively. The level of the core flow diffusion in an impeller is calculated by using TEIS model which regards the impeller as two successive rotating elements in series. At impeller exit, the mixing process occurs with an increase in entropy, that is to say, a decrease in total pressure. In loss models including Two-zone and TEIS model, some empirical parameters have a great influence on overall performance curve. So these parameters' influences on the overall performance curve are investigated and compared with experimental data.

큰산개구리(Rana uenoi ) 종분포모형을 활용한 시민과학 및 전문가 기반 조사자료의 비교연구 (Comparative Study of Citizen Science and Expert Based Survey Data Using the Species Distribution Model of Rana uenoi)

  • 이원철;유정우;노백호
    • 한국환경과학회지
    • /
    • 제32권6호
    • /
    • pp.429-440
    • /
    • 2023
  • Quantitative habitat model is established with species occurrence and spatial abundance data, which were usually acquired by professional field ecologists and citizen scientists. The importance of citizen science data is increasing, but the quality of these data needs to be evaluated. This study aims to identify and compare both expert-based data and citizen science data based on the performance power of quantitative models derived from both data sets. A Maximum Entropy (MaxENT) model was developed using eight environmental variables, including climate, topography, landcover and distance to forest edge. The AUC values derived from the MaxENT model were 0.842 and 0.809, respectively, indicating a high level of explanatory power. All environmental variables has similar values for both data sets, except for the distance to forest edge and rice paddy, which was relatively higher for expert-based survey data than that of the citizen science data as the distances increased. This result suggests that habitat model derived from expert-based survey data shows more ecological niche including wider ranges from forest edges and isolated habitat patches of rice paddy. This is presumably because citizen scientists focuses on direct observation methods, whereas professional field surveys investigate a wider variety of methods.

SAR Despeckling with Boundary Correction

  • Lee, Sang-Hoon
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.270-273
    • /
    • 2007
  • In this paper, a SAR-despeck1ing approach of adaptive iteration based a Bayesian model using the lognormal distribution for image intensity and a Gibbs random field (GRF) for image texture is proposed for noise removal of the images that are corrupted by multiplicative speckle noise. When the image intensity is logarithmically transformed, the speckle noise is approximately Gaussian additive noise, and it tends to a normal probability much faster than the intensity distribution. The MRF is incorporated into digital image analysis by viewing pixel types as states of molecules in a lattice-like physical system. The iterative approach based on MRF is very effective for the inner areas of regions in the observed scene, but may result in yielding false reconstruction around the boundaries due to using wrong information of adjacent regions with different characteristics. The proposed method suggests an adaptive approach using variable parameters depending on the location of reconstructed area, that is, how near to the boundary. The proximity of boundary is estimated by the statistics based on edge value, standard deviation, entropy, and the 4th moment of intensity distribution.

  • PDF

딥러닝 기반 분류 모델의 준 지도 학습 기법 분석 (The Analysis of Semi-supervised Learning Technique of Deep Learning-based Classification Model)

  • 박재현;조성인
    • 방송공학회논문지
    • /
    • 제26권1호
    • /
    • pp.79-87
    • /
    • 2021
  • 본 논문에서는 소량의 레이블 데이터로 딥러닝 기반 분류 모델을 훈련할 때 적용되는 준 지도 학습 기법 (semi-supervised learning: SSL)에 대해서 분석한다. 기존의 준 지도 학습 기법은 크게 일관성 정규화 (consistency regularization), 엔트로피 기반 (entropybased), 의사 레이블링 (pseudo labeling)으로 구분할 수 있다. 우선, 각 준 지도 학습 기법의 알고리즘에 대해서 서술한다. 실험에서는 준 지도학습 기법을 레이블 데이터의 수를 변화시키면서 훈련 후 분류 정확도를 평가한다. 최종적으로 실험 결과를 바탕으로 기존 준 지도 학습 기법의 한계에 대해서 서술하고, 분류 성능을 향상하기 위한 연구 방향을 제시한다.

가변 어휘 음성 인식기의 음향모델 개선 및 성능분석 (Acoustic Model Improvement and Performance Evaluation of the Variable Vocabulary Speech Recognition System)

  • 이승훈;김회린
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.3-8
    • /
    • 1999
  • 문맥독립형 음향모델을 채택하고 있는 기존의 가변어휘 음성인식기는 주변환경에 따른 음소의 변화를 모델링 할 수 없었다. 이러한 문제를 해결하기 위해서는 변이음을 이용한 문맥의존형 음향모델을 사용해야 한다. 본 논문은 가변어휘 음성인식기의 음향모델을 효과적으로 개선하기 위하여 적용한 방법에 대해서 기술하고 있다. 즉, 음향모델의 개선은 엔트로피를 이용한 군집화 기법을 적용하여 변이음의 개수를 변경시키면서 최적의 변이음 모델을 추출하는 방법을 사용하였다. 개선된 모델에 대한 성능은 POW(Phonetically Optimized Words) 3848 DB 및 SNR이 크게 다른 2종류의 PC168 DB를 이용하여 훈련 및 인식 실험을 수행하면서 평가하였다. 결론적으로 변이음의 개수를 낮추면서도 인식 성능의 저하를 가져오지 않는 최적의 변이음 모델을 얻을 수 있었으며 PC168 DB를 이용한 인식실험을 통하여 확인할 수 있었다.

  • PDF