• 제목/요약/키워드: 확률신경망

검색결과 261건 처리시간 0.024초

잡음 환경에 효과적인 음성 인식을 위한 Gaussian mixture model deep neural network 하이브리드 기반의 특징 보상 (A study on Gaussian mixture model deep neural network hybrid-based feature compensation for robust speech recognition in noisy environments)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제37권6호
    • /
    • pp.506-511
    • /
    • 2018
  • 본 논문에서는 잡음 환경에서 효과적인 음성인식을 위하여 GMM(Gaussian Mixture Model)-DNN(Deep Neural Network) 하이브리드 기반의 특징 보상 기법을 제안한다. 기존의 GMM 기반의 특징 보상에서 필요로 하는 사후 확률을 DNN을 통해 계산한다. Aurora 2.0 데이터를 이용한 음성 인식 성능 평가에서 본 논문에서 제안한 GMM-DNN 하이브리드 기법이 기존의 GMM 기반 기법에 비해 Known, Unknown 잡음 환경에서 모두 평균적으로 우수한 성능을 나타낸다. 특히 Unknown 잡음 환경에서 평균 오류율이 9.13 %의 상대 향상률을 나타내고, 낮은 SNR(Signal to Noise Ratio) 잡음 환경에서 상당히 우수한 성능을 보인다.

Improved real-time power analysis attack using CPA and CNN

  • Kim, Ki-Hwan;Kim, HyunHo;Lee, Hoon Jae
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권1호
    • /
    • pp.43-50
    • /
    • 2022
  • CPA(Correlation Power Analysis)는 암호 알고리즘이 탑재된 공격 대상 장비의 미세한 소비전력을 측정하여 90% 이상의 확률로 암호 알고리즘에 사용된 비밀키를 추측하는 부채널 공격 방법이다. CPA는 통계를 기반으로 분석을 수행하기 때문에 반드시 많은 양의 데이터가 요구된다. 따라서 CPA는 매회 공격을 위해 약 15분 이상 소비전력을 측정해야만 한다. 본 논문에서는 CPA의 데이터 수집 문제를 해결하기 위해 입력데이터를 축적하고 결과를 예측할 수 있는 CNN(Convolutional Neural Network)을 사용하는 방법을 제안한다. 사전에 공격 대상 장비의 소비전력을 수집 및 학습을 통해 임의의 소비전력을 입력시키면 즉각적으로 비밀키를 추정할 수 있어 연산속도를 향상하고 96.7%의 비밀키 추측 정확도를 나타냈다.

블랙 박스 모델의 출력값을 이용한 AI 모델 종류 추론 공격 (Model Type Inference Attack Using Output of Black-Box AI Model)

  • 안윤수;최대선
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.817-826
    • /
    • 2022
  • AI 기술이 여러 분야에 성공적으로 도입되는 추세이며, 서비스로 환경에 배포된 모델들은 지적 재산권과 데이터를 보호하기 위해 모델의 정보를 노출시키지 않는 블랙 박스 상태로 배포된다. 블랙 박스 환경에서 공격자들은 모델 출력을 이용해 학습에 쓰인 데이터나 파라미터를 훔치려고 한다. 본 논문은 딥러닝 모델을 대상으로 모델 종류에 대한 정보를 추론하는 공격이 없다는 점에서 착안하여, 모델의 구성 레이어 정보를 직접 알아내기 위해 모델의 종류를 추론하는 공격 방법을 제안한다. MNIST 데이터셋으로 학습된 ResNet, VGGNet, AlexNet과 간단한 컨볼루션 신경망 모델까지 네 가지 모델의 그레이 박스 및 블랙 박스 환경에서의 출력값을 이용해 모델의 종류가 추론될 수 있다는 것을 보였다. 또한 본 논문이 제안하는 방식인 대소 관계 피쳐를 딥러닝 모델에 함께 학습시킨 경우 블랙 박스 환경에서 약 83%의 정확도로 모델의 종류를 추론했으며, 그 결과를 통해 공격자에게 확률 벡터가 아닌 제한된 정보만 제공되는 상황에서도 모델 종류가 추론될 수 있음을 보였다.

Hellinger 거리 IoU와 Objectron 적용을 기반으로 하는 객체 감지 (Object Detection Based on Hellinger Distance IoU and Objectron Application)

  • 김용길;문경일
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.63-70
    • /
    • 2022
  • 2D 객체 감지 시스템은 최근 몇 년 동안 심층 신경망과 대규모 이미지 데이터세트의 사용으로 크게 개선되었지만, 아직도 범주 내에서 데이터 부족, 다양한 외관 및 객체 형상 때문에 자율 탐색 등과 같은 로봇 공학과 관련된 응용에서 2D 물체 감지 시스템은 적절하지 않다. 최근에 소개되고 있는 구글 Objectron 또한 증강 현실 세션 데이터를 사용하는 새로운 데이터 파이프라인이라는 점에서 도약이라 할 수 있지만, 3D 공간에서 2D 객체 이해라는 측면에서 마찬가지로 한계가 있다. 이에 본 연구에서는 더 성숙한 2D 물체 감지 방법을 Objectron에 도입하는 3D 물체 감지 시스템을 나타낸다. 대부분의 객체 감지 방법은 경계 상자를 사용하여 객체 모양과 위치를 인코딩한다. 본 작업에서는 가우스 분포를 사용하여 객체 영역의 확률적 표현을 탐색하는데, 일종의 확률적 IoU라 할 수 있는 Hellinger 거리를 기반으로 하는 가우스 분포에 대한 유사성 측도를 제시한다. 이러한 2D 표현은 모든 객체 감지기에 원활하게 통합할 수 있으며, 실험 결과 데이터 집합에서 주석이 달린 분할 영역에 더 가까워서 Objectron의 단점이라 할 수 있는 3D 감지 정확도를 높일 수 있다.

산사태 공간 정보시스템 개발 및 산사태 공간 정보의 활용 (Development of Spatial Landslide Information System and Application of Spatial Landslide Information)

  • 이사로;김윤종;민경덕
    • Spatial Information Research
    • /
    • 제8권1호
    • /
    • pp.141-153
    • /
    • 2000
  • 본 연구는 지리정보시스템(GIS)을 이용하여 공간정보를 중심으로 한 산사태 공간 정보 시스템을 개발하고 활용하는 것을 목적으로 하였다. 항공사진 판독 및 현장조사로 산사태 위치를 탐지하고 , 지형도, 토양도, 임상도, 지질도 등이 연구지역인 용인지역에 대해 수집되고 GIS를 이용하여 공간 데이터베이스로 구축되었다. 산사태 발생요인인 지형의 경사, 경상방향, , 곡률등은 지형 데이터베이스로부터 계산되었고 토질, 토양모재, 배수, 유효토심 등은 토양 데이터베이스로부터 추출되었고, 임상, 영급, 경급, 밀도 등은 임상 데이터베이스로부터 추출되었다. 그리고 역시 산사태 발생요인인 임상은 지질데이터베이스로부터 추출되었고, 토지이용은 Landsat TM 영상을 이용하여 추출되었다. 여기에 빌딩, 도로, 철도, 각종 시설물 등 산사태로 인해 피해를 받을 수 있는 요소에 대해서도 지형데이터베이스로부터 추출되었다. 산사태 취약성은 이러한 산사태 발생요인을 이용하여 확률, 로지스틱 회귀모델, 인공신경망 기법을 적용하여 분석되었다. 이러한 산사태 발생 요인 및 취약성 분석결과를 검색하기 위해 산사태 공간정보시스템이 개발되었다. 이 시스템은 ArcView 의 스크립트 언어인 Avenue를 이용하여 개발되었고 풀다운 메뉴 및 아이콘 메뉴방식을 사용하여 쉽게 개발되었다. 그리고 구축된 산사태 발생요인 및 취약성 분석결과를 인터넷 GIS 기술을 이용하여 인터넷 WWW 환경에서 검색할 수 있게 하였다.

  • PDF

확장 베이지안망을 적용한 고위험성 HRCT 영상 분류 (Classification of Very High Concerns HRCT Images using Extended Bayesian Networks)

  • 임채균;정용규
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.7-12
    • /
    • 2012
  • 최근 의료분야에서는 방대한 양의 정보를 효과적으로 처리하기 위하여 의사결정트리, 신경망, 베이지안망 등을 비롯한 각종 데이터마이닝 기법의 적용 방안을 연구하고 있다. 또한 환자의 기본적인 신상정보나 과거력, 가족력과 같은 정보 이외에도 MRI, HRCT 등의 영상정보를 추가적으로 수집하고 진단에 활용함으로써 질병진단의 정확도 향상을 도모하는 것이 일반적인 현황이다. 하지만 실제 상황에서는 결과에 영향을 미치는 다량의 변수가 존재하므로 특정 데이터마이닝 기법을 통하여 얻을 수 있는 정보가 상당히 제한적이라고 볼 수 있다. 그뿐만 아니라 촬영된 의료영상도 부수적으로 진단에 긍정적인 영향을 줄 수는 있지만, 주관적인 판단 비중이 높아 자동화된 시스템으로 처리하기가 난해한 문제이다. 이에 따라 현실의 복잡한 상황에서 상대적으로 대처가 유리하고 다변량 확률적인 모델을 기반으로 하는 베이지안망에서 K2나 TAN 등으로 탐색 알고리즘을 개선한 확장 모델이 제안되었다. 이 때, 적용되는 탐색 알고리즘의 종류에 따라 그 성능이 크게 좌우되는 확장 베이지안망의 특성상, 각 기법에 대한 성능과 적합성의 사실적인 평가가 요구된다. 따라서 본 논문에서는 확장 베이지안망에서 질병 진단에 대한 동일한 데이터를 이용하여 실험을 수행하였으며, K2, TAN과 같은 탐색 알고리즘에 변화를 주며 분류 정확도를 측정하였다. 실험에서는 10-fold 교차검증을 수행한 결과분석을 기반으로 성능을 비교평가하고, 발병 위험성이 높은 환자에 대한 HRCT 영상을 분류하여 고위험성의 데이터를 식별 가능하도록 하였다.

재입원 예측 모형 개발에 관한 연구 (A Study on the Development of Readmission Predictive Model)

  • 조윤정;김유미;함승우;최준영;백설경;강성홍
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.435-447
    • /
    • 2019
  • 불필요한 재입원을 예방하기 위해서는 재입원 확률이 높은 집단을 집중적으로 관리할 필요가 있다. 이를 위해서는 재입원 예측모형의 개발이 필요하다. 재원예측 모형을 개발하기 위해 1개 대학병원의 2016년에서 2017년의 2년간의 퇴원요약환자 데이터를 수집하였다. 이때 재입원 환자는 연구 기간 내에 2번 이상 퇴원한 환자라 정의 하였다. 재입원환자의 특성을 파악하기 위해 기술통계와 교착분석을 실시하였다. 재입원 예측 모형개발은 데이터마이닝 기법인 로지스틱회귀모형, 신경망, 의사결정모형을 이용하였다. 모형평가는 AUC(Area Under Curve)를 이용하였다. 로지스틱회귀모형이 AUC가 0.81로 가장 우수하게 나옴에 따라 본 연구에서는 로지스틱 회귀모형을 최종 재입원 예측 모형으로 선정을 하였다. 로지스틱회귀모형에서 선정된 재입원에 영향을 끼치는 주요한 변수는 성별, 연령, 지역, 주진단군, Charlson 동반질환지수, 퇴원과, 응급실 경유 여부, 수술여부, 재원일수, 총비용, 보험종류 등이었다. 본 연구에서 개발한 모형은 1개병원의 2년치 자료이므로 일반화하기에는 제한점이 있다. 추후에 여러 병원 장기간의 데이터를 수집하여 일반화 할 수 있는 모형을 개발하는 것이 필요하다. 더 나아가 계획에 없던 재입원 까지 예측을 할 수 있는 모형을 개발하는 것이 필요하다.

강우로 인한 사면의 불안정성에 대한 신뢰성 있는 평가 (Reliable Assessment of Rainfall-Induced Slope Instability)

  • 김윤기;최정찬;이승래;성주현
    • 한국지반공학회논문집
    • /
    • 제25권5호
    • /
    • pp.53-64
    • /
    • 2009
  • 강우침투로 인하여 많은 사면이 붕괴되고 있다. 따라서 사면에 대한 최근 연구들은 강우가 유발하는 사면의 불안정성에 초점이 맞춰져 있으며 강우침투 문제는 중요한 사면붕괴 발생 요인으로 인식되고 있다. 강우가 사면 내부의 모관흡수력을 감소시키면서 사면 내부로 침투되며 심지어 지반특성에 따라 표층 근에서 양의 간극수압이 발생할 수도 있다. 이러한 현상은 사면 강도를 감소시켜 사면 붕괴를 유발할 수 있다. 국내 여러 공공기관에서는 지하수위가 표층 또는 밀정 깊이 내에 존재하도록 하여 사면의 포화상태를 가정하는 보수적인 사면 설계방안을 제시하였으나, 이러한 가정은 대부분 부적절하고 이를 만족시키기 위해 때로는 사면설계 단계에서 잘못된 지반물성이 사용되기도 한다. 본 논문에서는 실제 강우침투 현상을 고려하여 보다 합리적으로 사면의 안정성을 평가하는 기법이 제안되었다. 국내 풍화토에 대한 불포화 지반물성(강도, 함수특성곡선, 투수곡선)이 실험적으로 획득되었으며, 인공신경망 모델을 통해 간접적으로도 추정되었다. 또한 현장 계측자료의 불확실성을 보완하기 위하여 사면의 불안정성 평가기법에 대하여 결정론적 해석과 확률론적 해석에 기반한 실시간 사면 붕괴 경보 기준이 모니터링 시스템에 도입되었다. 이러한 사면안정성 평가기법은 사면 내부의 모관흡수력, 함수비와 같은 중요요소를 계측한 현장자료와 접목하여 강우에 따라 불안정해진 사면에 대한 조기 경보시스템으로 활용될 수 있다.

일개 종합병원의 민간 건강검진 수검자의 검진이용 특성, 건강행태 및 건강관리 수준 분석 (Analysis of Utilization Characteristics, Health Behaviors and Health Management Level of Participants in Private Health Examination in a General Hospital)

  • 김유미;박종호;김원중
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.301-311
    • /
    • 2013
  • 본 연구의 목적은 2차 종합병원급 건강검진센터를 이용한 민간 종합검진 환자의 검진 이용특성과 이들의 건강행태 및 건강관리 수준을 분석하는 것이다. 이를 위해 대전지역 일개 2차 종합병원급 건강검진센터의 2011년 20,696명의 민간 건강검진 수검자를 대상으로 이들의 2001년에서 2011년까지 11년간의 수검자료 150,501건을 분석하였다. 민간 종합검진 수검자의 검진군 분류를 위한 군집분석은 K-means기법의 z-score표준화 방법을 이용하여 분류하였으며, 정기/비정기 검진 분류모형 개발을 위해 로지스틱회귀분석, 의사결정나무, 신경망 분석을 이용하였다. 개발된 비정기 검진군 분류 모형에 따라 신규 검진군 중 비정기 검진군이 될 확률이 높은 1,000명을 추출하여 고객관리사업 대상자로 하였다. 분석결과, 수검자는 신규 검진군, 정기 검진군, 비정기 검진군으로 분류하였다. 신규 검진군은 30대가 많고, 신장질환 의심자의 비율이 높았다. 정기 검진군은 남자, 이상지혈증 의심 비율이 높았다. 비정기 검진군은 흡연율과 운동부족 비율이 높았고, 빈혈 및 당뇨의심 비율이 높았다. 의사결정나무 분석결과 비정기 검진환자의 특성에 영향을 미치는 변수로는 성별, 연령, 거주지, 운동, 빈혈, 이상지혈증, 당뇨, 비만, 간질환 등이었다. 특히 여자 수검자로서 빈혈 검사는 정상, 운동을 하지 않는 군이면서 비만이 의심되는 수검자의 비정기적 수검율은 71.4%에 달하였다. 이러한 연구결과 토대로 맞춤형 고객관리 사업을 진행한다면 건강검진센터 효율적인 운영에 기여할 수 있을 것이다.

증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측 (The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF)

  • 양수연;이채록;원종관;홍태호
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.237-262
    • /
    • 2022
  • 본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영향을 미치는 요인이라는 것을 확인할 수 있었다.