• 제목/요약/키워드: 이진 분류

검색결과 605건 처리시간 0.038초

효율적인 직선 검출을 위한 에지 패턴 분류 방법 (Edge Pattern Classification Method for Efficient Line Detection)

  • 박상현;김종호;강의성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.918-920
    • /
    • 2011
  • 본 논문에서는 이진화 결과 임펄스 노이즈 형태가 나타나는 영상에서 직선 성분을 검출할 때 사용되는 에지 패턴 분리 방법을 제안한다. 임펄스 노이즈가 발생하면 직선형태의 에지 패턴이 왜곡되어 복잡한 형태의 에지 형태가 된다. 왜곡된 상태에서 직선 검출 알고리즘을 적용하면 노이즈로 왜곡된 직선을 검출하지 못하기 때문에 전체 영상의 에지 성분을 방향성을 이용하여 분리하여야 한다. 본 논문에서는 4 방향에 대해서 에지 성분을 분리하였고, 분리한 각 영상에 대해서 겹쳐진 직선 패턴을 분리하여 직선을 검출하였다. 실험 결과는 제안하는 방법이 간단하면서도 정확하게 직선을 검출함을 보여준다.

  • PDF

워드 임베딩과 딥러닝 기법을 이용한 SMS 문자 메시지 필터링 (SMS Text Messages Filtering using Word Embedding and Deep Learning Techniques)

  • 이현영;강승식
    • 스마트미디어저널
    • /
    • 제7권4호
    • /
    • pp.24-29
    • /
    • 2018
  • 딥러닝에서 자연어 처리를 위한 텍스트 분석 기법은 워드 임베딩을 통해 단어를 벡터 형태로 표현한다. 본 논문에서는 워드 임베딩 기법과 딥러닝 기법을 이용하여 SMS 문자 메시지를 문서 벡터로 구성하고 이를 스팸 문자 메시지와 정상적인 문자 메시지로 분류하는 방법을 제안하였다. 유사한 문맥을 가진 단어들은 벡터 공간에서 인접한 벡터 공간에 표현되도록 하기 위해 전처리 과정으로 자동 띄어쓰기를 적용하고 스팸 문자 메시지로 차단되는 것을 피하기 위한 목적으로 음절의 자모를 특수기호로 왜곡하여 맞춤법이 파괴된 상태로 단어 벡터와 문장 벡터를 생성하였다. 또한 문장 벡터 생성 시 CBOW와 skip gram이라는 두 가지 워드 임베딩 알고리즘을 적용하여 문장 벡터를 표현하였으며, 딥러닝을 이용한 스팸 문자 메시지 필터링의 성능 평가를 위해 SVM Light와 정확도를 비교 측정하였다.

KorBERT와 Popularity 정보에 기반한 한국어 개체연결 (Korean Entity Linking based on KorBERT and Popularity )

  • 허정;배경만;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.502-506
    • /
    • 2022
  • 본 논문에서는 KorBERT와 개체 인기정보(popularity)를 이용한 개체연결 기술을 소개한다. 멘션인식(mention detection)은 KorBERT를 이용한 토큰분류 문제로 학습하여 모델을 구성하였고, 개체 모호성해소(entity disambiguation)는 멘션 컨텍스트와 개체후보 컨텍스트 간의 의미적 연관성에 대한 KorBERT기반 이진분류 문제로 학습하여 모델을 구성하였다. 개체 인기정보는 위키피디아의 hyperlink, inlink, length 정보를 활용하였다. 멘션인식은 ETRI 개체명 인식기를 이용한 모델과 비교하였을 경우, ETRI 평가데이터에서는 F1 0.0312, 국립국어원 평가데이터에서는 F1 0.1106의 성능 개선이 있었다. 개체 모호성해소는 KorBERT 모델과 Popularity 모델을 혼용한 모델(hybrid)에서 가장 우수한 성능을 보였다. ETRI 평가데이터에서는 Hybrid 모델에서의 개체 모호성 해소의 성능이 Acc. 0.8911 이고, 국립국어원 평가데이터에서는 Acc. 0.793 이였다. 최종적으로 멘션인식 모델과 개체 모호성해소 모델을 통합한 개체연결 성능은 ETRI 평가데이터에서는 F1 0.7617 이고, 국립국어원 평가데이터에서는 F1 0.6784 였다.

  • PDF

CCTV 영상 기반 강수량 산정을 위한 데이터 전처리 방안 연구 (A Study on data pre-processing for rainfall estimation from CCTV videos)

  • 변종윤;전창현;이진욱;김현준;차호영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.167-167
    • /
    • 2022
  • 최근 빅데이터에 관련된 연구에 있어 데이터의 품질관리에 대한 논의가 꾸준히 이뤄져 오고 있다. 특히 이미지 처리 및 분석에 활용되어온 딥러닝 기술의 경우, 분류 작업 및 패턴인식 등으로부터 데이터의 특징을 추출함으로써 비지도학습(Unsupervised Learning)을 가능하게 한다는 장점이 있음에도 불구하고 빅데이터를 다루는 과정에 있어 용량, 다양성, 속도 및 신뢰성 측면에서의 한계가 있었다. 본 연구에서는 CCTV 영상을 활용한 강수량 산정 모델 개발에 있어 예측 정확도 향상 및 성능 개선을 도모할 수 있는 데이터 전처리 방법을 제안하였다. 서울 근린 AWS 4개소 지역(김포장기, 하남덕풍, 강동, 성남) 및 중앙대학교 지점 내 CCTV를 설치한 후, 최대 9개월의 영상을 확보하여 강수량 산정을 위한 딥러닝 모델을 개발하였다. 배경분리, 조도조정, 영역설정, 데이터증진, 이상데이터 분류 등이 가능한 알고리즘을 개발함으로써 데이터셋 자체에 대한 전처리 작업을 수행한 후, 이에 대한 결과를 기존 관측자료와 비교·분석하였다. 본 연구에서 제안한 전처리 방법들을 적용한 결과, 강수량 산정 모델의 예측 정확도를 평가하는 지표로 선정한 평균 제곱근 편차(Root Mean Square Error; RMSE)가 약 30% 감소함을 확인하였다. 본 연구의 결과로부터 CCTV 영상 데이터를 활용한 강수량 산정의 가능성을 확인할 수 있었으며 특히, 딥러닝 모델 개발시 필요한 적정 전처리 방법들에 대한 기준을 제시할 수 있을 것으로 판단된다.

  • PDF

딥러닝 기반 분류기법을 활용한 비상급수 예측 가능성 검토 (Predictability of emergency water supply using machine learning-based classification techniques)

  • 오영록;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.303-303
    • /
    • 2022
  • 기후변화로 인해 기상이변 현상의 발생 빈도가 잦아지며 가뭄 방생 빈도 또한 증가하는 추세이다. 이에 따라 가뭄 피해를 경감하는 선제적 가뭄대응체계 구축과 가뭄이 발생한 이후에 피해를 최소화하기 위한 연구가 필요하다. 본 연구에서는 가뭄피해 여부를 이진분류 방법으로 접근하여 예측 가능성을 검토하였다. 가뭄피해 여부는 비상급수(제한급수,운반급수) 자료를 이용하여 비상급수가 시행된 경우를 가뭄피해 발생으로 보고, 비상급수가 시행되지 않은 경우를 피해 없는 사례로 구분하였다. 기상 상황 변수로는 강수량, 기온, 상대습도 등을 이용하였다. 또한 지역별 연간 총 급수량 대비 저수량을 이용하여 지역별 현 상황을 고려하고자 하였다. 의사결정나무를 이용하여 분석한 결과 불균형 클래스 문제의 정확도에 주로 이용되는 오차행렬의 정확도가 0.95 이상으로 나타났으며, F1-Score는 약 0.5 로 나타났다. 이는 예측 결과 전체를 대상으로 했을 경우 95 %의 확률로 가뭄피해 여부를 구분할 수 있는 것을 나타내며, 가뭄 피해만을 대상으로 했을 경우 50 %의 정확도를 타나낸다. 그러나 본 연구에서는 비상급수를 유발하는 충분한 환경적 변수를 고려하지 않았고, 다양한 딥러닝 모형을 분석하지 않았다. 따라서 비상급수를 유발하는 요인을 충분히 고려하고 딥러닝 기법을 고도화 한다면 모형의 정확도 개선을 기대할 수 있을 것으로 판단된다.

  • PDF

강원도 강릉시 일대 산불지역 분류를 위한 Landsat ETM 영상 분류지수의 활용 (Application of Landsat ETM Image Indices to Classify the Wildfire Area of Gangneung, Gangweon Province, Korea)

  • 양동윤;김주용;전공수;이진영
    • 한국지구과학회지
    • /
    • 제25권8호
    • /
    • pp.754-763
    • /
    • 2004
  • 본 연구는 강원도 강릉지역 산불지역의 피해분석을 위한 피해지 지표분류를 목적으로 Landsat Enhanced Thematic Mapper Plus (ETM+) 영상에서 활용할 수 있는 분류지수의 적용을 검토하였다. 연구지역 산불지역을 대상으로 Landsat TM 영상을 활용하기 위해 개발된 식생지수(NDVI)와 토양을 고려한 식생지수(SAVI), Tasseled Cap 변환으로 억을 수 있는 밝기지수(brightness), 습윤지수(wetness), 녹색지수(greenness)를 야외조사 결과와 비교하였다. 분석 결과 식생지수와 토양을 고려한 식생지수는 산불발생지역과 산불이 발생하지 않은 지역에 대한 구분이 뚜렷하였으나, 산불발생지역내에서 피해지역 구분에는 적절하지 않은 것으로 파악되었다. 산불방생지역내에서는 Tasseled Cap 변화에서 나타나는 토양평면을 활용할 때 침식피해와 관련한 야외조사 결과와 가장 근접한 분류 결과를 얻을 수 있었다. Tasseled Cap 변환에서 건조지수와 녹색지수를 더하여 선형함수로 활용하면 신속하고 효율적으로 산불지역을 분류가 가능 할 것으로 기대된다.

히스토그램의 최적폭에 기반한 3차원 필름 영상의 분류 (3D Film Image Classification Based on Optimized Range of Histogram)

  • 이재은;김영봉;김종남
    • 융합신호처리학회논문지
    • /
    • 제22권2호
    • /
    • pp.71-78
    • /
    • 2021
  • 영상의 군집 속에서 특정 영상을 분류하기 위해서는 주로 목표 영상과 배경의 명암 차이를 구하는데 만약 특정 영상의 윤곽선이 흐리고 선명도가 낮다면 이를 분류하기가 쉽지 않다. 하지만 이러한 영상을 분류하기 위한 연구들이 많지 않으며, 지금까지 발표된 방법들을 적용하더라도 제대로 구분하지 못한다는 어려움이 있다. 본 논문에서는 각 3차원 필름 영상들의 히스토그램을 구한 후, 히스토그램의 최고 빈도를 기준으로 특정 빈도에서의 폭을 구하여 윤곽선이 흐린 불량패턴의 영상을 분류하는 방법을 제안한다. 실험을 통하여 정품 패턴과 불량 패턴 영상의 히스토그램 분포의 차이가 뚜렷하다는 것을 확인할 수 있었으며, 이러한 히스토그램의 특성을 반영한 제안 알고리즘을 통하여 모든 영상들을 정확하게 분류할 수 있다는 것을 보였다. 제안한 알고리즘의 성능을 평가하기 위하여 이진화, 히스토그램, 가장자리 검출을 이용한 각각의 유사도 검정들과 퓨샷 러닝의 분석 결과를 비교분석 하였으며, 실험을 통하여 제안한 알고리즘은 앞선 네 가지 방법들보다 복잡한 계산 없이 높은 성능을 낼 수 있다는 것을 검증하였다.

정보 보안 평가 및 취약점 분석을 위한 SW 테스팅 절차 (A SW Testing Procedure for Information Technology Security Evaluation and Vulnerability Analysis)

  • 김동진;정윤식;조성제;박민규;이진영;김일곤;이태승;김홍근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.80-82
    • /
    • 2012
  • 다양한 정보보호 제품이 개발됨에 따라, 정보보호 제품 보증을 위해 자체의 보안성 평가 및 인증이 중요시되고 있다. 정보보호 제품의 평가 및 인증을 위해서는 보안기능 검사와 취약점 분석 단계가 매우 중요하지만 이를 위한 정보보호 제품의 보안기능 시험과 취약성 분석을 위한 테스팅 절차에 대한 연구는 그 중요성에 비해 많이 수행되지 않았다. 현재까지는 보안제품을 기능별로 제품을 분류하여 보안성을 평가하였는데, 본 논문에서는 보안 제품들에서 공격에 취약한 SW 모듈 중심으로 테스팅 대상을 분류하는 방법을 제안한다. 분류된 SW 모듈별로 적합한 보안 테스팅 기법을 정의하고, 보안제품의 취약점을 효과적으로 탐지하기 위해 공개되어 있는 관련 취약점도 분석하였다. 이를 통해 정보보호 제품의 취약점 분석 및 제품 보안성 평가를 위한 SW 모듈별 보안 테스팅 절차를 수립하고, 테스트하였다. 실험을 통해 취약한 SW 모듈별 적절한 공격 기법 선정 시 제안 절차가 정보보호 제품 평가 인증에 활용될 수 있음을 확인하였다.

캐릭터 성장 유형 분류를 통한 온라인 게임 하드코어 유저와 게임 봇 탐지 연구 (A study on hard-core users and bots detection using classification of game character's growth type in online games)

  • 이진;강성욱;김휘강
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1077-1084
    • /
    • 2015
  • 온라인 게임에서 게임 봇의 사용은 개인정보 탈취, 계정도용의 보안 문제를 발생시킨다. 또한, 게임 봇은 게임 내재화를 불공정하게 수집하여 게임 콘텐츠의 빠른 소비와 정당한 게임 사용자에게 상대적 박탈감을 주어 게임시장 침체를 일으킨다. 본 연구에서는 실제 온라인 게임 내 캐릭터의 성장 과정 분석을 통해 성장 유형을 정의하고, 성장 유형에서 게임봇을 탐지 및 하드코어 유저와 봇을 분류하는 프레임워크를 제안한다. 실제 게임 데이터에 제안한 프레임워크를 적용하여 5가지로 성장 유형을 분류하였고, 93%의 정확도로 봇 탐지 및 하드코어 유저와 봇을 구분하였다. 또한 기존 연구에서 봇으로 탐지되었던 하드코어 유저를 구분해내고, 게임 봇을 성장 전에 사전 탐지함으로써 향상된 성능을 보였다.

청미천 산지사면에서의 토양 수분 측정 시스템구축 연구 (Soil Moisture Measurement System in the Mountainous Hillslope located at Chunmichun Watershed)

  • 선한나;주승효;김상현;권규상;이연길;이진원;정성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1787-1791
    • /
    • 2009
  • 지표수의 유출과정을 설명하는 과정에서 중요인자이며, 생태수문학의 핵심변수이자 기상모형의 중요한 입력변수인 토양수분의 공간적 시간적 특징들은 강우 및 지하수와 토양수분간의 순환 구조를 규명하는데 매우 중요하다. 가장 널리 쓰이는 토양 수분 측정 장비인 TDR 장비 매설에 앞서 대상유역 선정에 대한 여러 가지 고려사항을 검토하고 수치지형 분석 등을 통한 사전분석을 실시하였다. 대상유역을 선정하기 위해서는 대상유역의 자료획득의 용이함, 지정학적, 시스템 운영적 측면에서의 가용성, 그리고 정밀측량 및 부수적요인 등 여러 요소의 고려가 요구된다. 청미천 유역을 대상으로 약 21 개의 대상후보사면을 정밀조사 하였으며, 충청북도 음성군 수레의산 청소련 수련원내의 산지 사면을 측정대상 사면으로, 지정학적 위치, 식생분포, 지질구조 및 심도 등의 토양특성의 고려를 통해서 선정하였다. 또한 대상 사면에 흐름 발생 및 분포를 계산하기 위해서 대상사면의 지표 및 기반암 표고를 정밀 측량하였으며, 기반암 또는 풍화대까지의 깊이를 실측하여 지표면 및 지하면의 수치지형 모형을 구축하였다. 대상사면 및 지하면에 대하여 표고수치지형모형(Digital Elevation Model:DEM)으로 도식한 후 흐름 발생 공간 분포를 계산하였다. 다양한 흐름 발생 알고리즘으로 기여사면적과 지형습윤지수를 계산하였다. 분배알고리즘의 의해 도출된 지형인자들로 인한 흐름발생 공간적 분포특성을 비교하여 센서의 매설 위치를 결정하였다. 센서 매설 위치에 대한 토양시료를 채취하여 토성을 분석한 결과는 미국 농무성 기준에 의한 분류로는 사양토로, 국제토양학회의 분류기준에 따르면 양토로 분류되었다. 대상사면의 유효입력강우를 확보하기위해서 개방공간인 수레의산 청소년수련원과 대상산림의 Canopy하부에 각각 강수측정 시스템을 설치하였고 약 6개월간 성공적으로 자료를 획득하였다.

  • PDF