• Title/Summary/Keyword: 이진 분류

Search Result 605, Processing Time 0.034 seconds

Edge Pattern Classification Method for Efficient Line Detection (효율적인 직선 검출을 위한 에지 패턴 분류 방법)

  • Park, Sang-Hyun;Kim, Jong-Ho;Kang, Eui-Sung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2011.10a
    • /
    • pp.918-920
    • /
    • 2011
  • In this paper, a simple edge pattern classification method is proposed for detecting straight line segments in an image corrupted by impulse noise. Corrupted images have complicated edge patterns. To detect straight line from an complicated edge pattern, it is needed to simplify the entire edge. The proposed algorithm separates the entire edge into 4 directional partial edge patterns. Each line segment is separated from the partial edge image where several line segments are overlapped, and then the straight line is detected. The results of the experiments emphasize that the proposed algorithm is simple but accurate.

  • PDF

SMS Text Messages Filtering using Word Embedding and Deep Learning Techniques (워드 임베딩과 딥러닝 기법을 이용한 SMS 문자 메시지 필터링)

  • Lee, Hyun Young;Kang, Seung Shik
    • Smart Media Journal
    • /
    • v.7 no.4
    • /
    • pp.24-29
    • /
    • 2018
  • Text analysis technique for natural language processing in deep learning represents words in vector form through word embedding. In this paper, we propose a method of constructing a document vector and classifying it into spam and normal text message, using word embedding and deep learning method. Automatic spacing applied in the preprocessing process ensures that words with similar context are adjacently represented in vector space. Additionally, the intentional word formation errors with non-alphabetic or extraordinary characters are designed to avoid being blocked by spam message filter. Two embedding algorithms, CBOW and skip grams, are used to produce the sentence vector and the performance and the accuracy of deep learning based spam filter model are measured by comparing to those of SVM Light.

Korean Entity Linking based on KorBERT and Popularity (KorBERT와 Popularity 정보에 기반한 한국어 개체연결 )

  • Jeong Heo;Kyung-Man Bae;Soo-Jong Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.502-506
    • /
    • 2022
  • 본 논문에서는 KorBERT와 개체 인기정보(popularity)를 이용한 개체연결 기술을 소개한다. 멘션인식(mention detection)은 KorBERT를 이용한 토큰분류 문제로 학습하여 모델을 구성하였고, 개체 모호성해소(entity disambiguation)는 멘션 컨텍스트와 개체후보 컨텍스트 간의 의미적 연관성에 대한 KorBERT기반 이진분류 문제로 학습하여 모델을 구성하였다. 개체 인기정보는 위키피디아의 hyperlink, inlink, length 정보를 활용하였다. 멘션인식은 ETRI 개체명 인식기를 이용한 모델과 비교하였을 경우, ETRI 평가데이터에서는 F1 0.0312, 국립국어원 평가데이터에서는 F1 0.1106의 성능 개선이 있었다. 개체 모호성해소는 KorBERT 모델과 Popularity 모델을 혼용한 모델(hybrid)에서 가장 우수한 성능을 보였다. ETRI 평가데이터에서는 Hybrid 모델에서의 개체 모호성 해소의 성능이 Acc. 0.8911 이고, 국립국어원 평가데이터에서는 Acc. 0.793 이였다. 최종적으로 멘션인식 모델과 개체 모호성해소 모델을 통합한 개체연결 성능은 ETRI 평가데이터에서는 F1 0.7617 이고, 국립국어원 평가데이터에서는 F1 0.6784 였다.

  • PDF

A Study on data pre-processing for rainfall estimation from CCTV videos (CCTV 영상 기반 강수량 산정을 위한 데이터 전처리 방안 연구)

  • Byun, Jongyun;Jun, Changhyun;Lee, Jinwook;Kim, Hyeonjun;Cha, Hoyoung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.167-167
    • /
    • 2022
  • 최근 빅데이터에 관련된 연구에 있어 데이터의 품질관리에 대한 논의가 꾸준히 이뤄져 오고 있다. 특히 이미지 처리 및 분석에 활용되어온 딥러닝 기술의 경우, 분류 작업 및 패턴인식 등으로부터 데이터의 특징을 추출함으로써 비지도학습(Unsupervised Learning)을 가능하게 한다는 장점이 있음에도 불구하고 빅데이터를 다루는 과정에 있어 용량, 다양성, 속도 및 신뢰성 측면에서의 한계가 있었다. 본 연구에서는 CCTV 영상을 활용한 강수량 산정 모델 개발에 있어 예측 정확도 향상 및 성능 개선을 도모할 수 있는 데이터 전처리 방법을 제안하였다. 서울 근린 AWS 4개소 지역(김포장기, 하남덕풍, 강동, 성남) 및 중앙대학교 지점 내 CCTV를 설치한 후, 최대 9개월의 영상을 확보하여 강수량 산정을 위한 딥러닝 모델을 개발하였다. 배경분리, 조도조정, 영역설정, 데이터증진, 이상데이터 분류 등이 가능한 알고리즘을 개발함으로써 데이터셋 자체에 대한 전처리 작업을 수행한 후, 이에 대한 결과를 기존 관측자료와 비교·분석하였다. 본 연구에서 제안한 전처리 방법들을 적용한 결과, 강수량 산정 모델의 예측 정확도를 평가하는 지표로 선정한 평균 제곱근 편차(Root Mean Square Error; RMSE)가 약 30% 감소함을 확인하였다. 본 연구의 결과로부터 CCTV 영상 데이터를 활용한 강수량 산정의 가능성을 확인할 수 있었으며 특히, 딥러닝 모델 개발시 필요한 적정 전처리 방법들에 대한 기준을 제시할 수 있을 것으로 판단된다.

  • PDF

Predictability of emergency water supply using machine learning-based classification techniques (딥러닝 기반 분류기법을 활용한 비상급수 예측 가능성 검토)

  • Oh, Yeoung Rok;Jun, Kyung Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.303-303
    • /
    • 2022
  • 기후변화로 인해 기상이변 현상의 발생 빈도가 잦아지며 가뭄 방생 빈도 또한 증가하는 추세이다. 이에 따라 가뭄 피해를 경감하는 선제적 가뭄대응체계 구축과 가뭄이 발생한 이후에 피해를 최소화하기 위한 연구가 필요하다. 본 연구에서는 가뭄피해 여부를 이진분류 방법으로 접근하여 예측 가능성을 검토하였다. 가뭄피해 여부는 비상급수(제한급수,운반급수) 자료를 이용하여 비상급수가 시행된 경우를 가뭄피해 발생으로 보고, 비상급수가 시행되지 않은 경우를 피해 없는 사례로 구분하였다. 기상 상황 변수로는 강수량, 기온, 상대습도 등을 이용하였다. 또한 지역별 연간 총 급수량 대비 저수량을 이용하여 지역별 현 상황을 고려하고자 하였다. 의사결정나무를 이용하여 분석한 결과 불균형 클래스 문제의 정확도에 주로 이용되는 오차행렬의 정확도가 0.95 이상으로 나타났으며, F1-Score는 약 0.5 로 나타났다. 이는 예측 결과 전체를 대상으로 했을 경우 95 %의 확률로 가뭄피해 여부를 구분할 수 있는 것을 나타내며, 가뭄 피해만을 대상으로 했을 경우 50 %의 정확도를 타나낸다. 그러나 본 연구에서는 비상급수를 유발하는 충분한 환경적 변수를 고려하지 않았고, 다양한 딥러닝 모형을 분석하지 않았다. 따라서 비상급수를 유발하는 요인을 충분히 고려하고 딥러닝 기법을 고도화 한다면 모형의 정확도 개선을 기대할 수 있을 것으로 판단된다.

  • PDF

Application of Landsat ETM Image Indices to Classify the Wildfire Area of Gangneung, Gangweon Province, Korea (강원도 강릉시 일대 산불지역 분류를 위한 Landsat ETM 영상 분류지수의 활용)

  • Yang, Dong-Yoon;Kim, Ju-Yong;Chung, Gong-Soo;Lee, Jin-Young
    • Journal of the Korean earth science society
    • /
    • v.25 no.8
    • /
    • pp.754-763
    • /
    • 2004
  • This study was aimed to examine the Landsat Enhanced Thematic Mapper Plus (ETM+) index, which matches well with the field survey data in the wildfire area of Gangneung, Gangweon Province, Korea. In the wildfire area NDVI (Normalized Difference Vegetation Index), SAVI (Soil Adjusted Vegetation Index), and Tasseled Cap Transformation Index (Brightness, Wetness, Greenness) were compared with field survey data. NDVI and SAVI were very useful in detecting the difference between the wildfire and non-wildfire area, but not so in classify the soil types in the wildfire area. The soil plane based on the Tasseled Cap Transformation showed a better result in classifying the soil types in the wildfire areas than NDVI and SAVI, and corresponded well with field survey data. Using a linear function based on greenness and wetness in the Tasseled Cap Transformation is expected to provide a more efficient and quicker method to classify wildfire areas.

3D Film Image Classification Based on Optimized Range of Histogram (히스토그램의 최적폭에 기반한 3차원 필름 영상의 분류)

  • Lee, Jae-Eun;Kim, Young-Bong;Kim, Jong-Nam
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.22 no.2
    • /
    • pp.71-78
    • /
    • 2021
  • In order to classify a target image in a cluster of images, the difference in brightness between the object and the background is mainly concerned, which is not easy to classify if the shape of the object is blurred and the sharpness is low. However, there are a few studies attempted to solve these problems, and there is still the problem of not properly distinguishing between wrong pattern and right pattern images when applied to actual data analysis. In this paper, we propose an algorithm that classifies 3D films into sharp and blurry using the width of the pixel values histogram. This algorithm determines the width of the right and wrong images based on the width of the pixel distributions. The larger the width histogram, the sharp the image, while the shorter the width histogram the blurry the image. Experiments show that the proposed algorithm reflects that the characteristics of these histograms allows classification of all wrong images and right images. To determine the reliability and validity of the proposed algorithm, we compare the results with the other obtained from preprocessed 3D films. We then trained the 3D films using few-shot learning algorithm for accurate classification. The experiments verify that the proposed algorithm can perform higher without complicated computations.

A SW Testing Procedure for Information Technology Security Evaluation and Vulnerability Analysis (정보 보안 평가 및 취약점 분석을 위한 SW 테스팅 절차)

  • Kim, Dong-Jin;Jeong, Youn-Sik;Cho, Seong-Je;Park, Min-Kyu;Lee, Jin-Young;Kim, Il-Gon;Lee, Tae-Seung;Kim, Hong-Geun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.80-82
    • /
    • 2012
  • 다양한 정보보호 제품이 개발됨에 따라, 정보보호 제품 보증을 위해 자체의 보안성 평가 및 인증이 중요시되고 있다. 정보보호 제품의 평가 및 인증을 위해서는 보안기능 검사와 취약점 분석 단계가 매우 중요하지만 이를 위한 정보보호 제품의 보안기능 시험과 취약성 분석을 위한 테스팅 절차에 대한 연구는 그 중요성에 비해 많이 수행되지 않았다. 현재까지는 보안제품을 기능별로 제품을 분류하여 보안성을 평가하였는데, 본 논문에서는 보안 제품들에서 공격에 취약한 SW 모듈 중심으로 테스팅 대상을 분류하는 방법을 제안한다. 분류된 SW 모듈별로 적합한 보안 테스팅 기법을 정의하고, 보안제품의 취약점을 효과적으로 탐지하기 위해 공개되어 있는 관련 취약점도 분석하였다. 이를 통해 정보보호 제품의 취약점 분석 및 제품 보안성 평가를 위한 SW 모듈별 보안 테스팅 절차를 수립하고, 테스트하였다. 실험을 통해 취약한 SW 모듈별 적절한 공격 기법 선정 시 제안 절차가 정보보호 제품 평가 인증에 활용될 수 있음을 확인하였다.

A study on hard-core users and bots detection using classification of game character's growth type in online games (캐릭터 성장 유형 분류를 통한 온라인 게임 하드코어 유저와 게임 봇 탐지 연구)

  • Lee, Jin;Kang, Sung Wook;Kim, Huy Kang
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.25 no.5
    • /
    • pp.1077-1084
    • /
    • 2015
  • Security issues such as an illegal acquisition of personal information and identity theft happen due to using game bots in online games. Game bots collect items and money unfairly, so in-game contents are rapidly depleted, and honest users feel deprived. It causes a downturn in the game market. In this paper, we defined the growth types by analyzing the growth processes of users with actual game data. We proposed the framework that classify hard-core users and game bots in the growth patterns. We applied the framework in the actual data. As a result, we classified five growth types and detected game bots from hard-core users with 93% precision. Earlier studies show that hard-core users are also detected as a bot. We clearly separated game bots and hard-core users before full growth.

Soil Moisture Measurement System in the Mountainous Hillslope located at Chunmichun Watershed (청미천 산지사면에서의 토양 수분 측정 시스템구축 연구)

  • Sun, Han-Na;Joo, Seung-Hyo;Kim, Sang-Hyun;Kwon, Kyu-Sang;Lee, Yeon-Kil;Lee, Jin-Won;Jung, Sung-won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.1787-1791
    • /
    • 2009
  • 지표수의 유출과정을 설명하는 과정에서 중요인자이며, 생태수문학의 핵심변수이자 기상모형의 중요한 입력변수인 토양수분의 공간적 시간적 특징들은 강우 및 지하수와 토양수분간의 순환 구조를 규명하는데 매우 중요하다. 가장 널리 쓰이는 토양 수분 측정 장비인 TDR 장비 매설에 앞서 대상유역 선정에 대한 여러 가지 고려사항을 검토하고 수치지형 분석 등을 통한 사전분석을 실시하였다. 대상유역을 선정하기 위해서는 대상유역의 자료획득의 용이함, 지정학적, 시스템 운영적 측면에서의 가용성, 그리고 정밀측량 및 부수적요인 등 여러 요소의 고려가 요구된다. 청미천 유역을 대상으로 약 21 개의 대상후보사면을 정밀조사 하였으며, 충청북도 음성군 수레의산 청소련 수련원내의 산지 사면을 측정대상 사면으로, 지정학적 위치, 식생분포, 지질구조 및 심도 등의 토양특성의 고려를 통해서 선정하였다. 또한 대상 사면에 흐름 발생 및 분포를 계산하기 위해서 대상사면의 지표 및 기반암 표고를 정밀 측량하였으며, 기반암 또는 풍화대까지의 깊이를 실측하여 지표면 및 지하면의 수치지형 모형을 구축하였다. 대상사면 및 지하면에 대하여 표고수치지형모형(Digital Elevation Model:DEM)으로 도식한 후 흐름 발생 공간 분포를 계산하였다. 다양한 흐름 발생 알고리즘으로 기여사면적과 지형습윤지수를 계산하였다. 분배알고리즘의 의해 도출된 지형인자들로 인한 흐름발생 공간적 분포특성을 비교하여 센서의 매설 위치를 결정하였다. 센서 매설 위치에 대한 토양시료를 채취하여 토성을 분석한 결과는 미국 농무성 기준에 의한 분류로는 사양토로, 국제토양학회의 분류기준에 따르면 양토로 분류되었다. 대상사면의 유효입력강우를 확보하기위해서 개방공간인 수레의산 청소년수련원과 대상산림의 Canopy하부에 각각 강수측정 시스템을 설치하였고 약 6개월간 성공적으로 자료를 획득하였다.

  • PDF