• Title/Summary/Keyword: Korean human dataset

검색결과 164건 처리시간 0.018초

DeNERT: Named Entity Recognition Model using DQN and BERT

  • Yang, Sung-Min;Jeong, Ok-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.29-35
    • /
    • 2020
  • 본 논문에서는 새로운 구조의 개체명 인식 DeNERT 모델을 제안한다. 최근 자연어처리 분야는 방대한 양의 말뭉치로 사전 학습된 언어 표현 모델을 활용하는 연구가 활발하다. 특히 자연어처리 분야 중 하나인 개체명인식은 대부분 지도학습 방식을 사용하는데, 충분히 많은 양의 학습 데이터 세트와 학습 연산량이 필요하다는 단점이 있다. 강화학습은 초기 데이터 없이 시행착오 경험을 통해 학습하는 방식으로 다른 기계학습 방법론보다 조금 더 사람이 학습하는 과정에 가까운 알고리즘으로 아직 자연어처리 분야에는 많이 적용되지 않은 분야이다. 아타리 게임이나 알파고 등 시뮬레이션 가능한 게임 환경에서 많이 사용된다. BERT는 대량의 말뭉치와 연산량으로 학습된 구글에서 개발한 범용 언어 모델이다. 최근 자연어 처리 연구 분야에서 높은 성능을 보이고 있는 언어 모델이며 많은 자연어처리 하위분야에서도 높은 정확도를 나타낸다. 본 논문에서는 이러한 DQN, BERT 두가지 딥러닝 모델을 이용한 새로운 구조의 개체명 인식 DeNERT 모델을 제안한다. 제안하는 모델은 범용 언어 모델의 장점인 언어 표현력을 기반으로 강화학습 모델의 학습 환경을 만드는 방법으로 학습된다. 이러한 방식으로 학습된 DeNERT 모델은 적은 양의 학습 데이터세트로 더욱 빠른 추론시간과 높은 성능을 갖는 모델이다. 마지막으로 제안하는 모델의 개체명 인식 성능평가를 위해 실험을 통해서 검증한다.

Generative optical flow based abnormal object detection method using a spatio-temporal translation network

  • Lim, Hyunseok;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.11-19
    • /
    • 2021
  • 이상 객체란 일반적이고 평범한 행동을 취하는 객체가 아닌 비정상적이고 흔하지 않은 행동을 하여 관찰이나 감시·감독을 필요로 하는 사람, 물체, 기계 장치 등을 뜻한다. 이를 사람의 지속적인 개입 없이 인공지능 알고리즘을 통해 탐지하기 위해서 광학 흐름 기법을 활용한 시간적 특징의 특이도를 관찰하는 방법이 많이 활용되고 있으며, 이 기법은 정해진 표현 범위가 없는 수많은 이상 행동을 식별하기에 적합하다. 본 연구에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)으로 입력 영상 프레임을 광학 흐름 영상으로 변환하는 알고리즘을 학습시켜 비정상적인 상황을 식별한다. 특히 생성적 적대 신경망 모델이 입력 영상에 대한 중요한 특징 정보를 학습하고, 그 외 불필요한 이상치를 제외시키기 위한 전처리 과정과 학습 후 테스트 데이터셋에서 식별 정확도를 높이기 위한 후처리 과정을 고도화하여 전체적인 모델의 이상 행동 식별 성능을 향상시키는 기법을 제안한다. 이상 행동을 탐지하기 위한 학습 데이터셋으로 UCSD Pedestrian, UMN Unusual Crowd Activity를 활용하였으며, UCSD Ped2 데이터셋에서 프레임 레벨 AUC 0.9450, EER 0.1317의 수치를 보이며 이전 연구에서 도출된 성능 지표 대비 성능 향상이 확인되었다.

CAVE상에서의 방대한 볼륨 데이타의 실시간 입체 영상 가시화 (Real-Time Stereoscopic Visualization of Very Large Volume Data on CAVE)

  • 임무진;이중연;조민수;이상산;임인성
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권6호
    • /
    • pp.679-691
    • /
    • 2002
  • 과학적 가시화의 한 분야인 볼륨 가시화는 3차원, 혹은 그 이상의 차원의 공간에서 정의된 추상적이고 복잡한 볼륨 데이타로부터 의미 있고 가시적인 정보를 효과적으로 추출하도록 도와주는 다양한 기술에 관한 연구 분야로서, 기상학, 의학, 계산 유체 역학 등 여러 학문 분야에서 점차 그 중요성을 더해가고 있다. 한편 가상 현실은 컴퓨터가 만든 가상의 세상에 사용자가 몰입하여 시각, 청각, 촉각 등의 감각을 이용하여 세상을 경험하고 대화식으로 정보를 주고받을 수 있도록 도와주는 여러 기술에 관련된 연구 분야로서 국내외적으로 활발한 연구가 진행되고 있다. 본 논문에서는 CAVE라 불리는 몰입형 3차원 가상 환경 시스템 환경에서 인체 볼륨 데이타를 보다 개선된 볼륨 가시화 방법을 사용하여 실시간으로 입체 영상을 생성해주는 시스템을 설계하고 구현하였다. 이 시스템은 기존 3차원 텍스처 매핑 기반 볼륨 렌더링 방법의 느린 속도를 보완하고자, 영상 기반 렌더링에 기반을 둔 향상된 텍스처 매핑 기법을 사용하여 실시간 볼륨 입체 가시화 기능을 지원하며, 사용자를 위하여 다양한 인터페이스 기능들을 제공한다. 본 시스템의 효용성을 증명하기 위한 테스트 데이터로서 Visible Korean Human 데이타를 사용하였다. 본 논문에서는 실시간 입체 영상 시스템에 필요한 가시화 기법과 라이브러리, 그리고 구체적인 구현 내용에 대해서 설명한다.

텍스트 마이닝과 기계 학습을 이용한 국내 가짜뉴스 예측 (Fake News Detection for Korean News Using Text Mining and Machine Learning Techniques)

  • 윤태욱;안현철
    • Journal of Information Technology Applications and Management
    • /
    • 제25권1호
    • /
    • pp.19-32
    • /
    • 2018
  • Fake news is defined as the news articles that are intentionally and verifiably false, and could mislead readers. Spread of fake news may provoke anxiety, chaos, fear, or irrational decisions of the public. Thus, detecting fake news and preventing its spread has become very important issue in our society. However, due to the huge amount of fake news produced every day, it is almost impossible to identify it by a human. Under this context, researchers have tried to develop automated fake news detection method using Artificial Intelligence techniques over the past years. But, unfortunately, there have been no prior studies proposed an automated fake news detection method for Korean news. In this study, we aim to detect Korean fake news using text mining and machine learning techniques. Our proposed method consists of two steps. In the first step, the news contents to be analyzed is convert to quantified values using various text mining techniques (Topic Modeling, TF-IDF, and so on). After that, in step 2, classifiers are trained using the values produced in step 1. As the classifiers, machine learning techniques such as multiple discriminant analysis, case based reasoning, artificial neural networks, and support vector machine can be applied. To validate the effectiveness of the proposed method, we collected 200 Korean news from Seoul National University's FactCheck (http://factcheck.snu.ac.kr). which provides with detailed analysis reports from about 20 media outlets and links to source documents for each case. Using this dataset, we will identify which text features are important as well as which classifiers are effective in detecting Korean fake news.

Variations of AlexNet and GoogLeNet to Improve Korean Character Recognition Performance

  • Lee, Sang-Geol;Sung, Yunsick;Kim, Yeon-Gyu;Cha, Eui-Young
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.205-217
    • /
    • 2018
  • Deep learning using convolutional neural networks (CNNs) is being studied in various fields of image recognition and these studies show excellent performance. In this paper, we compare the performance of CNN architectures, KCR-AlexNet and KCR-GoogLeNet. The experimental data used in this paper is obtained from PHD08, a large-scale Korean character database. It has 2,187 samples of each Korean character with 2,350 Korean character classes for a total of 5,139,450 data samples. In the training results, KCR-AlexNet showed an accuracy of over 98% for the top-1 test and KCR-GoogLeNet showed an accuracy of over 99% for the top-1 test after the final training iteration. We made an additional Korean character dataset with fonts that were not in PHD08 to compare the classification success rate with commercial optical character recognition (OCR) programs and ensure the objectivity of the experiment. While the commercial OCR programs showed 66.95% to 83.16% classification success rates, KCR-AlexNet and KCR-GoogLeNet showed average classification success rates of 90.12% and 89.14%, respectively, which are higher than the commercial OCR programs' rates. Considering the time factor, KCR-AlexNet was faster than KCR-GoogLeNet when they were trained using PHD08; otherwise, KCR-GoogLeNet had a faster classification speed.

우리 국민의 총 지방 및 지방산 일상 섭취량 추정 및 평가: 2019 - 2021년 국민건강영양조사 자료를 활용한 단면조사연구 (Estimating and evaluating usual total fat and fatty acid intake in the Korean population using data from the 2019-2021 Korea National Health and Nutrition Examination Surveys: a cross-sectional study)

  • 이경윤;김동우
    • 대한지역사회영양학회지
    • /
    • 제28권5호
    • /
    • pp.414-422
    • /
    • 2023
  • Objectives: This study evaluated usual dietary intakes of total fat and fatty acids among the Korean population based on the revised Dietary Reference Intakes for Koreans 2020 (2020 KDRIs). Methods: This study utilized data from the eighth Korea National Health and Nutrition Examination Survey (KNHANES 2019-2021). We included 18,895 individuals aged 1 year and above whose 1-day 24-hour dietary recall data were available. To calculate the external variability using the National Cancer Institute 1-day method, data from the U.S. NHANES 2017-March 2020 Pre-pandemic dataset were employed. The total fat and fatty acid intake were evaluated based on the Acceptable Macronutrient Distribution Ranges (AMDRs) and Adequate intake (AI) of 2020 KDRIs for each sex and age groups. Results: Approximately 86% of the Korean population obtained an adequate amount of energy from total fat consumption (within the AMDRs), indicating an appropriate level of intake. However, the percentage of individuals consuming saturated fatty acids below the AMDR was low, with only 12% among those under 19 years of age and 52% aged 19 years and older. On a positive note, approximately 70% of the population showed adequate consumption of essential fatty acids, exceeding the AI. Nevertheless, monitoring the intake ratio of omega 3 (n-3) to omega 6 (n-6) fatty acids is essential to ensure an optimum balance. Conclusions: This study explored the possibility of estimating the distribution of nutrient intake in a population by applying the external variability ratio. Therefore, if future KNHANES conduct multiple 24-hour recalls every few years-similar to the U.S. NHANES-even for a subset of participants, this may aid in the accurate assessment of the nutritional status of the population.

Numerical Model Test of Spilled Oil Transport Near the Korean Coasts Using Various Input Parametric Models

  • Hai Van Dang;Suchan Joo;Junhyeok Lim;Jinhwan Hur;Sungwon Shin
    • 한국해양공학회지
    • /
    • 제38권2호
    • /
    • pp.64-73
    • /
    • 2024
  • Oil spills pose significant threats to marine ecosystems, human health, socioeconomic aspects, and coastal communities. Accurate real-time predictions of oil slick transport along coastlines are paramount for quick preparedness and response efforts. This study used an open-source OpenOil numerical model to simulate the fate and trajectories of oil slicks released during the 2007 Hebei Spirit accident along the Korean coasts. Six combinations of input parameters, derived from a five-day met-ocean dataset incorporating various hydrodynamic, meteorological, and wave models, were investigated to determine the input variables that lead to the most reasonable results. The predictive performance of each combination was evaluated quantitatively by comparing the dimensions and matching rates between the simulated and observed oil slicks extracted from synthetic aperture radar (SAR) data on the ocean surface. The results show that the combination incorporating the Hybrid Coordinate Ocean Model (HYCOM) for hydrodynamic parameters exhibited more substantial agreement with the observed spill areas than Copernicus Marine Environment Monitoring Service (CMEMS), yielding up to 88% and 53% similarity, respectively, during a more than four-day oil transportation near Taean coasts. This study underscores the importance of integrating high-resolution met-ocean models into oil spill modeling efforts to enhance the predictive accuracy regarding oil spill dynamics and weathering processes.

Bayesian Model for the Classification of GPCR Agonists and Antagonists

  • Choi, In-Hee;Kim, Han-Jo;Jung, Ji-Hoon;Nam, Ky-Youb;Yoo, Sung-Eun;Kang, Nam-Sook;No, Kyoung-Tai
    • Bulletin of the Korean Chemical Society
    • /
    • 제31권8호
    • /
    • pp.2163-2169
    • /
    • 2010
  • G-protein coupled receptors (GPCRs) are involved in a wide variety of physiological processes and are known to be targets for nearly 50% of drugs. The various functions of GPCRs are affected by their cognate ligands which are mainly classified as agonists and antagonists. The purpose of this study is to develop a Bayesian classification model, that can predict a compound as either human GPCR agonist or antagonist. Total 6627 compounds experimentally determined as either GPCR agonists or antagonists covering all the classes of GPCRs were gathered to comprise the dataset. This model distinguishes GPCR agonists from GPCR antagonists by using chemical fingerprint, FCFP_6. The model revealed distinctive structural characteristics between agonistic and antagonistic compounds: in general, 1) GPCR agonists were flexible and had aliphatic amines, and 2) GPCR antagonists had planar groups and aromatic amines. This model showed very good discriminative ability in general, with pretty good discriminant statistics for the training set (accuracy: 90.1%) and a good predictive ability for the test set (accuracy: 89.2%). Also, receiver operating characteristic (ROC) plot showed the area under the curve (AUC) to be 0.957, and Matthew's Correlation Coefficient (MCC) value was 0.803. The quality of our model suggests that it could aid to classify the compounds as either GPCR agonists or antagonists, especially in the early stages of the drug discovery process.

지구관측 위성자료를 이용한 주요 대기 에어러솔 성분의 공간분포 분석 (Spatial Analysis of Major Atmospheric Aerosol Species Using Earth Observing Satellite Data)

  • 이권호
    • 한국지리정보학회지
    • /
    • 제14권2호
    • /
    • pp.109-127
    • /
    • 2011
  • 대기 에어러솔은 대기중에 존재하는 미세입자로 인체 유해성을 지니고 있으며 기후변화에 있어서도 중요한 역할을 하는 변수로 알려져 있다. 게다가 대기 에어러솔의 주요 성분에 대한 정확한 평가는 환경에 미치는 영향에 있어서도 매우 중요하다. 이 때문에 지구관측 위성자료는 대기질 감시측면에서도 효과적인 수단으로 이용되고 있다. 따라서 본 연구에서는 인공위성 관측 자료를 이용하여 전구적인 규모의 대기 에어러솔의 주요 성분별 분포변화를 알아보고자 MODIS 에어러솔 광학두께(AOT; Aerosol Optical Thickness)와 미세입자분율(FMF; Fine Mode Fraction), 그리고 TOMS 자외선 흡수성 에어러솔 지수(AAI; UV Absorbing Aerosol Index)를 이용하여 네 가지의 주요 에어러솔의 성분(먼지, 탄소성, 황산화물, 해염)을 구분할 수 있는 방법을 제시하였다. 여기서 얻어진 결과물을 검증하기 위하여 에어러솔 예측 모델자료와 각 격자별 자료로 선형회귀분석을 수행한 결과, 본 연구에서 산출된 결과물이 에어러솔의 성분별 전반적인 패턴을 잘 표현하는 것을 확인 할 수 있었다. 이렇게 주요 에어러솔 타입으로 구분된 위성자료의 사용은 대기질 감시뿐만 아니라 기후변화연구에 있어서도 도움을 줄 것으로 사료된다.

A Study of Facial Organs Classification System Based on Fusion of CNN Features and Haar-CNN Features

  • Hao, Biao;Lim, Hye-Youn;Kang, Dae-Seong
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.105-113
    • /
    • 2018
  • 본 논문에서는 사람 얼굴의 눈, 코, 입을 효과적으로 분류하는 방법을 제안한다. 최근 대부분의 이미지 분류는 CNN(Convolutional Neural Network)을 이용한다. 그러나 CNN으로 추출한 특징은 충분하지 않아 분류 효과가 낮은 경우가 있다. 분류 효과를 더 높이기 위해 새로운 알고리즘을 제안한다. 제안하는 방법은 크게 세 부분으로 나눌 수 있다. 첫 번째는 Haar 특징추출 알고리즘을 사용하여 얼굴의 눈, 코, 입 데이터?을 구성한다. 두번째는 CNN 구조 중 하나인 AlexNet을 사용하여 이미지의 CNN 특징을 추출한다. 마지막으로 Haar 특징 추출 뒤에 합성(Convolution) 연산을 수행하여 Haar-CNN 특징을 추출한다. 그 후 CNN 특징과 Haar-CNN을 혼합하여 Softmax를 이용해 분류한다. 혼합한 특징을 사용한 인식률은 기존의 CNN 특징 보다 약 4% 향상되었다. 실험을 통해 제안하는 방법의 성능을 증명하였다.