• Title/Summary/Keyword: 비정형

Search Result 1,760, Processing Time 0.029 seconds

Recognition of numeral stings with broken digits (획의 일부분이 손상된 숫자가 포함된 필기체 숫자 열의 인식)

  • Kim, Kye-Kyung;Kim, Jin-Ho;Cho, Soo-Hyun;Chi, Soo-Young;Chung, Yun-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.503-506
    • /
    • 2001
  • 본 논문에서는 획의 일부분이 손상된 숫자(broken digit)나 붙은 숫자(touching digits)와 같은 비정형 숫자들이 포함된 필기체 숫자 열을 인식할 수 있는 방법에 대하여 제안하였다. 비정형 숫자들은 분류(pre-segmentation) 단계에서 숫자들의 구조적인 특징 정보를 이용하여 정형인 개별 숫자(isolated digit)로부터 획의 일부분이 손상된 숫자 또는 붙은 숫자들로 분류된다. 획의 일부분이 분리된 숫자의 결합 및 붙은 숫자들의 분할 단계를 거쳐 인식을 시도하였다. 제안된 방법의 타당성을 증명하기 위하여 NIST SDl9 데이터베이스를 이용하여 시뮬레이션 해 보았다.

  • PDF

A Normalization Matrics for Computational Processing of Crime Dataset (범죄 데이터의 전산처리를 위한 정규화 메트릭 설정 방안)

  • Ihm, Sun-Young;Park, Eun-Young;Park, Young-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.932-933
    • /
    • 2015
  • 최근 데이터의 양이 급격하게 증가하면서 빅데이터의 시대가 도래했다. 빅데이터는 형식이 없는 비정형 데이터이므로 기존의 정형 데이터 처리 방법으로는 분석 및 데이터 처리가 불가능해졌다. 또한, 범죄예방에 대한 관심이 증가하면서, 범죄 데이터 분석의 수요가 증가하고 있다. 본 연구에서는 비정형 범죄 데이터를 분석, 예측 등의 전산처리를 하기 위한 정규화 메트릭을 설정하는 방안을 제안하고자 한다.

Sentimental Analysis using the Phoneme-level Embedding Model (음소 단위 임베딩 모형을 이용한 감성 분석)

  • Hyun, Kyeongseok;Choi, Woosung;Jung, Soon-young;Chung, Jaehwa
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1030-1032
    • /
    • 2019
  • 형태소 분석을 통하여 한국어 문장을 형태소 단위의 임베딩 및 학습 관련 연구가 되었으나 최근 비정형적인 텍스트 데이터의 증가에 따라 음소 단위의 임베딩을 통한 신경망 학습에 대한 요구가 높아지고 있다. 본 논문은 비정형적인 텍스트 감성 분석 성능 향상을 위해 음소 단위의 토큰을 생성하고 이를 CNN 모형을 기반으로 다차원 임베딩을 수행하고 감성분석을 위하여 양방향 순환신경망 모델을 사용하여 유튜브의 비정형 텍스트를 학습시켰다. 그 결과 텍스트의 긍정 부정 판별에 있어 90%의 정확도를 보였다.

Movie subject classification using Machine Learning (기계학습을 이용한 영화 주제 분류)

  • Lee, Moohun;Cho, Joonmyun;Yoo, Jeongju
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1064-1067
    • /
    • 2013
  • 정보검색 기술의 발달과 더불어 검색에 대한 사용자의 요구사항이 다양해지고 있다. 특히, 스마트TV와 같은 장치에서 동영상 콘텐츠를 검색하는데 있어서 콘텐츠의 타이틀과 같은 정형 메타데이터를 이용한 검색뿐만 아니라, 콘텐츠 주제와 같은 비정형 메타데이터를 이용한 검색도 요구되고 있다. 이러한 검색 요구사항을 수용하기 위해서는 주제와 같은 비정형 메타데이터가 구축되어 있어야만 가능하다. 콘텐츠의 주제는 사람의 이해와 분석을 통해서 수작업으로 구축 가능하다. 본 논문에서는 수작업만으로 구축 가능한 콘텐츠의 주제를 기계학습을 기반으로 자동화 할 수 있는 기법을 제안하고, 제안한 기법의 실험을 통하여 타당성을 검증한다.

SNS 프로필 사진이 대출상환에 미치는 영향: 카카오톡 메신저 사진을 중심으로

  • Jeong, Won-Hun;Ha, Gyu-Su
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2020.11a
    • /
    • pp.127-130
    • /
    • 2020
  • 금융시장 환경이 점차 변화하고 있다. 흔히 지점이라 불리는 오프라인 환경에서 애플리케이션을 이용하거나 웹페이지를 이용하는 온라인 비대면 환경으로 이동함에 따라 기존의 정형 정보를 중심으로 한 소비자 행동 예측 방법보다 더 나은 방법을 모색하기 이르렀다. 이에 따라 주관적 비정형 정보의 중요하게 된 것이다. 본 연구는 비대면 대출시장에서 주관적 비정형 정보의 하나인 SNS 프로필 사진과 대출상환에 영향을 미치는 변인을 파악하는 것을 목표로 한다. SNS 프로필 사진은 자신의 감정이나 상태를 표현하는 도구로 떠오르고 있으며, 이러한 차입자의 SNS 프로필사진을 분석함으로써 정보비대칭의 최소화로, 대출심사를 위한 신용평가에 유의적 요소들을 규명하는데 목적이 있다. 본 연구에서는 대출자들이 차입자에 대한 평가의 중요 고려 요소들을 규명하고 탐색하는데 초점을 맞춰 SNS 대안 신용평가만을 심사기준으로 이용한 대출인 텐스페이스의 AI LOAN 대출자중에서 2020년 2월부터 2020년 2월까지 대출자료를 확보할 예정이다. 이러한 자료 중에서 2020년 12월 30일을 기준으로 상환기일이 도래한 대출상환 자료 중 SNS사진을 순서형 로짓회귀모형을 이용해 분석하고자 한다.

  • PDF

Design of Sentence Semantic Model for Cause-Effect Graph Automatic Generation from Natural Language Oriented Informal Requirement Specifications (비정형 요구사항으로부터 원인-결과 그래프 자동 발생을 위한 문장 의미 모델(Sentence Semantic Model) 설계)

  • Jang, Woo Sung;Jung, Se Jun;Kim, R.Young Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.215-219
    • /
    • 2020
  • 현재 한글 언어학 영역에서는 많은 언어 분석 연구가 수행되었다. 또한 소프트웨어공학의 요구공학 영역에서는 명료한 요구사항 정의와 분석이 필요하고, 비정형화된 요구사항 명세서로부터 테스트 케이스 추출이 매우 중요한 이슈이다. 즉, 자연어 기반의 요구사항 명세서로부터 원인-결과 그래프(Cause-Effect Graph)를 통한 의사 결정 테이블(Decision Table) 기반 테스트케이스(Test Case)를 자동 생성하는 방법이 거의 없다. 이런 문제를 해결하기 위해 '한글 언어 의미 분석 기법'을 '요구공학 영역'에 적용하는 방법이 필요하다. 본 논문은 비정형화된 요구사항으로부터 테스트케이스 생성하는 과정의 중간 단계인 요구사항에서 문장 의미 모델(Sentence Semantic Model)을 자동 생성하는 방법을 제안 한다. 이는 요구사항으로부터 생성된 원인-결과 그래프의 정확성을 검증할 수 있다.

  • PDF

Current Guidelines for Non-Steroidal Anti-Inflammatory Drugs (비스테로이드 소염제의 최신 사용 지침)

  • Park, Min-Gyue;Yoo, Jae-Doo;Lee, Kyu-Ho
    • Journal of the Korean Orthopaedic Association
    • /
    • v.55 no.1
    • /
    • pp.9-28
    • /
    • 2020
  • Non-steroidal anti-inflammatory drugs (NSAIDs) are the most commonly used drugs worldwide for chronic pain, such as arthritis, and there are many different types depending on their composition and mechanism. After long-term use, various side effects can occur, such as gastrointestinal and cardiovascular complications. With a similar analgesic effect to that of traditional non-selective NSAIDs, cyclooxygenase-2-selective NSAIDs have been highly anticipated, because they could complement gastrointestinal tolerance. On the other hand, because of concerns about cardiovascular safety in 2004 and 2005, and the license withdrawals of rofecoxib and valdecoxib, the interest in the side effects of NSAIDs is increasing. Therefore, it is important to use the necessary drugs at a minimum, considering the side effects and interactions of each drug. This study examined the side effects and characteristics of each NSAID that may occur and reviewed the recent research and guidelines related to the use of non-selective NSAIDs and cyclooxygenase-2-selective NSAIDs.

A Hybrid Oversampling Technique for Imbalanced Structured Data based on SMOTE and Adapted CycleGAN (불균형 정형 데이터를 위한 SMOTE와 변형 CycleGAN 기반 하이브리드 오버샘플링 기법)

  • Jung-Dam Noh;Byounggu Choi
    • Information Systems Review
    • /
    • v.24 no.4
    • /
    • pp.97-118
    • /
    • 2022
  • As generative adversarial network (GAN) based oversampling techniques have achieved impressive results in class imbalance of unstructured dataset such as image, many studies have begun to apply it to solving the problem of imbalance in structured dataset. However, these studies have failed to reflect the characteristics of structured data due to changing the data structure into an unstructured data format. In order to overcome the limitation, this study adapted CycleGAN to reflect the characteristics of structured data, and proposed hybridization of synthetic minority oversampling technique (SMOTE) and the adapted CycleGAN. In particular, this study tried to overcome the limitations of existing studies by using a one-dimensional convolutional neural network unlike previous studies that used two-dimensional convolutional neural network. Oversampling based on the method proposed have been experimented using various datasets and compared the performance of the method with existing oversampling methods such as SMOTE and adaptive synthetic sampling (ADASYN). The results indicated the proposed hybrid oversampling method showed superior performance compared to the existing methods when data have more dimensions or higher degree of imbalance. This study implied that the classification performance of oversampling structured data can be improved using the proposed hybrid oversampling method that considers the characteristic of structured data.

Modification of MUSCL Scheme for Application of Non-uniform Grid (비정형격자의 적용을 위한 MUSCL 기법의 수정)

  • Kim, Byung-Hyun;Han, Kun-Yeon
    • Journal of Korea Water Resources Association
    • /
    • v.43 no.1
    • /
    • pp.105-117
    • /
    • 2010
  • This paper presents a new and simple technique to perform MUSCL reconstruction for solving 2D shallow water equations. The modified MUSCL scheme uses weighted area ratio to apply non-uniform grid in stead of the previous method that equally distributed the difference of conservation variables to each interface. The suggested method can physically reconstruct conservation variables in case of uniform grid as well as non-uniform grid. In this study, Unsplit scheme applicable to unstructured grid is used and efficient slope limiter of TVD scheme is used to control numerical oscillation which can be occurred in modified MUSCL scheme. For accurate and efficient treatment of bed slope term, the modified MUSCL scheme is coupled with the surface gradient method. The finite volume model applied to suggested scheme is verified through a comparison between numerical solution and laboratory measurements data such as the simulations of isolated building test case and Bellos's dam break test case.

A Design on Informal Big Data Topic Extraction System Based on Spark Framework (Spark 프레임워크 기반 비정형 빅데이터 토픽 추출 시스템 설계)

  • Park, Kiejin
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.521-526
    • /
    • 2016
  • As on-line informal text data have massive in its volume and have unstructured characteristics in nature, there are limitations in applying traditional relational data model technologies for data storage and data analysis jobs. Moreover, using dynamically generating massive social data, social user's real-time reaction analysis tasks is hard to accomplish. In the paper, to capture easily the semantics of massive and informal on-line documents with unsupervised learning mechanism, we design and implement automatic topic extraction systems according to the mass of the words that consists a document. The input data set to the proposed system are generated first, using N-gram algorithm to build multiple words to capture the meaning of the sentences precisely, and Hadoop and Spark (In-memory distributed computing framework) are adopted to run topic model. In the experiment phases, TB level input data are processed for data preprocessing and proposed topic extraction steps are applied. We conclude that the proposed system shows good performance in extracting meaningful topics in time as the intermediate results come from main memories directly instead of an HDD reading.