• Title/Summary/Keyword: 범주기술

Search Result 928, Processing Time 0.025 seconds

A Study on Calculating Over-sampling Ratio using Classification Complexity (분류 복잡도를 활용한 오버 샘플링 비율 산출 알고리즘 개발)

  • Lee, Do-Hyeon;Kim, Kyoungok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.591-594
    • /
    • 2020
  • 불균형 데이터는 범주에 따른 데이터의 분포가 불균형한 데이터를 의미한다. 이런 데이터를 활용해 기존 분류 알고리즘으로 분류기를 학습하면 성능이 저하되는 문제가 발생한다. 오버 샘플링은 이를 해결하기 위한 기법 중 하나로 수가 적은 범주[이하 소수 범주]에 속한 데이터 수를 임의로 증가시킨다. 기존 연구들에서는 수가 많은 범주[이하 다수 범주]에 속한 데이터 수와 동일한 크기만큼 증가시키는 경우가 많다. 이는 증가시키는 샘플의 수를 결정할 때 범주 간 데이터 수 비율만 고려한 것이다. 그런데 데이터가 동일한 수준의 불균형 정도를 갖더라도 범주별 데이터 분포에 따라서 분류 복잡도가 다르며, 경우에 따라 데이터 분포에서 존재하는 불균형 정도를 완전히 해소하지 않아도 된다. 이에 본 논문은 분류 복잡도를 활용해 데이터 셋 별 적정 오버 샘플링 비율을 산출하는 알고리즘을 제안한다.

A Clustering-based Undersampling Method to Prevent Information Loss from Text Data (텍스트 데이터의 정보 손실을 방지하기 위한 군집화 기반 언더샘플링 기법)

  • Jong-Hwi Kim;Saim Shin;Jin Yea Jang
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.251-256
    • /
    • 2022
  • 범주 불균형은 분류 모델이 다수 범주에 편향되게 학습되어 소수 범주에 대한 분류 성능을 떨어뜨리는 문제를 야기한다. 언더 샘플링 기법은 다수 범주 데이터의 수를 줄여 소수 범주와 균형을 이루게하는 대표적인 불균형 해결 방법으로, 텍스트 도메인에서의 기존 언더 샘플링 연구에서는 단어 임베딩과 랜덤 샘플링과 같은 비교적 간단한 기법만이 적용되었다. 본 논문에서는 트랜스포머 기반 문장 임베딩과 군집화 기반 샘플링 방법을 통해 텍스트 데이터의 정보 손실을 최소화하는 언더샘플링 방법을 제안한다. 제안 방법의 검증을 위해, 감성 분석 실험에서 제안 방법과 랜덤 샘플링으로 추출한 훈련 세트로 모델을 학습하고 성능을 비교 평가하였다. 제안 방법을 활용한 모델이 랜덤 샘플링을 활용한 모델에 비해 적게는 0.2%, 많게는 2.0% 높은 분류 정확도를 보였고, 이를 통해 제안하는 군집화 기반 언더 샘플링 기법의 효과를 확인하였다.

  • PDF

A Study on Describing Relational Properties of Terms in Geographical Categories According to Conceptual Characteristics for Construction of Structured Glossary (구조적 학술용어사전 구축에 있어서 지역명의 개념적 특성에 따른 관계 속성 기술에 관한 연구)

  • Yim, Bolam
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2014.08a
    • /
    • pp.95-98
    • /
    • 2014
  • 본 연구는 지역명 범주에 속하는 용어들의 개념적 특성을 분석하고, 이를 토대로 다른 범주와의 관련도를 파악하여 지역명 범주 용어들을 중심으로 관계 속성들 사이의 논리적 연관성을 부여할 수 있는 모형 도출에 기반이 되는 기초 연구이다. 지역명 범주 용어 중 국가명에 한정하여 분석한 결과, 국가명 개념 속성 중심으로는 계층 구조 관계의 지역명 범주 용어들끼리 연관이 높으며, 전체 범주 용어들의 개념 속성 중심으로는 지역명 범주 용어가 지리적 위치로서의 의미로 주로 쓰이나, 행위의 주체 또는 객체의 의미나 시대의 개념으로도 많이 활용됨을 알 수 있었다. 국가명이 참조되는 개념 속성과 연관되어 활용되는 관계 속성의 경우의 일부는 참조하는 주요 개념 범주와 연관 관계를 토대로 논리적 의미 관계를 생각해볼 수 있는 것으로 나타났다.

  • PDF

Tense and Aspects in English (영어 시제와 상)

  • Kim, Jeong-O
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.127-129
    • /
    • 2012
  • 본고에서는 시제의 일반적 정의와 상에 관한 개념들을 정리하였다. 시제는 시간을 나타내는 동사의 굴절형'이고 따라서 시제는 문법범주의 하나로서 영어의 경우 현재시제와 과거시제를 인정하고 있다. 시제처럼 상을 문법범주로 인정한다면 그 기술 대상은 당연히 문법적 표현에 국한될 것이고 반대로 문법범주가 아닌 의미범주로 간주하면 문법적 표현은 물론이고 어휘적 표현까지 기술대상이 될 것이다. 따라서 상은 문법범주로서 명시되어 있고 특히 영어의 상은 진행형과 완료형의 두 형태로 국한하고 있다. 이 경우에 진행상(the progressive aspect)은 진행형, 완료상(the perfect aspect)은 완료형을 가리킨다. 이렇듯 시제와 상의 밀접한 관계가 있다 하겠다. 더하여 다양한 영역에서 상에 관한 개념정의가 필요하고 더 많은 연구가 있어야 할 것으로 여겨진다.

  • PDF

Exploratory Study on the Phenomenon of Technology Transfer in Livestock Industry Based on the Grounded Theory Approach: Backward Linkage Industries in Livestock Industry (근거이론 접근법을 이용한 축산업분야 기술이전현상에 관한 탐색연구: 후방연관산업을 중심으로)

  • Seol, Byung Moon;Park, Jong Bok
    • Asia-Pacific Journal of Business Venturing and Entrepreneurship
    • /
    • v.11 no.1
    • /
    • pp.97-108
    • /
    • 2016
  • The competition between countries became internationalized in the market. However, a situation in which globalization is concerned is important to domestic corporates. Corporate strategy to survive in the domestic market are also juggling the limit of survival. Technology transfer and commercialization at this point has important implications now. The same applies to the national level. Public-to-private technology transfer has been more important, in order to overcome the international competitions. Although various studies have been made to promote technology transfer, in the livestock sector rarely attempted. Taking into account that few previous research and theory development has been achieved, the paper explored the technology transfer phenomenon in the sector employing the grounded theory approach by Strauss & Corbin(1998). Corporates that licensed in technologies through the Foundation of Agri. Tech. Commercialization & Transfer, were targeted as informants or interviewees. Finally, eight informants were selected sequentially utilizing theoretical sampling technique to the saturation point. As the result of open coding and axial coding of the interview data using NVivo10 by QSR International, 77 concepts, 20 sub-categories, and 7 categories were derived while paradigm model was established. Through selective coding, 'the factors affecting technology transfer in livestock sector' was identified as core category. The story line about the core category was developed based on four main categories. Finally, it is expected that the concepts, categories, and the relationship between them can be an important basis for further research.

  • PDF

Entropy-based Clustering Validation Technique for Categorical Data Sets (범주형 데이터 집합에 대한 엔트로피 기반 군집 유효화 기술)

  • Park Namhyun;Ahn Chang Wook;Ramakrishna R.S.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.477-480
    • /
    • 2004
  • 본 논문에서는 고차원의 특성을 가진 범주형 데이터 집합의 군집 유효화 기술에 대하여 알아본다. 먼저, 범주형 데이터 집합에 대하여 한 군집의 센트로이드를 정의함에 따라 일반적인 군집화 방법에서 사용되는 쌍 유사성 측정을 가능하게 한다. 다음으로, 범주형 데이터 집합에 대한 증분 군집 알고리즘을 통하여 도출된 결과에 대해 최적 군집 수의 결정하기 위하여 엔트로피 기반 군집 유효화 지수를 사용한다. 이를 통하여 일반적인 군집 알고리즘에서 최적 결과를 얻기 위해 필요한 문턱값 결정 문제를 손쉽게 해결한다. 마지막으로, 위의 개념들을 여러 데이터 집합에 대해 실험한다.

  • PDF

Re-conceptualization of data literacy reflecting the expanded data characteristics and context (확장된 데이터의 특성과 맥락을 반영한 데이터 리터러시의 재개념화)

  • Choi, Kyunghee;Cho, Dong-sung
    • Informatization Policy
    • /
    • v.30 no.3
    • /
    • pp.49-68
    • /
    • 2023
  • This study presented a framework for re-conceptualized data literacy that consists of three domains-knowledge, skills, and contexts- and elements that are emphasized by each domain. In addition to the existing concept of data literacy that mainly emphasized the skills to handle data, the context domain of data was considered including the elements of scope, time, and value orientation. Based on the re-conceptualized data literacy, it is expected to be usable as reference material in the development of curriculum and educational programs in the fields of informatization, manpower training, and administration.

The Experience of Mixed Lectures of Nursing Students (간호대학생의 혼합 수업 경험)

  • Seo, Myoung Hee
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.22 no.3
    • /
    • pp.129-137
    • /
    • 2021
  • This study is a qualitative study conducted using focus group interviews to examine the mixed offline and online education experience of nursing students in the context of Covid-19. The subjects of this study included 7 students enrolled in the Department of Nursing at J City V University, and focus group interviews were conducted with sufficient explanation and written consent for the study. The contents of the interviews were recorded, and the interview contents were directly transcribed directly after the interview. Research results were derived through content analysis. As a result of the study, 5 domains, 10 categories, and 24 subcategories were derived from the experiences of nursing college students on mixed lectures. The 5 domains included 'mixed lectures,' 'tasks,' 'tests,' 'motivation,' and 'improvement.' The contents of each domain derived from this research result are expected to be used as basic data in the design of the on/offline mixed lectures in the future.

Metaphorical Analysis on Role Playing of Day Care Center Teachers (역할놀이에 대한 어린이집 교사의 은유분석)

  • Lim, Jin-Hyung;Lee, Jin-Hee
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.18 no.2
    • /
    • pp.524-531
    • /
    • 2017
  • Summary The purpose of this study was to understand the tendency and the meaning of day care center teachers regarding role playing through metaphorical analysis. The data were collected from 166 day care center teachers who participated in A-city university supplement education using the sentence completion metaphorical method. The collected data were categorized and analyzed through a qualitative research method conducted by 2 early childhood education specialists. The results are as follows. First, the tendency of role playing metaphorical expression was divided into 3 categories, 8 contents and the frequency of 'sociality development' was the highest followed by 'emotional development', 'development'. Second, the meaning of role playing metaphorical expression was recognized as 'social skills', 'role experience', 'imitation', and 'understanding of society' in the 'sociality development' category; as 'imagination', 'purification function', and 'means of expression' in the 'emotional development' category; and as 'essential factor of development' in the 'development' category. Based on the research result, it was suggested that the roles of education and teachers for the value and effective operation of role playing in early childhood education institutes should be reconsidered.