• 제목/요약/키워드: 불균형

검색결과 2,197건 처리시간 0.029초

우간다의 도시-농촌 간 교육 불균형 해소를 위한 ICT 적정기술 (Reducing Rural-Urban Education Gap in Uganda Through ICT Appropriate Technology)

  • 노효선
    • 적정기술학회지
    • /
    • 제7권1호
    • /
    • pp.33-40
    • /
    • 2021
  • 동아프리카에 속한 우간다도 농업 중심의 현 국가 상황에서 벗어나 중상위권 국가로 도약하기 위해 다양한 국가개발 계획을 세우고 진행하고 있다. 그러나 다양한 정부의 노력에도 도시-농촌간 균형적인 발전을 이루지 못하고 그 격차가 더욱 심화되고 있다. 특별히 도시-농촌간 교육 격차는 장기적으로 우간다 국가계발 계획에 부정적인 영향을 줄 수 있는 문제점으로 부각되고 있다. 본 논문에서는 우간다의 도시-농촌간 교육 불균형이 가속화되고 있는 원인들을 살펴 보고 전자도서관 시스템과 같은 ICT 적정 기술을 활용하여 교육 불균형을 감소 시킬 수 있는 방안을 소개하고자 한다.

텍스트 데이터의 정보 손실을 방지하기 위한 군집화 기반 언더샘플링 기법 (A Clustering-based Undersampling Method to Prevent Information Loss from Text Data)

  • 김종휘;신사임;장진예
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.251-256
    • /
    • 2022
  • 범주 불균형은 분류 모델이 다수 범주에 편향되게 학습되어 소수 범주에 대한 분류 성능을 떨어뜨리는 문제를 야기한다. 언더 샘플링 기법은 다수 범주 데이터의 수를 줄여 소수 범주와 균형을 이루게하는 대표적인 불균형 해결 방법으로, 텍스트 도메인에서의 기존 언더 샘플링 연구에서는 단어 임베딩과 랜덤 샘플링과 같은 비교적 간단한 기법만이 적용되었다. 본 논문에서는 트랜스포머 기반 문장 임베딩과 군집화 기반 샘플링 방법을 통해 텍스트 데이터의 정보 손실을 최소화하는 언더샘플링 방법을 제안한다. 제안 방법의 검증을 위해, 감성 분석 실험에서 제안 방법과 랜덤 샘플링으로 추출한 훈련 세트로 모델을 학습하고 성능을 비교 평가하였다. 제안 방법을 활용한 모델이 랜덤 샘플링을 활용한 모델에 비해 적게는 0.2%, 많게는 2.0% 높은 분류 정확도를 보였고, 이를 통해 제안하는 군집화 기반 언더 샘플링 기법의 효과를 확인하였다.

  • PDF

다중클래스 한국어 감성분석에서 클래스 불균형과 손실 스파이크 문제 해결을 위한 기법 (Methods For Resolving Challenges In Multi-class Korean Sentiment Analysis)

  • 박제윤;양기수;박예원;이문기;이상원;임수연;조재훈;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.507-511
    • /
    • 2020
  • 오픈 도메인 대화에서 텍스트에 나타난 태도나 성향과 같은 화자의 주관적인 감정정보를 분석하는 것은 사용자들에게서 풍부한 응답을 이끌어 내고 동시에 제공하는 목적으로 사용될 수 있다. 하지만 한국어 감성분석에서 기존의 대부분의 연구들은 긍정과 부정 두개의 클래스 분류만을 다루고 있고 이는 현실 화자의 감정 정보를 정확하게 분석하기에는 어려움이 있다. 또한 최근에 오픈한 다중클래스로된 한국어 대화 감성분석 데이터셋은 중립 클래스가 전체 데이터셋의 절반을 차지하고 일부 클래스는 사용하기에 매우 적은, 다시 말해 클래스 간의 데이터 불균형 문제가 있어 다루기 굉장히 까다롭다. 이 논문에서 우리는 일곱개의 클래스가 존재하는 한국어 대화에서 세션들을 효율적으로 분류하는 기법들에 대해 논의한다. 우리는 극심한 클래스 불균형에도 불구하고 76.56 micro F1을 기록하였다.

  • PDF

Diffusion Model을 활용한 신용 예측 데이터 불균형 해결 기법 (Mitigating Data Imbalance in Credit Prediction using the Diffusion Model)

  • 오상민;이주홍
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.9-15
    • /
    • 2024
  • 본 논문에서는 신용 예측에서 발생하는 불균형 문제를 해결하기 위해 Diffusion Multi-step Classifier(DMC)를 제안한다. DMC는 Diffusion Model을 통해 신용 예측 데이터의 연속적인 수치형 데이터들을 생성하고 생성된 데이터들을 Multi-step Classifier로 구분하는 것으로 범주형 데이터를 생성한다. DMC를 통해 기존의 데이터를 생성하는 다른 알고리즘보다 실제 데이터와 유사한 분포를 가지는 데이터를 생성할 수 있었다. 이렇게 생성된 데이터를 사용하여 실험을 진행하였을 때 연체를 예측할 확률이 20%이상 상승하였으며, 전체적으로 예측 정확성은 약 4%정도 상승하였다. 이러한 연구 결과는 실제 금융기관에 적용 시 연체율 감소와 수익 증가에 큰 기여를 할 수 있을것으로 예상된다.

무선 센서 네트워크에서의 에너지 효율적인 불균형 클러스터링 알고리즘 (An Energy Efficient Unequal Clustering Algorithm for Wireless Sensor Networks)

  • 이성주;김성천
    • 정보처리학회논문지C
    • /
    • 제16C권6호
    • /
    • pp.783-790
    • /
    • 2009
  • 무선 센서 네트워크의 필요성이 증가함에 따라 관련된 연구 또한 활발히 진행되고 있다. 특히, 에너지 제약적인 무선 센서 네트워크의 생존 시간을 증가시키고자 하는 클러스터링 기법들이 많이 연구되고 있다. 대표적인 LEACH와는 달리, 최근의 클러스터링 기법들은 다중 홉으로 데이터를 전송하기 때문에 데이터 병목 현상 문제가 발생한다. 불균형 클러스터링(unequal clustering) 기법들은 라우팅 경로를 증가시켜 데이터 병목 현상 문제를 해결하였다. 불균형 클러스터링 기법들의 대부분은 BS(Base Station)와의 거리만을 고려하여 클러스터의 크기를 결정하였기 때문에, 클러스터 헤드의 에너지 소모가 커지는 문제점이 있다. 본 논문에서는 클러스터 헤드의 에너지 소모를 최소화하고, 데이터 병목 현상 문제도 해결할 수 있는 불균형 클러스터링 알고리즘을 제안하였다. 기본 아이디어는 적절한 클러스터 헤드를 선출한 이후, BS와의 거리와 노드의 에너지 상태, 이웃 노드의 수를 고려하여 클러스터의 크기를 결정하고, 동시에 클러스터 헤드의 전송기능을 분담하는 노드를 선정하는 것이다. 이처럼 클러스터 헤드의 에너지 소모를 최소화함으로써 클러스터링의 반복횟수를 감소시킬 수 있었으며, 더불어 전체 네트워크의 에너지 소모도 감소시킬 수 있었다.

DFT 확산 방식의 OFDM 통신 시스템에서 위상잡음과 직교 불균형 보상 (Compensation of Phase Noise and IQ Imbalance in the OFDM Communication System of DFT Spreading Method)

  • 유상범;유흥균
    • 한국전자파학회논문지
    • /
    • 제20권1호
    • /
    • pp.21-28
    • /
    • 2009
  • DFT(Discrete Fourier Transform) 확산 방식의 OFDM(Orthogonal Frequency Division Multiplexing) 통신 시스템은 PAPR(Peak-to-Average Power Ratio) 저감에 매우 효과적인 시스템이며, 3GPP LTE($3^{rd}$ Generation Partnership Project Long Term Evolution)의 상향 링크에 SC-FDMA(Single Carrier-Frequency Division Multiple Access)에 사용된다. SC-FDMA는 일반적으로 OFDM 시스템보다 위상잡음과 직교 불균형으로 인한 ICI(Inter-Carrier Interference)에서 더 성능 열화가 발생하며, 등화기에 심각한 영향을 미친다. 그러므로 본 논문에서는 상향 링크에서 신호 전송 시 발생하는 위상잡음과 직교 불균형(IQ Imbalance: In-phase/Quadrature Imbalance), 그리고 전력 증폭기(HPA: High Power Amplifier)의 백-오프 특성에 따른 영향을 분석하고, ICI 성분을 제거할 수 있는 효과적인 등화 알고리듬을 제시한다. 제안된 등화기는 FDE(Frequency Domain Equalizer) 방식을 기반으로 설계하였으며, 기존의 PNS(Phase Noise Suppression) 알고리듬을 FDE에 사용될 수 있도록 수정하고 개선하여 위상 잡음과 직교 불균형으로 인한 ICI를 보상한다. 시뮬레이션 결과를 통하여 back-off 5.5 dB 상태에서 위상 잡음 $0.06\;rad^2$, 위상 에러 5도, 진폭 에러 0.005인 경우, 위상 잡음과 직교 불균형을 보상하여 SNR=14 dB 정도에서 $BER=10^{-4}$의 성능을 만족할 수 있다.

불균형 데이터 집합에서의 의사결정나무 추론: 종합 병원의 건강 보험료 청구 심사 사례 (Decision Tree Induction with Imbalanced Data Set: A Case of Health Insurance Bill Audit in a General Hospital)

  • 허준;김종우
    • 경영정보학연구
    • /
    • 제9권1호
    • /
    • pp.45-65
    • /
    • 2007
  • 다른 산업과 달리 병원/의료 산업에서는 건강 보험료 심사 평가라는 독특한 검증 과정이 필수적으로 있게 된다. 건강 보험료 심사 평가는 병원의 수익 문제 뿐 아니라 적정한 진료행위를 하는 병원이라는 이미지와도 맞물려 매우 중요한 분야이며, 특히 대형 종합병원일수록 이 부분에 많은 심사관련 인력들을 투입하여, 병원의 수익과 명예를 위해서 업무를 수행하고 있다. 본 논문은 이러한 건강보험료 청구 심사 과정에서, 사전에 수많은 진료 청구 건 중 심사 평가에서 삭감이 될 수 있는 진료 청구 건을 데이터 마이닝을 통해서 발견하여, 사전의 대비를 철저히 하고자 하는 한 국내 대형 종합병원의 사례를 소개하고자 한다. 데이터 마이닝을 적용함에 있어, 주요한 문제점 중 하나는 바로 지도학습 기법을 적용하기에 곤란한 데이터 불균형 문제가 발생하는 것이다. 이런 불균형 문제를 해소하고, 비교 조건 중에 가장 효율적인 삭감 예상 진료 건 탐지 모델을 만들어 내기 위하여, 데이터 불균형 문제의 기본 해법인 Sampling과 오분류 비용의 다양한 혼합적인 적용을 통하여, 적합한 조건을 가지는 의사결정 나무 모델을 도출하였다.

온라인 주식게시판 정보가 주식투자자의 거래행태에 미치는 영향 (The Impact of Information on Stock Message Boards on Stock Trading Behaviors of Individual Investors based on Order Imbalance Analysis)

  • 김현모;박재홍
    • 경영정보학연구
    • /
    • 제18권2호
    • /
    • pp.23-38
    • /
    • 2016
  • 지금까지 수행된 연구들은 온라인 주식게시판 정보가 주식시장 활동에 미치는 영향의 유무만을 보이는 것에 초점을 맞추었으며, 온라인 주식게시판 정보가 주식투자자에게 매수 의도를 갖도록 하는지, 혹은 매도 의도를 갖도록 하는지에 대해서 연구되지 않았다. 따라서 본 연구의 목적은 온라인 주식게시판 정보가 주로 주식투자자의 어떠한 거래행태를 불러일으키는지 확인하는 것이다. 본 연구의 목적을 달성하기 위하여, 온라인 주식게시판 정보로서 주식 게시물 수를 온라인 구전활동 정도로 보았으며, 매수 및 매도 거래행태로서 주문불균형을 주식투자자의 거래방향성으로 보았다. 그리고 이를 기반으로 온라인 주식게시판의 장내 및 장외 주식게시물 수와 주문불균형 간의 상관관계를 확인하였다. 실증분석을 위하여, KOSPI에 상장된 40개 주식종목에 대한 온라인 주식시판으로부터 3개월 동안의 전체 게시물 46,077개를 수집하였고, 코스콤 데이터베이스로부터 해당 주식 종목에 대한 매수 및 매도 주도거래 데이터를 수집하여 절대 거래횟수 주문불균형 데이터를 설정하였다. 수집한 모든 데이터는 종목 및 시간에 따른 균형 패널데이터(balanced panel data)로 구성하였고, 패널 벡터자기 회귀 분석을 수행하였다. 본 연구의 분석결과를 살펴보면, 온라인 주식게시판의 1, 2일 전(t-1, t-2) 장내 게시물 수는 당일 주문불균형에 양의 영향을 미치는 것으로 나타났다. 그리고 온라인 주식게시판의 1일 전(t-1) 장외 게시물 수는 당일 주문불균형에 양의 영향을 미치는 것으로 나타났다. 즉, 온라인 주식게시판 정보는 주식투자자에게 주로 주식매수 결정에 영향을 미치는 것으로 보여 졌으며, 온라인 주식게시판 정보는 주로 해당 주식을 매수하도록 하는 감성(strong buy or buy sentiment)의 속성을 가진 것으로 추정되었다. 이러한 실증분석 결과를 바탕으로 정보시스템 및 재무행태학 부문의 학술적, 실무적 기여점을 제시한다.

선별적 인공유산의 결정인자에 관한 비교연구 : 대구지역과 미국 캘리포니아 베이지역 (Determinants of Sex-Selective Induced Abortion Among Married Women : A Comparative Study between Taegu & Bay Area in California, USA)

  • 김한곤
    • 한국인구학
    • /
    • 제20권1호
    • /
    • pp.65-96
    • /
    • 1997
  • 본 연구의 목적은 1980년대 중반 이후부터 지속되고 있는 한국사회 전반에 걸친 출생시 성비불균형현상 가운데 특히 다른 지역에 비해 불균형 정도가 심각한 대구지역의 출생시 성비불균형의 원인을 경험적으로 규명하는 데 있다. 이러한 목적에서 한국에서 태어났지만 사회적,문화적,환경적 여건이 서로 다른 미국으로 이민하여 캘리포이아의 베이지역에 거주하고 있는 한국동포 기혼여성들의 성차별의식, 아들선호도, 태아성감별, 인공유산 등 출생시성비에 영향을 미친다고 알려진 요인들을 대구지역의 기혼여성들과 비교 분석하였다. 본 연구에는 대구지역과 미국 캘리포니아 베이지역에서 거주하는 25-44세 사이의 기혼여성들을 대상으로 조사한 설문조사 내용을 자료로 사용하였다. 연구결과 대구지역의 기혼여성들이 미국 베이지역의 한국동포 기혼여성보다 성차별을 더 많이 느끼고 있으며 아들선호도 역시 높은 것으로 밝혀졌다. 특히 아들을 낳기 위한 노력의 일환으로 임신 전부터 아들을 낳기 위한 시도는 대구지역 기혼여성들이 베이지역 한국동포 기혼여성들보다 2배 정도 더 높으며 태아의 성감별 후 여아로 판명되어 인공중절수술을 실시한 비율은 무려 여섯 배를 능가하는 것으로 밝혀졌다. 출생시 성비불균형에 결정적인 영향을 미치는 변수들을 경험적으로 규명하기하기 위하여 도입한 로지스틱회귀분석 결과에 의하면 대구지역의 경우 성차별 정도, 아들선호도, 성감별 등은 통계적으로 유의미한 영향을 미치는 것으로 나타났으나 베이지역의 경우 연령만이 통계적으로 유의미한 영향을 미치는 것으로 밝혀졌다. 그러므로 본 연구결과를 통하여 우리는 대구지역의 출생시 성비불균형의 가장 큰 원인은 무엇보다도 타지역에 비해 지나치게 강하게 남아있는 유교적 전통에서 비롯되는 아들선호의식에서 출발하고 있음을 알 수 있으며, 이러한 아들선호는 사회계층, 연령, 교육수준의 차이를 막론하고 존재하고 있는 것으로 보인다.

  • PDF

저역 통과 필터 불일치를 포함한 직접 변환 수신기의 I/Q 불균형 보상 기법 (I/Q Imbalance Compensation Method for the Direct Conversion Receiver with Low Pass Filter Mismatch)

  • 윤선희;안재민
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.3-10
    • /
    • 2014
  • 무선 통신 시스템의 집적화 및 비용 절감을 위해 복잡한 필터를 사용하는 헤테로다인 수신기 대신 직접 변환 수신기가 재조명되고 있다. 이에 따라 직접 변환 수신기의 성능 저하 요인을 개선하기 위한 방법 중 하나로 I/Q 불균형 문제, 즉 실수부와 허수부의 진폭, 위상 불일치 개선을 위한 연구가 진행되었다. 그러나 기존 협대역 시스템 중심의 연구에서 크게 고려하지 않아도 되었던 저역 통과 필터의 불일치 문제가 통신 시스템의 광대역화 추세에 따라 직접 변환 수신기의 I/Q 불균형 현상에 심각한 영향을 미칠 수 있게 되었다. 이에 따라 본 연구에서는 10MHz의 광대역 신호를 발생시켜 중심 주파수로부터 각각 ${\pm}8MHz$로 이동시켜 필터 불일치에 의한 영향이 주파수 선택적으로 나타남을 확인하고, 기존의 I/Q 불균형 모델링에서 주로 다루었던 진폭, 위상 불일치에 더하여 필터 불일치 모델링을 추가하였다. 또한 각 불일치 요소를 제거하기 위한 보상 방법을 제시하였다. 모의실험을 통해, 제안한 I/Q 불균형 보상기는 필터 불일치가 존재하는 상황에서 주파수에 따른 신호 왜곡의 차이를 보상함을 확인하였다.