• Title/Summary/Keyword: 불균형(不均衡)

Search Result 2,176, Processing Time 0.031 seconds

Learning T.P.O Inference Model of Fashion Outfit Using LDAM Loss in Class Imbalance (LDAM 손실 함수를 활용한 클래스 불균형 상황에서의 옷차림 T.P.O 추론 모델 학습)

  • Park, Jonghyuk
    • Journal of the Korea Convergence Society
    • /
    • v.12 no.3
    • /
    • pp.17-25
    • /
    • 2021
  • When a person wears clothing, it is important to configure an outfit appropriate to the intended occasion. Therefore, T.P.O(Time, Place, Occasion) of the outfit is considered in various fashion recommendation systems based on artificial intelligence. However, there are few studies that directly infer the T.P.O from outfit images, as the nature of the problem causes multi-label and class imbalance problems, which makes model training challenging. Therefore, in this study, we propose a model that can infer the T.P.O of outfit images by employing a label-distribution-aware margin(LDAM) loss function. Datasets for the model training and evaluation were collected from fashion shopping malls. As a result of measuring performance, it was confirmed that the proposed model showed balanced performance in all T.P.O classes compared to baselines.

A Study on the Characteristics of the Spatial Distribution and the Disparities in the Provision of Public Libraries in Busan (부산지역 공공도서관 분포의 특성과 공급 불균형 양상 분석)

  • Koo, Bon Jin;Chang, Durk Hyun
    • Journal of Korean Library and Information Science Society
    • /
    • v.52 no.2
    • /
    • pp.189-208
    • /
    • 2021
  • Public library usage is closely related to the accessibility to library facilities. Therefore, public library planning and development authorities should consider the policies for improving the library accessibility of community, for releasing disparities of the spatial accessibility and for increasing location efficiency of public libraries. In this regard, this study strives to analyze the spatial distribution of public libraries in Busan and to derive the regions that lack public libraries by identifying main characteristics using geographical information systems (GIS): identify the blind spot for public library service, analyze the hot and cold spot for the supply of libraries, and identify the vulnerable areas of library based on population density. The result of the study will contribute to understand the spatial distribution of public libraries in Busan and to prioritize sites where public library should be constructed in order to improve the accessibility to public library services.

A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data (불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신)

  • Bang, Sungwan;Kim, Jaeoh
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.2
    • /
    • pp.177-188
    • /
    • 2022
  • The support vector machine (SVM) has been successfully applied to various classification areas with a high level of classification accuracy. However, it is infeasible to use the SVM in analyzing massive data because of its significant computational problems. When analyzing imbalanced data with different class sizes, furthermore, the classification accuracy of SVM in minority class may drop significantly because its classifier could be biased toward the majority class. To overcome such a problem, we propose the DOC-SVM method, which uses divide-oversampling and conquers techniques. The proposed DOC-SVM divides the majority class into a few subsets and applies an oversampling technique to the minority class in order to produce the balanced subsets. And then the DOC-SVM obtains the final classifier by aggregating all SVM classifiers obtained from the balanced subsets. Simulation studies are presented to demonstrate the satisfactory performance of the proposed method.

Properties of chi-square statistic and information gain for feature selection of imbalanced text data (불균형 텍스트 데이터의 변수 선택에 있어서의 카이제곱통계량과 정보이득의 특징)

  • Mun, Hye In;Son, Won
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.4
    • /
    • pp.469-484
    • /
    • 2022
  • Since a large text corpus contains hundred-thousand unique words, text data is one of the typical large-dimensional data. Therefore, various feature selection methods have been proposed for dimension reduction. Feature selection methods can improve the prediction accuracy. In addition, with reduced data size, computational efficiency also can be achieved. The chi-square statistic and the information gain are two of the most popular measures for identifying interesting terms from text data. In this paper, we investigate the theoretical properties of the chi-square statistic and the information gain. We show that the two filtering metrics share theoretical properties such as non-negativity and convexity. However, they are different from each other in the sense that the information gain is prone to select more negative features than the chi-square statistic in imbalanced text data.

Study on Lifelog Anomaly Detection using VAE-based Machine Learning Model (VAE(Variational AutoEncoder) 기반 머신러닝 모델을 활용한 체중 라이프로그 이상탐지에 관한 연구)

  • Kim, Jiyong;Park, Minseo
    • The Journal of the Convergence on Culture Technology
    • /
    • v.8 no.4
    • /
    • pp.91-98
    • /
    • 2022
  • Lifelog data continuously collected through a wearable device may contain many outliers, so in order to improve data quality, it is necessary to find and remove outliers. In general, since the number of outliers is less than the number of normal data, a class imbalance problem occurs. To solve this imbalance problem, we propose a method that applies Variational AutoEncoder to outliers. After preprocessing the outlier data with proposed method, it is verified through a number of machine learning models(classification). As a result of verification using body weight data, it was confirmed that the performance was improved in all classification models. Based on the experimental results, when analyzing lifelog body weight data, we propose to apply the LightGBM model with the best performance after preprocessing the data using the outlier processing method proposed in this study.

Multi-Line Data Gathering Scheme for Efficient Operation of a Mobile Sink in Solar-Powered Wireless Sensor Networks (태양 에너지 수집형 무선 센서 네트워크에서 모바일 싱크의 효율적 운용을 위한 멀티라인 데이터 수집 기법)

  • Lee, Seungwoo;Kang, Minjae;Son, Youngjae;Gil, Gun Wook;Cheong, Seok Hyun;Bae, Ha Neul;Noh, Dong Kun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.135-138
    • /
    • 2020
  • 무선 센서 네트워크에서 모바일 싱크의 도입은 기존의 고정된 위치의 싱크를 사용하는 WSN에서 발생하는, 싱크 주변 노드들과 외곽 노드들 간의 에너지 불균형 문제(에너지 핫스팟 문제)를 어느 정도 해결할 수 있게 하였다. 그러나 모바일 싱크의 에너지 제약으로 인해 싱크가 모든 노드를 방문하여 데이터를 수집할 수 없기 때문에, 앵커(또는 헤드)라고 불리는 특정 노드에서 데이터를 모으고, 모바일 싱크는 이러한 앵커 노드들만을 방문하는 방법이 널리 사용되고 있다. 최근 연구에서는 모바일 싱크가 보다 효율적으로 에너지 불균형 문제를 해결하기 위하여 모바일 싱크 이동 경로 및 앵커 노드 선정 최적화 방법이 활발히 연구되고 있다. 본 연구에서는 태양 에너지 기반 센서 네트워크를 위한 영역 기반 앵커 선정 기법 및 모바일 싱크 이동 경로 선택 기법을 제안한다. 제안 기법은 각 노드가 수집하는 태양 에너지의 활용을 최대화하고, 에너지 핫스팟 문제를 완화하기 위해 두 개의 라인(영역)을 설정하고 이 라인을 따라 앵커 노드가 선정된다. 모바일 싱크는 데이터 수집을 위해 이 두 라인을 왕복 이동 경로로 택하여 라인 내의 앵커 노드를 방문한다. 실험을 통해 제안 기법이 기존 기법보다 에너지 불균형 문제가 완화되어 노드의 정전 시간이 줄어들고, 이에 따라 모바일 싱크에서 수집되는 데이터의 양이 증가하는 것을 확인하였다.

  • PDF

Prediction of CDOM absorption coefficient using Oversampling technique and Machine Learning in upstream reach of Baekje weir (백제보 상류하천구간의 Oversampling technique과 Machine Learning을 활용한 CDOM 흡수계수 예측)

  • Kim, Jinuk;Jang, Wonjin;Kim, Jinhwi;Park, Yongeun;Kim, Seongjoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.46-46
    • /
    • 2022
  • 유기물의 복잡한 혼합물인 CDOM(Colored or Chromophoric Dissolved Organic Matter)은 하천 내 BOD(Biological Oxygen Demand), COD(Chemical Oxygen Demand) 및 유기 오염물질과 상당한 관련이 있다. CDOM은 가시광선 영역에서 빛을 흡수하는 성질을 가지고 있으며, 최근 원격감지 기술로 CDOM을 모니터링하기 위한 연구가 진행되고 있다. 본 연구에서는 백제보 상류 23km 구간에서 3년(2016~2018) 중 13일의 초분광영상을 활용하여 머신러닝 기반 CDOM을 추정 알고리즘을 개발하고자 한다. 초분광영상은 400~970 nm의 범위의 4 nm 간격 127개 대역의 분광해상도와 2 m의 공간해상도를 가진 항공기 탑재 AsiaFENIX 초분광 센서를 통해 수집하였으며 CDOM은 Millipore polycarbonate filter (𝚽47, 0.2 ㎛)에서 여과된 CDOM 샘플 자료를 200~800 nm의 흡수계수 스펙트럼으로 추출하여 사용하였다. CDOM 값은 전체기간 동안 2.0~11.0 m-1의 값 분포를 보였으며 5 m-1이상의 고농도 구간 자료개수가 전체 153개 샘플자료 중 21개로 불균형하다. 따라서 ADASYN(Adaptive Synthesis Sampling Approach)의 oversampling 방법으로 생성된 합성 데이터를 사용하여 원본 데이터의 소수계층 데이터 불균형을 해결하고 모델 예측 성능을 개선하고자 하였다. 생성된 합성 데이터를 입력변수로 하여 ANN(Artificial Neural Netowk)을 활용한 CDOM 예측 알고리즘을 구축하였다. ADASYN 기법을 통한 합성 데이터는 관측된 데이터의 불균형을 해결하여 기계학습 모델의 CDOM 탐지 성능을 향상시킬 수 있으며, 저수지 내 유기 오염물질 관리를 위한 설계를 지원하는데 사용할 수 있을 것으로 판단된다.

  • PDF

Factors Affecting the Distribution of Practicing Nurses (임상간호사 분포에 영향을 미치는 요인)

  • Euntae Park;Jinhyun Kim
    • Health Policy and Management
    • /
    • v.34 no.1
    • /
    • pp.94-102
    • /
    • 2024
  • Background: There is controversy surrounding the claim that current nursing workforce policies exacerbate the geographic imbalance of nurses in Korea, but very few studies have confirmed this assertion. Therefore, this study aimed to identify factors influencing the distribution of nurses at the regional level, including variables related to nursing workforce policies. Methods: This study analyzed the distribution of 225,462 practicing nurses across 250 regions in Korea as of 2020. National statistics were collected for these 250 regions, and regression analysis was conducted. Results: Factors influencing the distribution of practicing nurses included the number of annual inpatient days, integrated nursing care service beds, public healthcare institutions, tertiary hospitals, and general hospitals. Additionally, the number of nursing graduates and healthcare institutions with nurse staffing grade 1 and 2 had an impact on nurse distribution in non-capital regions. Conclusion: To prevent exacerbating the geographic imbalance of nurses, careful decisions should be made regarding the expansion of integrated nursing care service beds. Furthermore, it is necessary to increase the number of nursing students in non-capital regions and prioritize the improvement of wages and working conditions for nurses in those areas.

Gender Preference and Sex Imbalance in the Population and Their Implication in Korea (한국의 성선호와 성비불균형 분석)

  • 박재빈
    • Korea journal of population studies
    • /
    • v.17 no.1
    • /
    • pp.87-114
    • /
    • 1994
  • 1950년대부터 많은 개발도상국가들은 가족계획을 위주로 하는 인구제어정책을 추진하여 왔다. 특히 가부장제도를 중심으로하는 동아시아 국가들에 있어서는 남아선호관이 출산력 저하나 피임 실천율이 증대에 지대한 유해요인으로 일관해 왔다. Sheps(1963)는 실증적으로 2명의 아들을 갖기 위해서는 약 3.9명 정도의 자녀를 두어야 한다는 연구결과를 제시한바 있다. 이와 같은 남아선호관의 여파에도 불구하고 한국과 홍콩은 1980년대 증반에 이미 1.6명 수준의 저출산율을 이룩하였으며, 1970년대에 인구억제 정책을 시작한 중국도 2명 수준으로 저하되어 가족계획사업의 성공사례로 평가되어 왔다. 그러나 이들 국가들의 출산율은 지난 20-30년이라는 짧은 기간에 너무나 급진적으로 감소된 반면에 남아선호관의 상존으로 인한 성비(여자 100명당 남자수)의 불균형을 초래하게 되였다. 한 예로 한국의 경우 1960년도만 해도 6명 이상의 자녀를 출산하는 과정에서 1-2명의 아들을 둘 수 있는 확률은 매우 높았으나, 최근에는 출산율이 2명 이하로 저하되어 아들을 둘 수 있는 확률은 과거보다 3-4배 어려워졌기 때문에 인위적인 방법으로 아들을 두는 부모의 수가 증가하고 있다. 중국은 1970년대 중반기부터 강력히 추진되어온 소위 "한자녀 갖기 운동"으로 인하여 여아출산인 경우 영아살해 또는 출생의 미신고등 많은 사회적 물의를 야기하였고, 최근에는 초음파검사를통한 선택적 인공임신중절(태아가 여아인 경우)으 경우가 급격히 증가하고 있다. 우리 나라의 성비는 출산율이 급격히 감소된 1980년대 증반기부터 급격히 증가되었다. 즉 인구전체에 대한 성비는 1980년의 103.9명에서 1985년에 110명으로 증가하였고ㅡ 1990년 116.9명으로 증가되었다. 성비는 자녀의 수가 적을수록 높아지는 추세이다. 1991년 조사에서 출산을 종료한 부인의 경우 1자녀의 성비는 무려 206명이나 되고 있다. 이와 같은 결과는 한자녀를 원하는 부인이 아들을 둔 경우 1자녀에서 조산을 결심하기 때문인 것이다. 통계청 자료에 의하면 성비는 무엇보다도 자녀의 출산순위와 밀접하다. 1991년 출생신고자료의 경우 첫아이의 출생시 성비는 106.1명이고, 둘째아이가 112.8명이나, 셋째아이는 184.7명으로 크게 증가하고 넷째 이상의 경우는 212.3명이나 된다. 동일한 출산순위라도 이미 두고 있는 자녀의 성에 따라서 많은 차이를 보인다. 1991년도 3번째 출산의 경우 딸만 2명을 두고 있는 자녀의 성에 아들만 2명 또는 아들과 딸을 각각 1명씩 두고 있는 경우에 비해 높은 성비를 보이고 있다. 자녀를 출산하는데 있어서 처음에는 아들ㅇ르 기다리지만 딸의 수가 증가함에 따라 적극적으로 아들을 낳고자 하는 노력을 지속하게 됨을 알 수 있다. 이는 즉 임신한 자녀의 성이 딸로 판명되면 인공임신중절을 통해 임신을 종결시키고 있음을 의미한다. 최근 한국보건사회연구원에서 수행한 연구결과에 의하면 이미 출생한 자녀의 성구성은 임신결과를 결정하는 가장 중요한 변수로 부각되고 있다. 즉 임신이 인공임신중절로 귀착되는 확률은 부모가 이미 아들을 두고 있는 경우에 일관성 있게 증가되고 있음을 보이고 있다. 따라서 남아선호관은 임신결과를 결정할뿐 아니라 선택절 인공임신중절에 의한 성비의 불균형을 초래하는 주요 변수로써 할거되었다. 특히 피임실천이 보편화되고 선택적 인공임신중절의 이용이 손쉬운 현대사회에 있어서는 남아선호관이 출산력 저하에 저해요인으로서가 아니라, 인위적이던 자연적이던 간에 아들만 두면 단산하는 현행의 출산풍토하에서는 남아선호관이 오히려 출산력저하에 결정적으로 작용하고 있다고 하겠다. 태아의 성 판별을 통한 선택적 인공임신중절의 건수는 1990년 한해에 약 20,000건 정도가 되고, 1986-1990년 사이에 총 80,000건으로 추정된다. 이 수치는 출생한 여아수의 5%에 해당한다. 현재 출생시 성비의 불균형은 연간 총출생수의 10% 미만에 불과한 3번째 이상의 출산에서 발생되고 있기 때문에 인구학적인 측면에서는 큰 문제가 아니다. 그러나 앞으로 출산율의 감소와 더불어 선택적 인공임신중절이 년간 출생수의 90% 이상을 차지하고 있는 둘째, 첫째출산순위로 확산된다면 성비의 불균형은 급진적으로 가속화되어 전통적 결혼관습의 재연등 인간의 생태계를 파괴하는 새로운 차원에서의 사회인구학적인 문제가 야기될 것이다. 결론적으로 성비의 불균형을 초래하는 근본적인 원인은 우리 나라으 전통적인 의식구조인 남아선호관의 상종과 최신의 의료기술에 의한 선택적 인공임신중절에 기인된 것이기 때문에 이를 시정하기 위한 제반 사회제도적 극복정책은 지속적으로 강화되어야 할 것이다.되어야 할 것이다.

  • PDF

A Study on Mechanical Errors in Cone Beam Computed Tomography(CBCT) System (콘빔 전산화단층촬영(CBCT) 시스템에서 기계적 오류에 관한 연구)

  • Lee, Yi-Seong;Yoo, Eun-Jeong;Kim, Seung-Keun;Choi, Kyoung-Sik;Lee, Jeong-Woo;Suh, Tae-Suk;Kim, Joeng-Koo
    • Journal of radiological science and technology
    • /
    • v.36 no.2
    • /
    • pp.123-129
    • /
    • 2013
  • This study investigated the rate of setup variance by the rotating unbalance of gantry in image-guided radiation therapy. The equipments used linear accelerator(Elekta Synergy TM, UK) and a three-dimensional volume imaging mode(3D Volume View) in cone beam computed tomography(CBCT) system. 2D images obtained by rotating $360^{\circ}$and $180^{\circ}$ were reconstructed to 3D image. Catpan503 phantom and homogeneous phantom were used to measure the setup errors. Ball-bearing phantom was used to check the rotation axis of the CBCT. The volume image from CBCT using Catphan503 phantom and homogeneous phantom were analyzed and compared to images from conventional CT in the six dimensional view(X, Y, Z, Roll, Pitch, and Yaw). The variance ratio of setup error were difference in X 0.6 mm, Y 0.5 mm Z 0.5 mm when the gantry rotated $360^{\circ}$ in orthogonal coordinate. whereas rotated $180^{\circ}$, the error measured 0.9 mm, 0.2 mm, 0.3 mm in X, Y, Z respectively. In the rotating coordinates, the more increased the rotating unbalance, the more raised average ratio of setup errors. The resolution of CBCT images showed 2 level of difference in the table recommended. CBCT had a good agreement compared to each recommended values which is the mechanical safety, geometry accuracy and image quality. The rotating unbalance of gentry vary hardly in orthogonal coordinate. However, in rotating coordinate of gantry exceeded the ${\pm}1^{\circ}$ of recommended value. Therefore, when we do sophisticated radiation therapy six dimensional correction is needed.