• 제목/요약/키워드: One-class Classification

검색결과 353건 처리시간 0.03초

일부(一部) 아동(兒童)의 신체발육(身體發育) 및 유병상태(有病狀態)에 관(關)한 조사연구(調査硏究) -기독교(基督敎) 아동복리회(兒童福利會) 전주분실(全州分室)에 가입(加入)한 아동(兒童)을 중심(中心)으로- (A Study on Physical Growth and Morbidity of the Children under Christian Children's Fund Inc. Programme)

  • 백영흠
    • Journal of Preventive Medicine and Public Health
    • /
    • 제7권1호
    • /
    • pp.131-138
    • /
    • 1974
  • The author has conducted survey on the status of physical growth and morbidity of the children for christian children's fund programme, as a means of collecting basic data for the anticipated establishment of a health planning. A total 345 children aged 9 to 16 underwent C.C.F. programme while as a control, a total of 480 children of same ages from the middle-class school children in Jeonju area was also studied. As results of survey conducted for a period of one month (form July 1 to 31, 1974) on a total 429 children in 347 households living in Jeonju area. I. Socio-economic background 1. By educational status of the children, 39.9 per cent of the total children was attending at primary school, 33.8 per cent in middle school and 15.6 per cent in high school. 2. The greatest proportion or 28.8 per cent of the household head were engaged in labor, 17.9 per cent in peddler and 13.2 per cent in retail. 3. As for the living standard of the households, low class constitued 90.1 per cent, middle and high classes only 9.9 per cent. 4. 39.5 per cent of the households had their own house, 39.1 per cent lived in rent deposit house or rooms and 14.6 per cent in monthly rented house and rooms. II. Physical growth and nutritional status 1. The growth of children for C.C.F. programme in terms of height was found to be slightly smaller than the school children. The ages frm 9 to 16 corespond to the 'secondary growth and replenishment period and this period was regarded to be the one most affected by environmental and nutritional factors of all the other periods of growth and developmet. 2. The body weight of the children for C.C.F. presented a quite different pattern from that of the school children. The above findings appeared thin-and-long stature from the famillies with higher living standard while those from the household with low standard of living had a short-and-plump one. 3. According to the values of Rohrer's index, the children of C.C.F carried a higher degree of 'replenishment' than the children in Jeonju area and adolesecence comes later for the girls under C.C.F. programme. III. Morbidity 1. The monthly prevalence rate was 110.0 per thousand persons for the children under C.C.F. programme. 2. The total number of case was classified by timing of the incidence as follws. 40.0 per cent was constituted by diseases carried over from tile previous month and 60.0 per cent by new incidences. 3. The diseases were broken down by W.H.O. disease classification into the greatest proportion or 39.1 per thousand person constituted by disease of the digestive system.

  • PDF

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

소아 루프스 신염의 임상양상 및 치료결과 (Clinical Manifestation and Treatment Outcome of Lupus Nephritis in Children)

  • 박지민;신재일;김병길;이재승
    • Childhood Kidney Diseases
    • /
    • 제6권2호
    • /
    • pp.155-168
    • /
    • 2002
  • 목적 : 전신성 홍반성 낭창(Systemic lupus erythematosus, SLE)은 여러장기를 침범하는 자가면역성 질환으로 신장의 손상이 본 질환의 예후를 좌우하는 주요원인이다. 특히 소아에서 루프스 신염은 성인보다 그 빈도가 높고, 증상이 심하므로, 신생검은 효과적인 치료의 계획을 위해서 중요한 수기이다. 이에 저자는 소아연령에서 루프스 신염의 임상적 병리학적 특성 및 치료방법에 대해 전반적으로 고찰하여 예후의 향상을 기대하고자 한다. 방법 : 1990년 1월부터 2002년 9월까지 소아과에서 전신성 홍반성 낭창으로 진단받은 63례의 환아중 신생검을 시행하여 루프스 신염으로 진단되었던 40례를 대상으로 의무 기록을 후향적으로 고찰하였다. 결과 : 환아의 남녀비는 1:3이었고 진단당시 평균발병 연령은 12.1(2-18)세였다. ARA 기준중에서는 형광 항핵항체(95.0%), 항dsDNA항체(87.5%), 나비모양 홍반(80.0%)의 순이었다. 가장 흔한 신장증상은 단백뇨와 현미경적 혈뇨(75.0%), 신증후군(55.0%), 현미경적 혈뇨 단독(15.0%)의 순이었고, 신생검상 27례(67.5%)에서 WHO Class IV 병변이 관찰되었고 3례에서 추적 관찰 신생검에서 조직소견이 바뀌었다. 치료는 prednisolone 단독 5례, prednisolone+azathioprine 9례, prednisolone+azathioprine+정맥cyclophosphamide 14례, prednisolone+cyclosporineA+정맥 cyclophosphamide 12례였고, 9례에서 혈장 교환술을 시행하였다. 환아들의 평균 추적관찰은 $51.8{\pm}40.5$개월이었고 사망은 4례에서 있었다. 사망과 관련된 위험인자로는 진단당시 성별이 남아일 때, WHO class IV의 조직소견, 급성 신부전을 동반할 때 의미있는 것으로 나타났다. 결론 : SLE 환아 중 루프스 신염의 빈도는 63.5%였으며 그중 67.5%가 예후가 불량한 WHO Class IV로 확인되었다. 따라서 신염의 초기에 적극적인 면역억제제 사용이 장기 예후 향상에 도움을 주리라고 생각된다. 하지만 소아기에 성장, 정신 사회적 발달, 생식기의 독성 등도 중요한 문제이므로 항상 적절한 치료를 위해 세심한 관심을 쏟아야 할 것이다.

  • PDF

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

Investigating Non-Laboratory Variables to Predict Diabetic and Prediabetic Patients from Electronic Medical Records Using Machine Learning

  • Mukhtar, Hamid;Al Azwari, Sana
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.19-30
    • /
    • 2021
  • Diabetes Mellitus (DM) is one of common chronic diseases leading to severe health complications that may cause death. The disease influences individuals, community, and the government due to the continuous monitoring, lifelong commitment, and the cost of treatment. The World Health Organization (WHO) considers Saudi Arabia as one of the top 10 countries in diabetes prevalence across the world. Since most of the medical services are provided by the government, the cost of the treatment in terms of hospitals and clinical visits and lab tests represents a real burden due to the large scale of the disease. The ability to predict the diabetic status of a patient without the laboratory tests by performing screening based on some personal features can lessen the health and economic burden caused by diabetes alone. The goal of this paper is to investigate the prediction of diabetic and prediabetic patients by considering factors other than the laboratory tests, as required by physicians in general. With the data obtained from local hospitals, medical records were processed to obtain a dataset that classified patients into three classes: diabetic, prediabetic, and non-diabetic. After applying three machine learning algorithms, we established good performance for accuracy, precision, and recall of the models on the dataset. Further analysis was performed on the data to identify important non-laboratory variables related to the patients for diabetes classification. The importance of five variables (gender, physical activity level, hypertension, BMI, and age) from the person's basic health data were investigated to find their contribution to the state of a patient being diabetic, prediabetic or normal. Our analysis presented great agreement with the risk factors of diabetes and prediabetes stated by the American Diabetes Association (ADA) and other health institutions worldwide. We conclude that by performing class-specific analysis of the disease, important factors specific to Saudi population can be identified, whose management can result in controlling the disease. We also provide some recommendations learnt from this research.

디렉터리 서비스 분류항목 및 정보자원의 계량적 분석 (A Quantitative Analysis of Classification Classes and Classified Information Resources of Directory)

  • 김성원
    • 정보관리연구
    • /
    • 제37권1호
    • /
    • pp.83-103
    • /
    • 2006
  • 본 연구에서는 키워드 검색의 단점을 보완하기 위해 다수의 웹 포털에서 제공중인 디렉터리 검색 서비스의 분류항목 및 정보자원에 대해 계량적으로 분석했다. 구체적으로는 Yahoo, Naver, Empas 등 3개 디렉터리 서비스의 주제별 분류항목, 주제별 정보자원, 그리고 분류항목 대비 정보자원의 계량적 분석을 시도했다. 이같은 분석결과, 각 디렉터리 서비스별로 차이를 파악해 볼 수 있다. 주제별 분류항목의 검토결과, 분야에 따라 순항목과 참조항목의 비율상 차이가 있고 형식구분의 성격인 주제분야에서 참조항목 전개비율이 높다는 것을 알 수 있다. 등록된 정보자원의 계량분석을 통해 규모의 관점에서는 야후의 등록자원이 가장 많으며, 디렉터리 서비스별로 주제별 정보자원의 다과를 파악할 수 있었다. 해당 분류항목에 분류된 정보자원의 수에 대한 계량적 분석은 뉴스, 미디어 분야를 중심으로 수행했으며, 이를 통해 엠파스나 네이버가 야후보다 등록자원에 비해 많은 분류항목을 전개하고 있다는 점을 알 수 있다. 또한 동일 정보자원이 분류된 깊이를 비교한 결과 야후가 한 단계 세분된 분류항목에 등록하고 있음을 알 수 있다.

사상체질 진단검사를 위한 데이터마이닝 알고리즘 연구 (Data mining Algorithms for the Development of Sasang Type Diagnosis)

  • 홍진우;김영인;박소정;김병철;엄일규;황민우;신상우;김병주;권영규;채한
    • 동의생리병리학회지
    • /
    • 제23권6호
    • /
    • pp.1234-1240
    • /
    • 2009
  • This study was to compare the effectiveness and validity of various data-mining algorithm for Sasang type diagnostic test. We compared the sensitivity and specificity index of nine attribute selection and eleven class classification algorithms with 31 data-set characterizing Sasang typology and 10-fold validation methods installed in Waikato Environment Knowledge Analysis (WEKA). The highest classification validity score can be acquired as follows; 69.9 as Percentage Correctly Predicted index with Naive Bayes Classifier, 80 as sensitivity index with LWL/Tae-Eum type, 93.5 as specificity index with Naive Bayes Classifier/So-Eum type. The classification algorithm with highest PCP index of 69.62 after attribute selection was Naive Bayes Classifier. In this study we can find that the best-fit algorithm for traditional medicine is case sensitive and that characteristics of clinical circumstances, and data-mining algorithms and study purpose should be considered to get the highest validity even with the well defined data sets. It is also confirmed that we can't find one-fits-all algorithm and there should be many studies with trials and errors. This study will serve as a pivotal foundation for the development of medical instruments for Pattern Identification and Sasang type diagnosis on the basis of traditional Korean Medicine.

전이 학습을 이용한 선박 기관실 기기의 분류에 관한 연구 (Machine Classification in Ship Engine Rooms Using Transfer Learning)

  • 박경민
    • 해양환경안전학회지
    • /
    • 제27권2호
    • /
    • pp.363-368
    • /
    • 2021
  • 선박 기관실은 기술의 발전으로 인해 자동화 시스템이 향상되었지만, 해상에서는 바람, 파도, 진동, 기기 노후화 등의 다양한 변수가 많아 자동화 시스템에서 계측되지 않는 풀림, 절단, 누유, 누수 등이 발생하므로 기관사는 주기적으로 순찰을 한다. 순찰 시에는 1명의 기관사만 순찰하는 경우도 있으며, 이는 고온고압 및 회전기기가 운전 중인 기관실에서 많은 위험요소를 가지고 있다. 기관사가 순찰 시에는 오감을 활용하며, 특히 시각에 의존한다. 본 논문에서는 로봇이 기관실을 순찰하며 기기의 특이사항을 검출하고 알려주는 기관실 순찰 로봇을 구현하기 위한 선행연구로서 선박 기관실 기기의 이미지를 합성곱 신경망을 이용하여 분류하였다. 선박 기관실의 이미지 데이터 셋을 구성한 후 사전 훈련된 합성곱 신경망 모델로 학습하였다. 학습한 모델의 분류 성능은 높은 재현율을 보였으며, 클래스 활성화 맵으로 이미지를 시각화 하였다. 데이터의 양이 제한적이어서 일반화할 수는 없지만, 각 선박의 데이터를 전이학습으로 학습시키면 적은 시간과 비용으로 각 선박의 특성에 맞는 모델을 구축할 수 있을 것으로 사료된다.

승모판막폐쇄부전에 대한 승모판막재건술 (Mitral Valve Repair for Mitral Regurgitation)

  • 최세영;유영선;박기성;최대융;박창권;이광숙
    • Journal of Chest Surgery
    • /
    • 제31권3호
    • /
    • pp.221-225
    • /
    • 1998
  • 계명대학교 의과대학 흉부외과학교실에서는 1996년 2월부터 1997년 5월까지 승모판막폐쇄부전이 있는 18명의 환자에 대하여 승모판막재건술을 시행하였다. 환자의 남여비는 9:9였고, 연령분포는 19세에서 68세까지로 평균연령은 53세였다. 수술당시 환자의 임상소견은 NYHA 기능적 분류상 3 또는 4등급이 13례(81%)였다. 판막병변의 원인은 퇴행성이 12례, 류마치스성이 5례, 심내막염이 1례였다. Carpentier의 기능적 분류상 II형이 15례, III형이 2례, I형이 1례였다. 수술수기는 인조링을 사용한 경우가 16례, 후첨부의 사각절제가 15례, 건삭의 단축술이 5례, 전첨부의 삼각절제가 2례, 교련절개술이 2례, 후첨의 일부를 절제하여 전첨에 이전시킨례가 1례있었다. 수술수기는 대부분의 경우에서 위의 방법을 복합적으로 시술하였다. 수술사망례는 없었다. 술후 평균 외래추적관찰기간은 6.7개월(1-15개월)이었다. 외래 추적관찰중 1례가 사망하여 사망율은 5.6%였으며 사망원인은 저심박출증이었다. 사망한 환자는 술후 3개월째 발생된 심내막염으로 승모판막치환술을 받았던 례였다. 승모판막재건술후 환자의 NYHA 기능적 분류, 흉부X-선상 심흉곽 비, 심초음파검사상 전반적으로 호전된 소견을 보였다. 이상의 결과에서 승모판막재건술은 승모판막폐쇄부전이 있는 환자에게 적용할 수 있는 비교적 안전한 수술방법으로 사료되어진다.

  • PDF

도시 하천(원주천) 유입이 섬강 하류 부착규조 군집에 미치는 영향 (Effects of an Inflowing Urban Stream (Wonju stream) on Epilithic Diatom Assemblages in the Lower Seom River)

  • 윤성애;김난영;김백호;황순진
    • 생태와환경
    • /
    • 제43권2호
    • /
    • pp.232-241
    • /
    • 2010
  • 섬강 수계로 유입되는 도시하천(원주천)의 유입이 부착조류 군집에 미치는 생태학적 영향을 평가하기 위하여 부착조류 및 수질조사를 실시하였다. 조사는 섬강 본류와 원주천을 포함한 지류 등 총 14개 지점을 선정하여 2007년 10월에서 2008년 9월에까지 계절별로 4회에 걸쳐 실시하였다. 조사결과, 수온과 용존산소를 제외한 대부분의 수질항목은 계절 변이가 크지 않았고, 섬강 상류에서 가장 낮은 농도를 보였으며, 섬강 중류(원주천 유입부분)에서 가장 높은 농도를 보였고, 원주천 합류 이후 하류로 갈수록 점차 농도가 감소하였다. 조사기간 동안 가장 높은 빈도와 생물량을 보인 종은 Achnanthes convergens이었고, 원주천를 비롯하여 수질오염이 심한 지점에서는 Navicula goeppertiana, Navicula subminuscula, Nitzschia palea 등이 높은 밀도를 보였다. 각 조사지점의 TDI(trophic diatom index)에 의하면, 섬강 수계는 크게 3 그룹 - 섬강 상류와 지류하천(A 또는 B등급), 원주천(D등급), 합류후 섬강하류의 본류(C등급)로 구분되었으며, 대부분의 수질과 높은 상관성을 보였다. 생물 및 수질요인을 근거로 하는 유사도 분석결과는 TDI 지수의 분포와 유사하였다. 따라서, 인구밀집과 공업단지를 관통하는 원주천은 섬강 수계에 서식하는 부착규조 및 수질에 큰 영향을 미치며, 원주천 합류 이후 하류로 갈수록 오염정도가 점차 감소하는 것으로 평가되었다.