• Title/Summary/Keyword: nearest-neighbor analysis

검색결과 254건 처리시간 0.03초

슬통 진단용 설문지개발 및 진단 일치도 평가연구 (Development of Knee Pain Diagnosis Questionnaire and Clinical Study of Diagnostic Correspondent Rate)

  • 황지후;김유종;김은정;이참결;이은용;이승덕;김갑성
    • Journal of Acupuncture Research
    • /
    • 제29권5호
    • /
    • pp.61-74
    • /
    • 2012
  • Objectives : This study is perfomed for preparation of oriental medicine clinical guidelines for drawing up the standards of oriental medicine demonstration and diagnosis classification about the knee pain. Methods : Statistical analysis about Crane's-knee wind(鶴膝風), arthralgia syndrome(痺症), knee injury(膝傷), gout arthritis(痛風), Youk jeol poung(歷節風) classified experts' opinions about knee pain patients by Delphi method is conducted by using oriental medicine diagnosis questionnaire. The result was classified by using linear discriminant analysis(LDA), diagonal linear discriminant analysis(DLDA), diagonal quadratic discriminant analysis(DQDA), K-nearest neighbor classification(KNN), classification and regression trees(CART), support vector machines(SVM). Results : The results are summarized as follows. 1. The result analyzed by using LDA has a hit rate of 81.65% in comparison with the original diagnosis. 2. The result analyzed by using DLDA has a hit rate of 63.3% in comparison with the original diagnosis. 3. The result analyzed by using DQDA has a hit rate of 65.14% in comparison with the original diagnosis. 4. The result analyzed by using KNN has a hit rate of 74.31% in comparison with the original diagnosis. 5. The result analyzed by using CART has a hit rate of 75.23% in comparison with the original diagnosis when the test of selected 13 significant questions based on analysis of variance was performed. 6. The result analyzed by using SVM has a hit rate of 87.16% in comparison with the original diagnosis. Conclusions : Statistical analysis using oriental medicine diagnosis questionnaire on knee pain generally turned out to have a significant result.

진주시 교통사고의 시계열적 공간분포특성 분석 (Analysis of Temporal and Spatial Distribution of Traffic Accidents in Jinju)

  • 성병준;배규한;유환희
    • 대한공간정보학회지
    • /
    • 제23권2호
    • /
    • pp.3-9
    • /
    • 2015
  • 도시공간에서 토지이용변화는 교통량을 유발하고 이에 따른 교통사고발생이 상호 밀접한 관계를 갖고 있으므로 토지이용변화에 따른 교통사고발생원인 분석은 교통사고저감대책 수립에 중요한 요소로 판단된다. 이에 지방 중소도시인 진주시를 대상으로 5년간(2009년~2013년)의 교통사고 데이터를 주거지역과 상업지역의 사고 발생빈도와 최근린 분석기법에 의한 군집도를 분석한 결과 다음과 같은 결론을 얻었다. 교통사고의 발생빈도는 봄에 가장 많았고 겨울이 가장 작게 발생하였다. 또한 주간과 야간의 교통사고 발생빈도는 주간이 야간에 비해 조금 더 많이 발생하였으나 교통사고발생 군집도는 야간이 주간에 비해 강하게 나타났다. 그리고 토지용도에 따른 교통사고 군집도 분석에서 상업지역은 계절에 따른 변화가 크지 않았으나 주거지역은 겨울철에 군집밀도가 크게 낮아지는 경향을 보였다. 교통사고 유형에 따른 분석 결과 차 대 차의 측면직각추돌사고가 가장 높은 발생빈도를 보였으며 상업지역과 주거지역에 모두 광범위하게 발생되는 것으로 나타났다. 이상의 결과는 도시공간구조에서 교통사고 발생패턴을 파악하는데 중요한 정보가 될 수 있으며, 향후 교통사고저감대책을 수립하는데 유용하게 활용될 것으로 예상된다.

도서 대출데이터를 활용한 남녀 노령자의 독서 주제 분석 (Analysis of Reading Domian of Men and Women Elderly Using Book Lending Data)

  • 조재인
    • 한국도서관정보학회지
    • /
    • 제50권1호
    • /
    • pp.23-41
    • /
    • 2019
  • 본 연구는 도서의 대출정보를 활용해 가중네트워크(PFNET :PathFinder Network) 분석을 수행함으로써 특수 계층으로서 남녀 노령자에 의해 자주 읽히는 도서의 주제와 특성을 이해하고 이들의 독서 양태가 일반 성인 남녀와 어떠한 차이를 보이는지 확인하였다. 이를 위해 남녀 노령자와 일반 성인 남녀로 구성된 4개 집단을 대상으로 도서관 빅데이터의 인기 대출도서를 기반으로 동시대출도서 행렬을 산출하고 이를 활용해 네트워크 분석을 수행하였다. 또한 PNNC(Parallel Nearest Neighbor Clustering) 알고리즘으로 대출도서 군집을 형성한 후 대출도서에 계산된 중심성지수를 기반으로 피어슨 상관분석(Pearson Correlation Analysis)을 수행해 집단간의 상관성을 파악하였다. 그 결과 자기계발, 재태크, 육아 등 다양한 분야의 도서를 대출하는 일반 성인 남녀에 비해 노령자 계층은 한국현대소설에 집중된 독서 활동을 하는 것으로 나타났으며, 특정 인기 저자의 저작에 집중된 도서 대출 경향을 보였다. 한편 여성 노령자가 일본소설, 영미소설을 포함해 상대적으로 다양한 분야를 대출하는 반면 남성 노령자는 극단적으로 한국대하소설에 집중하는 경향을 나타냈다. 상관분석에서도 남성 노령자는 성인 남성과 r=-0.222의 약한 음의 상관성을 보였으며, 다른 모든 집단과도 음의 방향성을 보여 대출 도서의 중심성이 반대 경향을 가지는 것으로 분석되었다.

학위논문 분석을 통한 미국 도서관학 및 정보과학 최근 연구 동향에 관한 연구 (A Study on Research Trends of Library Science and Information Science Through Analyzing Subject Headings of Doctoral Dissertations Recently Published in the U.S.)

  • 김현정
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.11-39
    • /
    • 2018
  • 본 연구는 2014년부터 2018년까지 최근 5년간 미국에서 발표된 도서관학 및 정보과학 분야 학위논문의 연구동향을 파악하기 위해 PQDT Global 데이터베이스에 수록된 1,016편의 박사학위 논문을 수집하여 각 논문의 관련 학문 분야를 나타내는 분야명들을 추출하고 네트워크 분석을 통해 분야명 간의 관계와 네트워크 전반에 걸쳐 다른 분야들과 관계가 있는 전역중심성이 높은 분야명을 파악하는 것과 동시에 군집분석을 통해 연관성 높은 분야명들이 어떠한 군집을 형성하는지, 각 군집 안에서 지역중심성이 높은 분야명들은 어떤 것들인지 살펴보았다. 103개 핵심 분야명 키워드를 이용한 네트워크 분석 결과 최근 5년간 미국의 도서관학 및 정보과학 분야 박사학위 논문의 관련 학문분야로는 컴퓨터 관련 분야, 교육 관련 분야, 커뮤니케이션 관련 분야 외에도 다양한 이용자 집단에 관한 연구와 정보시스템 관련 분야 등을 포함하여 26개의 군집을 형성하는 것으로 나타났다. 26개 군집들 중 정보과학을 중심으로 하는 군집에는 컴퓨터 관련 학문 분야명들이 다수 포함되었고, 도서관학을 중심으로 하는 군집에는 대부분 교육 관련 분야명들이 포함되었으며, 그 외에도 이용자 연구와 관련하여 특정 이용자 그룹과 관련된 젠더연구분야나 정보시스템과 관련하여 경영학, 지리학, 의공학 등 다양한 학문 분야와 연관되어 있음을 알 수 있다.

머신 러닝을 활용한 과학 논변 구성 요소 코딩 자동화 가능성 탐색 연구 (Exploratory Research on Automating the Analysis of Scientific Argumentation Using Machine Learning)

  • 이경건;하희수;홍훈기;김희백
    • 한국과학교육학회지
    • /
    • 제38권2호
    • /
    • pp.219-234
    • /
    • 2018
  • 본 연구에서는 국내 교육학 연구에서 거의 사용되지 않던 머신 러닝 기술을 과학 교육 연구에 접목하여, 학생들의 과학 논변 활동에서 나타나는 논변의 구성 요소를 분석하는 과정을 자동화할 수 있는 가능성을 탐색해보았다. 학습 데이터로는 Toulmin이 제안하였던 틀에 따라 학생들의 과학 논변 구성 요소를 코딩한 국내 선행 문헌 18건을 수합하고 정리하여 990개의 문장을 추출하였으며, 테스트 데이터로는 실제 교실 환경에서 발화된 과학 논변 전사 데이터를 사용하여 483개의 문장을 추출하고 연구자들이 사전 코딩을 수행하였다. Python의 'KoNLPy' 패키지와 '꼬꼬마(Kkma)' 모듈을 사용한 한국어 자연어 처리(Natural Language Processing, NLP)를 통해 개별 논변을 구성하는 단어와 형태소를 분석하였으며, 연구자 2인과 국어교육 석사학위 소지자 1인의 검토 과정을 거쳤다. 총 1,473개의 문장에 대한 논변-형태소:품사 행렬을 만든 후에 다섯 가지 방법으로 머신 러닝을 수행하고 생성된 예측 모델과 연구자의 사전 코딩을 비교한 결과, 개별 문장의 형태소만을 고려하였을 때에는 k-최근접 이웃 알고리즘(KNN)이 약 54%의 일치도(${\kappa}=0.22$)를 보임으로써 가장 우수하였다. 직전 문장이 어떻게 코딩되어 있는지에 관한 정보가 주어졌을 때, k-최근접 이웃 알고리즘(KNN)이 약 55%의 일치도(${\kappa}=0.24$)를 보였으며 다른 머신 러닝 기법에서도 전반적으로 일치도가 상승하였다. 더 나아가, 본 연구의 결과는 과학 논변 활동의 분석에서 개별문장을 고려하는 단순한 방법이 어느 정도 유용함과 동시에, 담화의 맥락을 고려하는 것 또한 필요함을 데이터에 기반하여 보여주었다. 또한 머신 러닝을 통해 교실에서 한국어로 이루어진 과학 논변 활동을 분석하여 연구자와 교사들에게 유용하게 사용될 수 있는 가능성을 보여준다.

수출인프라강화사업이 식품유통기업 수출에 미치는 정책효과 분석 (An Analysis of Policy Effects of Export Infrastructure Strengthening Program on Export of Food Distribution Companies)

  • 황성혁;지성태
    • 유통과학연구
    • /
    • 제16권1호
    • /
    • pp.87-99
    • /
    • 2018
  • Purpose - The Export Infrastructure Strengthening Program(EISP) is a project to expand exports of agri-food products through providing customized export information to food distribution companies and supporting overseas information activities. A total of 39.6 billion won was provided by 2016. So, the purpose of this study is to analyze whether EISP is effective for expanding exports of agri-food products. Research design, data, and methodology - A simple average difference between the export performance of the policy beneficiaries and the non-policy beneficiaries can be biased if the export capacity or inherent characteristics of the enterprise are not taken into consideration. In order to solve the problem of such a bias, the propensity score matching(PSM) method has been employed in this study. PSM is a method of converting the characteristics of an export company into an index through logit analysis and then reducing the matching to one dimension to improve the accuracy of the performance measurement. Results - The balancing test was conducted to determine how the characteristics of the policy beneficiary group and the matched policy non-beneficiary group corresponded to each other. As a result of the test, we could not reject the null hypothesis that there was no difference between the two groups, so that after the matching, the two groups were similar and the explanatory variables were well controlled. Using the nearest neighbor matching with propensity score estimating through logit analysis, we estimated average treatment effect on the treated(ATT). The food companies participating the EISP had the effect of increasing the exports of $ 5.88 million. As a result, the number of export contracts increased by 11.77, the number of exporting countries by 7.52, the number of export items by 47.51, and the number of buyers' consultation by 3.50. And overseas marketing expenses increased by 35.92 million won. Except for the number of export contracts, other export performance results showed statistically significant results. Conclusions - As the EISP has a positive effect on the expansion of agro-food exports, efforts should be made to find out the limitations or problems of the policy in the future and to make a greater contribution to the increase of exports.

투사에 기초한 얼굴 인식 알고리즘들의 통계적 분석 (Statistical Analysis of Projection-Based Face Recognition Algorithms)

  • 문현준;백순화;전병민
    • 한국통신학회논문지
    • /
    • 제25권5A호
    • /
    • pp.717-725
    • /
    • 2000
  • 최근 수년간 얼굴인식에 관한 많은 알고리즘이 개발되었고 그 대다수가 view와 투사에 기초한 알고리즘이었다. 본 논문에서의 투사는 비단 직교 기저상에 영상을 투사하는 것으로 국한하지 않고 영상 화소값을 변환하는 일반적인 선형 변환으로써 상관관계, 주성분 분석, 클러스트링, gray scale 투사, 그리고 추적 필터매칭을 포함한다. 본 연구에서는 FERET 데이터베이스 상의 얼굴 영상을 평가한 알고리즘들을 세부적으로 분석하고자 한다. 투사에 기초한 알고리즘은 3단계로 구성된다. 첫 번째 단계는 off-line상에서 행하며 알고리즘 설계자에 의해 새로운 기저가 설정되거나 또는 학습을 통해 새로운 기저를 결정한다. 두 번째 단계는 on-line상에서 행해지며 영상을 설정된 새로운 기저상에 투사한다. 세 번째 단계는 on-line상에서 행해지며 영상내의 얼굴은 가장 인접한 이웃 분류자로 인식된다. 대부분의 평가 방법들은 단일 gallery 상에서의 성능 평가가 이루어짐으로써 알고리즘 성능을 충분히 측정하지 못하는 반면 본 연구에서는 독립된 galley들의 집합을 구성함으로써 각각의 다른 galley상에서 가지는 변화와 이들의 상대적 성능을 평가한\ulcorner.

  • PDF

Comparison of Inflammatory Markers Changes in Patients Who Used Postoperative Prophylactic Antibiotics within 24 Hours after Spine Surgery and 5 Days after Spine Surgery

  • Youn, Gun;Choi, Man Kyu;Kim, Sung Bum
    • Journal of Korean Neurosurgical Society
    • /
    • 제65권6호
    • /
    • pp.834-840
    • /
    • 2022
  • Objective : C-reactive protein (CRP) level, erythrocyte sedimentation rate (ESR), and white blood cell (WBC) count are inflammatory markers used to evaluate postoperative infections. Although these markers are non-specific, understanding their normal kinetics after surgery may be helpful in the early detection of postoperative infections. To compliment the recent trend of reducing the duration of antibiotic use, this retrospective study investigated the inflammatory markers of patients who had received antibiotics within 24 hours after surgery according to the Health Insurance Review & Assessment Service guidelines and compared them with those of patients who had received antibiotics for 5 days, which was proven to be non-infectious. Methods : We enrolled 74 patients, divided into two groups. Patients underwent posterior lumbar interbody fusion (PLIF) at a single institution between 2019 and 2020. Group A included 37 patients who received antibiotics within 24 hours after the PLIF procedure, and group B comprised 37 patients who had used antibiotics for 5 days. A 1 : 1 nearest-neighbor propensity-matched analysis was used. The clinical variables included age, sex, medical history, body mass index, estimated blood loss, and operation time. Laboratory data included CRP, ESR, and WBC, which were measured preoperatively and on postoperative days (POD) 1, 3, 5, and 7. Results : CRP dynamics tended to decrease after peaking on POD 3, with a similar trend in both groups. The average CRP level in group B was slightly higher than that in group A; however, the difference was not statistically significant. Multiple linear regression analysis revealed operation time, number of fused levels, and estimated blood loss as significant predictors of a greater CRP peak value (r2=0.473, p<0.001) in patients. No trend (a tendency to decrease from the peak value) could be determined for ESR and WBC count on POD 7. Conclusion : Although slight differences were observed in numerical values and kinetics, sequential changes in inflammatory markers according to the duration of antibiotic administration showed similar patterns. Knowledge of CRP kinetics allows the assessment of the degree of difference between the clinical and expected values.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

데이터 접근 패턴 은닉을 지원하는 암호화 인덱스 기반 kNN 질의처리 알고리즘 (kNN Query Processing Algorithm based on the Encrypted Index for Hiding Data Access Patterns)

  • 김형일;김형진;신영성;장재우
    • 정보과학회 논문지
    • /
    • 제43권12호
    • /
    • pp.1437-1457
    • /
    • 2016
  • 데이터베이스 아웃소싱 환경에서, 클라우드는 인증된 사용자에게 아웃소싱된 데이터베이스를 기반으로 질의 서비스를 제공한다. 그러나 금융, 의료 정보와 같은 민감한 데이터는 클라우드에 아웃소싱 되기 전에 암호화되어야 한다. 한편, kNN 질의는 다양한 분야에서 폭넓게 사용되는 대표적인 질의 타입이며, kNN 질의 결과는 사용자의 관심사 및 선호도와 밀접하게 연관된다. 따라서 데이터 보호와 질의 보호를 동시에 고려하는 kNN 질의 처리 알고리즘에 대한 연구가 진행되어 왔다. 그러나 기존 연구는 높은 연산 비용이 요구되거나, 탐색한 인덱스의 노드 및 반환된 질의 결과가 드러나기 때문에 데이터 접근 패턴이 노출되는 문제점이 존재한다. 이러한 문제를 해결하기 위해 본 논문에서는 암호화 데이터베이스 상에서의 kNN 질의처리 알고리즘을 제안한다. 제안하는 알고리즘은 데이터 보호 및 질의 보호를 지원한다. 또한, 제안하는 알고리즘은 데이터 접근 패턴을 보호하는 동시에 효율적인 질의처리를 지원한다. 이를 위해, 데이터 접근 패턴 노출 없이 데이터 필터링을 지원하는 암호화 인덱스 탐색 기법을 제안한다. 성능 분석을 통해, 제안하는 알고리즘이 기존 기법에 비해 질의처리 시간 측면에서 우수한 성능을 보임을 검증한다.