• 제목/요약/키워드: Rating Prediction

검색결과 198건 처리시간 0.029초

청소년정서행동발달검사 표준화 연구 자료를 활용한 교사의 학교폭력 피해자 인지도 (Teachers' Recognition of Victims of School Bullying Using Data from the Adolescents' Mental Health and Problem Behavior Screening Questionnaire-II Standardization Study in Korea)

  • 황준원;방수영;유한익;김지훈;김봉석;안동현;서동수;조수철;반건호;이영식
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제23권2호
    • /
    • pp.69-75
    • /
    • 2012
  • Objectives : The current study was conducted in order to investigate teachers' recognition of school bullying using a nationwide database of adolescents in middle and high school in Korea. Methods : Students in the 7th to 12th grades at 23 secondary schools participated in the current study during the fall of 2009. Subjects completed the self-report form of the Adolescent Mental Health and Problem Behavior Screening Questionnaire-II (AMPQ-II) and Symptom Checklist-90 Revised (SCL-90-R). In addition, relevant teachers used the teachers' rating scale of the AMPQ-II to report their students' status. Differences in the number of bullied students between teachers' recognition and students' report were explored. Results : A total of 2270 subjects provided relevant responses to the questionnaire. While the one-month prevalence of victimization according to students' self-reports was 28.9%, the recognized prevalence by teachers was only 10.6%. For prediction of the presence of school bullying according to students' self reports on the AMPQ-II, item 7 of the teachers' report on the AMPQ-II showed a sensitivity of 16%, a specificity of 92%, a positive predictability of 44%, a negative predictability of 72%, a false positive rate of 8%, a false negative rate of 84%, and an accuracy of 69%, respectively. No significant differences in subscores of students' self reports of the AMPQ-II and SCL-90-R were observed between bullied students who were recognized by teachers and those who were not recognized. In stepwise discriminant analysis, classification of teachers' item 2 and item 7 on the AMPQ-II with respect to school bullying according to students' reports showed an accuracy of 63.4%. Using this model, 75.2% of non-victimized subjects were classified correctly, while only 35.2% of victimized subjects were classified correctly. Conclusion : Despite the high prevalence in Korea, teachers' recognition of school violence among their students remains low. Pre-professional and continuing education to improve teachers' understanding of school bullying and knowledge of effective classroom-based prevention activities should be encouraged.

공간 데이터의 분포를 고려한 공간 엔트로피 기반의 의사결정 트리 기법 (A Spatial Entropy based Decision Tree Method Considering Distribution of Spatial Data)

  • 장윤경;유병섭;이동욱;조숙경;배해영
    • 정보처리학회논문지B
    • /
    • 제13B권7호
    • /
    • pp.643-652
    • /
    • 2006
  • 의사결정 트리는 데이터 마이닝의 분류와 예측 작업에 주로 사용되는 기법 중의 하나이다. 실생활에서 공간의사결정을 위한 분류를 수행할 때에는 인접 데이터의 위치와 분산도를 고려하는 것이 매우 중요하다. 기존의 공간 의사결정 트리는 데이터의 공간적 특성을 표현하기 위해 각 객체간의 유클리디안 거리비율을 엔트로피로 반영하여 트리 구축 시 이용하였다. 그러나 이것은 공간 객체간의 거리 비율만을 설명할 뿐 공간 차원에서의 데이터 분산 정도와 각 분류된 클래스간의 연관관계 등은 파악할 수 없다는 한계점이 있었다 본 논문에서는 분산도와 차별도 기반의 공간 엔트로피를 이용하여 공간 데이터의 분포도를 반영하는 공간 의사결정 트리를 제안한다 분산도는 분류된 클래스 내의 공간 객체 분포도를 나타내고 차별도는 다른 클래스 내 공간 객체와의 분포도 및 관계성을 나타낸다. 이러한 분산도와 차별도의 비율을 엔트로피 계산 시 이용함으로써 비공간적 속성으로 분류된 각 클래스가 공간적으로는 얼마나 뚜렷하게 분류되는지 알 수 있게 한다. 제안 기법은 정확성과 계산 비용에 있어서 기존 기법보다 각각 약 18%, 11%의 성능 향상을 보였다.

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상 (Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood)

  • 정경용;김진수;김태용;이정현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.287-296
    • /
    • 2003
  • 추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

암반변형계수의 현장시험을 통한 경험적 추정식의 적정성 평가 (An Evaluation of Empirical Prediction Equation for Deformation Modulus of Rock Masses by Field Measurements)

  • 천병식;이용재;안경철;신재근;정상훈
    • 터널과지하공간
    • /
    • 제16권3호
    • /
    • pp.251-258
    • /
    • 2006
  • 본 연구에서는 공내재하시험으로 측정된 변형계수를 이용하여 RMR을 이용한 변형계수 추정 방법에 대한 국내 암반에서의 적용성을 평가하고, 암반의 변형계수에 영향을 미치는 여러 변수들과 변형계수와의 상관성 분석을 실시하였다. RMR을 이용하여 변형계수 예측을 위해 제안된 기존의 제안식은 변형계수를 과대 예측하고 있었으며, 암종별로도 추정값과 측정값이 상관성의 차이가 컸다. 암반 특성치로서 일축압축강도, RQD, 절리 상태, 절리 간격, 지하수 상태, 측정 심도를 주요 변수로 하여 암반의 변형계수에 미치는 영향에 대한 개개의 상관성 분석을 수행한 결과, RQD가 가장 높은 상관성을 보여 예비설계 단계에서 RQD만으로도 암반의 상태 및 변형계수를 추정할 수 있을 것으로 판단되었고 절리 간격과 절리 상태 의 경우 또한 암반 변형계수와의 상관성이 비교적 높은 것으로 예상되었으며, 일축압축강도는 변형계수와 밀접한 관계가 있음에도 불구하고 RMR값에 미치는 영향이 적기 때문에 상관성이 낮았다. 따라서 상관성을 높이기 위해서는 일축압축강도의 배점에 신경을 써야하고 일축압축강도 측정시 주의가 필요하다고 판단된다. 또한 지하수의 경우 점수 배점으로 평가되므로 시추자료로 변형계수를 평가하는데 한계가 있을 것으로 사료되어 평가에서 제외시키는 것이 합리적일 것으로 판단된다. 또한 앞으로 변형계수 및 암반 특성에 관한 자료 확보 및 연구를 통해 암반의 풍화도, 암반의 간극률, 절리 특성 등에 관한 보다 복합적인 결과 도출을 위하여 다변량 중회귀분석 등과 같은 다양한 접근을 통한 연구가 필요할 것으로 판단된다.

AdaBoost 알고리즘기반 SVM을 이용한 부실 확률분포 기반의 기업신용평가 (Corporate Credit Rating based on Bankruptcy Probability Using AdaBoost Algorithm-based Support Vector Machine)

  • 신택수;홍태호
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.25-41
    • /
    • 2011
  • 최근 몇 년간 SVM(support vector machines)기법은 패턴인식 또는 분류의사결정문제를 위한 분석기법으로서 기존의 데이터마이닝 기법과 비교할 때, 매우 높은 성과를 갖는 것으로 인식되어 왔다. 더 나아나 많은 연구자들은 SVM기법이 1980년대 이후 대표적인 예측 및 분류모형으로 인정받은 인공신경망기법(ANNs : Artificial Neural Networks)에 비해 더 성과가 좋다는 사실을 실증적으로 입증해 왔다(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al., 2005; Kim, 2003). 일반적으로 이와 같이 다양한 데이터마이닝 기법에 의해 분석되는 이진분류 또는 다분류 의사결정문제들은 특히 금융분야 등에 있어서 오분류비용에 민감하며, 이로 인한 오분류의 경제적 손실도 상대적으로 매우 크다고 할 수 있다. 따라서 기업부도예측모형과 같은 이진분류모형의 결과값을, 부도확률에 기초하여 정교하게 계산된 사후확률의 개념으로서 다분류의 신용등급평가의 문제로 변환할 필요가 있다. 그러나, SVM 모형의 결과값은 기본적으로 그와 같은 부도확률분포를 보여주지 않는다. 따라서, 그러한 확률분포를 정교하게 보여줄 방법을 제시할 필요가 있다(Platt, 1999; Drish, 2001). 본 연구는 AdaBoost 알고리즘기반의 SVM 모형을 이용하여, 이진분류모형으로서 IT 기업의 부실예측모형에 적용한 후, 이 SVM 모형의 예측결과를 SVM의 손실함수에 적용하여 계산된 값을 사후부도확률의 정규분포 특성에 따라 이를 구간화하여 IT기업에 대한 다분류 신용등급 평가의 문제로 전환시키는 방법을 제시하였다. 그리고 본 연구에서 제안하는 방법은 이러한 AdaBoost 알고리즘기반 SVM 모형이 각 기업이 고유한 신용위험(부도확률)을 갖고 있다는 조건하에서, 신용등급부여를 위한 부도확률분포 구간을 정교하게 조정함으로써 오분류 문제를 좀 더 줄일 수 있음을 제시하였다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

웹기반 지능형 기술가치평가 시스템에 관한 연구 (A Study on Web-based Technology Valuation System)

  • 성태응;전승표;김상국;박현우
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.23-46
    • /
    • 2017
  • 2000년대 이전부터 북미 유럽의 선진국을 중심으로 특정 기업이나 사업(프로젝트)에 관한 가치를 평가하는 사례는 있어 왔으나, 개별 기술(특허)의 경제적 가치를 산정하는 체계나 방법론은 국내를 중심으로 최근 들어 활성화되어 왔다. 이러한 기술가치평가 분야는 기술이전(거래), 현물출자, 사업타당성 분석, 투자유치, 세무/소송 등의 다양한 용도로 활용되고 있다. 물론 기술보증기금의 KTRS, 발명진흥회의 SMART 3.1과 같이, 평가대상기술에 대한 기술력(등급) 평가 혹은 특허등급평가를 정성적으로 수행하는 온라인 시스템은 존재해 왔으나, 대상기술의 정량적인 가치금액까지 산출해 주는 웹기반 지능형 기술가치평가 시스템은 한국과학기술정보연구원(KISTI)에 의해 유일하게 개발 및 공식 오픈되어 확산 활용되고 있다. 본 고에서는 KISTI에서 개발 운영중인 웹기반 'STAR-Value' 시스템을 중심으로, 탑재된 방법론 및 평가모델의 유형, 이를 지원하는 참조정보 및 데이터베이스(D/B)가 어떻게 연계 활용되는지를 소개한다. 특히 미래에 발생할 경제적 수익을 추정하여 현재가치화하는 소득접근법 기반의 대표 모델인 현금흐름할인(DCF) 모델과 특정 로열티율을 기반으로 로열티수입료의 현재가치를 기술료 대가로 산정하는 로열티절감모델을 포함한 6개 모델, 그리고 관련 지원정보(기술수명, 기업(업종)재무정보, 할인율, 산업기술요소 등)의 데이터 기반 연계 방식에 대해 살펴본다. STAR-Value 시스템은 평가대상기술에 대한 국제특허분류(IPC) 혹은 한국표준산업분류(KSIC) 등의 분류 정보로부터 기술순환주기(TCT) 지수, 유사업종(혹은 유사기업)의 매출액 성장률 및 수익성 데이터, 업종별 가중평균자본비용(WACC) 및 산업기술요소 지수 등 메타데이터값을 자동적으로 불러오고 여기에 조정요인을 반영하여 기술가치의 산출결과가 높은 신뢰성 및 객관성을 가지도록 한다. 나아가 대상기술의 잠재적 시장규모와 해당 사업화주체의 시장점유율에 대한 정보까지 보유 재무데이터 기반으로 참조값을 제시하거나 기존에 완료된 평가사례 축적 기반으로 업종별 유사 기술의 가치범위값을 제시해 준다면, 본 시스템이 보다 지능형으로 지원 모듈을 연계 활용하고 실시간으로 손쉽게 고(高)정확도의 기술가치범위를 제시해 줄 수 있을 것으로 기대된다. 본 고에서는 웹기반 STAR-Value 시스템이 참조데이터 기반으로 지능형 연계를 수행하도록 해주는 모형선택 가이드라인 지원기능, 기술가치범위 추론 지원기능, 유사기업 선정 기반의 시장점유율 산정 지원기능의 내부 로직 구성을 설명한다. 상기 지원기능을 통해 비전문가(또는 초보자) 수준에서 최적의 평가모형 선택, 기술가치 범위 추론, 유사기업 선택 및 시장점유율 산정에 대한 정보지원이 데이터 사이언스 및 기계학습 기반으로 수행될 수 있다. 본 연구는 기술가치평가 분야의 이론적 타당성을 평가실무에서 활용할 수 있는 평가모델 및 지원정보를 실제 탑재한 웹기반 시스템의 소개에 의미가 있으며, 추가적으로 보다 객관적이고 손쉬운 지능형 지원시스템의 활용성을 높임으로써, 앞으로 기술사업화의 제 분야에서 다양하게 활용할 수 있을 것으로 기대된다.

기업정보 기반 지능형 밸류체인 네트워크 시스템에 관한 연구 (A Study on Intelligent Value Chain Network System based on Firms' Information)

  • 성태응;김강회;문영수;이호신
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.67-88
    • /
    • 2018
  • 최근까지도 중소기업의 지속성장 및 경쟁력 확보에 대한 중요함을 인식함에 따라, 정부 차원에서의 유형 자원(R&D 인력, 자금 등)에 대한 지원이 주로 투입되어 왔다. 그러나 사업지원의 적절성이나 효과성, 효율성 면에서 서로 상충되는 정책부분이 존재하여 과소 지원이나 중복 지원 등 지원체계의 비효율성 문제가 제기되어온 것도 사실이다. 정부나 기업 관점에서는 중소기업의 한정된 자원으로 인해, 외부와의 협력을 통한 기술개발 및 역량강화가 기업의 경쟁우위를 창출하는 근간이라 보고 있으며, 이를 위한 가치창출 활동을 강조하고 있다. 기업 레벨에서의 지식생태계 구축을 통해 일련의 가치사슬로부터 기업거래 관계를 분석하고 결과를 가시화할 수 있는 밸류체인 네트워크 분석이 필요한 것도 이 때문이다. 특허/제품/기업명 검색을 통해 관련 제품의 정보나 특허 보유 기업의 기술(제품) 현황 정보를 제공하는 기술기회발굴시스템(Technology Opportunity Discovery system), 기업(재무)정보와 신용정보을 열람하게 해주는 CRETOP이나 KISLINE 등은 존재하고 있으나 밸류체인 네트워크 분석기반으로 유사(경쟁)기업의 리스트나 향후 거래 가능한 잠재 거래처 정보를 제공해주는 시스템은 부재한 실정이다. 따라서, 본 고에서는 KISTI에서 개발 운영중인 기업 비즈니스 전략수립 지원 파트너인 '밸류체인 네트워크 시스템(Value Chain Network System : VCNS)'을 중심으로, 탑재된 네트워크 기반 분석모듈의 유형, 이를 지원하는 참조정보 및 데이터베이스(D/B)의 구성 로직과 시스템 활용방안을 고찰하며, 산업구조를 이해하고 기업의 신제품 개발을 위한 핵심정보가 되고 있는 지능형 밸류체인 분석 시스템의 네트워크 가시화 기능을 살펴보기로 한다. 한 기업이 다른 기업 대비 경쟁우위를 확보하기 위해서는 보유 특허 또는 현재 생산하고 있는 제품에 대한 경쟁자 식별이 필요하며, 세부 업종별 유사(경쟁)기업을 탐색하는 일은 대상기업의 사업화 경쟁력 확보에 핵심이 된다. 또한 기업간 비즈니스 활동인 거래정보는 유사 분야로 진출할 경우 잠재 거래처 정보를 제공하는 중요한 역할을 수행한다. 이러한 기업간 판매정보를 기반으로 구축된 네트워크 맵을 활용하여 기업 또는 업종 수준의 경쟁자를 식별하는 일은 밸류체인 분석의 핵심모듈로 탑재될 수 있다. 밸류체인 네트워크 시스템(VCNS)은 단순 수집된 종래의 기업정보에 밸류체인(value chain) 및 산업구조 분석개념을 접목하여 개별 기업의 시장경쟁 상황은 물론 특정 산업의 가치사슬 관계를 파악할 수 있다. 특히 업종구조 파악, 경쟁사 동향 파악, 경쟁사 분석, 판매처 및 구매처 발굴, 품목별 산업동향, 유망 품목 발굴, 신규 진입기업 발굴, VC별 핵심기업 및 품목 도출, 해당 기업별 보유 특허 파악 등 기업 레벨에서의 유용한 정보분석 툴로 활용 가능하다. 또한, 거래처 정보 및 재무데이터로부터 분석된 결과의 객관성 및 신뢰성을 기반으로, 현재 국내에서 이용 중인 15,000여개 회원기업과 연구개발서비스업 종사자, 출연(연) 및 공공기관 등에서 사업평가 정보지원, R&D 의사결정 지원 및 중 단기 수요예측 전망 등 다양한 목적(용도)에 밸류체인 네트워크 시스템을 활용할 수 있을 것으로 기대된다. 기업의 사업경쟁력 강화를 위해 정부기관 및 민간 연구개발서비스 기업을 중심으로 기술(특허) 및 시장정보가 제공되어 왔으며, 이는 특허분석(등급, 계량분석 위주) 또는 시장분석(시장보고서 기반 시장규모 및 수요예측 위주)의 형태로 지원되어 왔다. 그러나 기업이 사업화진출 단계에서 겪게 되는 애로요인의 하나인 정보부족을 해결하는데 한계가 있었으며, 특히 경쟁기업 및 거래가능 기업 후보군에 대한 탐색정보는 입수하기 어려웠다. 본 연구를 통해 제안된 네트워크맵 및 보유 데이터 기반의 실시간 밸류체인 가시화 서비스모듈이 중견 중소기업이 당면한 신규시장 진출시 경쟁기업 대비 예상점유율, (예상)매출액 수준, 어느 기업을 컨택하여 유통망(원자재/부품에 대한 공급처, 완제품/모듈에 대한 수요처)을 확보할 지에 대한 핵심정보를 제공할 수 있을 것으로 기대된다. 향후 연구에서는 대체기업(또는 대체품목) 경쟁지표의 개발과 연구주체의 참여를 통한 경쟁요인별 지표의 고도화 연구, VCNS의 성능향상을 위한 데이터마이닝 기술 및 알고리즘을 추가 반영하도록 수행하고자 한다.