• 제목/요약/키워드: Binary-tree

검색결과 297건 처리시간 0.021초

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

가계 재무건전성이 주택투자수요에 미치는 영향에 관한 연구 (A Study on the Financial Strength of Households on House Investment Demand)

  • 노상윤;윤보현;최영민
    • 유통과학연구
    • /
    • 제12권4호
    • /
    • pp.31-39
    • /
    • 2014
  • Purpose - This study investigates the following two issues. First, we attempt to find the important determinants of housing investment and to identify their significance rank using survey panel data. Recently, the expansion of global uncertainty in the real estate market has directly and indirectly influenced the Korean housing market; households demonstrate a sensitive reaction to changes in that market. Therefore, this study aims to draw conclusions from understanding how the impact of financial strength of the household is related to house investment. Second, we attempt to verify the effectiveness of diverse indices of financial strength such as DTI, LTV, and PIR as measures to monitor the housing market. In the continuous housing market recession after the global crisis, the government places top priority on residence stability. However, the government still imposes forceful restraints on indices of financial strength. We believe this study verifies the utility of these regulations when used in the housing market. Research design, data, and methodology - The data source for this study is the "National Survey of Tax and Benefit" from 2007 (1st) to 2011 (5th) by the Korea Institute of Public Finance. Based on this survey data, we use panel data of 3,838 households that have been surveyed continuously for 5 years. We sort the base variables according to relevance of house investment criteria using the decision tree model (DTM), which is the standard decision-making model for data-mining techniques. The DTM method is known as a powerful methodology to identify contributory variables for predictive power. In addition, we analyze how important explanatory variables and the financial strength index of households affect housing investment with the binary logistic multi-regressive model. Based on the analyses, we conclude that the financial strength index has a significant role in house investment demand. Results - The results of this research are as follows: 1) The determinants of housing investment are age, consumption expenditures, income, total assets, rent deposit, housing price, habits satisfaction, housing scale, number of household members, and debt related to housing. 2) The impact power of these determinants has changed more or less annually due to economic situations and housing market conditions. The level of consumption expenditure and income are the main determinants before 2009; however, the determinants of housing investment changed to indices of the financial strength of households, i.e., DTI, LTV, and PIR, after 2009. 3) Most of all, since 2009, housing loans has been a more important variable than the level of consumption in making housing market decisions. Conclusions - The results of this research show that sound financing of households has a stronger effect on housing investment than reduced consumption expenditures. At the same time, the key indices that must be monitored by the government under economic emergency conditions differ from those requiring monitoring under normal market conditions; therefore, political indices to encourage and promote the housing market must be divided based on market conditions.

RFID 데이터 스트림에서 이동궤적 패턴의 탐사 (Mining Frequent Trajectory Patterns in RFID Data Streams)

  • 서성보;이용미;이준욱;남광우;류근호;박진수
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.127-136
    • /
    • 2009
  • 이 논문은 RFID 데이터 스트림의 변화 특성을 고려하면서 단일 패스로 이동궤적 패턴을 실시간 추출하는 새로운 기법을 제안한다. RFID, 센서와 무선 네트워크 기술의 발달로 인해 현실 세계에서 실시간으로 데이터를 수집하고 유용한 패턴을 탐사하는 연구에 많은 관심이 집중되고 있다. 스트림 데이터에서 순차 패턴 또는 이동궤적 패턴을 탐사하는 기존의 연구 기법들은 반복적으로 데이터베이스 또는 트리를 탐색하는 고비용 문제점과 시간의 변화에 따르는 동적 특성을 실시간으로 패턴에 반영하지 못하는 단점이 있다. 제안하는 기법은 시간에 따라 RFID 데이터 스트림의 변화를 정확히 반영하기 위해 시간진화 그래프를 이용하여 이진 시간관계 테이블에 빈발한 2-길이 항목간 정보를 유지한다. 또한 다중 패스의 문제점을 해결하기 위해 t 시점에 이진 시간관계 테이블을 이용하여 k-길이의 후보 이동궤적 패턴을 추론하고, t+1 시점에서 후보 패턴을 검증하는 과정을 통해 k-길이 이동궤적 패턴을 단일 패스로 추출한다. 실험결과 제안하는 기법은 기존의 Apriori-계열 기법들과 비교하여 약 7% 정도 후보 패턴의 비율이 적게 생성되어 시간 및 공간 복잡도 측면에서 우수한 성능을 보였다.

  • PDF

k 사다리꼴 셋의 영역 중심 비교 알고리즘 (A Region-based Comparison Algorithm of k sets of Trapezoids)

  • 정해재
    • 정보처리학회논문지A
    • /
    • 제10A권6호
    • /
    • pp.665-670
    • /
    • 2003
  • 반도체 생산을 위한 마스크 자동 생성과 같은 기하 객체를 다루는 응용에서는, 사다리꼴로 분할된 수 많은 다각형으로 구성된 도면에 새로운 다각형을 추가하거나 삭제하기 위해 사다리꼴 삽입, 삭제, 및 검색 연산을 한다. 동일한 다각형에 대해 분할된 사다리꼴은 사용된 분할 알고리즘에 따라 모양, 크기 등에 있어서 다르게 된다. 사다리꼴로 구성된 기하 객체를 다루는 프로그램을 검증하는 것과 같은 예에서는 구성된 도면의 관심 부분을 나타내는 여러 사다리꼴 셋을 비교하는 알고리즘이 필요하다 본 논문에서는 k개 도면의 관심 영역으로부터 각각 추출된 사다리꼴로 구성된 k 셋이 주어졌을 때, 그 k 셋이 형성하는 기하 도형틀이 동일한지 아닌지를 비교하는 새로운 알고리즘을 제시한다. 제시된 알고리즘은 각 셋이 공히 n개의 사다리꼴을 포함하고 있다고 가정할 때, O(2$^{k-2}$ $n^2$(log n+k))시간 복잡도를 가진다. 제시된 알고리즘은 입력셋의 수 k(<$n^2$ log n)를 가지며, 특히 k 셋이 동일하거나 대부분 동일한 사다리꼴들로 구성되어 있을 경우 훑기 중심 알고리즘보다 kn배까지 빠른 것은 나타났다.다.

Field Performance and Morphological Characterization of Transgenic Codonopsis lanceolata Expressing $\gamma-TMT$ Gene.

  • Ghimire, Bimal Kumar;Li, Cheng Hao;Kil, Hyun-Young;Kim, Na-Young;Lim, Jung-Dae;Kim, Jae-Kwang;Kim, Myong-Jo;Chung, Ill-Min;Lee, Sun-Joo;Eom, Seok-Hyun;Cho, Dong-Ha;Yu, Chang-Yeon
    • 한국약용작물학회지
    • /
    • 제15권5호
    • /
    • pp.339-345
    • /
    • 2007
  • Field performance and morphological characterization was conducted on seven transgenic lines of Codonopsis lanceolata expressing ${\gamma}-TMT$ gene. The shoots were obtained from leaf explants after co-cultivation with Agrobacterium tume-faciens strain LBA 4404 harboring a binary vector pYBI 121 that carried genes encoding ${\gamma}-Tocopherol$ methyltransferase gene (${\gamma}-TMT$) and a neomycin phosphotransferase II gene (npt II) for kanamycin resistance. The transgenic plants were transferred to a green house for acclimation. Integration of T-DNA into the $T_0\;and\;T_1$ generation of transgenic Codonopsis lanceolata genome was confirmed by the polymerase chain reaction and southern blot analysis. The progenies of transgenic plants showed phenotypic differences within the different lines and with relative to control plants. When grown in field, the transgenic plants in general exhibited increased fertility, significant improvement in the shoot weight, root weight, shoot height and rachis length with relation to the control plants. However, all seven independently derived transgenic lines produced normal flower with respect to its shape, size, color and seeds number at its maturity. Indicating that the addition of a selectable marker gene in the plant genome does not effect on seed germination and agronomic performance of transgenic Codonopsis lanceolata. $T_1$ progenies of these plants were obtained and evaluated together with control plant in a field experiment. Overall, the agronomic performance of $T_1$ progenies of transgenic Codonopsis lanceolata showed superior to that of the seed derived non-transgenic plant. In this study, we report on the morphological variation and agronomic performance of transgenic Codonopsis lanceolata developed by Agrobacterium transformation.

점진적 실행을 통한 소프트웨어의 구조 그래프 생성 (Constructing Software Structure Graph through Progressive Execution)

  • 이혜련;신승훈;최경희;정기현;박승규
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권7호
    • /
    • pp.111-123
    • /
    • 2013
  • 소프트웨어의 취약성을 검증하기 위하여 소프트웨어의 구조를 유추하여 유추된 구조를 활용하여 테스트하는 방법이 주목받고 있다. 이와 같은 방법을 사용하기 위해서 효과적인 소프트웨어의 구조 유추 방법이 요구된다. 많이 사용되는 DFG(Data Flow Graph), CFG(Control Flow Graph) 이나 CFA(Control Flow Automata)와 같은 그래프나 트리 방식은 소프트웨어 모델을 구조적으로 표현하지 못하는 단점을 가진다. 본 논문에서는 이러한 단점을 극복할 수 있는 방법을 제시한다. 제시된 방법은 바이너리 코드에 다양한 입력데이터 들을 부여하여 입력데이터별 CFG를 생성하고, 생성된 CFG들이 구조적으로 표현될 수 있도록 계층적 제어 흐름 그래프(Hierarchical Control Flow Graph, HCFG)를 작성한다. 또한 제안하는 HCFG을 생성하는데 요구되는 그래프의 구성요소와 점진적 그래프 생성 알고리듬도 제시한다. 제안한 방법론을 공개된 SMTP(Simple Mail Transfer Protocol) 서버 프로그램에 적용시켜 소프트웨어의 모델을 작성하는 실험을 수행하고, 생성된 모델과 실제 소프트웨어 구조를 비교 분석한다.

스트링 매칭과 해시 검색을 이용한 겹쳐진 이차원 물체의 인식 (The Recognition of Occluded 2-D Objects Using the String Matching and Hash Retrieval Algorithm)

  • 김관동;이지용;이병곤;안재형
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1923-1932
    • /
    • 1998
  • 본 논문은 아이콘 인덱싱 메커니즘(Icon indexing Mechanism)을 이용한 물체 인식 시스템을 구성함에 있어 기존의 모델을 계층적으로 찾아가는 탐색 트리의 방법을 보완하여 해시 테이블을 작성함으로써 모델의 검색에 필요한 시간을 줄이는 방법을 제안하고자 한다. 본 논문에서는 인접하는 다섯 개의 장점을 이용하여 매칭에 필요한 모델을 구조적 단위의 스트링으로 선정하였으며, 모델 스트링들간의 유사성을 측정하기 위하여 스트링 매칭 알고리듬을 이용하였다. 그리고 이들 스트링중 유사성이 가장 높은 스트링을 참조 스트링으로 선정하여, 참조 스트링으로부터의 각 스트링간의 거리를 해시의 킷값으로 이용하여 검색에 필요한 해시 테이블을 검색한다. 검색 결과 입력 영상으로부터 구해진 하나의 특권 스트링은 하나 혹은 여러 개의 모델에 대한 가설을 생성할 수 있으며, 이를 다시 해싱을 통하여 검색된 모델 스트링들과의 거리를 재계산하여 이 값이 주어진 임계값보다 작은 모델스트링과 최종 매칭이 되는 것으로 간주하였다. 실험결과 모델을 계층적으로 찾아가는 기존의 방식이 평균 8-10번의 거리를 계산해야만 매칭을 행할 수 있었음에 반해 제안한 방법은 2-3번의 거리 계산만으로 매칭을 행할 수 있었다.

  • PDF

항공관제용 현시시스템을 위한 패턴매칭 기반의 ASTERIX 파싱 모듈 설계 및 구현 (Design and Implementation of ASTERIX Parsing Module Based on Pattern Matching for Air Traffic Control Display System)

  • 김강희;김호중;은윤동;최상방
    • 전자공학회논문지
    • /
    • 제51권3호
    • /
    • pp.89-101
    • /
    • 2014
  • 최근 국내 항공교통량이 급증함에 따라 안전하고 효율적인 항공교통관리를 위한 항공관제 시스템의 필요성이 커지고 있다. 특히 원활한 항공교통관제를 위해 비행정보구역(FIR : Flight Information Region) 내의 모든 항공상황을 추가지연 없이 보여주어야 하는 현시시스템의 성능 보장이 무엇보다 중요하다. 본 논문에서는 표준 레이더 감시자료 포맷인 ASTERIX(All purpose STructured Eurocontrol suRveillance Information eXchange) 메시지의 파싱 과정에서 발생하는 오버헤드를 줄여 시스템 부하를 최소화함으로써 안정적인 관제운영을 도모할 수 있는 패턴매칭 기반의 ASTERIX 파싱 모듈을 설계하였다. 설계한 패턴매칭 기반의 ASTERIX 파싱 모듈은 수신 ASTERIX 데이터를 분석하여 패턴을 생성하며, 이후 수신되는 ASTERIX는 패턴을 통해 정의된 프로시저로 파싱한다. 기존 비트 수준 파싱 모듈의 불필요한 파싱 과정을 줄여 현시에 필요한 정보만을 빠르게 추출함으로써 현시 오류를 최소화하고 안정적인 항공관제를 가능하게 한다. 설계한 패턴매칭 기반의 ASTERIX 파싱 모듈의 성능을 비교하기 위하여 일반적인 비트 수준 ASTERIX 파싱 모듈과 비교한 결과, 짧은 처리지연시간, 높은 처리량, 낮은 CPU 사용률을 보이는 것을 확인하였다.

형질 전환된 포플러에 대한 nos-NPT II 유전자의 기관별 발현 특성 (Organ Specific Expression of the nos-NPT II Gene in Transgenic Hybrid Poplar)

  • 전영우
    • 한국산림과학회지
    • /
    • 제84권1호
    • /
    • pp.77-86
    • /
    • 1995
  • 임목을 대상으로 삽입된 외래 유전자의 공간적, 시기별 발현 특성을 이해하기 위한 기초연구로서 온실에서 생육 중인 형질전환된 2년생 잡종 포플러 (Populus alba X P. grandidentata) Hansen 클론을 대상으로 삽입된 외래 유전자의 발현정도를 각 기관별로 조사하였다. Agrobacterium binary vector pRT45, pRT102 및 pRT104에 의해서 형질전환된 3계통의 형질전환체 Tr15, Tr345, Tr665 모두는 선발가능한 표식 유전자로서 nos promoter-NPT II 유전자가 대상 식물체의 genome에 삽입되어 있으며, 그외에, pin2 promoter-CAT 유전자(pRT45), nos promoter-PIN2 유전자(pRT102), Cauliflower Mosaic Virus 35s promoter-PIN2 유전자(pRT104)가 3계통의 형질전환체에 제각각 삽입되어 있는 잡종 포플러이다. 이들 3계통의 형질전환 포플러 식물체의 DNA를 PCR 검정 기법을 이용하여 분석해 본 결과 선발 가능한 표식 유전자인 NPT-II가 삽입되어 있음이 입증되었다 발현 정도를 비교 분석하기 위해서 NPT-ELISA 검정을 실시하였다. 삽입된 NPT II 유전자는 형질전환된 포플러의 잎, 엽병, 형성층 조직, 줄기의 목질부, 뿌리에서 발현되었으며, 발현 정도는 형질전환된 식물체의 계통에 따라서, 그리고 형진전환된 식물체의 부위에 따라서 다양하게 나타났다. pRT45에 의해서 형질전환된 Tr15 형질전환체의 경우, 늙은 잎과 엽병에서 NPT II 유전자가 가장 높은 수준으로 발현되었으며, 어린 잎과 뿌리 조직에서 가장 낮게 발현되었다. 삽입된 외래 유전자가 각 식물체간에, 각 기관에 따라서 각각 상이한 발현 정도를 나타내는 이와 같은 결과는 형질전환된 식물체에 대한 효과적인 선발과정이 요구됨을 의미함은 물론이고, 형질전환 식물체의 발달 과정에 따라서 삽입된 외래 유전자가 공간적, 시기적으로 각각 다르게 발현할 수 있다는 것을 나타낸다.

  • PDF

비밀분산 기반의 2-Subset Difference 브로드캐스트 암호시스템 (2-Subset Difference Broadcast Encryption System Based on Secret Sharing Method)

  • 이재환;박종환
    • 방송공학회논문지
    • /
    • 제20권4호
    • /
    • pp.580-597
    • /
    • 2015
  • 브로드캐스트 암호시스템은 한명의 송신자가 다수의 수신자에게 안전하게 메시지를 전송하는 기법이다. 제안된 브로드캐스트 암호 시스템 중 가장 효율적인 것은 트리구조에서 Subset Difference(SD) 기법을 이용한 것으로, 이를 구체화하기 위해 유사난수생성기(PRG: Pseudo-Random Generator)와 비밀분산(SS: Secret Sharing) 방식을 이용한 두 가지 방법이 존재한다. 2-SD 기법은 SD 기법을 일반화하는 것으로 하나의 집합에서 두 개의 부분집합을 동시에 탈퇴시킬 수 있는 방법이다. 2-SD 기법의 장점으로는 SD 기법에 비해 전송량을 더 줄일 수 있다는 것이다. 그러나 현재까지 PRG나 SS 기반에서 2-SD 기법을 설계한 결과는 알려지지 않았다. 본 논문에서는 2014년 Jae Hwan Lee[9]등이 제시한 SS 기반의 SD 기법을 확장하여 SS 기반의 2-SD 기법을 설계한다. 제안된 기법은 기존 SS 기반의 SD 기법에서 요구하는 암호문 헤더 전송량의 약 25% 줄이는 효과가 있다. 또한 암호 이론적으로 본 논문의 결과는 증명 가능한 2-SD 기법을 최초로 제시한 것이다.