• 제목/요약/키워드: TREE FEATURE

검색결과 367건 처리시간 0.029초

온라인 토론의 댓글 응답 구조를 이용한 사용자 특성 분석 (User Characterization from Replying Comment Structures in Online Discussion)

  • 김성환;탁해성;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.135-145
    • /
    • 2018
  • 온라인 커뮤니티에서는 사용자들이 댓글을 이용하여 다양한 주제에 대한 의견과 감정을 교환한다. 댓글을 통한 의사소통은 신속하고 편리하지만 때로는 이러한 무게감이 덜한 특성이 사용자로 하여금 무례하고 공격적인 언사를 쉽게 행하도록 만들어 분쟁을 쉽게 유발하기도 한다. 따라서 이러한 분쟁을 미리 예측하고 대응하기 위하여 사용자들의 특성을 미리 파악하고 분류하는 작업이 중요하다. 본 논문에서는 이러한 사용자의 특성이 해당 사용자들이 참여한 발제글을 나타내는 댓글트리의 구조적인 특징에 나타난다는 가정을 바탕으로 댓글트리 구조를 서술하기 위한 여러 가지 정량적인 지표를 제안한다. 제안하는 정량 지표들의 분포를 통하여 발제글 작성자 및 댓글 작성자에 따른 지표의 분포를 살펴보고, 추가적으로 관리자에 의하여 경고를 받은 사용자들을 분류하는 실험을 통하여 제안하는 구조적 지표의 효과성을 보인다.

Genetic characterization and population structure of six brown layer pure lines using microsatellite markers

  • Karsli, Taki;Balcioglu, Murat Soner
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권1호
    • /
    • pp.49-57
    • /
    • 2019
  • Objective: The first stage in both breeding and programs for the conservation of genetic resources are the identification of genetic diversity in the relevant population. The aim of the present study is to identify genetic diversity of six brown layer pure chicken lines (Rhode Island Red [RIRI, RIRII], Barred Rock [BARI, BARII], Columbian Rock [COL], and line 54 [L-54]) with microsatellite markers. Furthermore, the study aims to employ its findings to discuss the possibilities for the conservation and sustainable use of these lines that have been bred as closed populations for a long time. Methods: In the present study, a total number of 180 samples belonging to RIRI (n = 30), RIRII (n = 30), BARI (n = 30), BARII (n = 30), L-54 (n = 30), and COL (n = 30) lines were genotyped using 22 microsatellite loci. Microsatellite markers are extremely useful tools in the identification of genetic diversity since they are distributed throughout the eukaryotic genome in multitudes, demonstrate co-dominant inheritance and they feature a high rate of polymorphism and repeatability. Results: In this study, we found all loci to be polymorphic and identified the average number of alleles per locus to be in the range between 4.41 (BARI) and 5.45 (RIRI); the observed heterozygosity to be in the range between 0.31 (RIRII) and 0.50 (BARII); and $F_{IS}$ (inbreeding coefficient) values in the range between 0.16 (L-54) and 0.46 (RIRII). The $F_{IS}$ values obtained in this context points out to a deviation from Hardy-Weinberg equilibrium due to heterozygote deficiency in six different populations. The Neighbour-Joining tree, Factorial Correspondence Analysis and STRUCTURE clustering analyzes showed that six brown layer lines were separated according to their genetic origins. Conclusion: The results obtained from the study indicate a medium level of genetic diversity, high level inbreeding in chicken lines and high level genetic differentiation between chicken lines.

여성복 스몰사이즈 재킷 제품 생산실태- 2021년 S/S 영컨템포러리 브랜드를 중심으로 - (An analysis of the production conditions for small-sized women's jacket products - Focusing on young contemporary brands for spring/summer 2021 -)

  • 이유진;장정아
    • 복식문화연구
    • /
    • 제29권6호
    • /
    • pp.849-864
    • /
    • 2021
  • This study analyzed product conditions in terms of "size system," "clothing construction depending on fit," "details," "colors," and "prices," with an emphasis on young contemporary brands for spring/summer 2021, in order to provide basic data for the development of small-sized women's jackets. Out of 96 domestic and foreign brands, the study analyzed 254 small-sized jacket products from 23 brands that produce size-XS jackets. First, when examining the sizes for women's jackets, we found that 8 out of the 23 brands offer a size-XXS option. After conducting tree analysis to analyze the factors affecting the production of size-XXS, the study found significant results in the areas of "distinction between domestic and foreign brands" and "product price." Second, after categorizing small-sized women's jackets into 3 categories-fit-slim, basic, and straight-the study analyzed clothing construction elements depending on fit. This seasons mainly feature straight-fit's hip-line length jacket, a 4-panel pattern, and a panel without a waist dart. Third, the study, through the analysis of the colors of small-sized women's jackets, found a higher frequency of colors in the order of black (23.0%), white (13.3%), and beige tones (10.1%), with additional colors such as sky blue, rose pink, and aquamarine in production, which exhibit the senses of the seasons. Price analysis revealed that small-sized jackets constituted a price range at the mid-to-low end, as in ₩50,000-100,000 (30.3%), ₩100,000-150,000 (19.3%), and ₩150,000-200,000 (11.8%).

Feature Extraction and Evaluation for Classification Models of Injurious Falls Based on Surface Electromyography

  • Lim, Kitaek;Choi, Woochol Joseph
    • 한국전문물리치료학회지
    • /
    • 제28권2호
    • /
    • pp.123-131
    • /
    • 2021
  • Background: Only 2% of falls in older adults result in serious injuries (i.e., hip fracture). Therefore, it is important to differentiate injurious versus non-injurious falls, which is critical to develop effective interventions for injury prevention. Objects: The purpose of this study was to a. extract the best features of surface electromyography (sEMG) for classification of injurious falls, and b. find a best model provided by data mining techniques using the extracted features. Methods: Twenty young adults self-initiated falls and landed sideways. Falling trials were consisted of three initial fall directions (forward, sideways, or backward) and three knee positions at the time of hip impact (the impacting-side knee contacted the other knee ("knee together") or the mat ("knee on mat"), or neither the other knee nor the mat was contacted by the impacting-side knee ("free knee"). Falls involved "backward initial fall direction" or "free knee" were defined as "injurious falls" as suggested from previous studies. Nine features were extracted from sEMG signals of four hip muscles during a fall, including integral of absolute value (IAV), Wilson amplitude (WAMP), zero crossing (ZC), number of turns (NT), mean of amplitude (MA), root mean square (RMS), average amplitude change (AAC), difference absolute standard deviation value (DASDV). The decision tree and support vector machine (SVM) were used to classify the injurious falls. Results: For the initial fall direction, accuracy of the best model (SVM with a DASDV) was 48%. For the knee position, accuracy of the best model (SVM with an AAC) was 49%. Furthermore, there was no model that has sensitivity and specificity of 80% or greater. Conclusion: Our results suggest that the classification model built upon the sEMG features of the four hip muscles are not effective to classify injurious falls. Future studies should consider other data mining techniques with different muscles.

Machine Learning Methods to Predict Vehicle Fuel Consumption

  • Ko, Kwangho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.13-20
    • /
    • 2022
  • 본 연구에서는 주행 차량의 실시간 연료소모량을 예측할 수 있는 머신러닝 기법을 제안하고 그 특성을 분석하였다. 머신러닝 학습을 위해 실도로 주행을 실시하여 주행 속도, 가속도, 도로 구배와 함께 연료소모량을 측정하였다. 특성 데이터로 속도, 가속도, 도로구배를, 타깃으로 연료소모량을 지정하여 다양한 머신러닝 모델을 학습시켰다. 회귀법에 해당하는 K-최근접이웃회귀 및 선형회귀와 함께, 분류법에 해당하는 K-최근접이웃분류, 로지스틱회귀, 결정트리, 랜덤포레스트, 그래디언부스팅을 사용하였다. 실시간 연료소모량에 대한 예측 정확도는 0.5 ~ 0.6 수준으로 전반적으로 낮았고, 회귀법의 경우 분류법보다 정확도가 떨어졌다. 총연료소모량에 대한 예측 오차는 0.2 ~ 2.0% 수준으로 상당히 정확했고, 분류법보다 회귀법의 오차가 더 낮았다. 이는 예측 정확도의 기준으로 결정계수(R2)를 사용했기 때문인데, 이 값이 작을수록 타깃의 평균 부근에 예측치가 좁게 분포하기 때문이다. 따라서 실시간 연료소모량 예측에는 분류법이, 총연료소모량 예측에는 회귀법이 적합하다고 할 수 있다.

인공지능 기반 빈집 추정 및 주요 특성 분석 (Vacant House Prediction and Important Features Exploration through Artificial Intelligence: In Case of Gunsan)

  • 임규건;노종화;이현태;안재익
    • 한국IT서비스학회지
    • /
    • 제21권3호
    • /
    • pp.63-72
    • /
    • 2022
  • The extinction crisis of local cities, caused by a population density increase phenomenon in capital regions, directly causes the increase of vacant houses in local cities. According to population and housing census, Gunsan-si has continuously shown increasing trend of vacant houses during 2015 to 2019. In particular, since Gunsan-si is the city which suffers from doughnut effect and industrial decline, problems regrading to vacant house seems to exacerbate. This study aims to provide a foundation of a system which can predict and deal with the building that has high risk of becoming vacant house through implementing a data driven vacant house prediction machine learning model. Methodologically, this study analyzes three types of machine learning model by differing the data components. First model is trained based on building register, individual declared land value, house price and socioeconomic data and second model is trained with the same data as first model but with additional POI(Point of Interest) data. Finally, third model is trained with same data as the second model but with excluding water usage and electricity usage data. As a result, second model shows the best performance based on F1-score. Random Forest, Gradient Boosting Machine, XGBoost and LightGBM which are tree ensemble series, show the best performance as a whole. Additionally, the complexity of the model can be reduced through eliminating independent variables that have correlation coefficient between the variables and vacant house status lower than the 0.1 based on absolute value. Finally, this study suggests XGBoost and LightGBM based machine learning model, which can handle missing values, as final vacant house prediction model.

Protecting Accounting Information Systems using Machine Learning Based Intrusion Detection

  • Biswajit Panja
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.111-118
    • /
    • 2024
  • In general network-based intrusion detection system is designed to detect malicious behavior directed at a network or its resources. The key goal of this paper is to look at network data and identify whether it is normal traffic data or anomaly traffic data specifically for accounting information systems. In today's world, there are a variety of principles for detecting various forms of network-based intrusion. In this paper, we are using supervised machine learning techniques. Classification models are used to train and validate data. Using these algorithms we are training the system using a training dataset then we use this trained system to detect intrusion from the testing dataset. In our proposed method, we will detect whether the network data is normal or an anomaly. Using this method we can avoid unauthorized activity on the network and systems under that network. The Decision Tree and K-Nearest Neighbor are applied to the proposed model to classify abnormal to normal behaviors of network traffic data. In addition to that, Logistic Regression Classifier and Support Vector Classification algorithms are used in our model to support proposed concepts. Furthermore, a feature selection method is used to collect valuable information from the dataset to enhance the efficiency of the proposed approach. Random Forest machine learning algorithm is used, which assists the system to identify crucial aspects and focus on them rather than all the features them. The experimental findings revealed that the suggested method for network intrusion detection has a neglected false alarm rate, with the accuracy of the result expected to be between 95% and 100%. As a result of the high precision rate, this concept can be used to detect network data intrusion and prevent vulnerabilities on the network.

도시 미세먼지 저감 식재를 위한 수종 선정 기준의 우선순위 도출 (Prioritization of Species Selection Criteria for Urban Fine Dust Reduction Planting)

  • 조동길
    • 한국환경생태학회지
    • /
    • 제33권4호
    • /
    • pp.472-480
    • /
    • 2019
  • 도심지 내 미세먼지 저감 식재를 위한 식물 소재 선정 시에는 식물의 흡착 기능에 영향을 미치는 식물의 잎 모양, 질감, 수피의 형태 등 형태적 특성을 종합적으로 고려하여 선정하여야 한다. 그러나 지금까지 식물을 통한 미세먼지 저감에 대한 연구는 식물의 흡착 기능보다 흡수 기능에 대한 연구가, 실외식물보다 실내식물인 관엽식물을 대상으로 한 연구가 주로 진행되어 왔다. 특히, 미세먼지 저감 수종 선정 기준이 구체적이지 않아 미세먼지 저감 식재를 위한 식물 소재 선정 기준에 대한 연구가 필요한 실정이다. 본 연구는 퍼지다기준 의사결정법(Fuzzy MCDM)을 활용하여 미세먼지 저감에 영향을 미치는 8가지 지표 항목에 대한 우선순위를 도출하고 도심 내 미세먼지 저감 식재를 위한 수종 선정 기준을 마련하였다. 이를 위하여 미세먼지 관련 분야 전공자와 미세먼지 관련 연구 경험자들을 대상으로 설문 조사를 실시하였다. 설문 조사 분석 결과, 미세먼지 저감에 영향을 미치는 지표 항목 중 잎 면적과 수종의 종류가 가장 높은 순위를 나타냈다. 그리고 잎 표면의 거칠기, 수고, 성장 속도, 잎의 복잡성, 잎 가장자리 형태, 수피 특징 순서로 우선순위가 높게 나타났다. 잎 표면이 거친 수종을 선정할 경우에는 잎에 털이 있고, 광택이 나며, 왁스층이 있는 수종을 우선적으로 선정하는 것이 좋다. 잎의 형태를 고려할 경우, 단일 잎보다 3종 혹은 2종 잎과 손바닥 형태의 잎을 선정하고, 잎의 가장자리는 밋밋한 모양보다는 톱니 모양의 잎을 선별하여 공기 중의 미세먼지가 잎의 표면에 흡착되는 표면적 비율을 높아지게 할 필요가 있다. 수피의 특성을 고려할 경우에는 피목이나 무늬종보다는 코르크층이 있고 껍질이탈이나 갈라짐이 관찰되거나, 앞으로 관찰될 가능성이 높은 수종을 선정하는 것이 바람직하다. 본 연구는 도심 내 미세먼지 저감을 위한 식재계획 시 식물의 미세먼지 흡착 기능에 영향을 미치는 식물의 형태적 특성을 중심으로 식물 소재 선정 기준에 대한 우선순위를 제시하였다는 것에 의의가 있다. 본 연구에서 도출한 결과는 도심지 내 수목 식재 계획을 위한 수종 선정 시 기초 자료로서 활용될 수 있을 것이다.

교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교 (Comparison of Association Rule Learning and Subgroup Discovery for Mining Traffic Accident Data)

  • 김정민;류광렬
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다. 연관규칙 학습기법은 비지도 학습 기법의 하나로 데이터 내에서 동시에 많이 등장하는 아이템(item)들을 찾아 규칙의 형태로 가공해 주며, 서브그룹 발견기법은 사용자가 지정한 대상 속성이 결론부에 나타나는 규칙을 학습하는 지도학습 기반 기법으로 일반성과 흥미도가 높은 규칙을 학습한다. 규칙 학습 시 사용자의 의도를 반영하기 위해서는 하나 이상의 관심 속성들을 조합한 합성 속성을 만들어 규칙을 학습할 수 있다. 규칙이 도출되고 나면 후처리 과정을 통해 중복된 규칙을 제거하고 유사한 규칙을 일반화하여 규칙들을 더 단순하고 이해하기 쉬운 형태로 가공한다. 교통사고 데이터를 대상으로 두 기법을 적용한 결과 대상 속성을 지정하지 않고 연관규칙 학습기법을 적용하는 경우 사용자가 쉽게 알기 어려운 속성 사이의 숨겨진 관계를 발견할 수 있었으며, 대상 속성을 지정하여 연관규칙 학습기법과 서브그룹 발견기법을 적용하는 경우 파라미터 조정에 많은 노력을 기울여야 하는 연관규칙 학습기법에 비해 서브그룹 발견기법이 흥미로운 규칙들을 더 쉽게 찾을 수 있음을 확인하였다.

덕유산 향적봉 및 중봉 아고산대의 산림식생유형분류와 임분 특성 (Classification and Stand Characteristics of Subalpine Forest Vegetation at Hyangjeukbong and Jungbong in Mt. Deogyusan)

  • 한상학;한심희;윤충원
    • 한국산림과학회지
    • /
    • 제105권1호
    • /
    • pp.48-62
    • /
    • 2016
  • 본 연구는 덕유산국립공원 향적봉 및 중봉 아고산대를 대상으로 총 48개소의 고정방형구를 설치하여 Z-M 식물사회학적 방법으로 군락유형분류와 임분 구조를 분석하였던 바, 신갈나무군락군에서 군락단위로 가문비나무군락, 까치박달군락, 피나무군락으로 분류되었으며 가문비나무군락은 물참대군, 백당나무군으로 세분되었다. 군단위로 물참대군은 복장나무소군과 까치밥나무소군으로 세분되었으며, 백당나무군은 각시원추리소군과 귀룽나무소군으로 세분되었다. 중요치를 분석한 결과, 교목층을 구성하는 주요 종으로는 신갈나무(23.9%), 구상나무(14.7%), 주목(10.2%), 가문나무(8.2%), 사스래나무(7.4%)로 나타났으며, 아교목층은 시닥나무(18.6%), 당단풍나무(18.4%), 신갈나무(8.9%)로 나타났으며, 관목층은 철쭉(20.7%), 당단풍나무(17.4%), 노린재나무(8.5%)로 나타났다. 식생단위 1의 지표종은 산수국, 들메나무, 물참대와 같은 아고산의 적습한 계곡부 또는 전석지 환경을 선호하는 종들이 나타났다. 종다양도는 식생단위 1, 4, 5는 생육환경이 이질적이고 복잡하거나 국소적인 교란이 있었을 것으로 사료된다. 가문비나무군락의 하위단위인 복장나무아군, 까치밥나무아군, 각시원추리아군, 귀룽나무아군의 식생단위 1, 2, 3, 4는 유사도 지수가 0.5 이상으로 식생단위 간 유사도가 높은 경향으로 나타나, 식생단위 간 구성종의 차이가 크지 않은 것으로 판단된다.