• 제목/요약/키워드: Software Graph

검색결과 313건 처리시간 0.022초

Student Group Division Algorithm based on Multi-view Attribute Heterogeneous Information Network

  • Jia, Xibin;Lu, Zijia;Mi, Qing;An, Zhefeng;Li, Xiaoyong;Hong, Min
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.3836-3854
    • /
    • 2022
  • The student group division is benefit for universities to do the student management based on the group profile. With the widespread use of student smart cards on campus, especially where students living in campus residence halls, students' daily activities on campus are recorded with information such as smart card swiping time and location. Therefore, it is feasible to depict the students with the daily activity data and accordingly group students based on objective measuring from their campus behavior with some regular student attributions collected in the management system. However, it is challenge in feature representation due to diverse forms of the student data. To effectively and comprehensively represent students' behaviors for further student group division, we proposed to adopt activity data from student smart cards and student attributes as input data with taking account of activity and attribution relationship types from different perspective. Specially, we propose a novel student group division method based on a multi-view student attribute heterogeneous information network (MSA-HIN). The network nodes in our proposed MSA-HIN represent students with their multi-dimensional attribute information. Meanwhile, the edges are constructed to characterize student different relationships, such as co-major, co-occurrence, and co-borrowing books. Based on the MSA-HIN, embedded representations of students are learned and a deep graph cluster algorithm is applied to divide students into groups. Comparative experiments have been done on a real-life campus dataset collected from a university. The experimental results demonstrate that our method can effectively reveal the variability of student attributes and relationships and accordingly achieves the best clustering results for group division.

굼벨 분포 모델을 이용한 표절 프로그램 자동 탐색 및 추적 (Automated Detecting and Tracing for Plagiarized Programs using Gumbel Distribution Model)

  • 지정훈;우균;조환규
    • 정보처리학회논문지A
    • /
    • 제16A권6호
    • /
    • pp.453-462
    • /
    • 2009
  • 소프트웨어의 지적 재산권 보호 및 인증에 대한 관심과 중요성이 커지면서 소프트웨어에 대한 표절 탐색 및 보호, 판단에 대한 연구가 활발 하게 진행되고 있다. 지금까지 표절에 대한 연구는 주로 속성 계산, 토큰 패턴, 프로그램 파스트리, 유사도 측정 알고리즘 등을 이용해 두 프로 그램을 비교하는데 초점을 두었다. 이와 더불어, 표절과 협동(collaboration)을 구분하는 것은 표절연구에서 매우 중요하다. 본 논문에서는 극단 치 분포 확률 모델을 이용한 소스코드 클러스터링을 위한 알고리즘을 제안한다. 본 논문에서는 먼저 두 프로그램 먼저 두 프로그램 $P_a$$P_b$ 의 유사도를 측정하는 비대칭거리측정함수 pdist($P_a$, $P_b$)를 제안하고, 모든 소스코드 쌍에 대해 pdist($P_a$, $P_b$)를 통해 측정된 유사도를 간선무게로 하는 표절방 향그래프(PDG)를 생성한다. 그리고 본 논문에서는 표절방향그래프를 굼벨거리그래프(GDG)로 변환한다. pdist($P_a$, $P_b$) 점수 분포는 극단치 확률 분포로 잘 알려진 굼벨분포(Gumbel distribution)와 매우 유사하다. 또한, 본 논문에서는 의사표절(pseudo- plagiarism)을 새롭게 정의한다. 의사표절은 프로그램의 강한 기능적 제약사항으로 인해 발생하는 가상 표절의 한 종류이다. 본 논문에서는 ICPC(International Collegiate Programming Contest)와 KOI(Korean Olympiad for Informatics) 대회에 제출된 18개 프로그램 그룹의 700개 이상의 소스코드에 대해 실험을 진행하였다. 실험결과 프로그램 그룹에 포함된 표절 프로그램들을 찾았으며, 소스코드 클러스터링 알고리즘은 의사표절과 실제표절 프로그램 그룹을 효과적으로 구분하였다.

데이터통합과 메타분석을 위한 그래프 통계량 추출과 검증 (Statistical Data Extraction and Validation from Graph for Data Integration and Meta-analysis)

  • 심성률;임요환;홍명희;송규선;한현욱
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.61-70
    • /
    • 2021
  • 본 연구의 목적은 개별연구들이 정확한 통계량을 제시하지 않고 그래프로만 나타내었을 경우 그래프로부터 통계량을 추출해내는 구체적인 방법을 기술한 것으로서 데이터통합과 정량적합성을 위한 메타분석을 가능하게 한다. 특히 메타분석(meta-analysis)은 체계적·객관적으로 대상문헌을 선택한 후 개별 연구들의 결과를 계량화하여 이를 통합된 효과크기(effect size)로 제시함으로써 근거중심의학(evidence based medicine)를 위한 올바른 의사결정을 할 수 있게 하는 중요한 분석도구이다. 데이터통합과 메타분석을 위해서 그래프로부터 정확한 통계수치를 추출하는 전산도구인 Adobe Acrobat Reader 와 Python기반의 JupyterLab 소프트웨어의 소개와 적용에 대한 주요사항을 알아보았다. 사용된 예제자료는 선행연구를 통해서 통계결과가 검증되어졌고 ClinicalTrials.gov에서 원자료 확보가 가능한 것을 사용하였다. 원자료와 각 전산도구들의 측정값을 각각 메타분석한 결과 통계적으로 유의한 차이는 없었다. 또한 연구자들간의 측정 신뢰도를 확인하였으며 높은 일치도를 나타내었다. 만약 그래프로부터 통게수치를 추출해야만 할 경우 연구의 완결성 유지를 위해서 전통적 사용 방법들보다는 전산 도구를 이용한 측정이 권고된다.

K-평균 클러스터링과 그래프 탐색을 통한 심장 자기공명영상의 좌심실 자동분할 알고리즘 (Automatic Left Ventricle Segmentation Algorithm using K-mean Clustering and Graph Searching on Cardiac MRI)

  • 조현우;이해연
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.57-66
    • /
    • 2011
  • 심장 질환을 예방하기 위해서는 정기적인 검진을 통해 심장 기능을 분석하고 관찰하는 것이 중요하다. 정기적인 검진에서 심장 기능은 심장을 촬영한 후에 관측자가 이를 수작업을 통하여 처리하여 혈류량과 심박구출률 등을 분석함으로서 이루어지나, 시간도 오래 걸리며 관측자에 따른 변이성이 문제가 된다. 본 논문에서는 심장 단축 자기공명영상에서 좌심실 영역을 분할하는 자동화된 알고리즘을 제안한다. 코일 위치에 따른 왜곡을 보정하고, K-평균 클러스터링 기법을 이용하여 좌심실 내부를 분할한다. 영상의 왜곡 및 잡음에 의하여 발생하는 분할 오류는 그래프 탐색 기법을 적용하여 수정하였다. 제안하는 알고리즘의 성능을 평가하기 위하여 38명의 지원자 그룹에 대하여 혈류량과 심박구출률을 계산하였고, 전문가에 의한 수동윤곽검출 결과와 GE MASS 소프트웨어와 비교하였다. 결과에 따르면 제안한 알고리즘의 수동윤곽검출과 혈류량의 차이는 평균적으로 이완기에 6.2mL${\pm}$5.6 및 수축기에 2.9mL${\pm}$3.0, 심박구출률의 차이는 2.1%${\pm}$1.5로 높은 정확성을 보였다. 특히 제안한 알고리즘은 기존 알고리즘에서 발생하던 사용자 간섭률을 최소화하여 자동화 성능을 향상하였다.

다목적 및 고활용성을 위한 객체지향 모델링 기반의 전자 측량기준점 모니터링 S/W 구현 (A Implementation of Electronic Measurement Datum Point Monitoring S/W based on Object-Oriented Modeling for Multi Purpose and High Availability)

  • 정세훈;심춘보
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.99-112
    • /
    • 2015
  • 표시점의 위치 및 고도를 표시하기 위한 기준점은 각종 측량에 유용하게 활용되는 장점을 가지고 있다. 그러나 기상 변화 및 지각 변화 등의 이유로 손 망실되는 사례가 급증하고 있으며, 무의미하게 방치되는 기준점이 늘어나고 있는 실정이다. 이에 본 논문에서는 기존 측량기준점의 활용성을 극대화할 뿐만 아니라 기준점 주변의 각종 환경 데이터 수집과 주변 지역의 지각변동 감지 기능 등이 포함된 다목적 전자 측량기준점 시스템모니터링 S/W를 설계 및 구현한다. 제안하는 S/W는 S/W의 재사용성 및 확장성을 충분히 지원할 수 있도록 객체지향 모델링 기법을 이용하여 설계하고 구현한다. 본 S/W에서는 전자측량 기준점 관리자를 위한 GUI 뿐만 아니라, 웹 및 모바일 사용자를 위한 GUI를 지원한다. 제공하는 GUI에서는 전자 측량기준점의 손 망실 예방 및 지각 변동을 감지하기 위해 측위된 위치정보 및 각종 센싱 정보를 데이터베이스에 실시간으로 저장하고 분석할 수 있도록 각종 데이터를 위한 그래프 GUI 지원한다. 아울러 QR-Code 및 RFID 인식 기능도 포함되어 있다. 마지막으로, 자이로센서를 이용한 지각 변화 감지 및 GPS 위치 오차율을 확인하기 위해 성능평가 결과를 제시한다.

Sentiment Analysis of Product Reviews to Identify Deceptive Rating Information in Social Media: A SentiDeceptive Approach

  • Marwat, M. Irfan;Khan, Javed Ali;Alshehri, Dr. Mohammad Dahman;Ali, Muhammad Asghar;Hizbullah;Ali, Haider;Assam, Muhammad
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.830-860
    • /
    • 2022
  • [Introduction] Nowadays, many companies are shifting their businesses online due to the growing trend among customers to buy and shop online, as people prefer online purchasing products. [Problem] Users share a vast amount of information about products, making it difficult and challenging for the end-users to make certain decisions. [Motivation] Therefore, we need a mechanism to automatically analyze end-user opinions, thoughts, or feelings in the social media platform about the products that might be useful for the customers to make or change their decisions about buying or purchasing specific products. [Proposed Solution] For this purpose, we proposed an automated SentiDecpective approach, which classifies end-user reviews into negative, positive, and neutral sentiments and identifies deceptive crowd-users rating information in the social media platform to help the user in decision-making. [Methodology] For this purpose, we first collected 11781 end-users comments from the Amazon store and Flipkart web application covering distant products, such as watches, mobile, shoes, clothes, and perfumes. Next, we develop a coding guideline used as a base for the comments annotation process. We then applied the content analysis approach and existing VADER library to annotate the end-user comments in the data set with the identified codes, which results in a labelled data set used as an input to the machine learning classifiers. Finally, we applied the sentiment analysis approach to identify the end-users opinions and overcome the deceptive rating information in the social media platforms by first preprocessing the input data to remove the irrelevant (stop words, special characters, etc.) data from the dataset, employing two standard resampling approaches to balance the data set, i-e, oversampling, and under-sampling, extract different features (TF-IDF and BOW) from the textual data in the data set and then train & test the machine learning algorithms by applying a standard cross-validation approach (KFold and Shuffle Split). [Results/Outcomes] Furthermore, to support our research study, we developed an automated tool that automatically analyzes each customer feedback and displays the collective sentiments of customers about a specific product with the help of a graph, which helps customers to make certain decisions. In a nutshell, our proposed sentiments approach produces good results when identifying the customer sentiments from the online user feedbacks, i-e, obtained an average 94.01% precision, 93.69% recall, and 93.81% F-measure value for classifying positive sentiments.

시각장애인 보행안전장치 개발에 관한 연구 (Study on the Development of Working Safety Device for Visually Impaired Person)

  • 김효관;최영규
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권4호
    • /
    • pp.366-372
    • /
    • 2016
  • 본 논문은 시각 장애인이 보행 중 장해물의 위치와 거리를 판단할 수 있는 보행안전장치 개발을 위해 소프트웨어와 하드웨어, 기구설계를 진행하였다. 첫 번째 소프트웨어 구현은 초음파센서 측정 거리 대 전압의 비에 대한 그래프를 알고리즘으로 구현 방법을 제시하였다. 그리고 정확한 거리측정을 할 수 있도록 시뮬레이션을 통해 정확한 거리 측정 파라메타 값을 추출하여 하였다. 두 번째 하드웨어 구현은 시각장애인의 보행보조를 위한 비교적 단순한 센서 기반으로 장애물을 감지할 수 있도록 회로를 설계하였다. 또한 배더리 충전의 편리성을 위해 고성능의 스위칭 레귤레이터 IC를 사용하여 리튬-이온(Li-ion) 배터리 3.7V를 5V로 승압하여 사용할 수 있도록 설계하였다. 세 번째 기구설계는 지팡이 지면 각도와 센서 각도를 분석하여 기구설계를 하였다.

웹 응용 재구성을 위한 폼 클러스터링 알고리즘 (A Form Clustering Algorithm for Web-based Application Reengineering)

  • 최상수;박학수;이강수
    • 한국전자거래학회지
    • /
    • 제8권2호
    • /
    • pp.77-98
    • /
    • 2003
  • 최근의 정보시스템은 웹기반 정보시스템이며 이의 개발과 유지보수 시에 "웹 위기" 현상이 발생하고 있다. 이를 해결하기 위해, 웹 공학 기술 중 웹기반 어플리케이션에 대한 소프트웨어 클러스터링 기술이 필요하다. 본 논문에서는 웹기반 정보시스템의 내부시스템 재구성을 위한 폼 클러스터링 알고리즘을 제시한다. 폼 클러스터링 알고리즘은 웹기반 정보시스템의 다양한 구조모델 중에서 웹의 특징이라 할 수 있는 페이지 모델에 초점을 맞춘다. 특히, 그래프 형태의 항해구조를 분석이 용이한 계층구조로 분석하기 위해 거리 척도 개념을 응용하고, 부하가 큰 핵심 기능객체를 파악하기 위하여 웹 로그분석 기술을 적용한다. 또한,2단계에 걸친 클러스터링 과정을 통해 재사용 성을 극대화하고 부하 균형화를 위한 하드웨어 할 당시에 사용할 수 있는 웹 소프트웨어 구조를 생성한다. 본 논문에서 제시한 폼 클러스터링 알고리즘은 웹기반 정보시스템의 신규 개발 또는 유지보수 시에 재사용 가능한 웹 컴포넌트 개발 및 부하균형화를 위한 하드웨어 할당 시에 적용할 수 있다.

  • PDF

PCA에 기반을 둔 인공신경회로망을 이용한 온실의 습도 예측 (Predicting the Greenhouse Air Humidity Using Artificial Neural Network Model Based on Principal Components Analysis)

  • 오우라비압둘하메드바바툰데;이종원;메쓰캄카남즈사니카닐란가니자야세카라;이현우
    • 한국농공학회논문집
    • /
    • 제59권5호
    • /
    • pp.93-99
    • /
    • 2017
  • A model was developed using Artificial Neural Networks (ANNs) based on Principal Component Analysis (PCA), to accurately predict the air humidity inside an experimental greenhouse located in Daegu (latitude $35.53^{\circ}N$, longitude $128.36^{\circ}E$, and altitude 48 m), South Korea. The weather parameters, air temperature, relative humidity, solar radiation, and carbon dioxide inside and outside the greenhouse were monitored and measured by mounted sensors. Through the PCA of the data samples, three main components were used as the input data, and the measured inside humidity was used as the output data for the ALYUDA forecaster software of the ANN model. The Nash-Sutcliff Model Efficiency Coefficient (NSE) was used to analyze the difference between the experimental and the simulated results, in order to determine the predictive power of the ANN software. The results obtained revealed the variables that affect the inside air humidity through a sensitivity analysis graph. The measured humidity agreed well with the predicted humidity, which signifies that the model has a very high accuracy and can be used for predictions based on the computed $R^2$ and NSE values for the training and validation samples.

태스크 상호작용 테스팅을 위한 MSC 명세로부터의 전체 유한 상태 기계 생성 (Construction of Global Finite State Machine from Message Sequence Charts for Testing Task Interactions)

  • 이남희;김태효;차성덕;신석종;홍인표
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권9호
    • /
    • pp.634-648
    • /
    • 2001
  • MSC는 통산 소프트웨어에서의 병행 수행 테스크들 사이의 상호작용을 기술하기 위해서 많이 사용되어져 왔다. 요구사항 단계에서 검증된 MSC 명세는 상태 기반의 설계 모델을 합성하는데 사용될 수 있을 뿐만 아니라, 테스크 시퀀스 생성에 사용될 수도 있다. 지금까지는 MSC에 기술된 각 이벤트의 위치 정보만을 이용하여 전체 상태 그래프를 생성함으로써 검증을 수행하였다. 본 논문에서는 MSC의 조건문을 시나리오 활성화 조건과 상태 변경을 기술할 수 있도록 확장하고, 이를 이용하여 전체 상태 그래프를 생성함으로써 테스크 시퀀스 생성에 이용한다. 생성된 전체 상태 그래프인 GFSM은 시스템의 의미 있는 상태 정보와 가능한 메시지 시퀀스만을 가지게 된다. 생성된 GFSM에 기존인 FSM 기반의 테스팅 기법을 적용하여 테스크 시퀀스를 추출할 수 있다.

  • PDF