• 제목/요약/키워드: statistical graph

검색결과 175건 처리시간 0.02초

Cross-architecture Binary Function Similarity Detection based on Composite Feature Model

  • Xiaonan Li;Guimin Zhang;Qingbao Li;Ping Zhang;Zhifeng Chen;Jinjin Liu;Shudan Yue
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권8호
    • /
    • pp.2101-2123
    • /
    • 2023
  • Recent studies have shown that the neural network-based binary code similarity detection technology performs well in vulnerability mining, plagiarism detection, and malicious code analysis. However, existing cross-architecture methods still suffer from insufficient feature characterization and low discrimination accuracy. To address these issues, this paper proposes a cross-architecture binary function similarity detection method based on composite feature model (SDCFM). Firstly, the binary function is converted into vector representation according to the proposed composite feature model, which is composed of instruction statistical features, control flow graph structural features, and application program interface calling behavioral features. Then, the composite features are embedded by the proposed hierarchical embedding network based on a graph neural network. In which, the block-level features and the function-level features are processed separately and finally fused into the embedding. In addition, to make the trained model more accurate and stable, our method utilizes the embeddings of predecessor nodes to modify the node embedding in the iterative updating process of the graph neural network. To assess the effectiveness of composite feature model, we contrast SDCFM with the state of art method on benchmark datasets. The experimental results show that SDCFM has good performance both on the area under the curve in the binary function similarity detection task and the vulnerable candidate function ranking in vulnerability search task.

동반수가 3인 가장 균형된 계획의 존재여부의 판단에 관한 연구

  • 배종성;김진
    • Communications for Statistical Applications and Methods
    • /
    • 제5권2호
    • /
    • pp.315-326
    • /
    • 1998
  • 균형된 불완비 블록계획이 존재하지 않는 경우 동반수가 연속적인 두 개의 정수값을 갖는 정규그래프계획(Regular Graph Designs :RGD)은 불완비 블록계획중에서 가장 효율적인 계획이 됨을 추측하였다(John과 Mitchell,1977). Brown(1988)은 주어진 모수를 이용하여 정규그래프계획의 존재 여부를 판단하는 방법을 연구하였다. 본 논문에서는 정규그래프계획의 존재여부를 판단하는 방법을 동반수가 3인 블록계획으로 확장하여 동반수가 3인 부분적으로 균형된 불완비 블록계획중에서 동반수가 3인 가장 균형된 계획 (3-concurrence most balanced designs)의 존재여부를 판단하는 방법을 제시하였다.

  • PDF

A Combining Dynamic Graph of Added Variable Plot and Component plus Residual Plot

  • Park, Chong-sun
    • Communications for Statistical Applications and Methods
    • /
    • 제4권1호
    • /
    • pp.119-128
    • /
    • 1997
  • Added variable plot and component-plus-residual plot are very useful for studying the role of a predictor in classical regression analysis. The former is usually used to check the effect of adding a new variable to existing model. The latter has been suggested as computationally convenient substitutes for the added variable plots, however, this plot is found to be better in detecting nonlinear relationships of a new predictor. By combining these two plots dynamically, we can take advantages of two plots simultaneously. And even further, we can get some knowledge of collinearity between a new predictor and predictors already in the model, and more accurate information about the possible outliers.

  • PDF

일반화 파레토 분포에서 임계치 결정에 대한 대안적 연구 (An Alternative Study of the Determination of the Threshold for the Generalized Pareto Distribution)

  • 윤정연;조재범;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.931-939
    • /
    • 2011
  • 일반적으로 일반화 파레토 분포(Generalized Pareto Distribution; GPD)에서 임계치를 결정하는 방법으로는 MEF-그래프나 Hill-그래프를 통한 주관적인 판단을 이용한다는 약점이 존재한다. 본 연구에서는 이와 같은 기존 방법의 약점을 해결하기 위하여 GPD에서 임계치를 결정하는 방법으로 로버스트 추정량을 이용하는 새로운 접근 방법을 제안하였다. 더불어 1987년 1월 5일부터 2009년 8월 3일까지 공시된 KOSPI지수의 일별수익률의 손실부분에 해당하는 왼쪽꼬리부분을 이용하여 실증분석을 실시하였다. 실증분석은 기존의 그래프를 이용한 임계치 결정방법과 본 연구에서 제안한 방법에서 계산된 VaR이 어떤 차이가 존재하는가를 알아보는 방법으로 실시되었다. 분석결과 본 논문에서 제안한 임계치 결정방법에 의하여 계산된 VaR값들은 기존 방법의 VaR과 큰 차이를 보이지 않았다. 아울러 본 연구에서 제안한 임계치 결정방법의 안정성을 파악한 결과 기존 방법과 큰 차이를 보이지 않았다. 이와 같은 결과들을 토대로 본 연구에서 제안한 로버스트 추정량을 이용한 임계치 결정방법은 기존의 그래프를 이용한 주관적인 임계치 결정방법에 대한 대안적인 방법으로 충분히 고려될 수 있을 것으로 생각된다.

초등 수학 교과서의 막대그래프와 꺾은선그래프 지도에 대한 분석 (An Analysis of Methods for Teaching Bar and Line Graphs in Elementary Mathematics Textbooks)

  • 김소민;이종학
    • 한국학교수학회논문집
    • /
    • 제23권3호
    • /
    • pp.259-276
    • /
    • 2020
  • 본 연구는 이전과 현재의 교육과정에 따른 3~4학년군 초등학교 수학 교과서의 그래프 지도에서 교수학적 지도 방법이 어떤 방식으로 발생하고 전개되었는가를 파악하는 것이다. 이에 본 연구에서는 제5차 교육과정부터 2015 개정 교육과정까지의 각 교육과정에 따른 교과서와 지도서를 대상으로 막대그래프와 꺾은선그래프 단원을 분석하였고, 그래프 지도에서 통계 교육적 의의를 탐색하였다. 연구 결과 지속적인 교육과정 변천에도 막대그래프와 꺾은선그래프의 지도 시기는 변화가 거의 없었고, 공학의 활용을 최근의 교육과정이 강조하는 바에 비교해서 교과서는 적극적으로 활용되고 있지 않았다. 또한 통계에서 유의미한 개념인 자료의 변동성, 분포, 표본, 표본추출 등을 실제적으로 다루고 있지 않았다. 본 연구의 결과를 기반으로 통계 그래프 지도 및 통계 영역에서 교과서 개발에의 시사점을 제안하는 바이다.

인포그래픽을 활용한 초등학교 5학년 통계 프로젝트 수업의 구체화 방안 (Concrete Class Plan for a Statistical Project of 5th Graders in Elementary School Using Infographics)

  • 김지혜;송상헌
    • 한국초등수학교육학회지
    • /
    • 제23권1호
    • /
    • pp.75-92
    • /
    • 2019
  • 2015 개정 수학과 교육과정에서는 학생들에게 그래프를 지도할 때 신문, 인터넷에 있는 그래프를 소재로 활용할 것과 자료를 수집, 분류, 정리하여 그래프를 그리고 해석하는 일련의 통계적 문제 해결 과정을 겪어볼 것을 권장하고 있다. 전통적인 교과서를 통해 학생들이 배우는 그래프는 단일한 형태의 그래프들이었고, 특히 5~6학년군의 그림그래프는 수치만 커졌을 뿐 기본 개념은 3~4학년군의 내용을 반복하고 있다. 다행히 2009 개정 교육과정부터는 일부 그래프의 특성을 서로 비교하면서 상황에 적합한 그래프를 선택할 수 있도록 하고 있으며 현실 세계 사용되는 그래프는 여러 가지 그래프들이 복합된 인포그래픽 형태로 제시되는 경우가 대부분이다. 본 연구는 인포그래픽을 활용한 통계 프로젝트 수업 사례 분석을 통해 초등학교 5학년 교실에서 활용 가능한 인포그래픽 활용 통계 프로젝트 수업을 구체화하는 방안을 제안하였다.

  • PDF

TeGCN:씬파일러 신용평가를 위한 트랜스포머 임베딩 기반 그래프 신경망 구조 개발 (TeGCN:Transformer-embedded Graph Neural Network for Thin-filer default prediction)

  • 김성수;배준호;이주현;정희주;김희웅
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.419-437
    • /
    • 2023
  • 국내 씬파일러(Thin Filer)의 수가 1200만명을 넘어서며, 금융 업계에서 씬파일러의 신용을 정확히 평가하여 우량고객을 선별해 대출을 공급하는 시도가 많아지고 있다. 특히, 차주의 신용정보에 존재하는 비선형성을 반영하여 채무불이행을 예측하기 위해서 다양한 머신러닝 알고리즘을 활용한 연구가 진행되고 있다. 그 중 그래프 신경망 구조(Graph Neural Network)는 일반적인 신용정보 외에 대출자 간의 네트워크 정보를 반영할 수 있다는 점에서 데이터가 부족한 씬파일러의 채무 불이행 예측에서 주목할 만하다. 그러나, 그래프 신경망을 활용한 기존의 연구들은 신용정보에 존재하는 다양한 범주형 변수를 적절히 처리하지 못했다는 한계가 있었다. 이에 본 연구는 범주형 변수의 맥락적 정보를 추출할 수 있는 트랜스포머 메커니즘(Transformer mechanism)과 대출자 간 네트워크 정보를 반영할 수 있는 그래프 합성곱 신경망(Graph Convolutional Network)를 결합하여 효과적으로 씬파일러의 채무 불이행 예측이 가능한 TeGCN (Transformer embedded Graph Convolutional Network)를 제안한다. TeGCN는 일반 대출자 데이터셋과 씬파일러 데이터셋에 대하여 모두 베이스 라인 모델 대비 높은 성능을 보였으며, 특히 씬파일러 채무 불이행 예측에 우수한 성능을 달성했다. 본 연구는 범주형 변수가 많은 신용정보와 데이터가 부족한 씬파일러의 특성에 적합한 모델 구조를 결합하여 높은 채무 불이행 예측 성능을 달성했다는 시사점이 있다. 이는 씬파일러의 금융소외문제를 해결하고 금융업계에서 씬파일러를 대상으로 추가적인 수익을 창출하는데 기여할 수 있을 것이다.

Workspace Visibility Graph Analysis (VGA) for Concentration Privacy and Group Relations in the Open-Plan Office Environment

  • Hong, Yeon-Koo;Yoo, Uoo-Sang
    • Architectural research
    • /
    • 제12권1호
    • /
    • pp.9-14
    • /
    • 2010
  • The present study explored the applicability of Visibility Graph Analysis (VGA) techniques to workplace design research. Six types of VGA measures in Depthmap encompassing visual connectivity, three types of visual integration, mean depth, and visual entropy were employed for the analysis of individual privacy for task concentration and group relationship behavior in the open-plan office environment. Data comprised 136 workers in 6 open-plan offices filled with low-paneled (1.2-1.5m) cubicle workspaces. For the statistical analysis, Spearman's rho correlations and t-tests were applied for the spatial and behavioral measures. The results showed that workspace VGA measures have a potential to be useful information to account for workers' concentration privacy and, limitedly, also informal relationships with team members. Visual entropy values especially offer reliable information to predict various aspects of office workers' privacy behavior while visual integration can be used to account for the workers' sense of trust in group relations. The study also discussed the limitation of VGA applications to the workplace context.

20대 한국 여성의 체위 분석과 도식화 연구 (A Research of Body Size Analysis and Graphing in 20yrs Korean Women)

  • 김동일;박현정
    • 대한한방부인과학회지
    • /
    • 제21권1호
    • /
    • pp.179-198
    • /
    • 2008
  • Purpose: Obesity is already a major clinical problem in Korea, so obesity prevention and treatment practices are gradually interested in Korean Medicine doctors. Moreover subjective body shape image entered as a important medical topic recently. To make a graph system for clinical tool which based on the Korean national standard physical scale. Methods: Physical data of the girth of upper arm, abdomen, hip, buttock, flank, calf, and body weight were statistically analyzed, which collected through the fifth national standard physical scale research. And then reviewed those statistical validation. Results: Relationship of the each body scale data and those graphs were fit and right statistically. Conclusion: These new achieved graph system of Korean standard body scales could be adopt as a useful clinical tool for body image related patients such as obesity, PCOD and postpartum patient.

  • PDF

한국어 음절의 Entropy에 관한 연구 (Statistical Measurement of Monsyllable Entropy for Korean Language)

  • 이주근;최흥문
    • 대한전자공학회논문지
    • /
    • 제11권3호
    • /
    • pp.15-21
    • /
    • 1974
  • 이 논문은 한국어의 3성음의 조직을 방정식화하고 그로부터 조직약적 상태 graph를 유도하여 정보원의 성질을 구명하고 나아가서 기본 요소의 통계량에 대한 Entropy와 Redundancy를 측정하여 서구어와 비교검토 하였다. 특히 한국어에서 정보원의 성질을 구명하기 위한 syllable의 상태 graph는 단일화된다는 것을 명시함으로서 타언어에서 볼 수 없는 특이한 현상이 나타난다는 것을 지적하였다.

  • PDF