• 제목/요약/키워드: data profiling

검색결과 422건 처리시간 0.027초

개인화된 제품 추천을 위한 고객 행동 기반 고객 프로파일링 기법 (Customer Behavior Based Customer Profiling Technique for Personalized Products Recommendation)

  • 박유진;정유진;장근녕
    • 경영과학
    • /
    • 제23권3호
    • /
    • pp.183-194
    • /
    • 2006
  • In this paper, we propose a customer profiling technique based on customer behavior for personalized products recommendation in Internet shopping mall. The proposed technique defines customer profile model based on customer behavior Information such as click data, buying data, market basket data, and interest categories. We also implement CBCPT(customer behavior based customer profiling technique) and perform extensive experiments. The experimental results show that CBCPT has higher MAE, precision, recall, and F1 than the existing other customer profiling technique.

LSA를 이용한 정형·비정형데이터 분석과 범죄 프로파일링 시스템 구현 (Analysis of Structured and Unstructured Data and Construction of Criminal Profiling System using LSA)

  • 김용훈;정목동
    • 한국멀티미디어학회논문지
    • /
    • 제20권1호
    • /
    • pp.66-73
    • /
    • 2017
  • Due to the recent rapid changes in society and wide spread of information devices, diverse digital information is utilized in a variety of economic and social analysis. Information related to the crime statistics by type of crime has been used as a major factor in crime. However, statistical analysis using only the structured data has the difficulty in the investigation by providing limited information to investigators and users. In this paper, structured data and unstructured data are analyzed by applying Korean Natural Language Processing (Ko-NLP) and the Latent Semantic Analysis (LSA) technique. It will provide a crime profile optimum system that can be applied to the crime profiling system or statistical analysis.

마이크로 서비스 아키텍처를 지원하는 데이터 프로파일링 소프트웨어의 개발 (Development of Data Profiling Software Supporting a Microservice Architecture)

  • 장재영;김지훈;지서우
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.127-134
    • /
    • 2021
  • 최근 빅데이터 산업의 확대로 고품질의 데이터를 확보하는 것이 중요한 이슈로 떠오르고 있다. 고품질의 데이터를 확보하기 위해서는 데이터에 품질에 대한 정확한 평가가 선행되어야 한다. 데이터의 품질은 데이터에 대한 통계와 같은 메타정보를 통해 평가할 수 있는데 이러한 메타정보를 자동으로 추출하는 기능을 데이터 프로파일링이라고 하다. 지금까지 데이터 프로파일링 소프트웨어는 기존의 데이터 품질 또는 시각화 관련 소프트웨어의 부품이나 추가적인 서비스로 제공되는 것이 일반적이었다. 따라서 프로파일링이 요구되는 다양한 환경에서 직접적으로 사용하기에는 적합하지 않았다. 본 논문에서는 이를 해결하기 위해 마이크로 서비스 아키텍처를 적용하여 다양한 환경에서 서비스가 가능한 데이터 프로파일링 소프트웨어의 개발 결과를 제시한다. 개발된 데이터 프로파일러는 restful API를 통해 데이터의 메타정보에 대한 요청과 응답을 제공하여 사용하기 쉬운 서비스를 제공한다. 또한, 특정 환경에 종속되지 않고 다양한 빅데이터 플랫폼이나 데이터 분석 도구들과 원활한 연계가 가능하다는 장점이 있다.

내장형 시스템 소프트웨어를 위한 XML 기반의 프로파일링 도구의 설계 및 구현 (A Design and Implementation A Software Profiling Tool based on XML for Embedded System)

  • 곽동규;유재우
    • 인터넷정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.143-151
    • /
    • 2010
  • 내장형 시스템의 요구사항이 증가함에 따라 내장형 시스템에서 동작하는 프로그램의 복잡도가 증가하고 있다. 이는 최적의 성능을 발휘하는 소프트웨어의 작성을 어렵게 만드는 요인이 된다. 본 논문은 내장형 시스템에 적합한 호스트/타겟 구조의 프로파일링 도구를 제안한다. 제안하는 도구는 교차 개발환경을 사용하는 내장형 시스템에 적합하도록 호스트에서 작성한 프로그램에 로그를 발생시키는 소스를 삽입하여 타겟 시스템에서 실행한다. 발생된 프로파일링 로그는 통신으로 호스트 시스템에 전송하고 전송한 로그 데이터는 호스트 시스템에서 분석하여 XML 형태로 저장하고 보고서를 생성한다. 보고서는 GUI 기반의 그래픽 뷰어를 통해 개발자에게 제공한다. 제안하는 도구는 자원이 적은 타겟 시스템의 로드를 줄이고 생성하는 로그 XML은 XSLT를 이용하여 다른 형태로 변환하기 용이하다. 또한 제안하는 도구는 이클립스 플러그인 기반으로 이클립스의 다양한 기능을 그대로 사용할 수 있는 장점을 가진다.

Application of metabolic profiling for biomarker discovery

  • Hwang, Geum-Sook
    • 한국응용약물학회:학술대회논문집
    • /
    • 한국응용약물학회 2007년도 Proceedings of The Convention
    • /
    • pp.19-27
    • /
    • 2007
  • An important potential of metabolomics-based approach is the possibility to develop fingerprints of diseases or cellular responses to classes of compounds with known common biological effect. Such fingerprints have the potential to allow classification of disease states or compounds, to provide mechanistic information on cellular perturbations and pathways and to identify biomarkers specific for disease severity and drug efficacy. Metabolic profiles of biological fluids contain a vast array of endogenous metabolites. Changes in those profiles resulting from perturbations of the system can be observed using analytical techniques, such as NMR and MS. $^1H$ NMR was used to generate a molecular fingerprint of serum or urinary sample, and then pattern recognition technique was applied to identity molecular signatures associated with the specific diseases or drug efficiency. Several metabolites that differentiate disease samples from the control were thoroughly characterized by NMR spectroscopy. We investigated the metabolic changes in human normal and clinical samples using $^1H$ NMR. Spectral data were applied to targeted profiling and spectral binning method, and then multivariate statistical data analysis (MVDA) was used to examine in detail the modulation of small molecule candidate biomarkers. We show that targeted profiling produces robust models, generates accurate metabolite concentration data, and provides data that can be used to help understand metabolic differences between healthy and disease population. Such metabolic signatures could provide diagnostic markers for a disease state or biomarkers for drug response phenotypes.

  • PDF

프로파일링 데이터를 이용한 가상기계 코드 최적화 (Virtual Machine Code Optimization using Profiling Data)

  • 신양훈;이창환;오세만
    • 정보처리학회논문지A
    • /
    • 제14A권3호
    • /
    • pp.167-172
    • /
    • 2007
  • 가상기계(Virtual Machine)는 소프트웨어로 제작되어 논리적인 시스템 구성을 갖는 컴퓨터이기 때문에 그 수행 속도와 필요 저장 공간 측면에서 성능이 떨어질 수밖에 없다. 이러한 환경에서의 가상기계 코드 최적화는 실행 성능을 향상시킬 수 있기에 중요하다. 특별히 임베디드 장치(Embedded Device)에서 작동하는 가상기계 환경에서의 최적화는 기존의 최적화에 비해 수행 비용 대비 효과에서 높은 효율을 요구한다. 이에 따라 프로파일링을 통하여 성능에 크게 영향을 주는 함수 또는 기본 블록(Basic Block)을 찾아 최적화하는 것이 효과적이다. 본 논문에서는 프로파일링을 이용한 가상기계 코드 최적화기를 설계하고 구현하였다. 먼저, 가상기계 코드 최적화를 위해 코드를 실행하여 얻을 수 있는 동적 정보인 프로파일링 데이터(Profiling Data)를 정의하였고, 프로파일링 정보를 이용한 가상기계 코드 최적기를 구현하였다. 또한, 구현과 실험에 있어서 가상기계 코드는 EVM(Embedded Virtual Machine)의 중간 언어인 SIL(Standard Intermediate Language)를 사용하였고, 구현된 최적화기에 대한 실험을 통해 최적화기의 효과를 확인하였다.

Enhancing GPU Performance by Efficient Hardware-Based and Hybrid L1 Data Cache Bypassing

  • Huangfu, Yijie;Zhang, Wei
    • Journal of Computing Science and Engineering
    • /
    • 제11권2호
    • /
    • pp.69-77
    • /
    • 2017
  • Recent GPUs have adopted cache memory to benefit general-purpose GPU (GPGPU) programs. However, unlike CPU programs, GPGPU programs typically have considerably less temporal/spatial locality. Moreover, the L1 data cache is used by many threads that access a data size typically considerably larger than the L1 cache, making it critical to bypass L1 data cache intelligently to enhance GPU cache performance. In this paper, we examine GPU cache access behavior and propose a simple hardware-based GPU cache bypassing method that can be applied to GPU applications without recompiling programs. Moreover, we introduce a hybrid method that integrates static profiling information and hardware-based bypassing to further enhance performance. Our experimental results reveal that hardware-based cache bypassing can boost performance for most benchmarks, and the hybrid method can achieve performance comparable to state-of-the-art compiler-based bypassing with considerably less profiling cost.

대형 윈도우에서 다중 분기 예측법을 이용하는 수퍼스칼라 프로세서의 프로화일링 성능 모델 (A Wide-Window Superscalar Microprocessor Profiling Performance Model Using Multiple Branch Prediction)

  • 이종복
    • 전기학회논문지
    • /
    • 제58권7호
    • /
    • pp.1443-1449
    • /
    • 2009
  • This paper presents a profiling model of a wide-window superscalar microprocessor using multiple branch prediction. The key idea is to apply statistical profiling technique to the superscalar microprocessor with a wide instruction window and a multiple branch predictor. The statistical profiling data are used to obtain a synthetical instruction trace, and the consecutive multiple branch prediction rates are utilized for running trace-driven simulation on the synthesized instruction trace. We describe our design and evaluate it with the SPEC 2000 integer benchmarks. Our performance model can achieve accuracy of 8.5 % on the average.

딥러닝 기반 사용자 특징 정보 모델링을 통한 사용자 안전 프로파일링 (Deep Learning Based User Safety Profiling Using User Feature Information Modeling)

  • 김계경
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권2호
    • /
    • pp.143-150
    • /
    • 2021
  • 산업 현장에서 발생하는 다양한 안전사고의 원인이 되는 위험 요소를 분석하여 사용자에게 발생하는 안전사고를 줄일 수 있는 지능형 기술 개발에 대한 필요성이 커지고 있다. 본 논문에서는 산업 현장에서 발생하는 안전사고와 관련된 사용자 정보를 특정하고 모델링하여 사용자에게 일어나는 안전 사고를 미리 예방할 수 있는 사용자 안전 프로파일링에 대한 기술을 제안하였다. 사용자 프로파일링은 사용자의 혈압, 맥박, 움직임 등의 정보로부터 사용자의 생체, 작업 패턴, 작업 유형에 대한 안전 상태를 정(positive)과 부(negative)로 특정 및 모델링하고 딥러닝 인공지능 분석기술을 이용하여 사용자의 안전 상태를 정상과 비정상 상태로 분류할 수 있도록 하였다. 제안된 기술의 타당성을 검증하기 위하여 산업 현장에서 근무하는 사용자 5명을 대상으로 10종 이상의 사용자 정보를 리빙랩에서 획득하여 지능형 분석 시스템을 학습한 후 5개의 테스트 셋을 이용하여 정확도 시험을 반복 시행하여 93.6%의 사용자 안전 프로파일링 시스템의 정확도를 얻을 수 있었다.

중소기업 프로파일링 분석을 통한 기술유출 방지 및 보호 모형 연구 (A Study on Empirical Model for the Prevention and Protection of Technology Leakage through SME Profiling Analysis)

  • 유인진;박도형
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제27권1호
    • /
    • pp.171-191
    • /
    • 2018
  • Purpose Corporate technology leakage is not only monetary loss, but also has a negative impact on the corporate image and further deteriorates sustainable growth. In particular, since SMEs are highly dependent on core technologies compared to large corporations, loss of technology leakage threatens corporate survival. Therefore, it is important for SMEs to "prevent and protect technology leakage". With the recent development of data analysis technology and the opening of public data, it has become possible to discover and proactively detect companies with a high probability of technology leakage based on actual company data. In this study, we try to construct profiles of enterprises with and without technology leakage experience through profiling analysis using data mining techniques. Furthermore, based on this, we propose a classification model that distinguishes companies that are likely to leak technology. Design/methodology/approach This study tries to develop the empirical model for prevention and protection of technology leakage through profiling method which analyzes each SME from the viewpoint of individual. Based on the previous research, we tried to classify many characteristics of SMEs into six categories and to identify the factors influencing the technology leakage of SMEs from the enterprise point of view. Specifically, we divided the 29 SME characteristics into the following six categories: 'firm characteristics', 'organizational characteristics', 'technical characteristics', 'relational characteristics', 'financial characteristics', and 'enterprise core competencies'. Each characteristic was extracted from the questionnaire data of 'Survey of Small and Medium Enterprises Technology' carried out annually by the Government of the Republic of Korea. Since the number of SMEs with experience of technology leakage in questionnaire data was significantly smaller than the other, we made a 1: 1 correspondence with each sample through mixed sampling. We conducted profiling of companies with and without technology leakage experience using decision-tree technique for research data, and derived meaningful variables that can distinguish the two. Then, empirical model for prevention and protection of technology leakage was developed through discriminant analysis and logistic regression analysis. Findings Profiling analysis shows that technology novelty, enterprise technology group, number of intellectual property registrations, product life cycle, technology development infrastructure level(absence of dedicated organization), enterprise core competency(design) and enterprise core competency(process design) help us find SME's technology leakage. We developed the two empirical model for prevention and protection of technology leakage in SMEs using discriminant analysis and logistic regression analysis, and each hit ratio is 65%(discriminant analysis) and 67%(logistic regression analysis).