• 제목/요약/키워드: Machine Tools

검색결과 1,300건 처리시간 0.032초

비전공자 학부생의 훈련데이터와 기초 인공신경망 개발 결과 분석 및 Orange 활용 (Analysis and Orange Utilization of Training Data and Basic Artificial Neural Network Development Results of Non-majors)

  • 허경
    • 실천공학교육논문지
    • /
    • 제15권2호
    • /
    • pp.381-388
    • /
    • 2023
  • 스프레드시트를 활용한 인공신경망 교육을 통해, 비전공자 학부생들은 인공신경망의 동작 원리을 이해하며 자신만의 인공신경망 SW를 개발할 수 있다. 여기서, 인공신경망의 동작 원리 교육은 훈련데이터의 생성과 정답 라벨의 할당부터 시작한다. 이후, 인공 뉴런의 발화 및 활성화 함수, 입력층과 은닉층 그리고 출력층의 매개변수들로부터 계산되는 출력값을 학습한다. 마지막으로, 최초 정의된 각 훈련데이터의 정답 라벨과 인공신경망이 계산한 출력값 간 오차를 계산하는 과정을 학습하고 오차제곱의 총합을 최소화하는 입력층과 은닉층 그리고 출력층의 매개변수들이 계산되는 과정을 학습한다. 스프레드시트를 활용한 인공신경망 동작 원리 교육을 비전공자 학부생 대상으로 실시하였다. 그리고 이미지 훈련데이터와 기초 인공신경망 개발 결과를 수집하였다. 본 논문에서는 12화소 크기의 소용량 이미지로 두 가지 훈련데이터와 해당 인공신경망 SW를 수집한 결과를 분석하고, 수집한 훈련데이터를 Orange 머신러닝 모델 학습 및 분석 도구에 활용하는 방법과 실행 결과를 제시하였다.

증강형 딥러닝 기반 미세먼지 예측 시스템 (Dust Prediction System based on Incremental Deep Learning)

  • 장성봉
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.301-307
    • /
    • 2023
  • 딥러닝은 심층신경망(Deep Neural Network)을 구축하고 대량의 훈련 데이터를 수집한 후, 구축된 신경망을 오랫동안 학습 시켜야 한다. 만약, 학습이 제대로 진행되지 않거나 과적합이 발생하면, 학습은 실패하게 된다. 현재까지 개발되고 있는 딥러닝 도구들을 사용할 경우, 훈련데이터 수집과 학습에 많은 시간이 소요된다. 하지만, 모바일 환경의 급격한 도래와 센서 데이터의 증가로 인해, 신경망 학습에 걸리는 시간을 획기적으로 줄일 수 있는 실시간 증강형 딥러닝 기술에 대한 요구가 급격하게 증가하고 있다. 본 연구에서는 미세먼지 센서를 장착한 아두이노 시스템을 사용하여 실시간 증강형 딥러닝 시스템을 구현 하였다. 구현된 시스템에서는 미세먼지 데이터를 5초마다 측정하고 최대 120개가 축적이 되면, 기존에 축적된 데이터와 새로이 축적된 데이터를 데이터셋으로 사용하여 학습을 수행하도록 하였다. 학습 수행을 위한 신경망은 입력층 1개, 은닉층 1개, 출력등 1개로 구성하였다. 구현된 시스템에 대한 성능을 평가하기 위해 학습 시간과 평균 제곱근 오차(root mean square error, RMSE)를 측정 하였다. 실험 결과, 평균 학습 오차는 0.04053796이었으며, 학습주기당(1 에포크) 평균 학습 시간은 3,447 초 정도의 시간이 걸렸다.

WUDAPT 절차를 활용한 창원시의 국지기후대 제작과 필터링 반경에 따른 비교 연구 (A Comparative Study on Mapping and Filtering Radii of Local Climate Zone in Changwon city using WUDAPT Protocol)

  • 김태경;박경훈;송봉근;김성현;정다은;박건웅
    • 한국지리정보학회지
    • /
    • 제27권2호
    • /
    • pp.78-95
    • /
    • 2024
  • 기후변화와 도시 문제를 고려해 다양한 영역에 걸친 환경계획의 수립과 비교를 위해서는 일관된 기준으로 분류된 지역 규모 수준의 공간자료 구축이 중요하다. 본 연구는 World Urban Database and Access Portal Tools(WUDAPT)에서 제시한 절차를 사용하여 기후 및 환경 연구가 활발히 이루어지고 있는 창원시의 Local Climate Zone(LCZ)를 분류하였다. 또한, 동질적인 기후 특성을 가진 지역일지라도 일부 격자가 다른 기후 특성으로 분류되는 파편화 문제를 개선하기 위해 필터링 기법을 적용하고 필터링 반경에 따른 LCZ 분류 특성을 비교하였다. 위성영상과 지상참조자료, 감독분류 머신러닝 기법인 Random Forest를 활용하여 필터링하지 않은 분류지도와 필터링 반경이 1, 2, 3인 분류지도를 제작하여 정확도를 비교하였다. 또한, 도시지역의 건물 유형에 따른 LCZ 분류특성을 비교하기 위해 GIS를 활용한 분류방법론에서 사용되는 도시형태지수를 제작하여 선행 연구에서 제시한 범위와 비교하였다. 그 결과, 전체 정확도는 필터링 반경이 1일 때 가장 높은 값을 보였다. 도시형태지수를 비교하였을 때 LCZ 유형별 차이는 적었고 대부분 선행연구의 범위를 만족하는 것을 확인하였다. 그러나 연구 결과를 통해 건물의 높이 정보를 반영하지 못하는 한계를 확인하였고, 이를 보완할 수 있는 데이터를 추가하여 분류한다면 더 높은 정확도의 결과물을 획득할 수 있을 것이라 판단된다. 연구 결과는 국내 도시기후 관련 환경 연구분야의 기초 공간자료 제작하기 위한 참고자료로 활용될 수 있을 것이다.

AdaBoost 알고리즘기반 SVM을 이용한 부실 확률분포 기반의 기업신용평가 (Corporate Credit Rating based on Bankruptcy Probability Using AdaBoost Algorithm-based Support Vector Machine)

  • 신택수;홍태호
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.25-41
    • /
    • 2011
  • 최근 몇 년간 SVM(support vector machines)기법은 패턴인식 또는 분류의사결정문제를 위한 분석기법으로서 기존의 데이터마이닝 기법과 비교할 때, 매우 높은 성과를 갖는 것으로 인식되어 왔다. 더 나아나 많은 연구자들은 SVM기법이 1980년대 이후 대표적인 예측 및 분류모형으로 인정받은 인공신경망기법(ANNs : Artificial Neural Networks)에 비해 더 성과가 좋다는 사실을 실증적으로 입증해 왔다(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al., 2005; Kim, 2003). 일반적으로 이와 같이 다양한 데이터마이닝 기법에 의해 분석되는 이진분류 또는 다분류 의사결정문제들은 특히 금융분야 등에 있어서 오분류비용에 민감하며, 이로 인한 오분류의 경제적 손실도 상대적으로 매우 크다고 할 수 있다. 따라서 기업부도예측모형과 같은 이진분류모형의 결과값을, 부도확률에 기초하여 정교하게 계산된 사후확률의 개념으로서 다분류의 신용등급평가의 문제로 변환할 필요가 있다. 그러나, SVM 모형의 결과값은 기본적으로 그와 같은 부도확률분포를 보여주지 않는다. 따라서, 그러한 확률분포를 정교하게 보여줄 방법을 제시할 필요가 있다(Platt, 1999; Drish, 2001). 본 연구는 AdaBoost 알고리즘기반의 SVM 모형을 이용하여, 이진분류모형으로서 IT 기업의 부실예측모형에 적용한 후, 이 SVM 모형의 예측결과를 SVM의 손실함수에 적용하여 계산된 값을 사후부도확률의 정규분포 특성에 따라 이를 구간화하여 IT기업에 대한 다분류 신용등급 평가의 문제로 전환시키는 방법을 제시하였다. 그리고 본 연구에서 제안하는 방법은 이러한 AdaBoost 알고리즘기반 SVM 모형이 각 기업이 고유한 신용위험(부도확률)을 갖고 있다는 조건하에서, 신용등급부여를 위한 부도확률분포 구간을 정교하게 조정함으로써 오분류 문제를 좀 더 줄일 수 있음을 제시하였다.

간호개념에 대한 기초조사 (The Empirical Exploration of the Conception on Nursing)

  • 백혜자
    • 대한간호학회지
    • /
    • 제11권1호
    • /
    • pp.65-87
    • /
    • 1981
  • The study is aimed at exploring concept held by clinical nurses of nursing. The data were collected from 225 nurses conviniently selected from the population of nurses working in Kang Won province. Findings include. 1) Nurse's Qualification. The respondents view that specialized knowledge is more important qualification of the nurse. Than warm personality. Specifically, 92.9% of the respondents indicated specialized knowledge as the most important qualification while only 43.1% indicated warm personality. 2) On Nursing Profession. The respondents view that nursing profession as health service oriented rather than independent profession specifically. This suggests that nursing profession is not consistentic present health care delivery system nor support nurses working independently. 3) On Clients of Nursing Care The respondents include patients, family and the community residents in the category of nursing care. Specifically, 92.0% of the respondents view that patient is the client, while only 67.1% of nursing student and 74.7% of herself. This indicates the lack of the nurse's recognition toward their clients. 4) On the Priority of Nursing care. Most of the respondents view the clients physical psychological respects as important component of nursing care but not the spiritual ones. Specially, 96.0% of the respondents indicated the physical respects, 93% psychological ones, while 64.1% indicated the spiritual ones. This means the lack of comprehensive conception on nursing aimension. 5) On Nursing Care. 91.6% of the respondents indicated that nursing care is the activity decreasing pain or helping to recover illness, while only 66.2% indicated earring out the physicians medical orders. 6) On Purpose of Nursing Care. 89.8% of the respondents indicated preventing illness and than 76.6% of them decreasing 1;ai of clients. On the other hand, maintaining health has the lowest selection at the degree of 13.8%. This means the lack of nurses' recognition for maintaining health as the most important point. 7) On Knowledge Needed in Nursing Care. Most of the respondents view that the knowledge faced with the spot of nursing care is needed. Specially, 81.3% of the respondents indicated simple curing method and 75.1%, 73.3%, 71.6% each indicated child nursing, maternal nursing and controlling for the communicable disease. On the other hand, knowledge w hick has been neglected in the specialized courses of nursing education, that is, thinking line among com-w unity members, overcoming style against between stress and personal relation in each home, and administration, management have a low selection at the depree of 48.9%,41.875 and 41.3%. 8) On Nursing Idea. The highest degree of selection is that they know themselves rightly, (The mean score measuring distribution was 4.205/5) In the lowest degree,3.016/5 is that devotion is the essential element of nursing, 2.860/5 the religious problems that human beings can not settle, such as a fatal ones, 2,810/5 the nursing profession is worth trying in one's life. This means that the peculiarly essential ideas on the professional sense of value. 9) On Nursing Services. The mean score measuring distribution for the nursing services showed that the inserting of machine air way is 2.132/5, the technique and knowledge for surviving heart-lung resuscitating is 2.892/s, and the preventing air pollution 3.021/5. Specially, 41.1% of the respondents indicated the lack of the replied ratio. 10) On Nurses' Qualifications. The respondents were selected five items as the most important qualifications. Specially, 17.4% of the respondents indicated specialized knowledge, 15.3% the nurses' health, 10.6% satisfaction for nursing profession, 9.8% the experience need, 9.2% comprehension and cooperation, while warm personality as nursing qualifications have a tendency of being lighted. 11) On the Priority of Nursing Care The respondents were selected three items as the most important component. Most of the respondents view the client's physical, spiritual: economic points as important components of nursing care. They showed each 36.8%, 27.6%, 13.8% while educational ones showed 1.8%. 12) On Purpose of Nursing Care. The respondents were selected four items as the most important purpose. Specially,29.3% of the respondents indicated curing illness for clients, 21.3% preventing illness for client 17.4% decreasing pain, 15.3% surviving. 13) On the Analysis of Important Nursing Care Ranging from 5 point to 25 point, the nurses' qualification are concentrated at the degree of 95.1%. Ranging from 3 point to 25, the priorities of nursing care are concentrated at the degree of 96.4%. Ranging from 4 point to 16, the purpose of nursing care is concentrated at the degree of 84.0%. 14) The Analysis, of General Characteristics and Facts of Nursing Concept. The correlation between the educational high level and nursing care showed significance. (P < 0.0262). The correction between the educational low level and purpose of nursing care showed significance. (P < 0.002) The correlation between nurses' working yeras and the degree of importance for the purpose of nursing care showed significance (P < 0.0155) Specially, the most affirmative answers were showed from two years to four ones. 15) On Nunes' qualification and its Degree of Importance The correlation between nurses' qualification and its degree of importance showed significance. (r = 0.2172, p< 0.001) 0.005) B. General characteristics of the subjects The mean age of the subject was 39 ; with 38.6% with in the age range of 20-29 ; 52.6% were male; 57.9% were Schizophrenia; 35.1% were graduated from high school or high school dropouts; 56.l% were not have any religion; 52.6% were unmarried; 47.4% were first admission; 91.2% were involuntary admission patients. C. Measurement of anxiety variables. 1. Measurement tools of affective anxiety in this study demonstrated high reliability (.854). 2. Measurement tools of somatic anxiety in this study demonstrated high reliability (.920). D. Relationship between the anxiety variables and the general characteristics. 1. Relationship between affective anxiety and general characteristics. 1) The level of female patients were higher than that of the male patient (t = 5.41, p < 0.05). 2) Frequencies of admission were related to affective anxiety, so in the first admission the anxiety level was the highest. (F = 5.50, p < 0.005). 2, Relationship between somatic anxiety and general characteristics. 1) The age range of 30-39 was found to have the highest level of the somatic anxiety. (F = 3.95, p < 0.005). 2) Frequencies of admission were related to the somatic anxiety, so .in first admission the anxiety level was the highest. (F = 9.12, p < 0.005) 0. Analysis of significant anxiety symptoms for nursing intervention. 1. Seven items such as dizziness, mental integration, sweating, restlessness, anxiousness, urinary frequency and insomnia, init. accounted for 96% of the variation within the first 24 hours after admission. 2. Seven items such as fear, paresthesias, restlessness, sweating insomnia, init., tremors and body aches and pains accounted for 84% of the variation on the 10th day after admission.

  • PDF

<사례보고> 농작업 환경개선을 위한 한국형 참여형 개선활동 교육(PAOT)의 개발과 실제 적용 사례 (<Field action report> Development and Application of Participatory Action Oriented Training(PAOT) for Improvement of Agricultural Working Environment in Korea)

  • 김진석;우극현;민영선;김보균;최경숙;박기수
    • 농촌의학ㆍ지역보건
    • /
    • 제35권4호
    • /
    • pp.417-427
    • /
    • 2010
  • 본 연구는 한국형 농업인 참여형 개선활동 기법(Participatory Action Oriented Training, PAOT) 교육 프로그램을 개발하고 적용함으로써 더 많은 지역으로 이 프로그램이 확산되는 데 기여하고자 시도하였다. 연구진은 농작업 환경 체크리스트를 노지, 과수, 시설, 축산, 복합농 등의 5개 범주로 구분하여 실제 우리나라 농작업 현장에 적합한 것으로 개발하였다. 체크리스트는 농작물 운반과 보관, 작업대와 연장 도구, 안전한 농기계 사용, 농작업 환경관리, 휴식과 일의 분담, 기초안전관리 등 6개의 대분류에 38개의 문항으로 구성하였다. 각 대분류별로 4-7개의 문항으로 구성이 된다. 또한 체크리스트와 교육에 포함할 모범사례들은 연구진이 직접 촬영한 사진과 외국의 사례를 참고로 하여 삽화 전문가에게 의뢰하여 제작한 삽화로 구성하였다. 이렇게 개발한 교재를 바탕으로 한국형 PAOT 프로그램을 개발하여, 경상북도의 4개 농촌 마을의 농업인 94명을 대상으로 2007년 7월에서 2008년 10월까지 4회의 참여형 농작업환경 개선교육을 수행하였다. 교육이 종료 3개월 후 연구진들이 직접 참여 농업인들의 농가를 방문하여 농업인들의 개선계획 실천여부를 확인하였고, 1시간 30분 정도 소요되는 "개선성과 중간 평가회"를 개최하여 개별 마을민들의 개선 성과를 전체 참가자들이 공유하는 시간을 가졌다. 전체 대상자 307명(남자 142명, 여자 165명)중 남자 59(41.5%)명, 여자 35(21.2%)명 등 총 94(30.6%)명이 PAOT 교육에 참가하였다. 전체 교육의 진행시간에 대한 적절성에서는 94.8%가 '만족한다' 이상으로 응답하였고, 교육의 전반적인 내용에는 98.9%가 '만족한다' 이상으로 응답하였고, 농작업 체크리스트 실습에는 100.0%가 '만족한다'고 응답하는 등 만족도 조사 문항 모두 90% 이상에서 만족한다고 응답하였다. 본 연구에서 개발된 농작업 환경 개선을 위한 PAOT 기법은 자발적이면서 지속적으로 농업인의 안전과 건강을 유지할 수 있는 하나의 대안이 될 수 있을 것으로 기대된다. 이를 위해서는 향후 보다 객관적인 연구가 수행되어야 할 것이며 더 많은 실제적인 적용 경험을 축적하는 것이 필요할 것이다.

기업의 SNS 노출과 주식 수익률간의 관계 분석 (The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea)

  • 김태환;정우진;이상용
    • Asia pacific journal of information systems
    • /
    • 제24권2호
    • /
    • pp.233-253
    • /
    • 2014
  • Can the stock market really be predicted? Stock market prediction has attracted much attention from many fields including business, economics, statistics, and mathematics. Early research on stock market prediction was based on random walk theory (RWT) and the efficient market hypothesis (EMH). According to the EMH, stock market are largely driven by new information rather than present and past prices. Since it is unpredictable, stock market will follow a random walk. Even though these theories, Schumaker [2010] asserted that people keep trying to predict the stock market by using artificial intelligence, statistical estimates, and mathematical models. Mathematical approaches include Percolation Methods, Log-Periodic Oscillations and Wavelet Transforms to model future prices. Examples of artificial intelligence approaches that deals with optimization and machine learning are Genetic Algorithms, Support Vector Machines (SVM) and Neural Networks. Statistical approaches typically predicts the future by using past stock market data. Recently, financial engineers have started to predict the stock prices movement pattern by using the SNS data. SNS is the place where peoples opinions and ideas are freely flow and affect others' beliefs on certain things. Through word-of-mouth in SNS, people share product usage experiences, subjective feelings, and commonly accompanying sentiment or mood with others. An increasing number of empirical analyses of sentiment and mood are based on textual collections of public user generated data on the web. The Opinion mining is one domain of the data mining fields extracting public opinions exposed in SNS by utilizing data mining. There have been many studies on the issues of opinion mining from Web sources such as product reviews, forum posts and blogs. In relation to this literatures, we are trying to understand the effects of SNS exposures of firms on stock prices in Korea. Similarly to Bollen et al. [2011], we empirically analyze the impact of SNS exposures on stock return rates. We use Social Metrics by Daum Soft, an SNS big data analysis company in Korea. Social Metrics provides trends and public opinions in Twitter and blogs by using natural language process and analysis tools. It collects the sentences circulated in the Twitter in real time, and breaks down these sentences into the word units and then extracts keywords. In this study, we classify firms' exposures in SNS into two groups: positive and negative. To test the correlation and causation relationship between SNS exposures and stock price returns, we first collect 252 firms' stock prices and KRX100 index in the Korea Stock Exchange (KRX) from May 25, 2012 to September 1, 2012. We also gather the public attitudes (positive, negative) about these firms from Social Metrics over the same period of time. We conduct regression analysis between stock prices and the number of SNS exposures. Having checked the correlation between the two variables, we perform Granger causality test to see the causation direction between the two variables. The research result is that the number of total SNS exposures is positively related with stock market returns. The number of positive mentions of has also positive relationship with stock market returns. Contrarily, the number of negative mentions has negative relationship with stock market returns, but this relationship is statistically not significant. This means that the impact of positive mentions is statistically bigger than the impact of negative mentions. We also investigate whether the impacts are moderated by industry type and firm's size. We find that the SNS exposures impacts are bigger for IT firms than for non-IT firms, and bigger for small sized firms than for large sized firms. The results of Granger causality test shows change of stock price return is caused by SNS exposures, while the causation of the other way round is not significant. Therefore the correlation relationship between SNS exposures and stock prices has uni-direction causality. The more a firm is exposed in SNS, the more is the stock price likely to increase, while stock price changes may not cause more SNS mentions.

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

비접촉 데이터 사회와 아카이브 재영토화 (Contactless Data Society and Reterritorialization of the Archive )

  • 조민지
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.5-32
    • /
    • 2024
  • 한국 정부가 UN의 2022년 전자정부 발전 지수에서 UN가입 193개국 중 3위에 랭크됐다. 그동안 꾸준히 상위국으로 평가된 한국은 분명 세계 전자정부의 선도국이라 할 수 있다. 전자정부의 윤활유는 데이터다. 데이터는 그 자체로 정보가 아니고 기록도 아니지만 정보와 기록의 원천이며 지식의 자원이다. 전자적 시스템을 통한 행정 행위가 보편화된 이후 당연히 데이터에 기반한 기록의 생산과 기술이 확대되고 진화하고 있다. 기술은 가치중립적인 듯 보이지만 사실 그 자체로 특정 세계관을 반영하고 있다. 더구나 비물질적 유통을 기반으로 하는 디지털 세계, 온라인 네트워크의 또 다른 아이러니는 반드시 물리적 도구를 통해서만 접속하고 접촉할 수 있다는 점이다. 디지털 정보는 논리적 대상이지만 반드시 어떤 유형이든 그것을 중계할 장치 없이는 디지털 자원을 읽어 내거나 활용할 수 없다. 초연결, 초지능을 무기로 하는 새로운 기술의 디지털 질서는 전통적인 권력 구조에 깊은 영향력을 끼칠 뿐만 아니라 기존의 정보 및 지식 전달 매개체에도 마찬가지의 영향을 미치고 있다. 더구나 데이터에 기반한 생성형 인공지능을 비롯해 새로운 기술과 매개가 단연 화두다. 디지털 기술의 전방위적 성장과 확산이 인간 역능의 증강과 사유의 외주화 상황까지 왔다고 볼 수 있을 것이다. 여기에는 딥 페이크를 비롯한 가짜 이미지, 오토 프로파일링, 사실처럼 생성해 내는 AI 거짓말(hallucination), 기계 학습데이터의 저작권 침해에 이르기까지 다양한 문제점 또한 내포하고 있다. 더구나 급진적 연결 능력은 방대한 데이터의 즉각적 공유를 가능하게 하고 인지 없이 행위를 발생시키는 기술적 무의식에 의존하게 된다. 그런 점에서 지금의 기술 사회의 기계는 단순 보조의 수준을 넘어서고 있으며 기계의 인간 사회 진입은 고도의 기술 발전에 따른 자연적인 변화 양상이라고 하기에는 간단하지 않은 지점이 존재한다. 시간이 지나며 기계에 대한 관점이 변화하게 될 것이기 때문이다. 따라서 중요한 것은 기계를 통한 커뮤니케이션, 행위의 결과로서의 기록이 생산되고 사용되는 방식의 변화가 의미하는 사회문화적 함의에 있다. 아카이브 영역에서도 초지능, 초연결사회를 향한 기술의 변화로 인해 데이터 기반 아카이브 사회는 어떤 문제에 직면하게 될 것인지, 그리고 그 속에서 누가 어떻게 기록과 데이터의 지속적 활동성을 입증하고 매체 변화의 주요 동인이 될 것인가에 대한 연구가 필요한 시점이다. 본 연구는 아카이브가 행위의 결과인 기록뿐만 아니라 데이터를 전략적 자산으로 인식할 필요성에서 시작했다. 이를 통해 전통적 경계를 확장하고 데이터 중심 사회에서 어떻게 재영토화를 이룰 수 있을지를 알아보았다.