• 제목/요약/키워드: User-specific system

검색결과 719건 처리시간 0.024초

MDCT 검출기의 x/y plane과 z축 분해능 팬텀 개발 및 유용성에 관한 연구 (A Study on the Development and usefulness of the x/y Plane and z Axis Resolution Phantom for MDCT Detector)

  • 김영균;한동균
    • 한국방사선학회논문지
    • /
    • 제16권1호
    • /
    • pp.67-75
    • /
    • 2022
  • 본 연구의 목적은 MDCT의 다양한 매개변수와 재구성 조건을 반영하고 z축과 x/y plane의 분해능을 동시에 평가할 수 있는 새로운 팬텀과 평가 방법을 정립하고 유용성을 파악하고자 한다. CT 장비는 Aquilion ONE(Cannon Medical System, Otawara, Japan)을 사용하였으며, 관전압 120 kV에 관전류는 260 mA, 그리고 재구성 영상은 D-FOV 300 mm2로 동일하게 설정하였다. 자체 제작한 SSP 측정 팬텀을 이용하여 고대조도 분해능과 절편두께 분해능을 평가하였다. 이때 갠트리 등각점부터의 거리와 재구성 알고리즘을 변화시켰다. 절편두께는 0.6 mm에서 10.0 mm까지 5단계로 재구성하였다. 영상의 분석은 Aquarius iNtuition Edition ver. 4.4.13.P6 software (Terarecon, California, USA)의 Profile tool을 이용하여 FWHM과 FWTM을 측정하였으며, ImageJ program(v1.53n, National Institutes of Health, USA)의 Plot profile tool을 사용하여 SPQI와 신호강도를 평가하였다. x/y plane의 고대조도 분해능을 평가한 결과, 갠트리 등각점에서 거리가 멀어질수록 2.5, 5.0, 10.0 mm의 절편두께에서 각각 4.09~11.99%, 4.12~35.52%, 4.70~37.64% 감소되었으며, 공칭 절편두께가 두꺼워질수록 감소폭이 증가되었다. 그리고 2.5, 5.0, 10.0 mm의 절편두께에서 High 알고리즘을 적용하면 고대조도 분해능이 각각 74.83, 15.18, 81.25% 증가되었다. x/y plane 및 z축의 절편두께 분해능을 평가한 결과, SSP 곡선에서 FWHM은 거의 일정하지만 사용자가 설정한 공칭 절편두께보다 모두 높게 측정되었다. 갠트리 등각점부터 거리가 멀어질수록 절편두께의 분해능이 감소되었다. 축방향 스캔이 나선형 방법보다 z축 FWHM과 FWTM이 더 증가되었다. 특히, 절편두께가 얇을수록 공칭 절편두께와 오차 범위가 증가되었다. 그리고 SPQI는 절편두께가 커질수록 증가되었으며 나선형 스캔이 축방향 스캔보다 90%에 가까워졌다. MDCT 장치의 성능을 평가할 수 있는 SSP 팬텀을 개발하여 x/y plane과 z축의 분해능을 비교 평가함으로서 노후 장비 관리와 화질 평가의 구체적인 방법으로 활용될 수 있으며, 진단 영상 분야에서 병변 감별에 큰 기여를 할 수 있을 것으로 기대한다.

수자원 분야 공익형 기술가치평가 시스템에 대한 연구 (A Study on Public Interest-based Technology Valuation Models in Water Resources Field)

  • 류승미;성태응
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.177-198
    • /
    • 2018
  • 최근 경제재로서 수자원(Water Resources)의 속성이 공공재 성격을 동시에 띠면서 수자원기술의 측정과 성과 관리 체계를 확보하고 활용해야 할 필요성이 제기되고 있다. 그 동안 수자원기술의 평가는 대부분 순현재가치(NPV)나 비용편익효과(B/C)를 바탕으로 경제성 평가(Feasibility Study) 혹은 기술(환경)영향평가(Technology Assessment)로 수행되어 왔으며, 연구성과의 확산과 피드백을 받을 수 있는 기술 기반 사업의 경제적 가치를 객관적으로 평가하는 모델은 체계화되지 않았다. 그리하여, 본 연구에서는 K-water(한국수자원공사)가 담당하고 있는 수자원분야의 기술적 특성에 적합한 기술평가 체계를 구축할 필요성을 느끼고, 공익형 수자원기술에 대한 기술가치평가 모델을 개발하여 사례를 실증하고자 한다. 본 연구에 적용된 K-water 평가대상기술은 공공재로서, 사회전반에 기여한 가치 및 성과를 측정하고 관리할 수 있는 도구로 활용 가능하다. 예를 들면, 사회전반에 기여한 가치를 산출하여, 편익의 파급효과에 대한 성과 홍보자료, 혹은 비용 투입 당위성에 대한 근거자료로 활용할 수 있고, 공공기술의 특성상 대규모 연구개발 투입 비용에 대한 정당성을 확보할 수 있다. 따라서, 공공재를 다루는 한국의 대표적 공기업인 K-water가 사업 운영상의 전략을 수립하고 투입개발 비용에 대한 성과산출 근거 기반을 구축할 수 있을 것으로 판단된다. 본 고에서는 K-water가 담당하고 있는 수자원분야의 기술적 특성에 적합한 기술평가 체계를 기반으로, 공익형 수자원기술에 대한 기술가치평가 모델을 개발하여 사례를 실증하였다. 특히, 일본 산업기술종합연구소(AIST)의 평가방법론을 활용하여 연관 편익항목을 기준으로 비용계정에 매칭시킨 후, 기존의 비용-편익 접근법과 FCF(Free Cash Flow)법의 평가체계를 활용하는 'K-water 고유모델'을 제시하였으며 이를 통해 K-water 연구성과 관리체계 상의 파이프라인을 구축하는 동시에 "해수담수화" 관련 기술에 대한 검증을 수행하였다. 수자원 분야 기술의 특성을 반영한 웹기반 가치평가시스템의 설계 구성로직과 평가프로세스를 분석하며, 기술통합관리시스템 상의 공익형 및 수익형 기술가치를 산출하기 위한 각 모델별 참조정보 및 DB 연계로직도 살펴본다. 종래의 타 분야 기술가치평가 시스템이 지닌 재무적 데이터 기반의 사업가치 산출로직에 수자원 특성이 반영된 정성평가지표의 정량화 지수를 함께 반영한 하이브리드형 평가모듈과 실제 웹기반 평가의 UI 구성화면을 검토한다. K-water의 가치평가 모형은 공익형과 수익형 수자원 기술을 구분하여 평가하게 되는데, 먼저 수익형 기술가치평가는 "기술의 경제성"이라고 하는 특성상 외부 산업유형의 수익(Profit)특성을 반영하여 화면을 설계 가능하다. 예를 들어 K-water 기술인벤토리 수도부문 기술은 수처리 멤브레인과 같이 수익 지향 기술이 다수 분포된다. 반면에, 공익형 기술가치평가는 공공의 편익(Benefit)과 비용(Cost)특성을 반영하여 화면을 설계하게 되는데, 댐과 같이 편익을 지향하는 기술을 평가하는데 활용된다. 또한 본 고에서 제시된 비용-편익 기반의 공익형 기술가치평가 모형(K-water 고유 평가모델)에 대한 적정성 검토를 위해 사회적 수명(20년)을 지닌 수자원 기술의 편익흐름 추정으로부터 실제 사례에 적용해 보았으며, 향후에는 다양한 사업환경 특성을 반영한 비즈니스 모델별 평가모형 검증을 추가적으로 수행하고자 한다.

시스템 다이내믹스 기법을 활용한 온라인 쇼핑몰의 전략에 관한 연구 : 소비자의 구매 및 재구매 행동을 중심으로 (A Study for Strategy of On-line Shopping Mall: Based on Customer Purchasing and Re-purchasing Pattern)

  • 이상근;민석기;강민철
    • Asia pacific journal of information systems
    • /
    • 제18권3호
    • /
    • pp.91-121
    • /
    • 2008
  • Electronic commerce, commonly known as e-commerce or eCommerce, has become a major business trend in these days. The amount of trade conducted electronically has grown extraordinarily by developing the Internet technology. Most electronic commerce has being conducted between businesses to customers; therefore, the researches with respect to e-commerce are to find customer's needs, behaviors through statistical methods. However, the statistical researches, mostly based on a questionnaire, are the static researches, They can tell us the dynamic relationships between initial purchasing and repurchasing. Therefore, this study proposes dynamic research model for analyzing the cause of initial purchasing and repurchasing. This paper is based on the System-Dynamic theory, using the powerful simulation model with some restriction, The restrictions are based on the theory TAM(Technology Acceptance Model), PAM, and TPB(Theory of Planned Behavior). This article investigates not only the customer's purchasing and repurchasing behavior by passing of time but also the interactive effects to one another. This research model has six scenarios and three steps for analyzing customer behaviors. The first step is the research of purchasing situations. The second step is the research of repurchasing situations. Finally, the third step is to study the relationship between initial purchasing and repurchasing. The purpose of six scenarios is to find the customer's purchasing patterns according to the environmental changes. We set six variables in these scenarios by (1) changing the number of products; (2) changing the number of contents in on-line shopping malls; (3) having multimedia files or not in the shopping mall web sites; (4) grading on-line communities; (5) changing the qualities of products; (6) changing the customer's degree of confidence on products. First three variables are applied to study customer's purchasing behavior, and the other variables are applied to repurchasing behavior study. Through the simulation study, this paper presents some inter-relational result about customer purchasing behaviors, For example, Active community actions are not the increasing factor of purchasing but the increasing factor of word of mouth effect, Additionally. The higher products' quality, the more word of mouth effects increase. The number of products and contents on the web sites have same influence on people's buying behaviors. All simulation methods in this paper is not only display the result of each scenario but also find how to affect each other. Hence, electronic commerce firm can make more realistic marketing strategy about consumer behavior through this dynamic simulation research. Moreover, dynamic analysis method can predict the results which help the decision of marketing strategy by using the time-line graph. Consequently, this dynamic simulation analysis could be a useful research model to make firm's competitive advantage. However, this simulation model needs more further study. With respect to reality, this simulation model has some limitations. There are some missing factors which affect customer's buying behaviors in this model. The first missing factor is the customer's degree of recognition of brands. The second factor is the degree of customer satisfaction. The third factor is the power of word of mouth in the specific region. Generally, word of mouth affects significantly on a region's culture, even people's buying behaviors. The last missing factor is the user interface environment in the internet or other on-line shopping tools. In order to get more realistic result, these factors might be essential matters to make better research in the future studies.

인공지능 기반 금융서비스의 공정성 확보를 위한 체크리스트 제안: 인공지능 기반 개인신용평가를 중심으로 (A Checklist to Improve the Fairness in AI Financial Service: Focused on the AI-based Credit Scoring Service)

  • 김하영;허정윤;권호창
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.259-278
    • /
    • 2022
  • 인공지능(AI)의 확산과 함께 금융 분야에서도 상품추천, 고객 응대 자동화, 이상거래탐지, 신용 심사 등 다양한 인공지능 기반 서비스가 확대되고 있다. 하지만 데이터에 기반한 기계학습의 특성상 신뢰성과 관련된 문제 발생과 예상하지 못한 사회적 논란도 함께 발생하고 있다. 인공지능의 효용은 극대화하고 위험과 부작용은 최소화할 수 있는 신뢰할 수 있는 인공지능에 대한 필요성은 점점 더 커지고 있다. 이러한 배경에서 본 연구는 소비자의 금융 생활에 직접 영향을 끼치는 인공지능 기반 개인신용평가의 공정성 확보를 위한 체크리스트 제안을 통해 인공지능 기반 금융서비스에 대한 신뢰 향상에 기여하고자 하였다. 인공지능 신뢰성의 주요 핵심 요소인 투명성, 안전성, 책무성, 공정성 중 포용 금융의 관점에서 자동화된 알고리즘의 혜택을 사회적 차별 없이 모두가 누릴 수 있도록 공정성을 연구 대상으로 선정하였다. 문헌 연구를 통해 공정성이 영향을 끼치는 서비스 운용의 전 과정을 데이터, 알고리즘, 사용자의 세 개의 영역으로 구분하고, 12가지 하위 점검 항목과 항목별 세부 권고안으로 체크리스트를 구성하였다. 구성한 체크리스트는 이해관계자(금융 분야 종사자, 인공지능 분야 종사자, 일반 사용자)별 계층적 분석과정(AHP)을 통해 점검 항목에 대한 상대적 중요도 및 우선순위를 도출하였다. 이해관계자별 중요도에 따라 세 개의 그룹으로 분류하여 분석한 결과 학습데이터와 비금융정보 활용에 대한 타당성 검증 및 신규 유입 데이터 모니터링의 필요성 등 실용적 측면에서 구체적인 점검 사항을 파악하였고, 금융 소비자인 일반 사용자의 경우 결과에 대한 해석 오류 및 편향성 확인에 대한 중요도를 높게 평가한다는 것을 확인할 수 있었다. 본 연구의 결과가 더 공정한 인공지능 기반 금융서비스의 구축과 운영에 기여할 수 있기를 기대한다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.

지역 관광 정보를 활용한 LBS 엔터테인먼트 컨텐츠 개발 방안에 관한 연구 (A Study on Strategy for developing LBS Entertainment content based on local tourist information)

  • 김현정
    • 디자인학연구
    • /
    • 제20권3호
    • /
    • pp.151-162
    • /
    • 2007
  • 모바일 IT와 무선인터넷의 발달에 따라 유선 인터넷 컨텐츠는 무선으로 확장하게 하였으며, 장소기반 관광 정보 서비스가 우선적으로 구축되고 있다. 그러나, 현재 모바일 기기로 서비스되고 있는 대부분의 관광정보는 관광지에 대한 간단한 설명, 교통편, 숙박, 음식점 등 매우 실용적이고 일반적이어서 편리하긴 하지만, 그다지 사용하고 싶은 매력은 없는 정보에 그치고 있다. 본 연구는 향후 유비쿼터스 도시 환경에서 활용 가능한 지역 관광정보를 활용한 LBS 엔터테인먼트 컨텐츠 개발 방안을 도출하기 위한 목적으로 진행되었다. 연구방법으로는 먼저, 지역정보 관련 서비스 및 연구의 국내외 동향을 살펴보고, 이를 기반으로 지역정보를 활용한 LBS 엔터테인먼트 컨텐츠 개발 방향 및 필요한 요소들을 추출하여, 사례 연구로서 부산시 중구 지역의 역사, 문화 컨텐츠 전달을 위한 모바일 투어 게임 "타임트렉"을 개발하였다. "타임트렉"프로토타입은 사용자의 보다 적극적인 참여와 흥미유발을 위해 롤플레잉 스토리 기반 게임과 물리적 장소에서 답을 찾아야 하는 오프라인 퀘스트 게임의 형식을 포함하는 모바일 투어 게임 형태로 구축되었다. 개발된 프로토타입은 제 10회 부산국제영화제 기간 동안투어코스의 한 장소였던 PIFF광장에서 사용자 테스트를 거쳤으며, 테스트 결과를 분석하여 향후 지역정보를 활용한 LBS 엔터테인먼트 컨텐츠 개발 방안을 도출, 제시하였다. 본 연구는 새롭고 재미있는 형태의 지역 역사, 문화 관광 경험을 창출하기 위해 LBS 모바일 기술과 스토리, 게임 등 엔터테인먼트 요소의 결합을 시도함으로써, 관광 산업과 모바일 컨텐츠 산업의 결합이라는 새로운 영역의 개척을 시도하였다는데 그 의의가 있다고 하겠다.순으로 광고물 제어에 유리하다. 그러므로 복합상업건축물 입면계획 시 일방적인 수평요소의 반복은 지양할 필요가 있다. 모서리계획 시에는, 첫째, 2개 이상의 가로와 접하는 건물의 경우 모서리부 광고 효과가 지배적이며 대부분 곡선돌출형이 사용되고 있었다. 그러므로 모서리 저층부를 필로티로 계획하여 보행흐름을 원활하게 하고 대신 입면을 투명하게 하여 간접광고(내부전시) 효과를 유도하는 것이 좋다. 특히 원형모서리는 건물 특화 성격이 강하므로 불가피할 경우 소형 액센트 광고 위치를 미리 벽면으로 할애하는 것이 경관 및 입면계획에 유리한 것으로 분석되었다. 불확실도 해석모형 등의 새로운 기능을 추가하여 제시하였다. 모든 입출력자료는 프로젝트 단위별로 운영되어 data의 관리가 손쉽도록 하였으며 결과를 DB에 저장하여 다른 모형에서도 적용할 수 있도록 하였다. 그리고 HyGIS-HMS 및 HyGIS-RAS 모형에서 강우-유출-하도 수리해석-범람해석 등이 일괄되게 하나의 시스템 내에서 구현될 수 있도록 하였다. 따라서 HyGIS와 통합된 수리, 수문모형은 국내 하천 및 유역에 적합한 시스템으로서 향후 HydroInformatics 구현을 염두에 둔 특화된 국내 수자원 분야 소프트웨어의 개발에 기본 토대를 제공할 것으로 판단된다.았다. 또한 저자들의 임상병리학적 연구결과가 다른 문헌에서 보고된 소아 신증후군의 연구결과와 큰 차이를 보이지 않음을 알 수 있었다. 자극에 차이가 있지 않나 추측되며 이에 관한 추후 연구가 요망된다. 총대장통과시간의 단축은 결장 분절 모두에서 줄어들어 나타났으나 좌측결장 통과시간의 감소 및 이로 인한 이 부위의 통과시간 비율의 저하가 가장 주요하였다. 이러한 결과는 차가운 생수 섭취가

  • PDF

적대적 생성 모델을 활용한 사용자 행위 이상 탐지 방법 (Anomaly Detection for User Action with Generative Adversarial Networks)

  • 최남웅;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.43-62
    • /
    • 2019
  • 한때, 이상 탐지 분야는 특정 데이터로부터 도출한 기초 통계량을 기반으로 이상 유무를 판단하는 방법이 지배적이었다. 이와 같은 방법론이 가능했던 이유는 과거엔 데이터의 차원이 단순하여 고전적 통계 방법이 효과적으로 작용할 수 있었기 때문이다. 하지만 빅데이터 시대에 접어들며 데이터의 속성이 복잡하게 변화함에 따라 더는 기존의 방식으로 산업 전반에 발생하는 데이터를 정확하게 분석, 예측하기 어렵게 되었다. 따라서 기계 학습 방법을 접목한 SVM, Decision Tree와 같은 모형을 활용하게 되었다. 하지만 지도 학습 기반의 모형은 훈련 데이터의 이상과 정상의 클래스 수가 비슷할 때만 테스트 과정에서 정확한 예측을 할 수 있다는 특수성이 있고 산업에서 생성되는 데이터는 대부분 정답 클래스가 불균형하기에 지도 학습 모형을 적용할 경우, 항상 예측되는 결과의 타당성이 부족하다는 문제점이 있다. 이러한 단점을 극복하고자 현재는 클래스 분포에 영향을 받지 않는 비지도 학습 기반의 모델을 바탕으로 이상 탐지 모형을 구성하여 실제 산업에 적용하기 위해 시행착오를 거치고 있다. 본 연구는 이러한 추세에 발맞춰 적대적 생성 신경망을 활용하여 이상 탐지하는 방법을 제안하고자 한다. 시퀀스 데이터를 학습시키기 위해 적대적 생성 신경망의 구조를 LSTM으로 구성하고 생성자의 LSTM은 2개의 층으로 각각 32차원과 64차원의 은닉유닛으로 구성, 판별자의 LSTM은 64차원의 은닉유닛으로 구성된 1개의 층을 사용하였다. 기존 시퀀스 데이터의 이상 탐지 논문에서는 이상 점수를 도출하는 과정에서 판별자가 실제데이터일 확률의 엔트로피 값을 사용하지만 본 논문에서는 자질 매칭 기법을 활용한 함수로 변경하여 이상 점수를 도출하였다. 또한, 잠재 변수를 최적화하는 과정을 LSTM으로 구성하여 모델 성능을 향상시킬 수 있었다. 변형된 형태의 적대적 생성 모델은 오토인코더의 비해 모든 실험의 경우에서 정밀도가 우세하였고 정확도 측면에서는 대략 7% 정도 높음을 확인할 수 있었다.

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

마켓 인사이트를 위한 상품 리뷰의 다차원 분석 방안 (Multi-Dimensional Analysis Method of Product Reviews for Market Insight)

  • 박정현;이서호;임규진;여운영;김종우
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.57-78
    • /
    • 2020
  • 인터넷의 발달로, 소비자들은 이커머스에서 손쉽게 상품 정보를 확인한다. 이때 활용되는 상품 리뷰는 사용자 경험을 토대로 작성되어 구매의사결정의 효율성을 높일 뿐만 아니라 상품 개발에 도움을 주기도 한다. 하지만, 방대한 양의 상품 리뷰에서 관심있는 평가차원의 세부내용을 파악하는 데에는 많은 시간과 노력이 소비된다. 예를 들어, 노트북을 구매하려는 소비자들은 성능, 무게, 디자인과 같은 평가차원에 대해 각 차원별로 비교 상품의 평가를 확인하고자 한다. 따라서 본 논문에서는 상품 리뷰에서 다차원 상품평가 점수를 자동적으로 생성하는 방안을 제안하고자 한다. 본 연구에서 제시하는 방안은 크게 2단계로 구성된다. 사전준비 단계와 개별상품평가 단계로, 대분류 상품군 리뷰를 토대로 사전에 생성된 차원분류모델과 감성분석모델이 개별상품의 리뷰를 분석하게 된다. 차원분류모델은 워드임베딩과 연관분석을 결합함으로써 기존 연구에서 차원과 단어들의 관련성을 찾기 위한 워드임베딩 방식이 문장 내 단어의 위치만을 본다는 한계를 보완한다. 감성분석모델은 정확한 극성 판단을 위해 구(phrase) 단위로 긍부정이 태깅된 학습데이터를 구성하여 CNN 모델을 생성한다. 이를 통해, 개별상품평가 단계에서는 구 단위의 리뷰에 준비된 모델들을 적용하고 평가차원별로 종합함으로써 다차원 평가점수를 얻을 수 있다. 본 논문의 실험에서는 대분류 상품군 리뷰 약 260,000건으로 평가모델을 구성하고, S사와 L사의 노트북 리뷰 각 1,011건과 1,062건을 실험데이터로 활용한다. 차원분류모델은 구로 분해한 개별상품 리뷰를 6개 평가차원으로 분류했고, 기존 워드임베딩 방식보다 연관분석을 결합한 모델의 정확도가 13.7% 증가했음을 볼 수 있었다. 감성분석모델은 문장보다 구 단위로 학습한 모델이 평가차원을 면밀히 분석함으로써 29.4% 더 높은 정확도를 보임을 확인했다. 본 연구를 통해 판매자, 소비자 모두가 상품의 다차원적 비교가 가능하다는 점에서 구매 및 상품 개발에 효율적인 의사결정을 기대할 수 있다.