통합 검색 | Korea Science

중립도 기반 선택적 단어 제거를 통한 유용 리뷰 분류 정확도 향상 방안 (Increasing Accuracy of Classifying Useful Reviews by Removing Neutral Terms)

이민식;이홍주
- 지능정보연구
- /
- 제22권3호
- /
- pp.129-142
- /
- 2016
전자상거래에서 소비자들의 구매 의사결정에 판매 제품을 이미 구매하여 사용한 고객의 리뷰가 중요한 영향을 미치고 있다. 전자상거래 업체들은 고객들이 제품 리뷰를 남기도록 유도하고 있으며, 구매고객들도 적극적으로 자신의 경험을 공유하고 있다. 한 제품에 대한 고객 리뷰가 너무 많아져서 구매하려는 제품의 모든 리뷰를 읽고 제품의 장단점을 파악하는 것은 무척 힘든 일이 되었다. 전자상거래 업체들과 연구자들은 텍스트 마이닝을 활용하여 리뷰들 중에서 유용한 리뷰들의 속성을 파악하거나 유용한 리뷰와 유용하지 않은 리뷰를 미리 분류하는 노력을 수행하고 있다. 고객들에게 유용한 리뷰를 필터링하여 전달하는 방안이다. 본 연구에서는 문서-단어 매트릭스에서 단어의 제거 기준으로 온라인 고객 리뷰가 유용한 지, 그렇지 않은지를 구분하는 문제에서 단어들이 유용 리뷰 집합과 유용하지 않은 리뷰집합에 중복하여 등장하는 정도를 측정한 중립도를 제시한다. 제시한 중립도를 희소성과 함께 분석에 활용하여 제거할 단어를 선정한 후에 각 분류 알고리즘의 성과를 비교하였다. 최적의 성과를 보이는 중립도를 찾았으며, 희소성과 중립도에 따라 단어를 선택적으로 제거하였다. 실험은 Amazon.com의 'Cellphones & Accessories', 'Movies & TV program', 'Automotive', 'CDs & Vinyl', 'Clothing, Shoes & Jewelry' 제품 분야 고객 리뷰와 사용자들의 리뷰에 대한 평가를 활용하였다. 전체 득표의 수가 4개 이상인 리뷰 중에서 제품 카테고리 별로 유용하다고 판단되는 1,500개의 리뷰와 유용하지 않다고 판단되는 1,500개의 리뷰를 무작위로 추출하여 연구에 사용하였다. 데이터 집합에 따라 정확도 개선 정도가 상이하며, F-measure 기준으로는 두 알고리즘에서 모두 희소성과 중립도에 기반하여 단어를 제거하는 방안이 더 성과가 높았다. 하지만 Information Gain 알고리즘에서는 Recall 기준으로는 5개 제품 카테고리 데이터에서 언제나 희소성만을 기준으로 단어를 제거하는 방안의 성과가 높았으며, SVM에서는 전체 단어를 활용하는 방안이 Precision 기준으로 성과가 더 높았다. 따라서, 활용하는 알고리즘과 분석 목적에 따라서 단어 제거 방안을 고려하는 것이 필요하다.
https://doi.org/10.13088/jiis.2016.22.3.129 인용 PDF KSCI

유전자 알고리즘을 이용한 동적통행배정에 관한 연구 (Dynamic Traffic Assignment Using Genetic Algorithm)

박경철;박창호;전경수;이성모
- 대한공간정보학회지
- /
- 제8권1호
- /
- pp.51-63
- /
- 2000
최근 교통문제를 해결하기 위한 방법으로 교통계획분야에 GIS나 ITS를 활용한 다양한 연구가 활발히 진행 중에 있다. 이와 함께 정보환경의 급격한 발달과 더불어 대안 경로의 선정, 또는 교통예보 서비스와 같은 온라인 상에서의 교통정보 제공이 이루어지고 있어 GIS 환경 내에서도 가로망의 교통량을 정확하게 예측할 수 있는 기능이 요구되고 있어 통행배정모형의 중요성이 증가하고 있다. 그런데, 전통적인 정적 통행배정모형은 급변하는 교통상황에 적합하지 않기 때문에 실시간 교통상황에 대한 교통흐름을 예측할 수 있는 동적 통행배정모형의 개발이 요구되고 있다. 그러나, 동적 통행배정모형은 시공간적인 변수들의 복잡성으로 인해서 그 최적해를 찾는데 많은 수학적인 어려움과 제약조건이 존재한다. 따라서, 이를 해결하기 위한 여러 가지 해법이 연구되어왔지만, 기존의 방법은 목적함수나 제약조건이 convex(하지 않은 경우에는 적용이 불가능한 단점을 가지고 있다. 본 연구에서는 인공지능방법(Artificial Intelligence Technique)의 한 분야로 활발히 연구되고 있는 유전자 알고리즘(Genetic Algorithm)을 동적 통행배정 모형에 도입하여 그 해결 방법을 제시하였다. 논문에서 사용한 동적 통행배정모형은 제약조건이 convex(하지 않은 Merchant-Nemhauser모형이고, 새로운 해결기법으로 사용된 유전자 알고리즘은 일반적인 제약조건을 처리할 수 있다고 알려진 GENOCOP III시스템이다. 새로 도입된 방법의 효율성과 유의성을 검증하기 위해 간단한 네트워크에 적용하였다. 그 결과 GENOCOP III 시스템이 계산과정의 효율성에 있어서 기존의 비선형 해법 알고리즘보다 우수한 것으로 입증되었다.연구가 진행되어야 할 것이다. 실질적으로 성감별 수정란의 대량생산이 가능할 것으로 사료되며, 농가차원에서 산업적 실용화가 될 수 있을 것으로 기대한다.twork descrition)를 통해 교통분석후의 제반 교통특성(교통량, 교통량/용량 비(比), 속도 등)을 교통망상에 표시할 수 있음으로서 의사결정에 보다 많은 도움을 줄 수 있을 것이다. 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을
PDF

전자결제서비스 이용 사업자 폐업 예측에서 비재무정보 활용을 통한 머신러닝 모델의 정확도 향상에 관한 연구 (A study on improving the accuracy of machine learning models through the use of non-financial information in predicting the Closure of operator using electronic payment service)

공현정;황유진;박성혁
- 지능정보연구
- /
- 제29권3호
- /
- pp.361-381
- /
- 2023
기업 부도 예측에 관한 연구는 재무정보를 중심으로 연구되어 왔다. 기업의 재무정보는 분기별로 갱신되기 때문에 실시간으로 기업의 폐업 가능성을 예측하는 데 있어 적시성이 부족하게 되는 문제가 발생한다. 이를 개선하고자 하는 평가 기업에서는 대상 기업의 건전성을 판단하기 위한 재무정보 외의 정보를 활용한 기업의 건전성을 판단하는 방법이 필요하다. 이를 위해 정보 기술의 발달로 기업에 대한 비재무정보 수집이 용이해지면서 기업 부도 예측에 재무정보 외의 추가적인 변수와 여러 가지 방법론을 적용하는 연구가 진행되어 왔으며, 이 중에서도 어떤 변수들이 기업의 부도를 예측하는데 영향을 주는지를 밝히는 것이 중요한 연구 과제가 되었다. 본 연구에서는 전자결제서비스를 이용하는 사업자의 폐업을 예측할 때 비재무정보를 구성하는 전자결제 정보들이 얼마나 영향을 미치는지를 살펴보았으며, 재무정보와 비재무정보 결합에 따른 폐업 예측 정확도 차이를 살펴보았다. 구체적으로, 재무정보 모형과 비재무정보 모형, 그리고 이를 결합한 모형으로 구성된 세 가지 연구 모형을 설계하였으며 Multi Layer Perceptron(MLP) 알고리즘을 포함한 여섯 가지 알고리즘으로 폐업 예측 정확도를 확인하였다. 재무정보와 비재무정보를 결합한 모형이 가장 높은 예측 정확도를 보였으며, 그 다음으로는 비재무정보 모형, 재무정보 모형의 순서로 예측 정확도가 확인되었다. 알고리즘별 폐업 예측 정확도는 여섯 가지의 알고리즘 중 XGBoost가 가장 높은 예측 정확도를 보였다. 사업자의 폐업 예측에 활용된 전체 87개의 변수를 대상으로 상대적 중요도를 살펴본 결과 폐업 예측에 중요하게 영향을 미친 변수는 상위 20개 중 70% 이상이 비재무정보인 것으로 확인되었다. 이를 통해 비재무정보의 전자결제 정보가 사업자의 폐업을 예측하는 중요한 변수임을 확인하였으며, 비재무 정보가 재무정보의 대안적 정보로서 활용할 수 있는 가능성 역시 살펴볼 수 있었다. 본 연구를 기반으로 사업자의 폐업을 예측할 수 있는 정보로서 비재무정보의 수집과 활용에 대한 중요성을 인식하고 기업의 의사결정에 활용할 수 있는 방안에 대해서도 다루었다.
https://doi.org/10.13088/jiis.2023.29.3.361 인용 PDF

공간 통계 데이터의 시각화 기술 및 시스템 개발 (Visualization Technique of Spatial Statistical Data and System Implementation)

백룡;홍광수;양승훈;김병규
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제2권12호
- /
- pp.849-854
- /
- 2013
본 논문에서는 공간 데이터를 기반으로 한 도시의 다양한 통계 정보를 제안된 알고리즘을 통해서 시각화하고 시각화된 데이터를 지도와 사상(Mapping)하여 분석할 수 있게 할 뿐만 아니라 공간적 정보를 기반으로 의사 결정을 하는 경우 활용할 수 있는 문서를 사용자의 간단한 조작으로 프로그래밍 방식에 의해 작성해주는 시스템을 제안한다. 제안된 기법은 2차원 지도 데이터에서 특징데이터 값에 대해 색을 이용하여 표현하는 기법인 히트 맵 분석 (Heat Map Analysis)기법과 공간적 근접성을 정의할 때 이용되는 버퍼링 분석 (Buffering Analysis) 기법을 활용한다. 본 시스템을 통해서 공간적 정보를 시각화를 한다면 지역의 분포된 다양한 공간적 정보를 쉽게 파악할 수 있을 것이다. 또한 분석된 정보를 기반으로 제공되고 있는 문서 자동생성기능을 활용한다면 표현된 공간적 정보의 문서화에 필요한 많은 시간과 비용을 절감할 수 있을 것으로 기대된다.
https://doi.org/10.3745/KTSDE.2013.2.12.849 인용 PDF KSCI

심박수변이도 분석을 위한 확률적 지식기반 모형 (A probabilistic knowledge model for analyzing heart rate variability)

손창식;강원석;최락현;박형섭;한성욱;김윤년
- 한국산업정보학회논문지
- /
- 제20권3호
- /
- pp.61-69
- /
- 2015
본 논문에서는 이산 웨이블릿 변환을 통해 추출된 시간 영역과 주파수 영역의 특징들을 활용하여 심박수변이도를 확률적인 지식으로 분석할 수 있는 방법을 제안하였다. 제안된 방법에서 지식획득 알고리즘은 규칙생성과 규칙평가 단계로 구성되어 있으며, 규칙생성에서는 ROC 분석을 통해 수치적인 속성값을 이산화된 구간으로 변환하고, 서로 다른 의사결정값을 포함하는 구간들 사이에 일관성 정도를 비교함으로써 감축된 규칙-집합을 생성한다. 이때 규칙-집합 내에 각 규칙에 대해서 확률적 해석을 위한 3가지 척도를 추정하였다. 제안된 모형의 효과성은 심혈관질환 병력을 가진 58명의 심전도 데이터로부터 심방세동을 식별할 수 있는 5가지 규칙을 생성하였고, 이들 규칙의 분별력을 평가하였다. 실험결과, 제안된 모형으로부터 생성된 지식은 4가지 성능평가 척도에 대해서 각각 93%의 정확도를 보여주었다.
https://doi.org/10.9723/jksiis.2015.20.3.061 인용 PDF KSCI

대화식 의사결정나무를 이용한 보건의료 데이터 질 관리 알고리즘 개발: 당뇨환자의 고혈압 동반을 중심으로 (Development of Healthcare Data Quality Control Algorithm Using Interactive Decision Tree: Focusing on Hypertension in Diabetes Mellitus Patients)

황규연;이은숙;김고원;홍성옥;박정선;곽미숙;이예진;임채혁;박태현;박종호;강성홍
- 보건의료산업학회지
- /
- 제10권3호
- /
- pp.63-74
- /
- 2016
Objectives : There is a need to develop a data quality management algorithm to improve the quality of healthcare data using a data quality management system. In this study, we developed a data quality control algorithms associated with diseases related to hypertension in patients with diabetes mellitus. Methods : To make a data quality algorithm, we extracted the 2011 and 2012 discharge damage survey data from diabetes mellitus patients. Derived variables were created using the primary diagnosis, diagnostic unit, primary surgery and treatment, minor surgery and treatment items. Results : Significant factors in diabetes mellitus patients with hypertension were sex, age, ischemic heart disease, and diagnostic ultrasound of the heart. Depending on the decision tree results, we found four groups with extreme values for diabetes accompanying hypertension patients. Conclusions : There is a need to check the actual data contained in the Outlier (extreme value) groups to improve the quality of the data.
https://doi.org/10.12811/kshsm.2016.10.3.063 인용 PDF KSCI

기상 데이터를 활용한 가스사고위험 예보에 관한 연구 (A Study on Forecasting Risk of Gas Accident using Weather Data)

오정석
- 한국가스학회지
- /
- 제22권5호
- /
- pp.107-113
- /
- 2018
사고 데이터는 사고의 경각심을 보여주거나 유사사례를 검토 할 때 활용되기는 하나 사고 데이터 본질에 대한 분석이나 사고와 주변 환경요소와의 연관성에 대한 분석은 굉장히 미흡하다. 따라서 사고와 연관된 데이터와 함께 분석하는 기법을 개발하여 특정 지역에 대한 사고 가능성을 제시하는 것이 대단히 필요하다. 본 연구는 과거 기상정보 데이터와 사고 및 신고 데이터를 기반으로 지역별 사고 가능성을 산출하는 분석 모델 개발하고 시스템을 구현하는 것을 목적으로 한다. 한국의 다수 지역에 대해 기상과 사고간의 개연성을 토대로 선택적 사용자 환경변수가 적용된 k-NN 과 의사결정트리 알고리즘 모델이 생성되도록 시스템을 설계하고 개발한다. 향후, 본 연구에서 개발된 모델은 좀 더 협소한 지역의 위험도를 분석하고 산출하는데 사용할 계획이다.
https://doi.org/10.7842/kigas.2018.22.5.107 인용 PDF KSCI

유전자알고리즘을 이용한 웨이블릿분석 및 인공신경망기법의 통합모형구축 (A Hybrid System of Wavelet Transformations and Neural Networks Using Genetic Algorithms: Applying to Chaotic Financial Markets)

Shin, Taeksoo;Han, Ingoo
- 한국데이타베이스학회:학술대회논문집
- /
- 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
- /
- pp.271-280
- /
- 1999
인공신경망을 시계열예측에 적용하는 경우에 고려되어야 할 문제중, 특히 모형에 적합한 입력변수의 생성이 중요시되고 있는데, 이러한 분야는 인공신경망의 모형생성과정에서 입력변수에 대한 전처리기법으로써 다양하게 제시되어 왔다. 가장 최근의 입력변수 전처리기법으로써 제시되고 있는 신호처리기법은 전통적 주기분할처리방법인 푸리에변환기법(Fourier transforms)을 비롯하여 이를 확장시킨 개념인 웨이블릿변환기법(wavelet transforms) 등으로 대별될 수 있다. 이는 기본적으로 시계열이 다수의 주기(cycle)들로 구성된 상이한 시계열들의 집합이라는 가정에서 출발하고 있다. 전통적으로 이러한 시계열은 전기 또는 전자공학에서 주파수영역분할, 즉 고주파 및 저주파수를 분할하기 위한 기법에 적용되어 왔다. 그러나, 최근에는 이러한 연구가 다양한 분야에 활발하게 응용되기 시작하였으며, 그 중의 대표적인 예가 바로 경영분야의 재무시계열에 대한 분석이다 전통적으로 재무시계열은 장, 단기의사결정을 가진 시장참여자들간의 거래특성이 시계열에 각기 달리 가격으로 반영되기 때문에 이러한 상이한 집단들의 고유한 거래움직임으로 말미암아 예를 들어, 주식시장이 프랙탈구조를 가지고 있다고 보기도 한다. 이처럼 재무시계열은 다양한 사회현상의 집합체라고 볼 수 있으며, 그만큼 예측모형을 구축하는데 어려움이 따른다. 본 연구는 이러한 시계열의 주기적 특성에 기반을 둔 신호처리분석으로서 기존의 시계열로부터 노이즈를 줄여 주면서 보다 의미 있는 정보로 변환시켜 줄 수 있는 웨이블릿분석 방법론을 새로운 필터링기법으로 사용하여 현재 많은 연구가 진행되고 있는 인공신경망과의 모형결합을 통해 기존연구와는 다른 새로운 통합예측방법론을 제시하고자 한다. 본 연구에서 제시하는 통합방법론은 크게 2단계 과정을 거쳐 예측모형으로 완성이 된다. 즉, 1차 모형단계에서 원시 재무시계열은 먼저 웨이블릿분석을 통해서 노이즈가 필터링 되는 동시에, 과거 재무시계열의 프랙탈 구조, 즉 비선형적인 움직임을 보다 잘 반영시켜 주는 다차원 주기요소를 가지는 시계열로 분해, 생성되며, 이렇게 주기에 따라 장단기로 분할된 시계열들은 2차 모형단계에서 신경망의 새로운 입력변수로서 사용되어 최종적인 인공 신경망모델을 구축하는 데 반영된다.
PDF

객체 중심 계층적 계획을 이용한 뇌경색 환자의 시기별 MRI 정량적 분석에 관한 연구 (MRI Quantification Analysis on Fall in Sick Times of the Cerebral Infarction Patients Using Object-Centered Hierarchical Planning)

하광;전계록;김길중
- 대한의용생체공학회:의공학회지
- /
- 제24권2호
- /
- pp.61-68
- /
- 2003
본 논문에서는 의학적 진단 및 처치 방법의 결정에 중요한 역할을 하는 뇌경색 환자의 각 시기별 특징을 정량화하기 위해 3 가지 MRI 촬영기법을 이용하여 획득한 영상의 특징과 그들의 상관관계들을 객체중심 계층적계획기법을 이용하여 분석하였다. 3 가지 영상의 비교를 위하여 다항워핑 알고리즘과 어파인 변환기법을 수행하여 영상을 정합하였으며, 정합된 영상을 기반으로 뇌경색 시기별 정량화를 수행하였다. 그리고 각 시기별로 색을 설정하여 수 작업으로 얻어진 데이터를 바탕으로 의사 컬러로 나타내었다. 본 연구에서 구한 뇌경색 시기별 정량화 자료를 바탕으로 구분된 결과와 전문의가 판단한 결과를 비교하였다.
PDF KSCI

유비쿼터스 헬스케어 시스템에서 이동에이전트 기반 균형화 클러스터링 (Balanced Clustering based on Mobile Agents for the Ubiquitous Healthcare Systems)

마테오 로미오;이재완;이말례
- 인터넷정보학회논문지
- /
- 제11권3호
- /
- pp.65-74
- /
- 2010
유비쿼터스 헬스케어에서 지능형 의사결정지원 및 빠른 진단결과를 제공하기 위한 자동진단은 일반적으로 에이전트 시스템에 의해 수행된다. 본 연구에서는 이동에이전트기술을 사용하여 저 부하 노드에 효율적으로 프로세스를 이주시켜 부하를 분산시키도록 유비쿼터스 헬스케어시스템을 설계하였다. 또한 실시간 자동진단시스템을 지원하는 이동에이전트 중심의 유비쿼터스 헬스케어 기술을 위한 프레임워크를 제시하며, 효율적인 자원활용을 고려하여, 노드들 내에 있는 프로세스의 부하분산을 위한 균형화된 클러스터링을 제안한다. 제안한 알고리즘은 시스템의 부하분산이 최소화될 때까지 과부하된 노드를 선택하여 프로세스를 가까운 노드에 이주시킨다. 제안한 균형화 클러스터링은, 가까운 노드에 이주시킴으로써 메시지오버헤드를 감안할 때, 효율적으로 프로세스를 모든 노드에 분산시킨다.
PDF KSCI

검색결과 583건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)