통합 검색 | Korea Science

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

김유영;송민
- 지능정보연구
- /
- 제22권3호
- /
- pp.71-89
- /
- 2016
누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.
https://doi.org/10.13088/jiis.2016.22.3.071 인용 PDF KSCI

정상망막과 변성망막에서 전압자극 파라미터 변화에 따른 망막신경절세포의 반응 비교 (Comparison of Retinal Ganglion Cell Responses to Different Voltage Stimulation Parameters in Normal and rd1 Mouse Retina)

예장희;류상백;김경환;구용숙
- 한국의학물리학회지:의학물리
- /
- 제21권2호
- /
- pp.209-217
- /
- 2010
색소성망막염(retinitis pigmentosa: RP)이나 연령관련 황반변성(age-related macular degeneration: AMD)과 같은 망막질환으로 인해 실명한 환자를 위해 인공시각장치가 개발되고 있다. 인공시각장치의 동작원리는 전기자극을 주어 신경세포의 활동도를 조절하는 것이므로 시각정보를 제대로 인코딩하기 위해 최적의 전기자극을 인가하는 것은 인공시각장치의 실용화를 위해 매우 중요한 요소이다. 그러므로 본 연구에서는 전압자극의 크기와 자극시간을 변화시켜 가면서 정상망막과 변성망막에 인가한 후 자극에 의해 유발된 망막신경절세포 반응을 분석하고 역치전하밀도를 비교함으로써 최적의 전기자극 조건을 찾아보고자 하였다. 이를 위하여 정상마우스와 rd1 마우스의 망막을 in vitro 상태로 분리한 후 망막의 신경절세포층이 전극을 향하여 부착되도록 한 후 망막신호를 기록하였다. rd1 마우스에서 얻은 변성망막의 망막신경절세포에서도 전압펄스를 인가시 정상망막의 망막신경절세포처럼 전압자극의 크기와 자극시간 변조에 대하여 반응하였다. 그러나 정상망막과 변성망막에서 망막신경절세포 반응의 시간적 패턴은 매우 달랐다: 정상망막의 망막신경절세포 반응은 전기자극 후 약 100 ms 내에서 1개의 피크만 나타나는 반면, 변성망막에서는 이보다 긴 400 ms 구간에서 약 10 Hz의 진동리듬을 가진 다수의 피크(~4개)들이 나타나는 것을 확인하였다. 또한 변성망막에서 망막신경절세포의 반응을 유발하기 위한 역치 전하밀도가 정상망막에서 보다 크게 상승하였다: 자극세기를 변화시켰을 때 정상망막의 역치 전하밀도는 $37.23{\sim}61.65\;{\mu}C/cm^2$, rd1 마우스에서는 $70.50{\sim}99.87\;{\mu}C/cm^2$로 2배가량 높은 것을 확인하였다. 자극시간을 변화시켰을 때 정상망막의 역치 전하밀도는 $22.69{\sim}37.57\;{\mu}C/cm^2$, rd1 마우스에서는 $120.5{\sim}170.6\;{\mu}C/cm^2$로 5배가량 높은 것을 확인하였다.
PDF KSCI

특징집합 IG-MLP 평가 기반의 최적화된 특징선택 방법을 이용한 질환 예측 머신러닝 모델 (Optimized Feature Selection using Feature Subset IG-MLP Evaluation based Machine Learning Model for Disease Prediction)

김경륜;김재권;이종식
- 한국시뮬레이션학회논문지
- /
- 제29권1호
- /
- pp.11-21
- /
- 2020
암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다. 심뇌혈관질환은 예방을 위한 조기증상들의 특징 분석이 어려워 질환예측이 힘들며, 한국인에 적합한 예측 방법이 필요하다. 본 연구의 목적은 심뇌혈관질환 데이터를 이용하여, 특징집합 IG-MLP 평가 기반의 특징선택 방법론을 시뮬레이션 하여 검증하는 것이다. 제안하는 방법은 제4~7기 국민건강영양조사 원시자료를 이용한다. 심뇌혈관질환의 예측에 중요한 특징들을 선별하기 위해, 속성들의 심뇌혈관질환에 대한 정보이득-다층신경망을 이용한 분석을 실시하며, 최종적으로 선별된 특징을 이용한 심뇌혈관질환 예측 모델을 제공한다. 제안하는 방법으로 한국인의 심뇌혈관질환에 관련된 중요한 특징들을 찾을 수 있으며, 최적화된 특징들로 구성된 예측 모델은 한국인에 대해 더욱 정확한 심뇌혈관 예측을 할 수 있다.
https://doi.org/10.9709/JKSS.2020.29.1.011 인용 PDF KSCI

SSAE 알고리즘을 통한 2003-2016년 남한 전역 쌀 생산량 추정 (Rice Yield Estimation of South Korea from Year 2003-2016 Using Stacked Sparse AutoEncoder)

마종원;이경도;최기영;허준
- 대한원격탐사학회지
- /
- 제33권5_2호
- /
- pp.631-640
- /
- 2017
쌀 생산량 예측 및 조사는 농가 소득 보전 및 농업 분야 기관에 영향을 주고 수급 조절과 가격 예측 등 정부의 정책 수립과 관련하여 중요한 의미를 갖는다. 이에 따라 작황 추정 모델의 구축이 필요하며 과거로부터 기상 자료 및 위성 자료를 통해 경험적 통계 모델 또는 인공신경망 알고리즘을 기반으로 한 연구가 다수 진행되었다. 현재 인공신경망 모델을 기반으로 개발된 딥 러닝 알고리즘이 패턴 인식, 컴퓨터 비전, 음성 인식 등의 분야에서 폭넓게 사용되며 뛰어난 성능을 보이고 있다. 최근 다양한 딥 러닝 알고리즘 중 SSAE 알고리즘이 시계열 자료를 통한 예측 분야에서 적용 가능성이 확인되었으며 본 연구에서는 SSAE를 통해 남한 전역에 대한 쌀 생산량 추정 연구를 진행하였다. 입력 변수로 기상자료와 위성자료를 사용하였으며 남한 벼의 생육 기간을 고려하여 입력 자료를 기간별로 나누고 최적의 입력 자료롤 찾고자 하였다. 실험 결과, 5월부터 9월까지의 위성 자료와 16일 평균값을 사용한 기상 자료와의 조합을 사용하였을 경우 평균 연도별 %RMSE, 시군구 %RMSE 각각 7.43%, 7.16%로 가장 좋은 성능을 보였으며 이를 통해 쌀 생산량 추정 분야에 대한 SSAE 알고리즘의 적용 가능성을 확인할 수 있었다.
https://doi.org/10.7780/kjrs.2017.33.5.2.3 인용 PDF KSCI

건표고 자동선별을 위한 시작시스템 개발 (Development of a Prototype Automatic Sorting System for Dried Oak Mushrooms)

황헌;이충호
- Journal of Biosystems Engineering
- /
- 제21권4호
- /
- pp.414-421
- /
- 1996
한국과 일본의 경우 건표고를 외관의 품질상태 에 따라 12등급에서 16등급으로 구분하고 있다. 그리고 등급판정 작업은 임의로 추출한 샘플을 대상으로 전문 감정가에 의해 수작업으로 수행되고 있다. 건표고의 품질을 결정짓는 외관의 품질인자들은 갓과 내피에 고루 분포하고 있다. 본 논문에서는 컴퓨터 영상처리 시스템에 의거하여 개발한 건표고 자동 등급판정 및 선별 시작시스템의 구조와 기능 그리고 성능에 대하여 설명하였다. 개발한 시작시스템은 표고의 이송과 취급자동화를 위한 진동이송기, 반전장치, 컨베이어 이송장치와 두 세트의 컴퓨터 영상처리 시스템, 그리고 시스템 통괄제어를 위한 IBM PC AT호환 컴퓨터, 디지털 입출력 보드, 전공압실린더 구동제어를 위한 PLC등으로 구성하였다. 등급판정의 효율성 및 실시간 작업시스템을 고려하여 건표고의 등급판정은 두 세트의 컴퓨터 영상처리 시스템을 이용하여 이송되는 건표고의 갓 또는 내피 중 어디가 위를 향하는 지에 따라 두 단계에 걸쳐 독립적으로 판정을 수행하도록 하였다. 첫 번째 영상처리부에서는 갓표면 영상으로부터 4등급의 고품질 표고를 분류하며 두 번째 영상처리부에서는 내피표면 영상으로부터 중간 및 저품질 표고를 8개의 등급으로 분류한다. 실시간 영상정보처리를 목적으로 기존에 개발한 신경회로망을 이용한 등급판정 알고리즘을 시작시스템에 적용하였다. 개발한 시작기는 88% 이상의 등급판정 정확도를 보여 주었으며, 전공압시스템의 구동제약으로 인하여 표고 1개당 약0.7초의 선별시간이 소요되었다. 일조 선별라인의 경우 본 연구에서 제안한 시작기의 선별능력은 표고가 일차 처리부로 갓이 위로 올라와 있는 상태로 계속 공급된다면 시간당 대략 5,000여 개의 표고를 처리할 수 있을 것으로 기대된다.보강하여 가능하면 B-Pillar의 Middle이 Bending type collapse을 방지하여 Pelvis와 Door가 먼저 접촉하는 방법 등이 적용가능하다. 제작하기 이전에 설계된 부품에 대한 스프링 상수 및 내구특성을 체계적으로 규명하여 제품 시험의 횟수를 줄이고, 보다 정밀한 제품을 제작할 수 있도록 하기 위한 것이다.세포수는 초기 배반포기배에서 팽윤 배반포기배로 진행됨에 따라 두배에서 세배 정도 증가되었음을 알 수 있었다. 또한, differential labelling과 bisbenzimide기법에서 얻어진 각각의 총세포수를 비교하였을 때 총세포수는 발달의 진행 정도에 따라 증가되며 그와 동시에 동일한 군 간의 세포수도 거의 유사함을 알 수 있었다. 따라서, ICM과 TE를 differential labelling하는 기법은 수정란의 quality를 평가하는데 매우 유용한 기법으로서 착상전 embryo 발달을 연구하는데 효과적으로 이용될 수 있다는 것을 시사한다. 고도의 유의차를 나타낸 반면 비수구, 초생수로구 및 Bromegrass 목초구 간에는 아무런 유의차가 인정되지 않았다. 7. 농지보전 처리구인 배수구와 초생수로구는 비처리구에 비해 낮은 침두 유출량과 낮은 토양유실량을 나타내었다.구보다 14% 절감되는 것으로 나타났다.작용하는 것으로 사료된다.된다.정량 분석한 결과이다. 시편의 조성은 33.6 at% U, 66.4 at% O의 결과를 얻었다. 산화물 핵연료의 표면 관찰 및 정량 분석 시험시 시편 표면을 전도성 물질로 증착시키지 않고, Silver Paint 에 시편을 접착하는 방법으로도 만족한 시험 결과를 얻을 수 있었다.째, 회복기 중에 일어나는 입자들의 유입은 자기폭풍의 지속시간을 연장시키는 경향을 보이며 큰
PDF

Support Vector Machine 기법을 이용한 고객의 구매의도 예측 (Forecasting of Customer's Purchasing Intention Using Support Vector Machine)

김진화;남기찬;이상종
- 경영정보학연구
- /
- 제10권2호
- /
- pp.137-158
- /
- 2008
기업 경쟁력 강화의 중요한 이슈인 대량 개별화(mass-customization)의 실행을 위하여 통합 고객관계 관리 프로세스로서의 CRM(customer relationship management)에 대한 관심과 활용에 대한 필요성은 점점 더 높아지고 있다. 특히, 기존 고객들의 구매 정보를 기반으로 고객의 구매 패턴을 파악하고 의도를 예측하는 것은 오늘날 실질적인 판매 전략을 수립하는 마케팅 분야에서 상당히 큰 비중을 차지하고 있다. 고객의 구매의도 예측에는 대량의 데이터로부터 과거에 인지하지 못했던 의미 있고, 근거 있는 정보를 추출하는 데이터마이닝(datamining)이 주로 사용되고 있다. 기존의 구매의도 예측에 사용된 데이터마이닝 기법들은 주로 신경망(neural networks)과 로지스틱 회귀분석(logistic regression analysis)이었는데, 예측 정확성 및 모형 구축의 어려움으로 인한 다양한 문제점들이 제기되고 있는 실정이다. 따라서, 본 논문에서는 기존의 기법들이 가지고 있는 단점들을 개선하기 위하여 신경망과 로지스틱 회귀분석 외에 연관규칙(association rule), 연관성 매트릭스(association matrix), 의사결정 나무(decision tree), 베이지안 망(bayesian network), SVM(support vector machine) 기법들을 추가로 제안하였다. 본 연구의 목적은 고객의 특정 상품에 대한 구매의도 예측을 위하여 새로운 알고리즘을 제시하기보다는 기존의 다양한 데이터마이닝 기법들을 적용시켜 봄으로써, 가장 우수한 예측성과를 나타내는 기법을 발견하는 것이다. 연구에 사용된 자료는 기존의 연구에서는 적용되지 않았던 편의점의 영수증 데이터이다. 예측 목표상품은 카테고리화 된 '우유'와 '냉동식품'이며, 제안된 기법들의 신뢰성을 위하여 전체 데이터를 10개의 training과 test 셋으로 중복되지 않게 구분함과 동시에 10번의 교차 검증(cross validation)을 실시하였다. 실험 결과 SVM이 영수증 데이터를 이용한 고객의 특정 상품에 대한 구매의도 예측에서 가장 우수한 성과를 나타내는 것을 확인하였다.
PDF KSCI

대출심사의 예측 정확도 향상을 위한 방법 제안 (Proposing the Method for Improving the Forecast Accuracy of Loan Underwriting)

양유영;박상성;신영근;장동식
- 한국산학기술학회논문지
- /
- 제11권4호
- /
- pp.1419-1429
- /
- 2010
외환위기 이후 본격적으로 시작된 외국계 대형 은행의 국내 진출 및 선진 금융상품의 수입은 국내 은행 산업 구조와 환경을 변화시키고 경쟁을 가속화시켰다. 앞으로 일어날 변화 및 추세에 대한 정확한 예측은 경쟁이 치열한 환경에서 국내의 은행이 생존하고 발전하기 위해 필수적인 요소이며 그 중에서도 대출 신청 고객에 대한 승인 여부에 대한 예측은 대출 상품이 은행 경영에 있어 가장 큰 비중을 차지하는 수익의 원천이자 신용 리스크 관리의 중심이 된다는 점에서 큰 의미가 있다. 따라서 본 논문에서는 대출 심사 결과의 예측 정확성을 높이기 위한 방법을 제시하고자 한다. 수행 단계로는 상관관계 분석과 특징선택 기법을 통해 대출승인 결과에 유의한 영향을 주는 예측변수들을 선별하고 선별된 변수로 2-Step 군집화 기법을 통해 고객을 군집화 하였다. 이후 각 군집에 LR, NN, SVM 기법을 활용하여 구축한 예측 모형을 적용하여 정확도가 가장 높은 모형을 찾아보았다. 최종적으로 기존 방식의 대출 심사 모형에 LR, NN, SVM 예측 모형을 적용했을 때 산출된 결과와 제안한 모형의 결과를 비교하여 예측의 정확도를 평가하였다.
https://doi.org/10.5762/KAIS.2010.11.4.1419 인용 PDF KSCI

데이터 마이닝을 이용한 당뇨환자의 관리요인에 관한 연구 (A Study on Factors of Management of Diabetes Mellitus using Data Mining)

김유미;장동민;김성수;박일수;강성홍
- 한국산학기술학회논문지
- /
- 제10권5호
- /
- pp.1100-1108
- /
- 2009
본 연구의 목적은 당뇨환자 관리와 관련된 요인을 규명하는데 있다. 2005년 국민건강 영양조사에 참여한 20세 이상의 성인 당뇨환자를 대상으로 하였다. 데이터마이닝 기법을 이용하여 로지스틱 회귀모형, 의사결정나무, 신경망 모형으로 당뇨환자관리모형을 개발한 결과 의사결정나무가 가장 설명력이 뛰어났다. 당뇨인지율과 관련된 요인으로는 연령, 거주지 및 직업이었고 중 연령이 가장 중요한 요인으로 나타났다. 당뇨치료율과 관련된 요인으로는 당뇨인지여부, 거주지 및 직업이었고 그 중 당뇨인지여부가 가장 중요한 변수로 나타났다. 당뇨환자의 관리프로그램은 당뇨환자의 특성별 군집으로 분류하고 그에 따라 관리해야 한다.
https://doi.org/10.5762/KAIS.2009.10.5.1100 인용 PDF

머신러닝을 이용한 탄성파 반사법 자료의 해저면 겹반사 제거 (Removal of Seabed Multiples in Seismic Reflection Data using Machine Learning)

남호수;임보성;권일룡;김지수
- 지구물리와물리탐사
- /
- 제23권3호
- /
- pp.168-177
- /
- 2020
해저면 탄성파 겹반사는 발파점 모음자료와 겹쌓기 단면에서 모두 일차 반사파의 해석에 잘못된 결과를 초래할 수 있다. 따라서, 해저면 겹반사는 자료처리를 통해 제거해야 한다. 전통적인 자료처리 과정에서 겹반사 제거는 예측오차 곱풀기와 라돈 필터링 등과 같은 모델-기반 기법과 지표관련-겹반사제거와 같은 데이터-기반 기법에 의해 이루어져 왔다. 그러나 대다수의 자료처리 과정들은 방대한 컴퓨터 자원과 전문적인 자료처리 기법뿐만 아니라 자료처리 변수들을 테스트하고 선택하는데 많은 시간을 필요로 한다. 이 논문에서는 머신러닝 시스템을 활용한 해저면 겹반사의 제거효과를 살펴보기 위해 Marmousi2 속도모델에 대한 수치모델링으로 겹반사가 포함된 입력데이터와 겹반사가 포함되지 않은 레이블데이터를 생성하였다. 수직시간차가 보정된 공통중간점 모음자료로 훈련데이터를 구성하였으며 인공신경망은 U-Net 모델을 적용하였다. 해저면 겹반사를 제거하기 위해 훈련된 모델은 레이블데이터에 거의 근접하는 예측 결과를 만들어내며, 현장자료에 대한 예측 테스트에서 해저면 겹반사를 효과적으로 제거하는 것으로 나타났다.
https://doi.org/10.7582/GGE.2020.23.3.00168 인용 PDF KSCI

Power Ramp Rate를 이용한 풍력 발전량 예측모델 구축 (Building of Prediction Model of Wind Power Generationusing Power Ramp Rate)

황미영;김성호;윤은일;김광득;류근호
- 한국컴퓨터정보학회논문지
- /
- 제17권1호
- /
- pp.211-218
- /
- 2012
전 세계적으로 화석연료의 많이 사용이 증가되고 있으며 이로 인해 온실가스가 배출되어 지구 온난화와 환경오염이 심각해지고 있는 실정이다. 지구의 환경오염을 줄이기 위해서 무공해 청정에너지인 신재생에너지에 대한 관심이 증가되는 추세인데, 그중에서도 풍력발전은 환경오염 물질을 배출하지 않고, 자원량이 무한대이기 때문에 많은 관심을 받고 있다. 하지만, 풍력발전은 전력 생산량이 불규칙한 단점을 갖고 있어 풍력 터빈의 손상과 전력 생산량이 불규칙적인 문제를 야기하여 이러한 문제점을 보완하기 위해 풍력 발전량을 정확하게 예측하는 것이 중요하다. 풍력 발전량을 정확하게 예측하기 위해서 전력 생산량이 급증 또는 급감하는 것을 의미하는 ramp의 특성을 잘 활용해야 한다. 이 논문에서는 예측의 정확도를 높이기 위하여 다계층 신경망을 이용해 예측모델을 구축하였다. 구축된 예측모델은 흔히 사용되는 풍속, 풍향 속성뿐만 아니라 Power Ramp Rate(PRR) 속성까지 사용하였다. 구축된 풍력 발전량 예측모델은 앞서 말한 세 가지 속성을 모두 사용한 경우, 두 속성을 조합하여 사용한 경우 총 4가지 예측모델을 구축하였다. 구축된 4가지 예측모델을 성능평가 한 결과 PRR, 풍속, 풍향의 속성 모두를 사용한 예측모델의 예측 값이 풍력 터빈에서 관측된 관측 값에 가장 근접하였다. 그로 인해 PRR 속성을 사용하면 풍력 발전량의 예측 정확도를 향상 시킬 수 있었다.
https://doi.org/10.9708/jksci.2012.17.1.211 인용 PDF KSCI

검색결과 9,932건 처리시간 0.051초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)