• 제목/요약/키워드: Entropy score

검색결과 26건 처리시간 0.025초

엔트로피 점수를 이용한 감성분석 분류알고리즘의 수행도 평가 (Evaluation of Classification Algorithm Performance of Sentiment Analysis Using Entropy Score)

  • 박만희
    • 한국정보통신학회논문지
    • /
    • 제22권9호
    • /
    • pp.1153-1158
    • /
    • 2018
  • 다양한 온라인 고객 평가 및 소셜 미디어 정보는 고객의 의사결정에 영향을 미치기 때문에 기업에게 매우 중요한 정보 출처라고 할 수 있다. 설문 조사를 통해 고객의 다양한 요구와 불만 사항을 파악하는 데는 많은 비용과 시간적인 제약이 발생하고 있다. 온라인 쇼핑몰의 고객 후기 데이터는 제품에 대한 고객들의 감성을 분석할 수 있는 이상적인 자료를 제공하고 있다. 본 연구에서는 삼성과 애플 스마폰에 대한 감성분석을 위해 아마존 쇼핑몰로부터 고객 리뷰 데이터를 수집하였다. 선행 연구에서 대표적인 감성분석 기법으로 사용된 5가지 분류 알고리즘을 적용하였다. 5가지 분류알고리즘은 support vector machines, bagging, random forest, classification or regression tree, maximum entropy 등이다. 본 연구에서는 분류 알고리즘의 수행도를 종합적으로 평가할 수 있는 entropy score를 제안하였다. Entropy score를 이용하여 5가지 알고리즘을 평가한 결과에 따르면 support vector machines 알고리즘의 entropy score가 가장 높은 것으로 분석되었다.

Entropy-based Similarity Measures for Memory-based Collaborative Filtering

  • Kwon, Hyeong-Joon;Latchman, Haniph
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제5권2호
    • /
    • pp.5-10
    • /
    • 2013
  • We proposed a novel similarity measure using weighted difference entropy (WDE) to improve the performance of the CF system. The proposed similarity metric evaluates the entropy with a preference score difference between the common rated items of two users, and normalizes it based on the Gaussian, tanh and sigmoid function. We showed significant improvement of experimental results and environments. These experiments involved changing the number of nearest neighborhoods, and we presented experimental results for two data sets with different characteristics, and results for the quality of recommendation.

다중선택 시험에서 부정행위자 발견을 위한 새로운 통계적 측도 (A New Statistical Index for Detecting Cheaters on Multiple Choice Tests)

  • 한은수;임요한;이경은
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.81-92
    • /
    • 2013
  • 학문적 진실성(academic integrity)을 위반하는 잠재적 부적행위를 판단할 때, 잘못된 결정을 피하기 위해서는 확고한 근거를 마련하는 것이 중요하다. 교육학 연구자들은 부정행위를 발견 혹은 확신 할 수 있는 많은 통계적인 방법들을 발전시켰다. 그러나, 대부분의 방법들은 단순히 상관계수를 기초로한 방법들이어서 종종 응답자들의 패턴을 설명하기가 어렵다. 이 논문에서는, 이런 어려움을 해결하기 해결하기 위하여 표준화된 부호 엔트로피 유사성 점수(Standardized Signed Entropy Similarity Score)라는 새로운 통계적인 측도를 제안한다. 또한, 이 제안한 방법을 실제 시험 자료를 이용 부정행위자를 발견하는데 적용하였고, 다른 기존의 방법들과 비교하였다.

독립성분분석에서 Convolution-FFT을 이용한 효율적인 점수함수의 생성 알고리즘 (An Algorithm of Score Function Generation using Convolution-FFT in Independent Component Analysis)

  • 김웅명;이현수
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.27-34
    • /
    • 2006
  • 본 연구에서는 엔트로피를 이용한 독립성분분석(ICA : Independent Component Analysis)에서 점수함수(score function)를 생성하는 알고리즘을 제안한다. 점수함수를 생성하기 위해서 원 신호(original signals)에 대한 확률밀도함수의 추정이 반드시 필요하고 밀도함수가 미분 가능해야 한다. 따라서 원 신호에 따른 적응적인 점수 함수를 유도할 수 있도록 커널 기반의 밀도추정(kernel density estimation)방법을 사용하였으며, 보다 빠른 밀도 추정 계산을 위해서 식의 형태를 컨볼루션(convolution) 변환 한 후, 컨볼루션을 빠르게 계산할 수 있는 FFT(Fast Fourier Transform) 알고리즘을 이용하였다. 제안한 점수함수 생성 방법은 원 신호에 확률밀도분포와 추정된 신호의 확률밀도 분포의 오차를 줄이는 역할을 한다 실험 결과, 암묵신호분리(blind source separation)문제에서 기존의 Extended Infomax 알고리즘과 Fixed Point ICA 보다 원 신호와 유사한 밀도함수를 추정하였고, 분리된 신호의 신호대잡음비등(SNR)에 있어서 향상된 성능을 얻을 수 있었다.

Entropy와 PCA-DEA 모형을 이용한 은행 대출상담사의 서비스 품질 효율성 분석 (An Analysis of Quality Efficiency of Loan Consultants in a Bank using Shannon's Entropy and PCA-DEA Model)

  • 최장기;김경택;서재준
    • 산업경영시스템학회지
    • /
    • 제40권3호
    • /
    • pp.7-17
    • /
    • 2017
  • Loan consultants assist clients with loan application processing and loan decisions. Their duties may include contacting people to ask if they want a loan, meeting with loan applicants and explaining different loan options. We studied the efficiency of service quality of loan consultants contracted to a bank in Korea. They do not work as a team, but do work independently. Since he/she is not an employee of the bank, the consultant is paid solely in proportion to how much he/she sell loans. In this study, a consultant is considered as a decision making unit (DMU) in the DEA (Data Envelopment Analysis) model. We use a principal component analysis-data envelopment analysis (PCA-DEA) model integrated with Shannon's Entropy to evaluate quality efficiency of the consultants. We adopt a three-stage process to calculate the efficiency of service quality of the consultants. In the first stage, we use PCA to obtain 6 synthetic indicators, including 4 input indicators and 2 output indicators, from survey results in which questionnaire items are constructed on the basis of SERVQUAL model. In the second stage, 3 DEA models allowing negative values are used to calculate the relative efficiency of each DMU. In the third stage, the weight of each result is calculated on the basis of Shannon's Entropy theory, and then we generate a comprehensive efficiency score using it. An example illustrates the proposed process of evaluating the relative quality efficiency of the loan consultants and how to use the efficiency to improve the service quality of the consultants.

생태하천 복원사업 우선순위 선정에 대한 연구: 한강하구를 중심으로 (Priority Determination of the Projects for Ecological Restoration of the Stream : Case Study for Han River Estuary)

  • 백선욱;이준학;이승민;이하늘;김형수;김수전
    • 한국습지학회지
    • /
    • 제25권1호
    • /
    • pp.64-73
    • /
    • 2023
  • 2022년 이전에는 하천 관리 주체가 이원화되어 생태하천 복원사업을 계획 및 시행하는 과정에서 많은 혼선이 발생하였다. 이로 인해 하천 수생태계 건강성이 확보되지 못하였다. 그러나 2022년 환경부가 생태하천 복원사업을 주관하게 되며, 하천 수생태계 건강성 확보는 복원사업에서 필수적인 요소가 되었다. 따라서 본 연구에서는 기수역과 람사르 습지가 위치하여 하천 수생태계 건강성 확보가 필수적인 한강하구 지역을 대상으로 복원사업이 필요한 하천 구역을 선정하였다. 우선, 생태하천 복원사업의 세부 조사항목을 기반으로 하천의 물리적, 화학적, 공간/인문학적, 수생태계 건강성 평가지수를 산정하였다. 산정된 평가지수에 순위정렬(ranking), 스케일 재조정(re-scaling), z 점수(z-score), t 점수(t-score) 표준화(normalization) 방법을 적용하였으며, 도출된 값을 비교·분석하였다. 이후 각 평가지수에 엔트로피 가중치 방법(entropy weight method)을 적용하였다. 해당 과정을 통해 한강하구 지역 내에서 수생태계 건강성 확보를 목적으로 복원사업이 요구되는 하천(목감천, 안양천 등)을 선정하였다. 본 연구의 결과는 생태하천 복원사업의 우선순위를 선정하는 과정에서 기초연구 자료로 활용될 수 있을 것이다.

엔트로피법과 Fuzzy ELECTRE III를 이용한 고장모드영향분석 (Failure Modes and Effects Analysis by using the Entropy Method and Fuzzy ELECTRE III)

  • 류시욱
    • 대한안전경영과학회지
    • /
    • 제16권4호
    • /
    • pp.229-236
    • /
    • 2014
  • Failure modes and effects analysis (FMEA) is a widely used engineering tool in the fields of the design of a product or a process to improve its quality or performance by prioritizing potential failure modes in terms of three risk factors-severity, occurrence, and detection. In a classical FMEA, the risk priority number is obtained by multiplying the three values in 10 score scales which are evaluated for the three risk factors. However, the drawbacks of the classical FMEA have been mentioned by many previous researchers. As a way to overcome these difficulties, this paper suggests the ELECTRE III that is a representative technique among outranking models. Furthermore, fuzzy linguistic variables are included to deal with ambiguous and imperfect evaluation process. In addition, when the importances for the three risk factors are obtained, the entropy method is applied. The numerical example which was previously studied by Kutlu and Ekmekio$\breve{g}$lu(2012), who suggested the fuzzy TOPSIS method along with fuzzy AHP, is also adopted so as to be compared with the results of their research. Finally, after comparing the results of this study with that of Kutlu and Ekmekio$\breve{g}$lu(2012), further possible researches are mentioned.

Modeling the Spatial Distribution of Black-Necked Cranes in Ladakh Using Maximum Entropy

  • Meenakshi Chauhan;Randeep Singh;Puneet Pandey
    • Proceedings of the National Institute of Ecology of the Republic of Korea
    • /
    • 제4권2호
    • /
    • pp.79-85
    • /
    • 2023
  • The Tibetan Plateau is home to the only alpine crane species, the black-necked crane (Grus nigricollis). Conservation efforts are severely hampered by a lack of knowledge on the spatial distribution and breeding habitats of this species. The ecological niche modeling framework used to predict the spatial distribution of this species, based on the maximum entropy and occurrence record data, allowed us to generate a species-specific spatial distribution map in Ladakh, Trans-Himalaya, India. The model was created by assimilating species occurrence data from 486 geographical sites with 24 topographic and bioclimatic variables. Fourteen variables helped forecast the distribution of black-necked cranes by 96.2%. The area under the curve score for the model training data was high (0.98), indicating the accuracy and predictive performance of the model. Of the total study area, the areas with high and moderate habitat suitability for black-necked cranes were anticipated to be 8,156 km2 and 6,759 km2, respectively. The area with high habitat suitability within the protected areas was 5,335 km2. The spatial distribution predicted using our model showed that the majority of speculated conservation areas bordered the existing protected areas of the Changthang Wildlife Sanctuary. Hence, we believe, that by increasing the current study area, we can account for these gaps in conservation areas, more effectively.

스코어 기반 관측신뢰도를 이용한 잡음환경하 화자식별 (Speaker Identification Using Score-based Confidence in Noisy Environments)

  • 민소희;송민규;나승유;최승호;김진영
    • 음성과학
    • /
    • 제14권4호
    • /
    • pp.145-156
    • /
    • 2007
  • The performance of speaker identification is severely degraded in noisy environments. Recently probability weighting method based on observation membership was proposed for overcoming the noise problem[1]. In the paper[1] the observation confidence was calculated from SNR with sigmoid function. However, estimating SNR needs additive calculation amount and estimated SNR is corrupted in dynamic noisy environments. In this paper we propose estimation methods of the observation confidence based on score-based reliabilities (SBR) of entropy and dispersion measures. Generally SBRs are obtained from speaker models' probabilities. The proposed methods are evaluated with ETRI speaker recognition DB. We compared the performances of the proposed methods with those in [1][8]. The experimental results show that the proposed methods can be successfully applied for the case where SNR is not available.

  • PDF

서울시 용도복합 현상의 측정 및 기술에 관한 연구 (Measuring and Describing Seoul's Mixed-Use Phenomenon)

  • 김현무;이우진;권태정;연정민
    • 한국지리정보학회지
    • /
    • 제24권3호
    • /
    • pp.10-31
    • /
    • 2021
  • 본 연구를 통해 정의된 용도복합 개념은 세 가지 이상의 주요 도시기능의 복합을 의미하며 도시공간의 경제적, 사회적, 환경적 가치를 동시에 실현하기 위한 수단을 의미한다. 이러한 정의 하에서 서울의 용도복합 현상을 탐구하였다. 상대적 엔트로피 개념을 사용하여 단위 지역인 법정동을 기준으로 복합도(R.E.)를 측정하였으며 도시기능의 유형은 용도복합의 정의에서 도출한 개념을 통해 건축물 층별 용도를 유형화하여 계량화하였다. 서울의 용도복합 현상은 복합도(R.E.) 0.631 이하를 '복합아님', 복합도(R.E.) 0.631 초과 0.884 미만을 '불균형 복합', 복합도(R.E.) 0.884 이상 0.991 미만을 '균형복합', 복합도(R.E.) 0.991 이상을 '완전균형복합'의 단계로 구분하여 용도복합 현상을 해석하는 기준으로 지표화하였다.