• 제목/요약/키워드: One-Hot Vector

검색결과 18건 처리시간 0.031초

단어-역문서 빈도 벡터화를 통한 한국 걸그룹의 음반 메타 정보 군집화 (Clustering Meta Information of K-Pop Girl Groups Using Term Frequency-inverse Document Frequency Vectorization)

  • 현준서;조재혁
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.12-23
    • /
    • 2023
  • 2020 년대 K-Pop 시장은 보이그룹보다 걸그룹이, 3 세대보다 4 세대가 전반에서 주목받았다. 해당 논문은 걸그룹의 세대가 바뀌기 시작했는지 알아보고자 가사 군집화에 대한 방법과 결과를 제시한다. 2013 년부터 2022 년까지 발표된 47 개 그룹의 1469 곡에 대한 메타정보를 수집하여 가사 정보와 가사 외 메타정보로 분류하여 각각 수치화했다. 가사 정보는 선행연구를 기반으로 단어역문서 빈도 벡터화를 적용한 뒤 상위 벡터 값만 선정하는 전처리를 하였다. 가사 외 메타정보는 가사 정보만 사용했을 때의 편향성을 줄이고 더 좋은 군집화 결과를 보여주기 위해 One-Hot Encoding 으로 전처리하여 적용했다. 전처리된 데이터에 대한 군집화 성능은 Spherical K-Means 의 Silhouette Coefficient, Calinski-Harabasz Score 가 Hierarchical Clustering 에 비해 각각 129%, 45% 더 높았다. 본 연구는 한국 대중가요 발전사와 걸그룹 가사 분석 및 군집화 연구에 기여할 수 있을 것으로 기대된다.

  • PDF

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

3-D Structure of a Coronal Jet Seen in Hinode, SDO, and STEREO

  • Lee, Kyoung-Sun;Innes, Davina;Moon, Yong-Jae;Shibata, Kazunari
    • 천문학회보
    • /
    • 제36권2호
    • /
    • pp.89.1-89.1
    • /
    • 2011
  • We have investigated a coronal jet near the limb on 2010 June 27 by Hinode/X-Ray Telescope (XRT), EUV Imaging Spectrograph (EIS), Solar Optical Telescope (SOT), SDO/Atmospheric Imaging Assembly (AIA), and STEREO. From EUV (AIA and EIS) and soft X-ray (XRT) images we identify the erupting jet feature in cool and hot temperatures. It is noted that there was a small loop eruption in Ca II images of the SOT before the jet eruption. Using high temporal and multi wavelength AIA images, we found that the hot jet preceded its associated cool jet. The jet also shows helical-like structures during the rising period. According to the spectroscopic analysis, the jet structure changes from blue shift to red one with time, implying the helical structure of the jet. The STEREO observation, which enables us to observe this jet on the disk, shows that there was a dim loop associated with the jet. Comparing the observations from the AIA and STEREO, the dim loop corresponds to the jet structure which implies the heated loop. Considering that the structure of its associated active region seen in STEREO is similar to that in AIA observed 5 days before, we compared the jet morphology on the limb with the magnetic fields extrapolated from a HMI vector magnetogram observed on the disk. Interestingly, the comparison shows that the open field corresponds to the jet which is seen as the dim loop in STEREO. Our observations (XRT, SDO, SOT, and STEREO) are well consistent with the numerical simulation of the emerging flux reconnection model.

  • PDF

건강군과 질환군의 한열지표 차이에 관한 고찰 (Differences of Cold-heat Patterns between Healthy and Disease Group)

  • 김지은;이승기;유화승;박경모
    • 동의생리병리학회지
    • /
    • 제20권1호
    • /
    • pp.224-228
    • /
    • 2006
  • The pattern identification of exterior-interior syndrome and cold-heat syndrome is one of the diagnostic methods using most frequently in Oriental medicine. There was no systematic studies analyzing the characteristics of the 'exterior-interior and cold-heat' between healthy and disease group. In this study, cold-heat pattern, blood pressure, pulse rate, height and weight are recorded from 100 healthy subjects and 196 disease subjects with age ranging from 30 to 59 years. To analyze the differences between healthy and disease group, we used the descriptive statistics. And linear regression function, linear support vector machine and bayesian classifier were used for distinguishing healthy group from disease group. The score of both exterior-heat and interior-cold in healthy group is higher than the score in disease group. This means that if one belongs to the disease group, his(or her) exterior gets cold and his interior gets hot. And also, these result have no relevance to age. But, the attempt to classify healthy group from disease group with a exterior-interior and cold-heat and other vital signs did not have good performance. It mean that even though they have a different trend each other, only these kinds of information couldn't classify healthy group and disease group.

RawNet3 화자 표현을 활용한 임의의 화자 간 음성 변환을 위한 StarGAN의 확장 (Extending StarGAN-VC to Unseen Speakers Using RawNet3 Speaker Representation)

  • 박보경;박소민;홍현기
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권7호
    • /
    • pp.303-314
    • /
    • 2023
  • 음성 변환(Voice Conversion)은 개인의 음성 데이터를 다른 사람의 음향적 특성(음조, 리듬, 성별 등)으로 재생성할 수 있는 기술로, 교육, 의사소통, 엔터테인먼트 등 다양한 분야에서 활용되고 있다. 본 논문은 StarGAN-VC 모델을 기반으로 한 접근 방식을 제안하여, 병렬 발화(Utterance) 없이도 현실적인 음성을 생성할 수 있다. 고정된 원본(source) 및 목표(target)화자 정보의 원핫 벡터(One-hot vector)를 이용하는 기존 StarGAN-VC 모델의 제약을 극복하기 위해, 본 논문에서는 사전 훈련된 Rawnet3를 사용하여 목표화자의 특징 벡터를 추출한다. 이를 통해 음성 변환은 직접적인 화자 간 매핑 없이 잠재 공간(latent space)에서 이루어져 many-to-many를 넘어서 any-to-any 구조가 가능하다. 기존 StarGAN-VC 모델에서 사용된 손실함수 외에도, Wasserstein-1 거리를 사용하여 생성된 음성 세그먼트가 목표 음성의 음향적 특성과 일치하도록 보장했다. 또한, 안정적인 훈련을 위해 Two Time-Scale Update Rule (TTUR)을 사용한다. 본 논문에서 제시한 평가 지표들을 적용한 실험 결과에 따르면, 제한된 목소리 변환만이 가능한 기존 StarGAN-VC 기법 대비, 본 논문의 제안 방법을 통해 다양한 발화자에 대한 성능이 개선된 음성 변환을 제공할 수 있음을 정량적으로 확인하였다.

네트워크 분석을 활용한 딥러닝 기반 전공과목 추천 시스템 (Major Class Recommendation System based on Deep learning using Network Analysis)

  • 이재규;박희성;김우주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.95-112
    • /
    • 2021
  • 대학 교육에 있어서 전공과목의 선택은 학생들의 진로에 중요한 역할을 한다. 하지만, 산업의 변화에 발맞춰 대학 교육도 학과별 전공과목의 분야가 다양해지고 그 수가 많아지고 있다. 이에 학생들은 본인의 진로에 맞게 수업을 선택하여 수강하는 것에 어려움을 겪고 있다. 본 연구는 대학 전공과목 추천 모델을 제시함으로써 개인 맞춤형 교육을 실현하고 학생들의 교육만족도를 제고하고자 한다. 모델 연구에는 대학교 학부생들의 2015년~2017년 수강 이력 데이터를 활용하였으며, 메타데이터로는 학생과 수업의 전공 명을 사용했다. 수강 이력 데이터는 컨텐츠 소비 여부만을 나타낸 암시적 피드백 데이터로, 수업에 대한 선호도를 반영한 것이 아니다. 따라서 학생과 수업의 특성을 나타내는 임베딩 벡터를 도출했을 시, 표현력이 낮다. 본 연구는 이러한 문제점에 착안하여, 네트워크 분석을 통해 학생, 수업의 벡터를 생성하고 이를 모델의 입력 값으로 활용하는 Net-NeuMF 모델을 제시한다. 모델은 암시적 피드백을 가진 데이터를 이용한 대표적인 모델인 원핫 벡터를 이용하는 NeuMF의 구조를 기반으로 하였다. 모델의 입력 벡터는 네트워크 분석을 통해 학생과 수업의 특성을 나타낼 수 있도록 생성하였다. 학생을 표현하는 벡터를 생성하기 위해, 각 학생을 노드로 설정하고 엣지는 두 학생이 같은 수업을 수강한 경우 가중치를 가지고 연결되도록 설계했다. 마찬가지로 수업을 표현하는 벡터를 생성하기 위해 각 수업을 노드로 설정하고 엣지는 공통으로 수강한 학생이 있는 경우 연결시켰다. 이에 각 노드의 특성을 수치화 하는 표현 학습방법론인 Node2Vec을 이용하였다. 모델의 평가를 위해 추천 시스템에서 주로 활용하는 지표 4가지를 사용하였고, 임베딩 차원이 모델에 미치는 영향을 분석하기 위해 3가지 다른 차원에 대한 실험을 진행하였다. 그 결과 기존 NeuMF 구조에서 원-핫 벡터를 이용하였을 때보다 차원과 관계없이 평가지표에서 좋은 성능을 보였다. 이에 본 연구는 학생(사용자)와 수업(아이템)의 네트워크를 이용해 기존 원-핫 임베딩 보다 표현력을 높였다는 점, 모델을 구성하는 각 구조의 특성에 맞도록 임베딩 벡터를 활용하였다는 점, 그리고 기존의 방법론에 비해 다양한 종류의 평가지표에서 좋은 성능을 보였다는 점을 기여점으로 가지고 있다.

챗봇 형태로 구현한 사용자 맞춤형 레시피 추천 시스템 (Customized Recipe Recommendation System Implemented in the form of a Chatbot)

  • 안예진;조하영;강신재
    • 한국산학기술학회논문지
    • /
    • 제21권5호
    • /
    • pp.543-550
    • /
    • 2020
  • 음식의 레시피에 대한 관심도가 높아지고 있는 요즘 대부분의 레시피 검색 시스템들은 요리명, 또는 음식 재료명으로 검색하는 정도로 구현이 되어 있으며, 레시피마다 상이한 계량 단위로 식재료의 양에 대한 정보를 제공하기 때문에 자신이 원하는 인분에 맞춰 식재료의 양을 다시 계산해야 하는 불편함이 있다. 이에 본 논문에서는 이러한 불편 사항을 해결하고 메신저 대화에 익숙한 사용자들에게 맞춤형 서비스를 제공하기 위해 챗봇 형태의 사용자 맞춤형 레시피 추천 시스템을 구현하였다. 레시피에 대한 사용자의 리뷰와 별점, 조회 수 등을 기반으로 인기 있는 레시피들을 선별하고 전처리를 통해 해당 레시피별로 주요 단어와 식재료 양, 조리 순서 등 필요한 정보들만을 추출, 가공한 뒤, 그를 통해 얻은 약 10만 개의 데이터를 기반으로 사용자가 입력한 레시피명, 식재료명, 제외할 식재료명 등을 분석해 레시피를 필터링하고, 사용자가 입력한 인분을 기준으로 재계량하여 레시피를 추천하는 시스템을 구현하였다. 사용자의 요구에 따른 레시피 추천 결과물에 대한 만족도를 평가하여 90.5%의 결과를 얻을 수 있었다.

Visualization of Flow in a Transonic Centrifugal Compressor

  • Hayami Hiroshi
    • 한국가시화정보학회:학술대회논문집
    • /
    • 한국가시화정보학회 2002년도 추계학술대회 논문집
    • /
    • pp.1-6
    • /
    • 2002
  • How is the flow in a rotating impeller. About 35 years have passed since one experimentalist rotating with the impeller. of a huge centrifugal blower made the flow measurements using a hot-wire anemometer (Fowler 1968). Optical measurement methods have great advantages over the intrusive methods especially for the flow measurement in a rotating impeller. One is the optical flow visualization (FV) technique (Senoo, et al., 1968) and the other is the application of laser velocimetry (LV) (Hah and Krain, 1990). Particle image velocimetries (PIVs) combine major features of both FV and LV, and are very attractive due to the feasibility of simultaneous and multi-points measurements (Hayami and Aramaki, 1999). A high-pressure-ratio transonic centrifugal compressor with a low-solidity cascade diffuser was tested in a closed loop with HFC134a gas at 18,000rpm (Hayami, 2000). Two kinds of measurement techniques by image processing were applied to visualize a flow in the compressor. One is a velocity field measurement at the inducer of the impeller using a PIV and the other is a pressure field measurement on the side wall of the cascade diffuser using a pressure sensitive paint (PSP) measurement technique. The PIV was successfully applied for visualization of an unsteady behavior of a shock wave based on the instantaneous velocity field measurement (Hayami, et al., 2002b) as well as a phase-averaged velocity vector field with a shock wave over one blade pitch (Hayami, et al., 2002a. b). A violent change in pressure was successfully visualized using a PSP measurement during a surge condition even though there are still some problems to be overcome (Hayami, et al., 2002c). Both PIV and PSP results are discussed in comparison with those of laser-2-focus (L2F) velocimetry and those of semiconductor pressure sensors. Experimental fluid dynamics (EFDs) are still growing up more and more both in hardware and in software. On the other hand, computational fluid dynamics (CFDs) are very attractive to understand the details of flow. A secondary flow on the side wall of the cascade diffuser was visualized based either steady or unsteady CFD calculations (Bonaiuti, et al.,2002). EFD and CFD methods will be combined to a hybrid method being complementary to each other. Measurement techniques by image processing as well as CFD calculations give a huge amount of data. Then, data mining technique will become more important to understand the flow mechanism both for EFD and CFD.

  • PDF