• 제목/요약/키워드: Data Embedding

검색결과 529건 처리시간 0.029초

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

음악과 플레이리스트의 메타데이터를 활용한 하이브리드 음악 추천 시스템에 관한 연구 (Research on hybrid music recommendation system using metadata of music tracks and playlists)

  • 이현태;임규건
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.145-165
    • /
    • 2023
  • 추천 시스템은 인터넷의 발달로 급격하게 증가하는 정보의 양으로 인해 생긴 정보 선택의 어려움을 소비자에게 덜어주고 각 개인의 취향에 맞는 정보를 효율적으로 보여주는 중요한 역할을 한다. 특히, E-commerce와 OTT 기업은 상품과 콘텐츠 양이 급격하게 증가하면서 추천 시스템의 도움 없이는 인기 있는 상품만 소비되는 현상을 극복하지 못한다. 이러한 현상을 극복하고 고객 개인 취향에 맞는 정보 혹은 콘텐츠를 제공해 고객의 소비를 유도하기 위해 추천 시스템의 연구가 활발히 진행되고 있다. 일반적으로 유저(user)의 과거 행동 이력을 활용한 협업 필터링이 유저가 선호한 콘텐츠의 정보를 활용하는 콘텐츠 기반 필터링에 비해 높은 성능을 보여준다. 하지만 협업 필터링은 과거 행동 데이터가 부족한 유저에 대해서는 추천의 성능이 낮아지는 콜드 스타트(Cold Start) 문제를 겪게 된다. 본 논문에서는 카카오 아레나 경진대회에서 주어진 음악 스트리밍 서비스 멜론의 플레이리스트 데이터를 기반으로 앞에서 언급한 콜드 스타트 문제를 해결할 수 있는 하이브리드 음악 추천 시스템을 제시했다. 본 연구에서는 플레이리스트에 수록된 곡 목록과 각 음악과 플레이리스트의 메타데이터를 활용해 절반 혹은 전부 가려진 플레이리스트의 다른 수록 곡을 예측하는 것을 목표로 하였다. 이를 위해 플레이리스트 안에 곡이 있는 경우와 아예 곡이 없는 경우를 나눠서 추천을 진행하였다. 플레이리스트 안에 곡이 있는 경우에는 해당 플레이리스트의 곡 목록과 각 곡의 메타데이터를 활용하기 위해 LightFM을 활용하였다. 그 다음에 Item2Vec을 활용해 플레이리스트에 있는 수록 곡과 태그 및 제목의 임베딩 벡터를 생성하고 이를 추천에 활용하였다. 최종적으로 LightFM과 Item2Vec 모델의 앙상블을 통해 최종 추천 결과를 생성하였다. 플레이리스트 안에 곡이 없고 태그 혹은 제목만이 존재할 경우에는 플레이리스트의 메타데이터인 태그와 제목을 FastText를 활용해 사전 학습을 시켜 생성된 플레이리스트 벡터를 기반으로 플레이리스트 간의 유사도를 활용하여 추천을 진행하였다. 이렇게 추천한 결과, 기존 Matrix Factorization(MF)에서 해결하지 못한 콜드 스타트 문제를 해결할 수 있었을 뿐만 아니라 곡과 플레이리스트의 메타데이터를 활용해 기존 MF 모델인 ALS와 BPR 그리고 Word2Vec 기반으로 추천해 주는 Item2Vec 기술보다 높은 추천 성능을 낼 수 있었다. 또한, LightFM을 토대로 다양한 곡의 메타데이터를 실험한 결과, 여러 메타데이터 중에서 아티스트 정보를 단독으로 활용한 LightFM 모델이 다른 메타데이터를 활용한 LightFM 모델들과 비교해 가장 높은 성능을 보여준다는 것을 확인할 수 있었다.

유역정보 기반 Transformer및 LSTM을 활용한 다목적댐 일 단위 유입량 예측 (Prediction of multipurpose dam inflow utilizing catchment attributes with LSTM and transformer models)

  • 김형주;송영훈;정은성
    • 한국수자원학회논문집
    • /
    • 제57권7호
    • /
    • pp.437-449
    • /
    • 2024
  • 딥러닝을 활용하여 유역 특성을 반영한 유량 예측 및 비교 연구가 주목받고 있다. 본 연구는 셀프 어텐션 메커니즘을 통해 대용량 데이터 훈련에 적합한 Transformer와 인코더-디코더(Encoder-Decoder) 구조를 가지는 LSTM-based multi-state-vector sequence-to-sequence (LSTM-MSV-S2S) 모형을 선정하여 유역정보(catchment attributes)를 고려할 수 있는 모형을 구축하였고 이를 토대로 국내 10개 다목적댐 유역의 유입량을 예측하였다. 본 연구에서 설계한 실험 구성은 단일유역-단일훈련(Single-basin Training, ST), 다수유역-단일훈련(Pretraining, PT), 사전학습-파인튜닝(Pretraining-Finetuning, PT-FT)의 세 가지 훈련 방법을 사용하였다. 모형의 입력 자료는 선정된 10가지 유역정보와 함께 기상 자료를 사용하였으며, 훈련 방법에 따른 유입량 예측 성능을 비교하였다. 그 결과, Transformer 모형은 PT와 PT-FT 방법에서 LSTM-MSV-S2S보다 우수한 성능을 보였으며, 특히 PT-FT 기법 적용 시 가장 높은 성능을 나타냈다. LSTM-MSV-S2S는 ST 방법에서는 Transformer보다 높은 성능을 보였으나, PT 및 PT-FT 방법에서는 낮은 성능을 보였다. 또한, 임베딩 레이어 활성화 값과 원본 유역정보를 군집화하여 모형의 유역 간 유사성 학습 여부를 분석하였다. Transformer는 활성화 벡터가 유사한 유역들에서 성능이 향상되었으며, 이는 사전에 학습된 다른 유역의 정보를 활용해 성능이 개선됨을 입증하였다. 본 연구는 다목적댐별 적합한 모형 및 훈련 방법을 비교하고, 국내 유역에 PT 및 PT-FT 방법을 적용한 딥러닝 모형 구축의 필요성을 제시하였다. 또한, PT 및 PT-FT 방법 적용 시 Transformer가 LSTM-MSV-S2S보다 성능이 더 우수하였다.

프로스포츠 산업 조직 구성원의 역량에 따른 관리자의 역할: 미국프로농구(NBA)와 한국프로농구(KBL)의 감독과 선수단 전력 수준에 관한 실증연구 분석 (The Effects of Managers on Organizational Performance in NBA and KBL Teams: The Moderating Role of Player Capabilities)

  • 정태성;김필수;이상현;이상범
    • 벤처창업연구
    • /
    • 제17권6호
    • /
    • pp.195-208
    • /
    • 2022
  • 벤처기업 CEO의 본질적인 역량과 역할은 관리자로서 조직의 자원을 얼마나 효율적으로 운영하는가에 달려있으며, 자원의 효율적 운영은 조직성과에 큰 영향을 미친다. 이러한 중요성에도 불구하고 CEO의 역량, 벤처기업 자원의 효율적 운영, 조직성과, 구성원의 역량 간에 어떤 관계가 존재하는지에 관한 이론적 고찰과 실증연구는 매우 부족한 실정이다. 기존 선행연구의 한계점을 보완하기 위해 본 연구에서는 프로스포츠 산업 조직 구성원의 역량에 따른 관리자의 감독역할에 대해 기업가정신(entrepreneurship)의 이론과 자원기반관점(resource-based view)을 프로스포츠 산업에 접목하여 이에 대한 실증분석을 진행하였다. 구체적으로, 벤처기업 CEO와 프로스포츠 감독의 역할이 조직구조와 성과 메커니즘의 측면에서 매우 흡사하며 조직의 자원을 효율적으로 운영하고 성과를 도출하는 측면에서 모두 기업가(entrepreneur)적 특성을 반드시 내재해야 한다고 본다. 프로스포츠팀 관리자로서의 감독역량과 조직성과 간의 관계에서 조직의 자원 효율성의 매개효과와 조직 구성원 역량에 대한 조절효과를 설명하고자 한다. 미국프로농구(NBA) 30개 구단과 한국프로농구(KBL) 10개 구단의 9개 시즌(2013~2014시즌 - 2021~2022시즌)의 감독과 팀 데이터의 실증분석 실행에 있어 프로세스 매크로 58 모형을 적용하여 본 연구의 가설을 검증하였다. 본 연구의 실증분석 결과, 미국프로농구와 한국프로농구 데이터 모두에서 (1) 프로농구팀의 자원 효율성은 감독의 역량과 승률 간의 정(+)의 관계를 매개하고, (2) 조직 구성원의 역량은 농구팀의 자원 효율성을 통한 감독역량이 승률에 미치는 간접효과를 조절(p<.05) 하는 것으로 나타났다. 본 연구는 비교적 객관적이면서도 정확하게 조직성과를 측정할 수 있는 프로스포츠 데이터를 활용하여 프로스포츠 산업에서 벤처기업의 CEO와 유사한 기업가적 임무를 수행해야 하는 감독 및 조직 구성원의 역량이 조직의 성과에 미치는 영향을 실증분석하는 한편, 스포츠산업 분야와 경영학 연구를 융합하였다는 의의가 있다.

청소년 창업교육프로그램 효과성 측정지표 개발 연구 (The Study of Metrics development for Entrepreneurial Program Effectiveness)

  • 변영조;김명숙;양영석
    • 벤처창업연구
    • /
    • 제9권4호
    • /
    • pp.77-85
    • /
    • 2014
  • 청소년을 대상으로 진행되는 창업교육의 목적은 성공적인 창업을 위한 창업구성요소의 개별적인 훈련보다는 창업이라는 프로세스를 이해하고 기업가정신을 함양하며 창의성을 향상시키는데 있다. 교육의 효과는 창업에 대한 올바른 인식을 심어주며 창업저변을 확대할 수 있는 가능성을 만들어 준다. 따라서 창업교육프로그램을 수강한 학생들이 교육을 통하여 어떠한 영향을 받았는지에 대한 검증은 매우 중요하며 이러한 효과측정을 통하여 더 나은 교육프로그램을 개발할 수 있는 계기를 마련할 수 있다. 그럼에도 불구하고 창업교육프로그램에 대한 효과성 측정도구에 대해서는 아직 연구가 미진한 상태이다. 따라서 창업교육프로그램을 통한 효과에 대한 정의와 이를 측정할 수 있는 지표의 개발이 필요하다. 본 연구에서는 이론적 경험적 접근방법을 통해 청소년의 창업교육프로그램을 통해 체화될 수 있는 학습효과를 기업가지향성, 창의성, 창업준비행동 등의 3개영역과 11개의 하위영역으로 구분하고 효과측정을 위한 49개의 예비문항을 도출하였다. 도출된 항목을 비즈쿨 선정학교인 5개의 특성화고등학교 학생 287명을 표본으로 실중분석을 실시하였다. 탐색적 요인분석과 확인적 요인분석을 통해 최종 3개영역, 8개의 하위영역(혁신성, 위험감수성, 문제해결능력, 협력적 의사결정, 효율적 행동능력, 정보수집, 진로탐색, 창업탐색 및 준비), 38개의 측정문항을 확정하였고, 마지막으로 척도의 신뢰도를 확보함으로써 최종의 청소년 창업교육프로그램 효과성 측정항목을 완성하였다. 추가적으로 비즈쿨 대상의 학생중에서 적극적으로 창업교육프로그램에 참여하고 있는 창업동아리 참여자와 비참여자와의 효과성에 대한 평균값을 비교한 것과 9개의 측정지표에 차이가 있음을 볼 수 있었다.

  • PDF

고품질 스테레오 음악을 위한 오디오 워터마크 정보 삽입/추출 기술 (An Embedding /Extracting Method of Audio Watermark Information for High Quality Stereo Music)

  • 배경율
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.21-35
    • /
    • 2018
  • 본 논문에서는 스테레오 음악에 오디오 워터마크를 삽입하기 위한 알고리즘을 제안하였다. 스테레오 음악은 2개의 채널을 갖고 있기 때문에 기존 워터마킹 기술은 일반적으로 각 채널을 독립적으로 생각하고 처리하는 경우가 많다. 그러나 스테레오를 모노로 변환하는 과정에서 워터마크의 손실이 발생하는 경우가 많이 발생할 수 있다. 제안한 알고리즘은 스테레오를 모노로 변환하더라도 워터마크의 손실이 발생하지 않도록 워터마크를 삽입할 때 스테레오와 모노변환의 특성을 이용하였다. 제안된 알고리즘에 사용된 오디오 워터마크는 "Copyright"와 "Copy_free"라는 두 가지 정보를 터보코드를 이용하여 생성하였다. 두 워터마크는 9바이트(72비트)로 이루어져 있으며, 오류정정을 위하여 터보코드를 적용하면 222비트로 삽입해야 하는 정보량이 늘어난다. 222비트의 워터마크는 추가적인 오류에 강인하도록 1024비트로 확장하여 최종적으로 스테레오 음악에 삽입할 워터마크로 사용하였다. 평균적으로 SNR은 40dB를 넘어서서 전통적인 양자화 방식보다 10dB 이상의 음질 개선을 가져왔다. 이는 상대적으로 10배의 음질 개선도를 의미하는 것으로 매우 유의미한 결과이다. 또한 워터마크의 추출에 필요한 샘플길이는 1초 이내의 길이면 충분히 추출이 가능하고, 128Kbps의 비트레이트를 갖는 MP3 압축에 대해서도 모두 1초 이내 길이의 음악 샘플로부터 워터마크의 완전한 추출이 가능하였다. 전통적인 양자화 방식이 10초 길이의 샘플을 이용해도 대부분 워터마크의 추출에 실패한 것에 비하면 1/10에 불과한 길이로 워터마크의 추출이 가능하다.

광조사 방식이 복합레진 수복물의 변연누출에 미치는 영향 (EFFECT OF LIGHT IRRADIATION MODES ON THE MARGINAL LEAKAGE OF COMPOSITE RESIN RESTORATION)

  • 박은숙;김기옥;김성교
    • Restorative Dentistry and Endodontics
    • /
    • 제26권4호
    • /
    • pp.263-272
    • /
    • 2001
  • 저광도 중합법, 펄스 지연 중합법, 초고광도 중합법 등의 광조사 방식이 광중합형 복합레진 수복물에서의 중합수축 응력에 미치는 영향을 알아보기 위해 in vitro에서 미세 누출 실험을 하였다. 80개의 발거된 소구치의 협측면에 5급 와동을 형성하고, 600mW/$cm^2$로 30초간 광조사하는 보통 광도 중합군, 300mW/$cm^2$로 60초간 광조사하는 저광도 중합군, 400mW/$cm^2$로 2초간 광조사하고 5분간 기다린 후 800mW/$cm^2$로 10초간 최종 중합시키는 펄스-지연 중합군, 그리고 1930mW/$cm^2$의 광도로 3초간 광조사하는 초고광도 중합군 등의 4개의 군으로 나누어 hybrid 형의 광중합복합레진을 충전하고 각 군의 방법대로 중합한 후, 변연의 0.5mm 외부에 nail varnish를 도포하고 37$^{\circ}C$, 2% metylene blue 용액에 24시간 동안 침적시켰다. 시편을 아크릴릭 레진에 매몰한 후 수복물의 중앙에서 종절단하여 입체현미경하에서 그 단면을 관찰한 후 법랑질과 상아질 변연으로 나누어 색소의 침투도를 측정하여 다음과 같은 결과를 얻었다. 1. 펄스 지연 중합군의 색소 침투도는 법랑질과 상아질 변연 모두에서 보통광도, 저광도 및 초고광도 중합군과 유의한 차이를 보이지 않았다(p>0.05). 2. 상아질 변연에서 초고광도 중합군은 보통광도 중합군과 저광도 중합군에 비해 유의하게 높은 색소 침투도를 보였다(p<0.05). 3. 법랑질 변연에서의 4개 군의 색소 침투도는 서로 유의한 차이를 보이지 않았다(p>0.05). 4. 모든 군에서 상아질 변연에서의 색소 침투도는 법랑질군에서의 색소 침투도에 비해 유의하게 높았다(p<0.05).

  • PDF

AH-26 및 산화아연유지놀 근관실러가 상아질에 대한 복합레진의 전단결합강도에 미치는 영향 (The Influence of AH-26 and Zinc Oxide-Eugenol Root Canal Sealer on the Shear Bond Strength of Composite Resin to Dentin)

  • 조주연;진명욱;김영경;김성교
    • Restorative Dentistry and Endodontics
    • /
    • 제31권3호
    • /
    • pp.147-152
    • /
    • 2006
  • AH-26 근관실러가 상아질에 대한 복합레진의 전단결합강도에 미치는 영향을 평가하기 위하여 144개의 발거된 대구치를 실린더형의 몰드에 매식한 다음 치관부의 상아질 표면을 노출시킨 후 편평하게 연마하고 AH-26을 도포한 군, ZOE paste를 도포한 군 및 실러를 도포하지 않은 대조군으로 나누어 One-step 상아질 접착제를 처리한 후에 Charisma (Heraeus Kulzer Germany) 복합레진을 적용하고 광중합시켰다. 시편을 분리하여 $37^{\circ}C$ 항온조에 24시간 보관후 Instron test machine (Model 4202, Instron Corp. USA)을 이용하여 시편의 전단 결합 강도를 측정하고 one-way ANOVA 및 Tukey's studentized rank test로 통계 분석 하였다. AH-26 근관실러로 처리한 군과 대조군은 ZOE 근관실러 처리군에 비해 유의하게 놓은 접착강도를 나타내었다(p<0.05). AH-26 근관실러 처리군과 아무 처리하지 않은 대조군 사이에는 결합강도에 있어 유의한 차이를 나타내지 않았다 (p>0.05). 본 연구의 조건에서는 ZOE 근관실러는 상아질에 대한 복합레진의 전단결합강도를 저하시키는 반면 AH-26 근관실러는 유의한 영향을 미치지는 않는 것으로 보인다. 따라서 임상에서 근관실러로 AH-26을 사용한 근관충전 후에는 즉시 복합레진 코어를 해 주어도 결합력에 저해가 없을 것으로 여겨진다.