• 제목/요약/키워드: Text analysis

검색결과 3,350건 처리시간 0.029초

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측 (Prediction of Music Generation on Time Series Using Bi-LSTM Model)

  • 김광진;이칠우
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.65-75
    • /
    • 2022
  • 딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.

관련 동영상 정보를 활용한 YouTube 가짜뉴스 탐지 기법 (Fake News Detection on YouTube Using Related Video Information)

  • 김준호;신용준;안현철
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.19-36
    • /
    • 2023
  • 정보통신기술의 발전으로 인해 누구나 쉽게 정보를 생산, 유포할 수 있게 되면서, 이를 악용하여 의도적으로 유포하는 거짓 정보인 가짜뉴스가 새로운 문제로 대두되기 시작하였다. 초기에 텍스트 방식으로 주로 전파되던 가짜뉴스는 점차 진화하여 이제는 멀티미디어 형식으로 퍼지고 있다. 유튜브는 2005년에 설립된 이후 세계 최고의 동영상 플랫폼으로 성장하면서 전 세계 사람들이 대부분 이용하고 있다. 하지만 유튜브는 가짜뉴스가 퍼지는 주요 창구가 되며 사회적인 문제를 일으키고 있다. 유튜브의 가짜뉴스를 탐지하기 위하여 다양한 학자들이 연구를 진행해 왔다. 가짜뉴스 탐지 연구에는 콘텐츠 기반의 접근과 배경정보 기반의 접근이 존재하는데 기존 가짜뉴스 연구와 유튜브의 가짜뉴스 탐지 연구를 살펴보면 콘텐츠 기반의 접근이 다수를 차지하고 있다. 본 연구에서는 콘텐츠 기반의 가짜뉴스 탐지가 아닌 배경정보 기반의 가짜뉴스 탐지기법을 제안하는데, 그 중에서도 유튜브에서 제공하는 관련 동영상 정보를 활용하여 가짜뉴스를 탐지하는 방법을 제안하고자 한다. 구체적으로 관련 동영상에서 얻은 정보와 원본 동영상에서 얻은 정보를 임베딩 기술인 Doc2vec을 이용하여 벡터화 한 후, 딥러닝 네트워크인 합성곱 신경망(CNN)을 통하여 가짜뉴스를 판별하고자 하였다. 실증분석 결과 제안 기법은 기존의 콘텐츠 기반으로 유튜브 가짜뉴스를 탐지하는 접근에 비해 보다 우수한 예측 성능을 보임을 확인하였다. 이러한 본 연구의 제안 기법은 파급력이 높은 유튜브 상에서 유포되는 가짜뉴스의 전파를 사전에 예방함으로써, 우리사회를 보다 안전하고 신뢰할 수 있도록 만드는데 기여할 수 있을 것으로 기대한다.

미래신호 탐지 기법을 활용한 위성산업 시장의 진입 전략 수립 연구 (A Study on Establishing a Market Entry Strategy for the Satellite Industry Using Future Signal Detection Techniques)

  • 김세형;박재형;이한솔;강주영
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.249-265
    • /
    • 2023
  • 우주 산업은 세계적으로 잠재력이 높은 산업 분야로 여겨지지만, 국내에서는 아직 글로벌 시장에 비해 비교적 관심이 저조한 실정이다. 국내에서도 최근 위성산업은 전통적인 정부 주도의 산업에서 벗어난 민간 주도의 '뉴스페이스(New Space)' 패러다임에 관심을 기울이고 있다. 따라서, 본 연구의 목적은 국내 위성산업 관련 민간 기업의 시장 진입 전략을 결정하는 데 도움이 될 수 있는 미래의 신호를 탐색하는 것이다. 이를 위해 본 연구에서는 미래신호 이론과 Keyword Portfolio Map 등의 이론적 배경을 활용하여, 키워드 성장률과 키워드 등장 빈도 등을 바탕으로 특허 문서 데이터 내 키워드 잠재력을 분석한다. 또한, 뉴스 데이터를 추가로 수집하여 미래신호를 각각 first symptom, early information으로 구분하였다. 이는 해당 키워드가 특허문서 이외에 어떻게 실질적인 잠재력을 드러내는지에 대한 해석적 지표로 활용된다. 본 연구는 미래신호 탐색을 위한 데이터 수집과 분석 과정을 수록하였고, 키워드 맵의 시각화 자료를 통해 어떤 형태로 활용될 수 있는지 구체적으로 시각화함으로써 수집된 문서의 각각의 키워드가 약신호에서 강신호로 발전하는 과정을 추적하는 일련의 과정을 수록하였다. 본 연구의 과정은 기존 미래신호에 관한 연구의 방법론적인 기여와 활용 범위의 확장에 기여할 수 있고, 결과물은 위성 산업에서의 신산업 기획 및 연구 방향성 수립에 기여할 수 있다.

어린이 광고의 설득전략에 대한 기호학적 해독 연구 (Decoding the Persuasion Strategies Used in the Advertising Targeted for Children)

  • 이두원
    • 커뮤니케이션학 연구
    • /
    • 제18권4호
    • /
    • pp.31-50
    • /
    • 2010
  • 이 연구는 어린이 광고에 내재된 설득전략을 기호학적 시각에서 해독(decoding)해보고자 하는 시도이다. 현대사회에서 광고가 소비생활에 미치는 막대한 영향력을 고려할 때, 국내에서 어린이 광고에 대한 '비판적 연구(critical studies)'는 매우 부족한 것이 현실이다. 이는 많은 선진국들이 '어린이 광고'가 어린이 소비가치관 및 소비생활에 미치는 유해성이나 부정적 영향에 대하여 장기간 연구하고, 그 결과를 어린이 광고 정책과 비평의 틀로 활용하는 것과 매우 대조적인 현실이다. 이 연구는 사회적 '의사소통 도구'로서 그리고 미디어 산업의 생태학적 부분으로서 '어린이 광고'의 중요성을 인식하고, 어린이를 광고의 '수동적 수용자'로 단정하지 않고, '능동적·비판적 수용자'로서 능력을 배양하기 위한 기초자료와 비판적 담론을 구축해보는 데 그 목적이 있다. 이 연구에서는 이러한 목적을 달성하기 위하여 어린이 광고를 수집하여 '표현기법(화용적 양태)'과 광고에 내재된 설득 '소구점(appeals)'과 '전제(premises),' 소비문화적 '이데올로기(ideology)'를 분석함으로써 궁극적으로 광고주의 의도된 정교한 설득전략을 해독해 보고자 하였다. 특히 기호학적 접근을 통하여, 어린이 광고에서 소비 기호들의 화용적 체계와 의미전달 체계 그리고 그 이데올로기가 '어떻게' 생성, 유지, 강화되며, 어린이를 향한 '전략적인' 구매 설득 수단으로 이용되는가를 살펴보는데 연구의 주안점을 두었다.

강증산(姜甑山)의 중국신화 수용과 그 의미 (Kangjeungsan(姜甑山)'s Embracement of Chinese Myth and It's Meaning)

  • 정재서
    • 대순사상논총
    • /
    • 제25_1집
    • /
    • pp.1-22
    • /
    • 2015
  • This paper took Jeonkyeong (典經) of Daesunjinrihoe(大巡眞理會) as the basic text and studied how Kangjeungsan(姜甑山), the Sangje (上帝), had embraced Chinese myth in process of formation of his religious thought focusing on Yan Emperor(炎帝) Shennong(神農) myth and Shanrangang(禪讓) myth (namely Danchu myth). First when we examine the myth surrounding Kangjeungsan's birth, it deeply emraced a feeling-birth myth(感生神話), we could realize that this is a universe motif through myth of hero birth in East Asia. Further judging from the analysis of geographic space of Kangjeungsan's activity, it included a variety of mythical and Daoist related place names. I think this is because of the fact that birth place of Kangjeungsan and the surrounding area is the locality of Xian(仙) tradition where major characters of Danhak sect(丹學派) have been turned out, and that Korean way of Xian suppressed by the regulatory system has been widely rooted in the public. Especially it's interesting that Jeungsan, the pen name of Kangjeungsan, ambiguously connotes Siru mountain(甑山), a place of his training, and the spiritual realm of the 『Zhouyicantongqi(周易參同契)』. Then I examined the God of fire Shennong myth which has been actively admitted and embraced by Kangjeungsan. Kangjeungsan put the root of his pedigree on Shennong and there is a close affinity between Shennong and Dongyi(東夷) such as Buyeo(夫餘), Goguryeo(高句麗), etc. These Dongyi spirits are losers against the Chinese major myth and beings of ressentiment. At the same time the predecessor of Jiutianyingyuanleishengpuhuatianzun(九天應元雷聲普化天尊) who shares mythical characteristics with the God of fire Shennong was a formerly Taishi(太師) Wenzhong(聞仲) of Yin(殷) dynasty. He was defeated and died by Zhou(周) dynasty, and was deified. The fact that Kangjeungsan regarded himself as a descendent of Shennong and possessed divinity of Jiutianyingyuanleishengpuhuatianzun connotes that he represents all beings of ressentiment such as family of Yin and Dongyi. However, Kangjeungsan set a religious milestone by turning revenge for such ressentiment at tribe level into religious sublimation. At the end Shanrang myth which has been critically embraced by Kangjeungsan was reviewed. According to the existing Shanrang myth, Danchu(丹朱) was unworthy and not succeeded in the succession to the throne. Then good natured Emperor Shun(舜) succeeded to the throne from Emperor Yao(堯). However, the reality of Shanrang myth was a violent change of sovereign power and Danchu was a victim in the process of such violent change. Kangjeungsan shrewdly grasped the reality of ancient China and cast light on presence of Danchu. And he emphasized the need of religious sublimation of revenge, Haewon(解冤). His such awareness of culture had a close relation with revisionist standpoint of independent Danhak sect expressing a skeptical glance at systematic, commensurate and authentic historical view of Chinese civilization. And further Kangjeungsan cosmologically and causationally reinterpreted revenge of Danchu. He established a universal salvation theology which has a corresponsive connotation in regard to embracement of Shennong myth. In conclusion, embracement of Chinese myth by Kangjeungsan was a creative work of reinterpretation resulting in an inherent religious connotation through a process of appropriation, that is independent and selective introjection.

지방자치단체의 스마트시티 조례 분석: 토픽모델링을 활용하여 (Analysis of Municipal Ordinances for Smart Cities of Municipal Governments: Using Topic Modeling)

  • 서형준
    • 정보화정책
    • /
    • 제30권1호
    • /
    • pp.41-66
    • /
    • 2023
  • 본 연구는 72개 지자체의 74개 스마트시티 조례를 대상으로, 지자체 스마트시티 조례의 방향성을 확인하고자 토픽모델링을 활용하여 조례의 주요 키워드를 확인하고, 조례의 키워드에 따른 주제분류를 진행하였다. 분석결과 주요 키워드는 스마트도시위원회의 구성 및 운영에 관한 키워드가 조례 내에서 높은 빈도를 보였다. 조례에 대한 토픽모델링 Latent Dirichlet Allocation(LDA) 분석결과 관련 키워드에 따라 총 8개의 주제로 분류할 수 있었다. 구체적으로 주제-1(스마트시티 추진사항 보안), 주제-2(스마트시티 산업진흥), 주제-3(스마트시티 주민협의체 구성), 주제-4(스마트시티 추진체계 지원), 주제-5(개인정보 관리), 주제-6(스마트시티 데이터 활용), 주제-7(지능정보화 행정구현), 주제-8(스마트시티 홍보) 등으로, 주제의 비중은 주제-6, 주제-4, 주제-1 등의 순으로 나타났다. 권역별 주제분류는 수도권은 주제-5, 주제-6, 주제-8 의 비중이 높았고, 지방권은 주제-2, 주제-3, 주제-4의 비중이 높아 수도권은 스마트시티의 실질 운영 관련 주제가 높았고, 지방권은 스마트시티 추진을 위한 준비단계 관련 주제 비중이 높았다.

최고경영진의 인지적 특성과 최고경영자 특성이 R&D투자에 미치는 영향 (The Effects of TMT's Cognitive Traits and CEO Factors on R&D Investment)

  • 조혜진;홍가혜
    • 지식경영연구
    • /
    • 제24권2호
    • /
    • pp.65-85
    • /
    • 2023
  • 본 연구는 최고경영진의 인지적 특성이 R&D투자에 어떤 영향을 미치는지 분석한다. 주의기반관점(attention-based view)에 기반하여 최고경영진의 미래지향성과 위험감수성이 R&D투자 수준을 높일 수 있음을 제시한다. R&D활동은 장기적으로 독점적인 지식을 생성하는 것을 목표로 삼고 있기에 기업의 미래성장가능성 및 경쟁우위를 이해하기위해 최고 경영진의 미래지향성과 위험감수성이 R&D투자에 미치는 영향을 이해하는 것이 중요하다. 추가적으로 최고경영진의 영향력을 조절하는 요인으로 CEO 관련 특성을 제시한다. CEO는 최고경영진의 리더역할을 하고 있기 때문에 만약 CEO의 의사결정권한이 높은 수준으로 집중되는 경우 최고경영진 자체의 특성이 R&D에 미치는 영향이 감소할 수 있다. CEO 특성 중 CEO 이사회의장 겸직 여부 및 CEO 소유지분을 통해 CEO의 높은 영향력을 측정하였다. 1994년부터 2015년까지 미국 제조업체 837개의 샘플을 기반으로, 최고경영진의 미래지향성 및 위험감수성이 높을수록 R&D집중도가 증가함이 나타났다. 그러나 CEO가 이사회의 의장도 겸임하며 높은 지분을 보유할 때, 최고경영진의 R&D집중도에 대한 영향력이 감소하였다. 이는 최고경영진과 CEO 사이에 상호작용이 있으며, CEO의 영향력이 커지고 의사결정권한이 높은 상태 및 구조에 따라 변화할 수 있음을 제시한다. 결론적으로 본 연구의 실증 연구 결과는 최고경영진의 주의와 CEO의 영향력 정도가 장기적인 관점에서의 지식 활용 및 개발을 촉진시키는 데 중요한 요소임을 시사한다.

LDA 토픽모델링을 활용한 국내 치유시설과 치유프로그램 연구 동향 (Research Trends in Korean Healing Facilities and Healing Programs Using LDA Topic Modeling)

  • 이주홍;이경진;성정한
    • 한국조경학회지
    • /
    • 제51권3호
    • /
    • pp.95-106
    • /
    • 2023
  • 국내 치유 연구는 치유에 대한 사회적 관심 증가와 함께 최근 20년 동안 발전해왔다. 치유를 연구하는 분야는 다양하며, 법제화된 자연-기반(natural-based) 치유를 포함한다. 본 연구에서는 KCI와 RISS에 게재된 2,202편의 학술지, 석·박사학위논문 초록을 수집하여 분석하였다. 연구방법은 LDA 토픽모델링을 활용하여 연구의 주제를 분류하였고, 시계열적 논문 발행 추이를 살펴보았다. 연구 결과, 국내 치유 연구의 주제가 5개의 유형과 4개의 매개어로 연결되었음을 규명하였다. 5개의 연구 유형은 "치유관광", "마음·예술치유", "산림치유", "치유공간", "청소년회복치유"였고, 4개의 매개 단어는 "산림", "자연", "문화", "교육"이었다. 또한 국내 치유 연구에서 법제화된 치유 연구만 추출하여 토픽을 분석하였다. 그 결과, 법제화된 치유 연구의 주제 유형이 4개로 분류되었다. 4개의 연구 유형은 "공간환경계획치유", "치유요법실험", "농업교육체험치유", "치유관광요인"이었다. 법제화된 치유에서 연구의 양이 가장 많은 산림치유, 식물을 매개로 유사한 프로그램을 운영하는 치유농업과 정원치유, 해양자원을 활용하는 해양치유의 연구 토픽 또한 분석하였다. 그 결과, 개별 치유 연구만의 독특한 특성을 보여주는 토픽과 모든 치유 연구에서 범용되는 것으로 생각되는 토픽을 도출하였다. 본 연구는 텍스트마이닝의 LDA 토픽모델링을 활용하여 국내 치유시설과 치유프로그램 연구의 전반적 경향을 파악하였다는 데 의의가 있다.

GNN을 이용한 웹사이트 Hierarchy 유사도 분석 기반 해외 침해 사이트 분류 모델 연구 (A Study on the Classification Model of Overseas Infringing Websites based on Web Hierarchy Similarity Analysis using GNN)

  • 서주현;유선모;박종화;박진주;이태진
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.47-54
    • /
    • 2023
  • 전 세계적으로 한류 콘텐츠가 유행하며 국내뿐만 아니라 해외에서도 국내 저작물의 저작권 침해 사례가 지속적으로 증가하고 있다. 이에 대응하기 위한 국내 불법 저작물 유통 사이트를 탐지하는 기술에 대한 연구가 활발하게 진행되고 있으며 최근 연구는 국내 불법 저작물 유통 사이트들이 광고 배너를 상당수 포함하고 있는 특징을 활용한 연구가 존재한다. 그러나 해외 불법 저작물 유통 사이트의 경우 광고 배너를 포함하지 않거나 국내 사이트에 비해 적은 양의 광고를 포함하고 있어 국내와 같은 탐지 기술의 적용이 제한적이다. 본 연구에서는 저작물 불법 공유 사이트가 게시물과 저작물의 이미지를 유사한 계층 구조로 포함하는 특징을 이용하여 링크 트리 및 텍스트 유사도 비교 기반의 탐지 기술을 제안한다. 대량의 링크로 작성된 대규모 트리의 정확한 유사도 비교를 위해 GNN(Graph Neural Network)를 활용한다. 본 연구의 실험에서 일반 사이트와 저작물 불법 유통 사이트를 분류에 95% 이상의 높은 정확도를 보였고 해당 알고리즘을 적용하여 불법 유통 사이트의 자동화된 탐지를 통해 신속한 저작권 침해 대응이 가능할 것으로 기대된다.