• 제목/요약/키워드: 키워드 그래프

검색결과 51건 처리시간 0.023초

개체명 인식과 키워드 네트워크 분석을 활용한 약물 이상 반응 탐지 시스템 개발 (Development of Detection of Adverse Drug Reactions based on Named Entity Recognition and Keyword Network Analysis)

  • 이채연;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.670-672
    • /
    • 2023
  • 본 논문에서는 소셜 미디어 약물 리뷰 데이터로부터 약물 이상 반응을 탐지하는 모델인 FC-BERT 를 기반으로 소셜 네트워크 분석을 활용하여 웹 애플리케이션을 구현하였다. FC-BERT 모델을 거쳐 나온 개체명 인식 결과 중에 같은 의미를 가진 서로 다른 약물 이상 반응 표현들을 MedDRA 부작용 사전을 참고하여 하나의 MedDRA 용어로 표준화하여 매핑했다. 해당 결과에 소셜 네트워크 분석 기법을 적용하여 생성한 상위 15 개의 ADR 동시 출현 그래프를 상위 30 개의 워드 클라우드와 함께 시각화하여 보여주는 웹 애플리케이션을 개발했다. 동시 출현 그래프는 가장 많은 리뷰에서 동시에 나타나는 ADR 쌍을 보여준다. 본 논문에서 제안한 웹 애플리케이션은 사람마다 다르게 나타나는 다양한 약물 이상 반응을 사용자에게 좀 더 접근성이 좋게 제공할 수 있을 것으로 보인다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.

사용자 질의 의미 해석을 위한 온톨로지 지식 기반 검색 (Ontology Knowledge based Information Retrieval for User Query Interpretation)

  • 김난주;표혜진;정훈;최의인
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.245-252
    • /
    • 2014
  • 시맨틱 검색은 논리적으로 표현된 지식 베이스를 사용하여 현재의 키워드 기반 검색보다 더 정확한 결과를 제공할 수 있다. 그러나 일반 사용자는 지식 기반의 복잡하고 정형화된 질의어와 스키마를 잘 알지 못한다. 그래서 검색 시스템은 사용자 키워드의 의미를 해석할 수 있어야 한다. 본 논문에서는 멀티미디어 콘텐츠의 시맨틱 검색을 위한 사용자 질의 의미 해석 시스템을 설명한다. 제안한 시스템은 도메인 온톨로지 기반으로 구축된 지식 베이스의 정형화된 구조에 의미 해석 과정이 통합된 온톨로지 지식 베이스 기반 검색 시스템이다.

의료 산업에 있어 현대인의 비대면 의학 상담에 대한 관심도 분석 기법 (Analysis of interest in non-face-to-face medical counseling of modern people in the medical industry)

  • 강유성;박종훈;오하영;이세욱
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1571-1576
    • /
    • 2022
  • 코로나 바이러스의 발병 이후, 의료 산업은 침체기에 들어섰으며, 이에 대한 대응책으로 정부는 일시적으로 비대면 진료를 허용한 상태이다. 본 연구에서는, 이런 시대 흐름에 맞추어 의료 산업에 있어 현대인의 비대면 의학상담에 대한 관심도를 분석하고자 한다. 전문가에게 의학상담을 받을 수 있는 플랫폼인 지식인과, 유튜브 두가지 소셜 플랫폼에서 빅데이터를 수집해 연구를 진행했다. 전화 상담 상위 5개 키워드인 "내과", "일반의", "산경과", "정신건강의학과", "소아청소년과"와 더불어, "전문의", "의학상담", "건강정보" 총 8개의 검색어를 가지고 각 플랫폼으로부터 데이터 세트를 구축했다. 이후 크롤링 된 데이터를 바탕으로 형태소 분류, 질병 추출, 정규화 등 전처리 과정을 거쳤다. 단어 빈도수를 기준으로 한 워드 클라우드, 꺾은선 그래프, 분기별 그래프, 질병 등장 빈도별 막대 그래프 등으로 데이터 시각화를 하였다. 유튜브 데이터에 한해 감성 분류 모델을 구축하였고, GRU와 BERT 기반 모델의 성능을 비교하였다.

휴먼 오피니언 자동 분류 시스템 구현을 위한 비결정 오피니언 형용사 구문에 대한 연구 (Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion)

  • 안애림;한용진;박세영;남지순
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.248-251
    • /
    • 2011
  • 본 연구에서는, 웹 문서로부터 특정 상품에 대한 의견 문장을 분석하는 오피니언 마이닝(Opinion Mining) 연구의 일환으로, 특히 함께 공기하는 자질 명사에 따라 그 극성 값이 달라지는 '비결정 오피니언어휘'의 처리를 위해서 도메인을 '맛집'으로 한정하여 공기하는 도메인 키워드의 목록을 결정하고, 이를 부분문법그래프(Local Grammar Graphs) 방법론을 통해서 이들 간의 어휘 통사적 관계를 결정해 주었다.

소셜 네트워크에서 사용자 관심도를 고려한 이벤트 검출 기법 (Event Detection Scheme Considering User Interests in Social Networks)

  • 김이나;임종태;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.345-346
    • /
    • 2018
  • 소셜 네트워크 서비스의 사용량이 폭발적으로 증가함에 따라 실생활에서 발생한 이벤트에 관한 정보가 온라인을 통해 급속도로 확산되고 있다. 이에 따라 소셜 데이터를 통해 이벤트를 검출하기 위한 연구들이 진행되고 있다. 본 논문에서는 소셜 데이터를 이용하여 키워드 그래프를 구축하여 사용자 관심도를 고려한 이벤트 검출 기법을 제안한다. 사용자의 소셜 행위로부터 관심도를 계산하고 관심도의 변화를 고려하여 이벤트 판별에 이용한다. 기존의 기법과 달리 관심도를 반영함으로써 결과의 신뢰성을 향상시킨다.

  • PDF

대학 BI 분석을 위한 주제분류기의 구현 (Implementation of Topic Classifier for University News-based BI Analysis)

  • 장서윤;장현영;차채원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.23-25
    • /
    • 2021
  • 본 논문에서는 대학별 홍보 전략, 발전에 기여하기 위한 서비스를 제안한다. 이 서비스는 데이터 수집에는 크롤링을 사용하고 사이킷 런을 사용하여 정확도를 최대화하고, 각 분류된 카테고리의 오류을 최소화한다. 이 서비스는 각 카테고리별로 특성이 높은 키워드를 사용하여 카테고리 별 학습 데이터셋을 생성한 후 이러한 학습 데이터셋을 바탕으로 각 기사들을 최적의 카테고리로 분류해주는 분류기를 구현한다. 이러한 분류기를 사용하여 분류된 기사들을 분석하여 막대 그래프 등의 시각화된 자료들로 볼 수 있도록 하여 기존의 대학 홍보 자료에 비해 누구든 쉽고 간단하게 접근이 가능하도록 한다.

  • PDF

트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구 (Topic-Network based Topic Shift Detection on Twitter)

  • 진설아;허고은;정유경;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.285-302
    • /
    • 2013
  • 본 연구는 높은 접근성과 간결성으로 인해 방대한 양의 텍스트를 생산하는 트위터 데이터를 분석하여 토픽의 변화 시점 및 패턴을 파악하였다. 먼저 특정 상품명에 관한 키워드를 추출한 후, 동시출현단어분석(Co-word Analysis)을 이용하여 노드와 에지를 통해 토픽과 관련 키워드를 직관적으로 파악 가능한 네트워크로 표현하였다. 이후 네트워크 분석 결과를 검증하기 위해 출현빈도 기반의 시계열 분석과 LDA 토픽 모델링을 실시하였다. 또한 트위터 상의 토픽 변화와 언론 기사 검색결과를 비교한 결과, 트위터는 언론 뉴스에 즉각적으로 반응하며 부정적 이슈를 빠르게 확산시키는 것을 확인하였다. 이를 통해 기업은 대중의 부정적 의견을 신속하게 파악하고 이에 대한 즉각적인 의사결정 및 대응을 위한 도구로 본 연구방법을 활용할 수 있을 것으로 기대된다.

사례 기반의 요구사항 정형화 및 선정 평가 기법 (A Technique for Requirements Normalization and Selection based on Practical Approach)

  • 변정원;류성열;김진수
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권11호
    • /
    • pp.149-161
    • /
    • 2012
  • 인터넷 및 소셜 네트워크 등이 적극적으로 활용되는 사용자 참여 사회에서 사용자의 요구사항을 올바르게 시스템에 반영하는 것은 매우 중요하다. 본 연구에서는 C 사의1,800 여건의사용자 요구사항을 정형화하기 위한 절차와 기법을 제안하고, 정형화된 요구사항이 시스템 설계와 구현에 반영될 수 있도록 상대적 기여도를 측정하여 선정하는 기법을 제시한다. 다양한 사용자 요구사항을 요구사항 수준에 적합하도록 정형화하기 위하여, 요구사항 명세 표준에 따라 작성하고 키워드를 추출하고 상호 관계를 분석하여, 요구사항 계층 그래프를 작성하였다. 요구사항 계층 그래프는 시스템 설계와 구현을 위한 세부 목표를 정의하며, 계층별 요구사항의 상대적인 중요도를 표현한다. 요구사항의 상대적 중요도를 이용하여 요구사항별 상대적 기여도를 계산하고, 이를 이용한 선정 평가 기법을 제안한다. 제안한 기법의 타당성은 C 사의 사례 연구를 통하여 그 가능성을 입증하였다.

ESG 보고서의 텍스트 분석을 이용한 ESG 활동 탐색 -중국 상장 제조 기업을 대상으로- (Exploring ESG Activities Using Text Analysis of ESG Reports -A Case of Chinese Listed Manufacturing Companies-)

  • 진웅철;백승익;손유봉;김향단
    • 서비스연구
    • /
    • 제14권2호
    • /
    • pp.18-36
    • /
    • 2024
  • 본 연구는 글로벌 경제 시장에서 중국의 제조 기업들이 동적역량을 기반으로 어떠한 ESG 활동을 수행하고 있으며 그 활동에는 어떠한 차이가 있는가를 분석하였다. 상하이와 선전 증권 거래소 (Shanghai & Shenzhen Stock Exchange)에서 151개 중국 상장 제조 기업들의 ESG 연례 보고서와 상하이 화정 지표 정보 회사(CSI, China Securities Index Company)의 ESG 지표를 데이터로 사용하였다. 연구 분석에는 TensorFlow-BERT 모델과 코사인 유사도를 사용하여 환경, 사회, 지배구조로 구분된 ESG 키워드를 분류하였고 이를 기반으로 다음 세가지의 연구 질문을 구성하였다. 첫번째는 ESG 점수가 높은 기업(TOP-25)과 낮은 기업(BOT-25)을 구분하여 이 기업들 사이의 ESG 활동에는 어떠한 차이가 있는지를 확인하였으며, 두 번째는 ESG 점수가 높은 기업만을 중심으로 10년간(2010~2019년)의 ESG 활동에는 어떠한 변화가 있는지도 확인하였다. 그 결과 ESG 점수가 높은 기업과 낮은 기업간의 ESG 활동에는 유의한 차이를 보였으며, TOP-25기업의 연도별 활동 변화 추적에서는 ESG 활동의 모든 부분에서 차이를 보이지 않은 것으로 나타났다. 세번째 연구에서는 연도별로 작성된 각 항목별 E, S, G 키워드에 대하여 소셜 네트워크 분석을 진행하였다. 동시발생행렬(Co-occurance matrix) 기법을 통해 기업들의 ESG활동을 4사분면 그래프로 시각화하였으며 이를 바탕으로 ESG활동에 대한 향후 방향을 제시하였다.