• 제목/요약/키워드: 부정어

검색결과 101건 처리시간 0.029초

상수도시스템 수질사고의 전개양상을 고려한 비정형정보 의미분석 (Semantic analysis of unstructured information considering the step in progress of water quality accidents in the water supply systems)

  • 홍성진;문기훈;양성훈;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.378-378
    • /
    • 2022
  • 상수도시스템의 과정 중 최종 단계인 급수단계에서 지역전반에 수질문제가 발생할 경우, 직간접적인 피해의 해결은 장기간 지속될 수 있다. 본 연구에서는 실시간 비정형정보의 빅데이터 분석을 통해 상수도시스템에서 수질사고 문제의 파급력과 2차 피해 등의 연결 관계 변화 추적을 위한 기초적 분석을 수행하였다. 과거 대규모 수질사고가 발생된 바 있는 인천광역시 유충발생 사고를 대상으로 뉴스 기사 웹크롤링 절차를 정립하고, 그 결과를 분석하였다. '인천 유충'이 최초 보도되었던 2020년 7월 13일 부터 이후 1년을 대상으로 네이버 통합검색에 의해 표출되는 뉴스기사를 웹크롤링하였으며, 프로그래밍을 통한 불용어 제거 및 관련성 검토를 통해 총 920건의 기사를 분석하였다. 수질사고의 전개양상에 따라 사고발생, 확산, 수습, 그리고 보상의 4단계로 임의 구분하여 분석하였다. 의미분석을 위한 토픽모델링 기법은 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 방법을 적용하였으며, 긍부정 감정분석은 KNU 한국어 감성사전(KNU sentiment lexicon)을 활용하여 수행하였다. 토픽 모델링 결과, 사고 발생에서부터 확산, 수습, 보상의 단계에 맞춰 적절한 주제어의 조합에 따른 기사들이 도출되었으며, 단계별 긍부정 기사 비율역시 사고의 전개단계에 따라 적절히 나타남을 확인하였다. 제시된 수질사고 관련 비정형정보 분석 방법론과 결과는 과거 사고 사례 분석을 통한 검색 및 긍부정 키워드 확정, 키워드 발생 비율 변동(사고전과 후)에 따른 상황판단 기준설정 등에 활용이 가능하다.

  • PDF

독일어의 신체부위 "손" 관련 관용구의 결합가 연구 (Zur Valenz deutscher verbaler Somatismen mit der Komponente ${\lceil}hand{\rfloor}$)

  • 김수남
    • 한국독어학회지:독어학
    • /
    • 제4집
    • /
    • pp.1-27
    • /
    • 2001
  • 이 글의 목적은 독일어 신체어휘 관련 관용구들 가운데 ${\lceil}$Duden Band 11${\rfloor}$에 수록된 108개의 $\lceil$$\rfloor$ 관련 관용구를 대상으로 이들의 형태$\cdot$통사구조를 파악하고, 그들을 모형화하는 것이다. 우리는 연구 대상을 문장에서 결합가 보유어로서 술어의 기능을 하는 관용구에 한정했다. 우리는 $\lceil$$\rfloor$ 관련 관용구를 보충어의 수와 형태에 따라 크게 세 가지 부류, 즉 1가, 2가, 3가의 관용구로 구분하였다 보충어의 형태는 명사구(Sn, Sd, Sa)와 전치사구(pS)에 한정했으며 문장형태의 보충어, 예를 들어 부문장(NS)과 부정사문(Inf) 형태는 고려하지 않았다. 이들이 보충어로 간주될 수 있는지의 여부는 아직 더 많은 연구를 필요로 하기 때문에 다음 과제로 남겨두었다. 일차적으로 외적 결합가($\"{a}u{\beta}ere\;Valenz)$에 따라, 이차적으로는 내적 결합가(innere Valenz)에 따라 108개의 $\lceil$$\rfloor$ 관련 관용구를 분석한 결과 우리는 다음과 같은 형태$\cdot$통사적 문형을 얻을 수 있었다. $\cdot$ 1가 동사 관용구: 1) PL-Sn : (1) PL[VPL - Sa] - Sn (2) PL(VPL - pS) - Sn (3) PL[VPL - Sa - pS] - Sn (4) PL[VPL - pS - pS] - Sn Sondergruppen: PL[VPL - Sa - Inf] - Sn PL[VPL - pS - Inf] - Sn 2) PL - Sd: (1) PL[VPL - Sn] - Sd (2) PL[VPL - Sn(es) - pS] - Sd $\cdot$ 2가 동사 관용구1) PL - Sn - Sd: (1) PL[VPL - Sa] - Sn - Sd (2) PL[VPL - pS] - Sn - Sd (3) PL[VPL - Sa - pS) - Sn - Sd 2) PL - Sn - pS: (1) PL[VPL - Sa] - Sn - pS (2) PL[VPL - pS] - Sn - pS (3) PL(VPL - Sa - pS) - Sn - pS 3) PL[VPL - pS) - Sn -Sa $\cdot$ 3가 동사 관용구: (1) PL[VPL - pS] - Sn - Sd - Sa (2) PL[VPL - pS] - Sn - Sa - pS (3) PL[VPL - Sa] - Sn - Sd - pS 이러한 분류가 보여주듯이, 독일어에는 1가, 2가, 3가의 관용구가 있으며, 구조 외적으로 동일한 통사적 결합가를 갖는다 하더라도 구조 내적 성분구조가 다르다는 것을 알 수 있다. 우리는 이 글이 외국어로서의 독일어를 배우는 이들에게 독일어의 관용구를 보다 올바르게 이해할 수 있는 방법론적인 토대를 제공함은 물론, (관용어) 사전에서 외국인 학습자를 고려하여 관용구를 알기 쉽게 기술하는 데 도움을 줄 수 있기를 바란다.

  • PDF

한국 신문 사설의 정치적 성향 분석 연구 (The Study on Political Stances based on Editorials of Korean Newspapers)

  • 반현
    • 문화기술의 융합
    • /
    • 제4권3호
    • /
    • pp.87-92
    • /
    • 2018
  • 본 논문은 뉴스 생산자인 저널리스트, 혹은 언론사의 정치적 입장이 신문사설에서 어떻게 나타나는 가를 평가어를 근거로 살펴보는데 목적이 있다. 이 목적을 위해 이념이 상이한 한국의 조선일보와 한겨레신문을 기준으로 북미(미북) 정상회담에 관한 사설들을 질적 양적 분석하였다. 구체적으로 북미정상회담이 열렸던 6월 12일 전후 5월 28일부터 6월 27일까지의 30일 동안에 실린 조선일보의 16개의 사설들과 한겨레에 실린 14개의 사설을 두고 첫째로 사설 제목에 드러난 평가어들을 부정, 긍정, 중립으로 분류하였다. 질적 목적을 위해 6월 12일 미국과 북한의 공동선언문이 발표된 직후 출판된 2개의 사설들을 마틴과 화이트(2005)의 평가어 틀을 기준으로 분석하였다. 분석 결과 조선일보 사설은 북미정상회담에 대한 부정적 견해를 감정평가에 의존하여 기술하고 있으며, 한겨레는 북미정상회담에 대한 긍정적 견해를 '공간확대'와 같은 '개입' 요소를 통해 객관화시키고 있다는 점을 알 수 있었다.

소셜 빅데이터 분석에 의한 신 소비시장 트렌드 연구 - '나홀로 소비' 연관어를 중심으로 - (Research on the New Consumer Market Trend by Social Big data Analysis -Focusing on the 'alone consumption' association-)

  • 추진기
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.367-376
    • /
    • 2020
  • 최근 신 소비시장 트렌드에 관한 통계에 따르면 그 중심에 '나홀로 소비' 가 있다. 본 연구는 특정 사회적 트렌드는 그것에 대한 배경을 형성하고 있는 사회와 지역성, 문화, 경제, 심리 등 삶의 다양한 측면들을 통합적인 시각으로 해석하는 것이 중요하다는 측면에서, 수많은 대중의 의견이 수렴되는 신 소비시장 관련 리서치 데이터에서 추출한 '나홀로 소비' 연관어를 분석 키워드로 설정하였고, 분석솔루션 중 하나인 소셜메트릭스TM를 통한 오피니언 분석(Opinion Analisys) 기법을 활용하여 신 소비시장 트렌드에 관한 연구를 진행하였다. 신 소비시장 고찰결과 '혼밥', '혼술', '혼영'이라는 키워드가 도출되었고 이를 활용하여 신 소비시장 트렌드를 분석하였다. 나홀로 소비는 기존 소비자 트렌드 가운데 글로벌 경제위기 이후에 인구변화와 함께 야기된 필연적 새로운 소비 트렌드가 되었고 연관어에 따른 긍, 부정 감정분석의 결과도 대체로 긍정적인 데이터 결과를 확인할 수 있었으며, 이 소비 트렌드는 시대를 반영하는 새로운 트렌드로서의 중요성이 더욱 강화될 것이다. 향후 소셜 빅데이터에 의한 트렌드 분석이 본 연구보다 다양한 분석 도구를 통해 실행된다면 신 소비시장에 관한 새롭고 가치 있는 유통전략 및 기획에 도움이 될 것이다.

영상 콘텐츠의 신뢰도 평가를 위한 언어와 비언어 통합 감성 분석 시스템 (Integrated Verbal and Nonverbal Sentiment Analysis System for Evaluating Reliability of Video Contents)

  • 신희원;이소정;손규진;김혜린;김윤희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권4호
    • /
    • pp.153-160
    • /
    • 2021
  • IT 기술 발달에 따른 영상 콘텐츠 생산과 소비가 증가함에 따라 영상 콘텐츠를 통한 제품 리뷰 정보로 구매의사 결정이 빈번해졌다. 따라서, 리뷰 영상에 대한 신뢰성을 평가할 필요가 있다. 본 연구에서는 제품 리뷰 영상을 얼굴 표정 분석과 텍스트 마이닝을 통해 리뷰어의 표정과 음성을 분석하여 영상의 신뢰도를 분석한다. 영상 내 인물 표정의 감성 값을 추출하는 알고리즘을 활용하여 비언어 감성을 정량화하고, 유의미한 감정 변화 구간을 추출한다. 유의미한 감정 변화 구간의 리뷰어 음성을 텍스트화하여 표준어 및 비표준어 감성 사전 활용을 통해 긍정과 부정으로 리뷰에 대한 언어 감성 분석 후 수치화 한다. 비언어 감성 분석과 언어 감성 분석의 결과를 통합하여 일치 여부에 따라 신뢰도를 도출한다. 본 연구를 통해 영상 콘텐츠의 신뢰성 평가 방법을 제시한다.

종자 어휘를 이용한 자질 추출과 지지 벡터 기계(SVM)을 이용한 문서 감정 분류 시스템의 개발 (A Sentiment Classification System Using Feature Extraction from Seed Words and Support Vector Machine)

  • 황재원;전태균;고영중
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.938-942
    • /
    • 2007
  • 신문 기사 및 상품 평은 특정 주제나 상품을 대상으로 하여 글쓴이의 감정과 의견이 잘 나타나 있는 대표적인 문서이다. 최근 여론 조사 및 상품 의견 조사 등 다양한 측면에서 대용량의 문서의 의미적 분류 및 분석이 요구되고 있다. 본 논문에서는 문서에 나타난 내용을 기준으로 문서가 나타내고 있는 감정을 긍정과 부정의 두 가지 범주로 분류하는 시스템을 구현한다. 문서 분류의 시작은 감정을 지닌 대표적인 종자 어휘(seed word)로부터 시작하며, 자질의 선정은 한국어 특징상 감정 및 감각을 표현하는 명사, 형용사, 부사, 동사를 대상으로 한다. 가중치 부여 방법은 한글 유의어 사전을 통해 종자 어휘의 의미를 확장하여 각각의 가중치를 책정한다. 단어 벡터로 표현된 입력 문서를 이진 분류기인 지지벡터 기계를 이용하여 문서에 나타난 감정을 판단하는 시스템을 구현하고 그 성능을 평가한다.

  • PDF

퍼지 언어적 관련도에 근거한 시소러스 모델 (Thesaurus Model based on Fuzzy Linguistic Relation Degree)

  • 최명복;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.72-74
    • /
    • 1998
  • 정보검색 시스템에서 시소러스는 정보항목에 대한 용어들간의 관계를 계층적 구조로 나타낸다. 따라서 정보검색 시스템에서 시소러스의 사용은 이용자의 질의에 있는 탐색어와 관련된 정보항목들을 검색할 수 있기 때문에 정보검색 시스템의 검색효율을 크게 증가시킬 수 있다. 그러나 기존의 시소러스 모델들은 용어들간의 관련 정도를 무시하거나 정량적인 수치값으로 부여하기 때문에 인간의 주관성과 부정확성을 다루는데 적합하지 않다. 용어들간 의미의 밀접한 정도(Degree of Closeness)는 모호하고 부정확한 판단에 근거하는 인간의 정성적인 측정 단위이다. 그러므로 관련정도를 정량적으로 표현하는 것은 정성적 개념을 정확한 숫자 값으로 변환하는 것이기 때문에 인간의 정성적 측정 단위를 정확하고 용이하게 정량적으로 측도하여 반영한다는 것은 어렵다. 따라서 본 논문에서는 용어들간의 관련도를 정성적으로 부여한 시소러스 모델을 제안한다. 이 시소러스 모델에서는 색인어간의 관련도를 정성적으로 표현하기 위해 퍼지 집합 이론에 근거한 언어적 설명자들을 정의한다. 언어적 설명자들은 존재론적 문제가 고려되고 다분히 인식론적인 표현에 근거한다.

  • PDF

임베딩 자질을 이용한 대화의 감정 분류 (Emotion Classification in Dialogues Using Embedding Features)

  • 신동원;이연수;장정선;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.109-114
    • /
    • 2015
  • 대화 시스템에서 사용자 발화에 대한 감정 분석은 적절한 시스템 응답과 서비스를 제공하는데 있어 매우 중요한 정보이다. 본 연구에서는 단순한 긍, 부정이 아닌 분노, 슬픔, 공포, 기쁨 등 Plutchick의 8 분류 체계에 해당하는 상세한 감정을 분석 하는 데 있어, 임베딩 모델을 사용하여 기존의 어휘 자질을 효과적으로 사용할 수 있는 새로운 방법을 제안한다. 또한 대화 속에서 발생한 감정의 지속성을 반영하기 위하여 문장 임베딩 벡터와 문맥 임베딩 벡터를 자질로서 이용하는 방법에 대해 제안한다. 실험 결과 제안하는 임베딩 자질은 특히 내용어에 대해 기존의 어휘 자질을 대체할 수 있으며, 데이터 부족 문제를 다소 해소하여 성능 향상에 도움이 되는 것으로 나타났다.

  • PDF

빅데이터 분석을 활용한 음성 인식 스피치 교정 애플리케이션 (Voice Recognition Speech Correction Application Using Big Data Analysis)

  • 김한결;김도우;임세명;홍두표
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.533-535
    • /
    • 2019
  • 최근 청년 실업률의 증가에 따른 취업 경쟁이 날이 갈수록 심해지고 있다. 채용과정에서 면접의 비중을 높이는 기업도 갈수록 증가하고 있다. 또한 대기업에서는 면접의 객관성을 확보하기 위해 AI 면접을 도입했다. 이러한 면접의 도입으로 인해 취업 준비생들의 면접 준비에 드는 비용 부담이 증가하였다. 최근 AI분야에서 음성 인식과 자연어 처리에 대한 개발이 활발히 이루어지고 있다. 본 논문은 녹음된 면접 음성을 음성 인식 기술 중 STT(Speech To Text) 와 TTS(Text To Speech)를 활용하여 면접의 음성을 문자로, 면접 질문의 문장을 음성으로 변환한다. 또한 자연어 처리 및 감성어 사전(KNU)을 활용하여 면접 문장의 형태소 분석하고 긍정 및 부정 단어별 정보를 시각화 하여 나타낼 수 있게 구현하였다.

자폐와 발달장애를 바라보는 언론사 시각 변화 -이상한 변호사 우영우 드라마 전후 비교- (Changes in Media Perspectives on Autism and Developmental Disorders)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.183-184
    • /
    • 2023
  • 본 연구는 2022년 여름 인기리에 반영된 '이상한 변호사 우영우'라는 드라마가 '자폐'와 '발달장애' 관련 언론사의 보도형태에 어떤 영향을 미쳤는지 분석하였다. 본 연구에서는 2018년 1월 1일부터 2022년 12월 14일까지(약 5년간) 총 54개 언론사에서 보도한 '자폐'와 '발달장애'라는 용어가 포함된 관련 뉴스 기사들을 분석하였다. 그 분석대상 뉴스 빅데이터를 대상으로 키워드 트렌드 분석, 연관어 분석(워드클라우드 제시) 등을 진행하였다. 본 연구결과는 일반 시민 대상 장애인식 개선 프로그램의 개발 등에 활용될 수 있을 것으로 기대된다. 또한 본 연구를 확대하여, 장애인 관련 언론사의 보도태도(긍정-중립-부정 등)를 체계적으로 분석하고자 한다.

  • PDF