• 제목/요약/키워드: lexical information

검색결과 324건 처리시간 0.023초

Classifying Social Media Users' Stance: Exploring Diverse Feature Sets Using Machine Learning Algorithms

  • Kashif Ayyub;Muhammad Wasif Nisar;Ehsan Ullah Munir;Muhammad Ramzan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.79-88
    • /
    • 2024
  • The use of the social media has become part of our daily life activities. The social web channels provide the content generation facility to its users who can share their views, opinions and experiences towards certain topics. The researchers are using the social media content for various research areas. Sentiment analysis, one of the most active research areas in last decade, is the process to extract reviews, opinions and sentiments of people. Sentiment analysis is applied in diverse sub-areas such as subjectivity analysis, polarity detection, and emotion detection. Stance classification has emerged as a new and interesting research area as it aims to determine whether the content writer is in favor, against or neutral towards the target topic or issue. Stance classification is significant as it has many research applications like rumor stance classifications, stance classification towards public forums, claim stance classification, neural attention stance classification, online debate stance classification, dialogic properties stance classification etc. This research study explores different feature sets such as lexical, sentiment-specific, dialog-based which have been extracted using the standard datasets in the relevant area. Supervised learning approaches of generative algorithms such as Naïve Bayes and discriminative machine learning algorithms such as Support Vector Machine, Naïve Bayes, Decision Tree and k-Nearest Neighbor have been applied and then ensemble-based algorithms like Random Forest and AdaBoost have been applied. The empirical based results have been evaluated using the standard performance measures of Accuracy, Precision, Recall, and F-measures.

복합 커널을 사용한 한국어 종속절의 의존관계 분석 (Analyzing dependency of Korean subordinate clauses using a composit kernel)

  • 김상수;박성배;박세영;이상조
    • 인지과학
    • /
    • 제19권1호
    • /
    • pp.1-15
    • /
    • 2008
  • 한국어에서 절들의 의존관계를 밝히는 작업은 구문 분석 작업에서 가장 어려운 작업들 중에 하나로 인식되고 있다. 절의 의존관계를 파악하는 일은 표면적으로 나타나는 정보만을 가지고 처리할 수 없고, 의미정보와 같은 추가적인 정보가 필요할 것으로 판단하고 처리해 왔다. 본 논문에서는 추가적인 정보를 사용하지 알고, 문장에서 얻을 수 있는 표면적인 정보만을 사용하여 절들 간의 의존관계를 파악하는 방법을 제안한다. 문장에서 얻을 수 있는 표면적인 정보는 문장의 구문 정보(tree structure information)와 어휘 및 거리 정보를 가지고 있는 정적인 정보(static information)로 나누어 볼 수 있다. 본 논문에서는 절들 간의 의존 관계 파악을 위하여 구문 정보와 정적 정보를 다루는 하나 이상의 커널의 결합해서 사용하는 복합 커널(composite kernel)을 제안하고, 이 커널에 맞는 다양한 인스턴스 공간의 설정을 제안한다. 실험은 최적화된 인스턴스 공간을 절들 간의 의존관계 파악 및 문장 수준에서 성능을 검정하였다. 관계 인스턴스 공간은 절들 간의 연결 및 하부절의 표현 유무로 나누었고, 결정된 인스턴스 공간에서 복합커널을 사용한 방법이 좋은 성능을 발휘함을 보였다.

  • PDF

웹 통합문서의 효율적 생성과 검색을 위한 자동링크지원 시스템의 설계 및 구축 (Design and Implementation of Automatic Linking Support System for Efficient Generating and Retrieving Integrated Documents Based on Web)

  • 이원중;정은재;주수종;이승용
    • 정보처리학회논문지A
    • /
    • 제10A권2호
    • /
    • pp.93-100
    • /
    • 2003
  • 분산 컴퓨팅과 웹 서비스 기술의 발달과 함께, 급증하는 인터넷 사용자는 웹 기반의 맞춤형 정보를 편리하게 작성하고 제공받을 수 있는 서비스들을 요구하고 있다. 이를 위해, 본 논문에서는 맞춤형 정보로서 웹 기반의 통합문서를 생성하고, 사용자 요구에 따라 다양한 검색을 지원할 수 있는 자동링크지원 시스템(ALSS : Automatic Linking Support System)을 구축하고자 한다. 본 시스템의 구성은 클라이언트/서버 환경을 기반으로, 서버는 어휘분석, 질의처리 및 통합문서생성 기능들을 제공하는 자동링크엔진과 사전, 이미지 컨텐츠 및 URLs로 이루어진 데이터베이스를 지원하도록 구축하였다. 클라이언트 측은 서버 측의 자동링크엔진과 데이터베이스를 접근하여 웹 기반의 통합문서를 생성하는 웹 에디터와 검색 서비스를 지원하는 웹 도우미로 구축하였다. 웹 에디터나 웹 도우미 프로그램은 클라이언트 측에 별도의 설치 없이 서버로부터 다운로딩하여 실행할 수 있으며, 서버의 실행기능들의 일부를 글라이언트 측에 분산시키므로써 서버의 부하를 감소시켰다. 본 시스템의 구현으로서, 사용자 인터페이스는 JDK 1.3 기반의 SWING을 이용하고, 클라이언트와 서버간의 연동을 위한 자바 RMI 기법을 적용하였으며, SQL Server 7.0을 사용하여 데이터베이스를 구축하였다. 마지막으로 웹 에디터와 웹 도우미에 의해 자동링크엔진과 데이터베이스를 접근하는 과정과 그들의 실행결과를 보였다.

한국어 서사 텍스트 처리의 다중 표상과 구성 통합 이론: 주제어 연속성에 대한 양태 어미의 형태 통사적, 담화 화용적 기능 (A Multi-level Representation of the Korean Narrative Text Processing and Construction-Integration Theory: Morpho- syntactic and Discourse-Pragmatic Effects of Verb Modality on Topic Continuity)

  • 조숙환;김세영
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.103-118
    • /
    • 2006
  • 본 논문은 구성 통합 이론(Kintsch, 1988, Singer & Kintsch 2001, Graesser, Gernsbacher, & Goldman, 2003)을 토대로 주제어 연속성의 강도와 양태 어미 단서가 이야기 서사 텍스트에 쓰인 공주어 해석에 어떻게 이용되는지 검토했다. 실험 연구에는 명시적 조건과 중립적 조건 등 두 조건이 생성되었는데, 명시적 조건에는, 중립적 조건과는 달리, 주제어가 일관성 있게 유지되었고 또한 동사 어미의 형태 통사적 특징이 인칭과 일치되었다. 이 실험에는 59명의 대학생들이 다음 세 가지 과제에 참여했다. 실험은 첫째, 주어가 생략된 경우 피험자가 시험 문장(target sentence)을 읽는데 소요되는 시간을 측정했고, 둘째, 공주어의 해석, 즉, 선행사 (참조대상) 선택에 소요되는 반응 시간을 측정했으며, 셋째, 선행사 선정의 정답율을 분석했다. 실험 결과, 텍스트 처리과정에서 인칭과 같은 형태 통사적 조건이 유의미한 결과를 낳았으며, 또한, 주제어 연속성 조건의 효과가 형태 통사 조건에 따라 선택적인 양상을 보였다. 즉, 주제어가 지속적으로 연결되는 동안 화용적 맥락, 담화자의 사전 정보, 추론 등과 같은 총체적 정보와 주어, 동사 어미의 인칭과 같은 어휘적, 지엽적인 형태 통사적인 정보가 선행사 해석에 핵심적인 역할을 했다. 따라서, 이 실험 결과는 최소주의 가설 보다 공명 기반 모델을 지지한다.

  • PDF

명사 출현 특성을 이용한 효율적인 한국어 명사 추출 방법 (An Efficient Method for Korean Noun Extraction Using Noun Patterns)

  • 이도길;이상주;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.173-183
    • /
    • 2003
  • 형태소 분석을 한 후 명사를 추출하는 방법은 모든 어절에 대해 빈번한 사전 참조와 음운 복원을 위한 규칙 적용을 수행하므로 많은 연산을 필요로 하고, 중의성이 있는 어절에 대해 모든 가능한 분석결과를 생성하므로 명사 추출의 관점에서는 비효율적이다. 본 논문에서는 명사 추출의 관점에서 형태소 분석시 불필요한 연산을 줄이기 위해 명사 출현 특성을 고려하는 명사 추출 방법을 제안한다. 명사 출현 특성은 명사의 존재에 대한 긍정적 또는 부정적인 단서를 표현하는 한국어의 특성으로서, 배제 정보와 명사 접미 음절열이 있다. 배제 정보는 명사가 잃는 어절을 미리 배제하여 형태소 분석에 요구되는 탐색 공간을 줄이고. 명사 접미 음절열은 바로 알에 있는 병사를 검사함으로써 단순한 방법으로 명사를 추출하거나 미등록어를 인식하는 데에 사용한다. 또한 본 논문에서는 형태소 분석시 복잡한 음운 현상을 처리하기 위해 많은 음운 규칙을 적용하는 대신 음운 복인 정보를 사용하여 음운 현상을 처리한다. 실험 결과에 의하면 덕 방법은 기존의 형태소 분석 방법에 의한 명사 추출에 비해 정확도는 떨어지지 않으면서 수행 속도 면에서 매우 효율적임을 알 수 있다.

인공지능 스피커의 세대별 온라인 리뷰 분석을 통한 사용자 경험 요인 탐색 (Exploring user experience factors through generational online review analysis of AI speakers)

  • 박정은;양동욱;김하영
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.193-205
    • /
    • 2021
  • 인공지능 스피커 시장은 꾸준히 성장하고 있지만, 실제 스피커 사용자들의 만족도는 42%에 그치고 있다. 따라서, 본 연구에서는 인공지능 스피커의 세대별 토픽 변화와 감성 변화를 통해 사용자 경험을 저해하는 요소는 무엇인지 분석해 보고자 한다. 이를 위해 아마존 에코 닷 3세대와 4세대 모델에 대한 리뷰를 수집하였다. 토픽모델링 분석 기법을 사용하여 세대별로 리뷰를 이루는 주제 및 주제의 변화를 찾아내고, 딥러닝 기반 감성 분석을 통해 토픽에 대한 사용자 감성이 세대에 따라 어떻게 변화되었는지 살펴보았다. 토픽모델링 결과, 세대별로 5개의 토픽이 도출되었다. 3세대의 경우 스피커의 일반적 속성을 나타내는 토픽은 제품에 긍정적 반응 요인으로 작용했고, 사용자 편의 기능은 부정적 반응 요인으로 작용했다. 반대로 4세대에서는 일반적 속성은 부정적으로, 사용자 편의 기능은 긍정적으로 도출되었다. 이와 같은 분석은 방법론 측면에서 어휘적 특징뿐 아니라 문장 전체의 문맥적 특징이 고려된 분석결과를 제시할 수 있다는 것에 그 의의가 있다.

불안수준 및 일시적 유발정서가 서열정보 어휘처리에 미치는 효과 (An Effect for Sequential Information Processing by the Anxiety Level and Temporary Affect Induction)

  • 김충명
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.224-231
    • /
    • 2019
  • 본 연구는 불안 및 정상그룹을 대상으로 서열성을 판단하는 인지과제 수행과정에서, 유발된 배경정서와 내재된 불안 수준이 과제처리에 미치는 영향을 밝히고자 하였다. 어휘 간 관계정보 중 서열판단 과제에서의 피험자 내 변인으로 유발정서 유형(기쁨, 분노, 슬픔 및 통제) 및 인지과제 처리유형(숫자서열 및 크기서열)을, 피험자 간 변인으로는 일반 대학생 중 벡 불안척도 검사를 통해 분리된 불안여부로 설정한 후 반응시간 및 오류율의 차이를 분석하였다. 자극의 제시와 반응의 수집은 DmDx5를 활용하였다. 실험결과, 집단 간 반응의 차이가 확인되었고 불안그룹이 과제유형에 관계없이 모든 정서유발 조건에서 정상그룹에 비해 더 느린 반응시간과 더 높은 오류율을 보였다. 그리고 정서유형에 관계없이 두 서열과제에서도 지체응답 경향을 보였다. 다음으로 정서유발 및 서열과제 효과를 통해 정서 및 과제 특정적인 반응경향을 확인하였는데, 슬픔조건이 타 정서보다 빠른 반응을 보였으며, 숫자서열 조건이 크기서열 조건보다 더 빨랐다. 이는 그룹별 그리고 과제유형별 인지과제 처리경향은 물론, 수반되는 정서유형에 따른 응답경향의 차이를 확인해 줌으로써 정서-인지 관련 행동에서의 기저의 배경정서가 처리과정에 주요 요인이 될 수 있음을 시사하는 결과라 하겠다.

그림의 부호화 과정과 신경기제 : fMRI 연구 (Neural Substrates of Picture Encoding: An fMRI Study)

  • 강은주;김희정;김성일;나동규;이경민;나덕렬;이정모
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.23-40
    • /
    • 2002
  • 본 연구는 fMRI를 이용하여 정상인에 있어서 자극 유형, 특히 그림 자극의 부호화와 관련된 두뇌영역을 확인하고자 하였다. Scan 1에서는 그림 자극의 부호화 과정에 관여하는 두뇌 영역을 화인하기 위하여 어의범주 판단 과정 중에 그림과 단어에 대하여 비교 관찰하였으며 Scan 2에서는 그림자극에 대하여 그림 명명과제와 어의범주 판단과제를 비교하여 과제 유형에 따른 그림의 부호화에 관여하는 두뇌 활성화 영역을 연구하였다. 피험자는 어의범주(인공물/자연물)에 따라 마우스를 눌러 반응하거나(Scan 1) 그림명명이나 범주 소속 여부를 속으로 말하도록(subvocal response)(Scan 2) 요구되었다. 자극의 유형과 무관하게 부호화 중에 좌측 전전두 영역 양측의 두정엽, 그리고 양측의 고차시각 피질 등이 공통적으로 활성화 되었다. 그림보다 단어의 부호화에는 좌측 하 전전두엽, 우측 전측 전전두 영역, 양측의 도(insula), 좌측 두정-측두엽 등 광범위한 언어/개념관련 두뇌 영역에서 더 높은 활성화가 발견되는 반면, 그림의 부호화에는 양측의 고차 시각 영역과 해마방화(parahippocampal gyrus) 영역에서 더 높은 활성화가 관찰되었다. 이는 동일한 어의판단 과제를 수행하는 과정에도 단어는 어의적/언어적 처리가 그림은 지각적 정보처리 및 novelty 관련 정보처리가 서로 다른 해부학적인 영역에 의하여 매개됨을 의미한다. 그림 명명과제나 어의범주 판단과제 모두를 속으로 말하는 수행(Scan 2)은 배측 하 전전두 영역, 즉 Broca영역의 활동 증가를 야기시켰으며, 특히 명명과제 수행에는 어의범주 판단과제를 수행할 때에 비하여 양측의 시각영역에서 더 많은 활성화가 발견되었는데, 이는 대상의 명칭을 인출하는 과정에 고차 시각정보 처리가 더 많이 관여하였을 가능성을 시사한다.

  • PDF

딥러닝 자동 분류 모델을 위한 공황장애 소셜미디어 코퍼스 구축 및 분석 (Building and Analyzing Panic Disorder Social Media Corpus for Automatic Deep Learning Classification Model)

  • 이수빈;김성덕;이주희;고영수;송민
    • 정보관리학회지
    • /
    • 제38권2호
    • /
    • pp.153-172
    • /
    • 2021
  • 본 연구는 공황장애 말뭉치 구축과 분석을 통해 공황장애의 특성을 살펴보고 공황장애 경향 문헌을 분류할 수 있는 딥러닝 자동 분류 모델을 만들고자 하였다. 이를 위해 소셜미디어에서 수집한 공황장애 관련 문헌 5,884개를 정신 질환 진단 매뉴얼 기준으로 직접 주석 처리하여 공황장애 경향 문헌과 비 경향 문헌으로 분류하였다. 이 중 공황장애 경향 문헌에 나타난 어휘적 특성 및 어휘의 관계성을 분석하기 위해 TF-IDF값을 산출하고 단어 동시출현 분석을 실시하였다. 공황장애의 특성 및 증상 간의 관련성을 분석하기 위해 증상 빈도수와 주석 처리된 증상 번호 간의 동시출현 빈도수를 산출하였다. 또한, 구축한 말뭉치를 활용하여 딥러닝 자동 분류 모델 학습 및 성능 평가를 하였다. 이를 위하여 최신 딥러닝 언어 모델 BERT 중 세 가지 모델을 활용하였고 이 중 KcBERT가 가장 우수한 성능을 보였다. 본 연구는 공황장애 관련 증상을 겪는 사람들의 조기 진단 및 치료를 돕고 소셜미디어 말뭉치를 활용한 정신 질환 연구의 영역을 확장하고자 시도한 점에서 의의가 있다.

A Research on Paramedic Student Type of Perception for 119 Rescue Workers

  • Lee, Jae-Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.127-137
    • /
    • 2021
  • 본 연구는 응급구조과 학생들의 119구조대원에 대한 인식유형 연구이며, 소방공무원 중 119구조대원의 인식 유형을 파악하고 유형별 특성을 알아보기 위한 기초자료를 마련하고자 실시하였다. 27개의 진술문으로 된 Q 표본을 응급구조과 학생 총 54명을 대상으로 Q UANL 프로그램을 실행하여 분석한 결과 분류된 유형은 3개 유형으로, 전체 변량의 45 %로 확인되었다. 각 유형별 설명력을 보면 제I유형은 32 %, 제II유형은 6.7 %, 제III유형은 5.8 % 로 나타났다. 제I유형은 '우리의 슈퍼맨형', 제II유형은 '고통 받은 영웅형', 제III유형은 '구조 전문가형'으로 명명하였다. 전체적으로 119구조대원은 사전적인 구조대원이 있었으며 힘든 상황에서 외상후스트레스장애에 의해 힘들어하고 시민이 감싸주고 보호해 주어야 하는 119구조대원이 있었다. 또한 전문분야로 인정받으며 요구조자를 한 치의 실수 없이 인명 구조를 실시하는 119구조대원의 인식이 있었다. 이에 119구조대원이 구조의 전문분야로 인정받기 위해 다양한 훈련 및 경험을 공유할 수 있는 프로그램이 제공되어야 하고 연구되어져야 한다.