• 제목/요약/키워드: Semantic class

검색결과 153건 처리시간 0.02초

네이버 영화 리뷰 데이터를 이용한 의미 분석(semantic analysis) (Semantic analysis via application of deep learning using Naver movie review data)

  • 김소진;송종우
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.19-33
    • /
    • 2022
  • SNS의 등장으로 인터넷 이용자들이 온라인에 남기는 텍스트의 양이 방대해지고 그 중요성이 강조되고있다. 특히 네이버의 영화 탭에서 볼 수 있는 영화 평점이나 리뷰는 실제로 관객들이 영화를 보기 전 해당 영화를 볼 것인지 결정하는 데 주요 요인이 되기도 한다. 본 연구는 실제 네이버 영화 리뷰 데이터를 가지고 평점을 예측하는 분석을 수행했다. 영화 리뷰 데이터를 분석하기 위해 평점의 분포를 통해 데이터 특성을 살펴보았고, 텍스트의 의미를 분석하기 위해 형태소 분석을 통한 한국어 자연어처리를 수행했다. 또한 평점 예측에 활용할 모델 선택을 위해 2-Class와 multi-Class 문제들에 대해 머신러닝과 딥러닝, 회귀와 분류 분석을 비교했으며, 오분류의 원인을 영화 리뷰 데이터 특성과 연관시켜 서술했다.

웹문서 검색을 위한 온톨로지 버전 제어 (Ontology Version Control for Web Document Search)

  • 김병곤
    • 디지털산업정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.39-48
    • /
    • 2013
  • Ontology has an important role in semantic web to construct and query semantic data. When system make changes to ontologies, questions arise about versioning of these changes. Applying this changes on a dynamic environment is even more important. To apply these changes, change specification method is needed. Early studies show RDF-based syntax for the operations between old and new ontologies. When several ontology versions can be used for some query, if possible, using possible newest version ontology with prospective use is best way to process the query. Prospective use of ontology means using a newer version of an ontology with a data source that conforms to a more recent ontology. In this paper, for prospective use of ontology version, structure of change specification of class and property through several ontology versions is proposed. From this, efficient adaptive ontology version selection for a query can be possible. Algorithm for structure of version transition representation is proposed and simulation results show possible newest version number for queries.

Symmetric Paths: Their Structures and Relations

  • Nam, Seungho
    • 한국언어정보학회지:언어와정보
    • /
    • 제17권1호
    • /
    • pp.1-16
    • /
    • 2013
  • The goal of this paper is two-fold: (i) the paper aims to characterize unique semantics of so called "symmetric" locatives like across the street - this will provide a guiding semantics for annotating a variety of paths; and (ii) the paper claims that we need "symmetric" paths to give a unified account of the various semantic effects of symmetric locatives. The paper illustrates several semantic effects induced by symmetric locatives: (i) symmetric underspecification, (ii) path-/event-quantification, (iii) static symmetric relations, and (iv) the symmetric inference by the adverb back. The paper defines the semantic class of symmetric locatives, and accounts for the symmetry effects in terms of properties and relations of Path Structure proposed by Nam (1995).

  • PDF

C++에서 프로그램 의존도 그래프를 이용한 클래스 분해 방법 (Class Slicing Method using Program Dependency Graph in C++)

  • 김영선;김홍진;손용식
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권1호
    • /
    • pp.63-80
    • /
    • 1998
  • 객체 지향 소프트웨어 개발에서 재사용은 소프트웨어 품질 향상과 소프트웨어 개발자의 생산성 향상을 위하여 연구되고 있다. 그러나 설계 단계에서 부적절한 작성과 유지보수시의 잘못된 변화로 인하여 클래스를 재사용 하는데 문제점이 존재한다. 본 논문에서 제안하는 방법은 C++. 프로그램 의존도 그래프를 이용하여 클래스의 의미론적인 결합 도를 분석하고, 결합 도에 따라 클래스를 분해하여 클래스의 품질 재평가와 확장성을 지원하도록 하는 방법이다. 따라서 본 논문에서 제안하는 방안은 개발자가 객체 지향 프로그램을 개발시에 원하는 부품만을 선택하여 재사용 시스템 구축을 용이하게 하였다.

  • PDF

잔차 연결의 조건부 생성적 적대 신경망을 사용한 시맨틱 객체 분할 (Semantic Object Segmentation Using Conditional Generative Adversarial Network with Residual Connections)

  • ;;;강현수;서재원
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1919-1925
    • /
    • 2022
  • 본 논문에서는 시맨틱 분할을 위한 조건부 생성적 적대 신경망 기반의 이미지 대 이미지 변환 접근법을 제안한다. 시맨틱 분할은 동일한 개체 클래스에 속하는 이미지 부분을 함께 클러스터링하는 작업이다. 기존의 픽셀별 분류 방식과 달리 제안하는 방식은 픽셀 회귀 방식을 사용하여 입력 RGB 이미지를 해당 시맨틱 분할 마스크로 구문 분석한다. 제안하는 방법은 Pix2Pix 이미지 합성 방식을 기반으로 하였다. 잔차 연결이 훈련 프로세스를 가속화하고 더 정확한 결과를 생성하므로 생성기 및 판별기 아키텍처 모두에 대해 잔여 연결 기반 컨볼루션 신경망 아키텍처를 사용하였다. 제안하는 방법은 NYU-depthV2 데이터셋를 이용하여 학습 및 테스트 되었으며 우수한 mIOU 값(49.5%)을 달성할 수 있었다. 또한 시맨틱 객체분할 실험에서 제안한 방법과 현재 방법을 비교하여 제안한 방법이 기존의 대부분의 방법들보다 성능이 우수함을 보였다.

Geometric and Semantic Improvement for Unbiased Scene Graph Generation

  • Ruhui Zhang;Pengcheng Xu;Kang Kang;You Yang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권10호
    • /
    • pp.2643-2657
    • /
    • 2023
  • Scene graphs are structured representations that can clearly convey objects and the relationships between them, but are often heavily biased due to the highly skewed, long-tailed relational labeling in the dataset. Indeed, the visual world itself and its descriptions are biased. Therefore, Unbiased Scene Graph Generation (USGG) prefers to train models to eliminate long-tail effects as much as possible, rather than altering the dataset directly. To this end, we propose Geometric and Semantic Improvement (GSI) for USGG to mitigate this issue. First, to fully exploit the feature information in the images, geometric dimension and semantic dimension enhancement modules are designed. The geometric module is designed from the perspective that the position information between neighboring object pairs will affect each other, which can improve the recall rate of the overall relationship in the dataset. The semantic module further processes the embedded word vector, which can enhance the acquisition of semantic information. Then, to improve the recall rate of the tail data, the Class Balanced Seesaw Loss (CBSLoss) is designed for the tail data. The recall rate of the prediction is improved by penalizing the body or tail relations that are judged incorrectly in the dataset. The experimental findings demonstrate that the GSI method performs better than mainstream models in terms of the mean Recall@K (mR@K) metric in three tasks. The long-tailed imbalance in the Visual Genome 150 (VG150) dataset is addressed better using the GSI method than by most of the existing methods.

코미디언 김희갑, 구봉서, 서영춘의 웃음 의미작용 분석 : 1960년대 후반기 한국 코미디영화를 중심으로 (An Analysis of the Meaning of Laughter by Comedians Hee-Gap Kim, Bong-Seo Koo and Young-Chun Seo : focusing on Korean Comedy Movies in the late 1960s)

  • 서곡숙
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권8호
    • /
    • pp.75-89
    • /
    • 2021
  • 본고에서 코미디언 김희갑, 구봉서, 서영춘을 중심으로 1960년대 후반기 코미디영화에 나타나는 웃음의 의미작용을 분석한 결과는 다음과 같다. 첫째, 코미디언의 내러티브적 웃음은 기성세대/청년세대의 세대 갈등, 하층계급/상층계급의 계층 갈등, 남성/여성의 젠더 갈등과 현실의 좌절을 나타낸다. 둘째, 코미디언의 웃음 창출 기제는 보수적인 기성세대에 대한 조롱, 부도덕한 상층계급에 대한 폭로, 좌절하는 하층계급에 대한 희화화를 보여준다. 셋째, 코미디언 웃음의 실천적 양상은 전통/근대의 균열, 경제적 불평등의 간극, 금지된 욕망의 표출을 드러낸다. 그래서 코미디언 김희갑, 구봉서, 서영춘은 비공식문화의 폐쇄적 개방, 캐릭터/퍼포머의 충돌을 통해 내부/외부의 경계자와 낙관적 세계관이라는 웃음의 의미작용을 보여준다.

의미 중의성을 고려한 온톨로지 기반 메타데이타의 자동 생성 (Ontology-based Automated Metadata Generation Considering Semantic Ambiguity)

  • 최정화;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.986-998
    • /
    • 2006
  • 인터넷의 발전으로 방대해진 정보를 컴퓨터가 이해하고 효율적으로 관리하기 위해서는 시맨틱 웹 기반의 메타데이타가 반드시 필요하다. 그러나 메타데이타 생성 시 의미 중의성을 가진 정보가 존재하며 이 문제의 해결책이 필요하다. 본 논문에서는 순차적으로 존재할 수 있는 단어들의 확률 모델을 이용하여 문서와 같은 정보에 포함된 의미가 애매한 단어를 관련성이 높은 모델의 개념으로 메타데이타를 생성하는 방법을 제안한다. 제안한 방법에서 메타데이타를 생성 할 때, 온톨로지에 정의된 개념들 간의 중의성을 고려하고 명칭(named entity)의 일부 단어에 대한 인식을 위해 은닉 마르코프 모델(Hidden Markov Model)을 사용한다. 먼저 온톨로지에 정의된 각 클래스(class)의 인스턴스(instance)를 인식하기 위한 마르코프 모델을 생성한다. 다음으로 문서로부터 의미가 애매한 단어의 의미를 파악할 수 있는 상황정보(Context)를 생성하고, 상황정보에 포함된 단어들의 순서에 대응하는 최적의 마르코프 모델을 찾아 메타데이타 생성시의 중의성 문제를 해결한다. 제안한 방법으로 전산학관련 논문에 대해 의미가 애매한 7개의 단어를 추출하여 실험하였다. 그 결과 상황정보에 존재하는 개체(entity)의 의미부류들 중 가장 빈번한 의미 부류로 애매한 단어의 의미를 선정한 SemTag보다 정확도 면에서 38%정도의 나은 성능을 나타내었다.

객체 지향 클래스 계층 구조 재구성 방법 (Restructuring Method for Object-Oriented Class Hierarchy)

  • 정계동;최영근
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1185-1203
    • /
    • 1998
  • 객체 지향 시스템에서 클래스 추가 및 삭제로 인하여 클래스간의 새로운 관계를 유지할 수 있는 클래스 계층 구조의 변경이 필요하다. 그러나 기존의 방법에서는 클래스 계층 구조 변경시 부모 클래스와 자식 클래스 사이의 의미를 파악하기 어려워 많은 추가적인 분석 비용이 소요된다. 본 논문에서는 클래스간의 유사성을 측정하여 새로운 관계성 분류 방법을 통해 의미적 변화에 따른 수정 방법을 제시한다. 즉, 이 방법은 클래스들의 유사성을 측정하여 관계성을 기준 하여 무관 관계, 동일 관계, 포함 관계, 부분 집합 관계로 구분하여 클래스 계층 구조를 재구성한다. 본 논문에서 제시하는 방법은 클래스 계층 구조 변경시 클래스간의 의미 오류 가능성을 최소화 할 수 있도록 한다. 또한 다양한 그래픽 및 텍스트 처리를 통하여 사용자에게 재사용의 편리성 및 이해성을 높일 수 있도록 하였다.

  • PDF

Learning Probabilistic Kernel from Latent Dirichlet Allocation

  • Lv, Qi;Pang, Lin;Li, Xiong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권6호
    • /
    • pp.2527-2545
    • /
    • 2016
  • Measuring the similarity of given samples is a key problem of recognition, clustering, retrieval and related applications. A number of works, e.g. kernel method and metric learning, have been contributed to this problem. The challenge of similarity learning is to find a similarity robust to intra-class variance and simultaneously selective to inter-class characteristic. We observed that, the similarity measure can be improved if the data distribution and hidden semantic information are exploited in a more sophisticated way. In this paper, we propose a similarity learning approach for retrieval and recognition. The approach, termed as LDA-FEK, derives free energy kernel (FEK) from Latent Dirichlet Allocation (LDA). First, it trains LDA and constructs kernel using the parameters and variables of the trained model. Then, the unknown kernel parameters are learned by a discriminative learning approach. The main contributions of the proposed method are twofold: (1) the method is computationally efficient and scalable since the parameters in kernel are determined in a staged way; (2) the method exploits data distribution and semantic level hidden information by means of LDA. To evaluate the performance of LDA-FEK, we apply it for image retrieval over two data sets and for text categorization on four popular data sets. The results show the competitive performance of our method.