• Title/Summary/Keyword: 의미적 분할

Search Result 876, Processing Time 0.028 seconds

Modeling of Semantic Similarity for Scene Segmentation (장면 분할 기법을 위한 의미적 유사도의 모델링)

  • Jung, Eui-Son;Jeon, Seong-Jun;Cho, Dong-Hwi;Geum, Yong-Ho;Ham, Dong-gyun;Kim, Eun-Ji;Park, Seung-Bo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.225-228
    • /
    • 2022
  • 본 논문에서는 의미적 유사도 기반의 장면 분할 방법을 제안한다. 이 방법은 의미적 접근을 통해 기존 연구에서 가졌던 한계를 극복하고 정확한 장면 분할이 가능할 것으로 기대한다. 의미적 유사도 비교를 Class 종류 비교, Class별 객체의 개수 비교, 샷 간의 Histogram비교, 객체의 관심영역(ROI) Histogram비교 총 4가지 규칙으로 정의했고 이때 도출된 4가지 유사도는 전처리를 거쳐 종합 유사도를 계산한다. 또한 의미적 접근을 통해 연속되는 Shot의 유사도를 비교하고 기준값에 따라 Shot을 묶어서 최종적으로 의미적 유사도(Semantic Similarity)에 기반한 장면의 경계(Scene Boundary) 분할 방법을 제시한다.

  • PDF

Two-Level Clausal Segmentation Algorithm using Sense Information (의미 정보를 이용한 이단계 단문 분할 알고리즘)

  • Park, Hyun-Jae;Lee, Su-Seon;Woo, Yo-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.237-241
    • /
    • 1999
  • 단문 분할은 한 문장에 중심어인 용언이 복수개인 경우 용언을 중심으로 문장을 나누는 방법이다. 기존의 방법은 정형화된 문장의 경우 효율적인 결과를 얻을 수 있으나 구문적으로 복잡한 문장인 경우는 한계를 보였다. 본 논문에서는 이러한 한계를 극복하기 위해 구문 정보의 단문 분할이 아닌 의미 정보를 활용하여 복잡한 문장을 효율적으로 단문으로 분할하는 방법을 제안한다. 정형화된 문장의 경우와 달리 일상적인 문장은 문장의 구조적 애매성이나 조사의 생략 등이 빈번하므로 의미 수준에서의 단문 분할이 필요하다. 본 논문에서는 의미 영역에서 단문 분할의 할 경우 기존의 방법들의 애매성을 해소할 수 있다는 점을 보인다. 이를 위해, 먼저 하위범주화 사전과 시소러스의 의미 정보를 이용하여 용언과 보어 성분간의 의존구조를 1차적으로 작성하고 이후 구문적인 정보와 기타 문법적인 지식을 사용하여 기타 성분을 의존구조에 점진적으로 포함시켜가는 이단계 단문 분할 알고리즘을 제안한다. 제안된 이단계 단문 분할 방법의 유용성을 보이기 위해 ETRI-KONAN의 말뭉치 중 20,000문장을 반 자동적인 방법으로 술어와 보어 성분간의 의존구조를 태깅한 후 본 논문에서 제안한 방법과 비교하는 실험을 수행한다.

  • PDF

Multi-Modal Cross Attention for 3D Point Cloud Semantic Segmentation (3차원 포인트 클라우드의 의미적 분할을 위한 멀티-모달 교차 주의집중)

  • HyeLim Bae;Incheol Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.660-662
    • /
    • 2023
  • 3차원 포인트 클라우드의 의미적 분할은 환경을 구성하는 물체 단위로 포인트 클라우드를 분할하는 작업으로서, 환경의 3차원적 구성을 이해하고 환경과 상호작용에 필수적인 시각 지능을 요구한다. 본 논문에서는 포인트 클라우드에서 추출하는 3차원 기하학적 특징과 함께 멀티-뷰 영상에서 추출하는 2차원 시각적 특징들도 활용하는 새로운 3차원 포인트 클라우드 의미적 분할 모델 MFNet을 제안한다. 제안 모델은 서로 이질적인 2차원 시각적 특징과 3차원 기하학적 특징의 효과적인 융합을 위해, 새로운 중기 융합 전략과 멀티-모달 교차 주의집중을 이용한다. 본 논문에서는 ScanNetV2 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 제안 모델 MFNet의 우수성을 입증한다.

Robust Gesture Spotting and Recognition in Continuous Full Body Gesture (연속적인 전신 제스처에서 강인한 행동 적출 및 인식)

  • Park A.-V.;Shin H.-K.;Lee S.-W
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.898-900
    • /
    • 2005
  • 강인한 행동 인식을 하기 위해서는 연속적인 전신 제스처 입력에서부터 의미 있는 부분만을 분할하는 기술이 필요하다. 하지만 의미 없는 행동을 정의하고, 모델링 하기 어렵기 때문에, 연속적인 행동에서 중요한 행동만을 분할한다는 것은 어려운 문제이다. 본 논문에서는 연속적인 전신 행동의 입력으로부터 의미있는 부분을 분할하고, 동시에 인식하는 방법을 제안한다. 의미 없는 행동을 제거하고, 의미 있는 행동만을 적출하기 위해 garbage 모델을 제안한다. 이 garbage 모델에 의해 의미 있는 부분만 HMM의 입력으로 사용되어지며, 학습되어진 HMM 중에서 가장 높은 확률 값을 가지는 모델을 선택하여. 행동으로 인식한다. 제안된 방법은 20명의 3D motion capture data와 Principal Component Analysis를 이용하여 생성된 80개의 행동 데이터를 이용하여 평가하였으며, 의미 있는 행동과, 의미 없는 행동을 포함하는 연속적인 제스처 입력열에 대해 $98.3\%$의 인식률과 $94.8\%$의 적출률을 얻었다.

  • PDF

Segmentation Foundation Model-based Automated Yard Management Algorithm (의미론적 분할 기반 모델을 이용한 조선소 사외 적치장 객체 자동 관리 기술)

  • Mingyu Jeong;Jeonghyun Noh;Janghyun Kim;Seongheon Ha;Taeseon Kang;Byounghak Lee;Kiryong Kang;Junhyeon Kim;Jinsun Park
    • Smart Media Journal
    • /
    • v.13 no.2
    • /
    • pp.52-61
    • /
    • 2024
  • In the shipyard, aerial images are acquired at regular intervals using Unmanned Aerial Vehicles (UAVs) for the management of external storage yards. These images are then investigated by humans to manage the status of the storage yards. This method requires a significant amount of time and manpower especially for large areas. In this paper, we propose an automated management technology based on a semantic segmentation foundation model to address these challenges and accurately assess the status of external storage yards. In addition, as there is insufficient publicly available dataset for external storage yards, we collected a small-scale dataset for external storage yards objects and equipment. Using this dataset, we fine-tune an object detector and extract initial object candidates. They are utilized as prompts for the Segment Anything Model(SAM) to obtain precise semantic segmentation results. Furthermore, to facilitate continuous storage yards dataset collection, we propose a training data generation pipeline using SAM. Our proposed method has achieved 4.00%p higher performance compared to those of previous semantic segmentation methods on average. Specifically, our method has achieved 5.08% higher performance than that of SegFormer.

Fuzzy Partitions with Fuzzy Equalization (퍼지 균등화 조건을 갖는 퍼지분할)

  • Kim Kyeongtaek;Kim Chongsu
    • Proceedings of the Society of Korea Industrial and System Engineering Conference
    • /
    • 2002.05a
    • /
    • pp.45-50
    • /
    • 2002
  • 퍼지 균등화(fuzzy equalization)는 어의론적으로(semantically) 의미있고, 실험적으로 (experimentally) 의미있는 언어라벨(linguistic labels)을 붙이도록 하는 조건이다. 지금까지 발표된 퍼지 균등화조건을 갖는 퍼지분할을 생성하는 알고리듬은 주어진 데이터에 대하여, 오직 하나의 퍼지분할만을 생성할 수 있다. 만일 생성된 퍼지 분할이 더 이상 유용하지 못한 것으로 판명되면, 이 알고리듬은 주어진 데이터에 대한 퍼지 균등화조건을 갖는 퍼지분할을 생성할 수 없다. 이는 생성된 퍼지분할을 사용하여 탐색적 발견을 수행하는 데이터마이닝인 경우 더 이상 프로세스가 진행되지 못함을 의미한다. 본 연구에서는 주어진 데이터에 대한 퍼지 균등화조건을 갖는 서로 다른 두 퍼지분할이 존재한다면, 어떠한 관계가 있는지를 증명하고, 위치적 특성을 서술하였다. 이 특성은 추후 퍼지 균등화조건을 갖는 퍼지분할을 원하는 만큼 생성할 수 있는 알고리듬을 만드는데 유용하게 사용 될 수 있다.

  • PDF

Two-Phased Fuzzy Partitions with Funny Equalization (퍼지 균등화존건을 갖는 2단 퍼지분할)

  • Kyeongtaek Kim;Chongsu Kim
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.25 no.6
    • /
    • pp.54-58
    • /
    • 2002
  • 퍼지 균등화는 어의론적으로 의미있고, 실험적으로 의미있는 언어레이블을 붙이도록 하는 조건이다. 지금까지 발표된 퍼지 균등화조건을 갖는 퍼지분할을 생성하는 알고리듬은 주어진 데이터에 대하여, 오직 하나의 퍼지분할만을 생성할 수 있었다. 만일 생성된 퍼지 분할이 더 이상 유용하지 못한 것으로 판명되면, 이 알고리듬은 주어진 데이터에 대한 퍼지 균등화조건을 갖는 또 다른 퍼지분할을 생성할 수 없다. 이는 생성된 퍼지분할을 사용하여 탐색적 발견을 수행하는 데이터마이닝의 경우 더 이상 프로세스가 진행되지 못함을 의미한다. 본 연구에서는 주어진 데이터에 대한 퍼지 균등화조건을 갖는 서로 다른 두 퍼지분할이 존재한다면, 어떠한 관계가 있는지를 증명하고, 이를 위치적 특성으로 서술한다. 또한 이 특성을 이용하여 퍼지 균등화조건을 갖는 퍼지분할을 원하는 만큼 생성할 수 있는 알고리듬을 제시하고, 예를 들어 설명한다.

Aesthetics and Meaning of Split Screen: Focusing on Feature Film (화면 분할의 미학과 의미 - 극영화를 중심으로)

  • Chang, Woo-Jin
    • The Journal of the Korea Contents Association
    • /
    • v.12 no.1
    • /
    • pp.154-165
    • /
    • 2012
  • In this paper, I examine the history of split screens, primarily seek to explain types of them, and explore the narrative meaning of each type in feature films. In short, I try to categorize the types of split screens and present a figure of them according to events and characters, focusing the relations between/among simultaneous images and narrative meanings. In addition, I assert that split screen have altered some methods of filmic storytelling and the ontology of screen. Story lines no longer have to be linear and the screen need not to remain a window through which we can see another world. The screen has come to be a canvas upon which several images can be arranged for narrative purposes.

Two-Level Clausal Segmentation using Sense Information (의미 정보를 이용한 이단계 단문분할)

  • Park, Hyun-Jae;Woo, Yo-Seop
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.9
    • /
    • pp.2876-2884
    • /
    • 2000
  • Clausal segmentation is the method that parses Korean sentences by segmenting one long sentence into several phrases according to the predicates. So far most of researches could be useful for literary sentences, but long sentences increase complexities of the syntax analysis. Thus this paper proposed Two-Level Clausal Segmentation using sense information which was designed and implemented to solve this problem. Analysis of clausal segmentation and understanding of word senses can reduce syntactic and semantic ambiguity. Clausal segmentation using Sense Information is necessary because there are structural ambiguity of sentences and a frequent abbreviation of auxiliary word in common sentences. Two-Level Clausal Segmentation System(TLCSS) consists of Complement Selection Process(CSP) and Noncomplement Expansion Process(NEP). CSP matches sentence elements to subcategorization dictionary and noun thesaurus. As a result of this step, we can find the complement and subcategorization pattern. Secondly, NEP is the method that uses syntactic property and the others methods for noncomplement increase of growth. As a result of this step, we acquire segmented sentences. We present a technique to estimate the precision of Two-Level Clausal Segmentation System, and shows a result of Clausal Segmentation with 25,000 manually sense tagged corpus constructed by ETRl-KONAN group. An Two-Level Clausal Segmentation System shows clausal segmentation precision of 91.8%.

  • PDF

Effective Multi-Modal Feature Fusion for 3D Semantic Segmentation with Multi-View Images (멀티-뷰 영상들을 활용하는 3차원 의미적 분할을 위한 효과적인 멀티-모달 특징 융합)

  • Hye-Lim Bae;Incheol Kim
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.12 no.12
    • /
    • pp.505-518
    • /
    • 2023
  • 3D point cloud semantic segmentation is a computer vision task that involves dividing the point cloud into different objects and regions by predicting the class label of each point. Existing 3D semantic segmentation models have some limitations in performing sufficient fusion of multi-modal features while ensuring both characteristics of 2D visual features extracted from RGB images and 3D geometric features extracted from point cloud. Therefore, in this paper, we propose MMCA-Net, a novel 3D semantic segmentation model using 2D-3D multi-modal features. The proposed model effectively fuses two heterogeneous 2D visual features and 3D geometric features by using an intermediate fusion strategy and a multi-modal cross attention-based fusion operation. Also, the proposed model extracts context-rich 3D geometric features from input point cloud consisting of irregularly distributed points by adopting PTv2 as 3D geometric encoder. In this paper, we conducted both quantitative and qualitative experiments with the benchmark dataset, ScanNetv2 in order to analyze the performance of the proposed model. In terms of the metric mIoU, the proposed model showed a 9.2% performance improvement over the PTv2 model using only 3D geometric features, and a 12.12% performance improvement over the MVPNet model using 2D-3D multi-modal features. As a result, we proved the effectiveness and usefulness of the proposed model.