• 제목/요약/키워드: Object Segment

검색결과 204건 처리시간 0.024초

포아송 객체 편집을 이용한 스테레오 영상 합성 (Stereo Image Composition Using Poisson Object Editing)

  • 백으뜸;호요성
    • 한국통신학회논문지
    • /
    • 제39A권8호
    • /
    • pp.453-458
    • /
    • 2014
  • 본 논문에서는 포아송 영상 편집을 이용한 스테레오 3차원 영상 합성 방법을 제안한다. 3차원 영상을 만들 때 객체의 깊이 값을 고려하지 않고 색상 영상을 합성하면 매우 부자연스러운 결과를 얻는다. 본 논문에서는 그랩컷 방법을 사용하여 추출한 전경 객체를 새로운 배경 영상에 포함시켜 자연스러운 2차원 영상을 만든다. 제안된 방법에서는 기하학적인 위치뿐 아니라 색상 톤도 고려하여 자연스러운 영상을 합성한 후, 합성된 영상의 경계선 주변에 블러링을 수행하여 전경과 배경이 잘 어우러지게 만든다. 이와 더불어, 임의로 주어진 객체의 깊이 값을 이용하여 추출된 객체의 변위를 구하고, 오른쪽 색상 영상과 깊이 영상을 자동으로 합성한다. 실험을 통해, 제안하는 방법이 자연스러운 스테레오 3차원 영상을 생성할 수 있음을 확인했다.

해양환경에서 고속 영역 병합 알고리즘을 이용한 물표 탐지 기법 (Object Detection Method in Sea Environment Using Fast Region Merge Algorithm)

  • 정종면;박계각
    • 한국지능시스템학회논문지
    • /
    • 제22권5호
    • /
    • pp.610-616
    • /
    • 2012
  • 본 논문에서는 선박의 안전 항행을 위하여 해양 IR 영상으로부터 선박, 암초, 부이 등과 같은 해상 물표를 탐지하기 위한 기법을 제안한다. 이를 위하여 먼저 주어진 IR 영상을 평탄화 한 후, 워터쉐드 알고리즘을 이용하여 영역을 분할한다. 워터쉐드 알고리즘은 거의 항상 과분할된 영역을 생성하기 때문에 의미있는 영역 분할을 위해 과분할 영역에 대한 병합 과정이 필요하다. 우리는 빠른 병합을 위해 픽셀에 대한 직접 접근을 단 2회만 수행하는 효율적인 영역 병합 알고리즘을 제안한다. 또한 해양 IR 영상에 대한 분석을 통해 해양 물표에서는 수평방향의 에지가 집중적으로 나타나는 것을 확인하였다. 따라서 본 논문에서는 주어진 영상으로부터 수평에 지를 추출한 후 모폴로지 연산을 통해 배경 및 잡음에 의해 만들어진 고립된 수평에지를 제거한 다음, 이전 단계에서 얻은 분할된 영역 중 수평 방향의 에지영역을 갖는 영역을 물표 영역으로 검출한다. 마지막으로 실험을 통하여 제안된 기법의 타당성을 보였다.

원격 카메라 로봇 제어를 위한 동적 제스처 인식 (Dynamic Gesture Recognition for the Remote Camera Robot Control)

  • 이주원;이병로
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1480-1487
    • /
    • 2004
  • 본 연구에서는 원격 카메라 로봇 제어를 위한 새로운 제스처 인식 방법을 제안하였다. 제스처 인식의 전처리 단계인 동적 제스처의 세그먼테이션이며, 이를 위한 기존의 방법은 인식 대상에 대한 많은 칼라정보를 필요로 하고, 인식단계에서는 각각 제스처에 대한 많은 특징벡터들을 요구하는 단점이 있다. 이러한 단점을 개선하기 위해, 본 연구에서는 동적 제스처의 세그먼테이션을 위한 새로운 Max-Min 탐색법과 제스처 특징 추출을 위한 평균 공간 사상법과 무게중심법, 그리고 인식을 위한 다층 퍼셉트론 신경망의 구조 둥을 제안하였다 실험에서 제안된 기법의 인식율이 90%이상으로 나타났으며, 이 결과는 원격 로봇 제어를 위한 휴먼컴퓨터 인터페이스(HCI : Human Compute. Interface)장치로 사용 가능함을 보였다.

인터넷 웹페이지의 음성합성을 위한 엔진 및 플러그-인 설계 및 구현 (Design and Implementation of a Speech Synthesis Engine and a Plug-in for Internet Web Page)

  • 이희만;김지영
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.461-469
    • /
    • 2000
  • 본 논문은 인터넷 웹페이지의 텍스트 정보를 추출하여 이를 음성으로 합성하기 위한 음성합성 엔진 및 넷스케이프 플러그인의 설계 및 구현에 관한 것이다. 인터넷 웹페이지를 음성으로 합성하는 방법은 audio/x-esp MIME 타입을 임베딩한 웹페이지가 발견되면서 이에 상응하는 플러그-인이 작되며 해당 플러그인은 URL로 지정된 HTML 문서를 네트워크에서 가져와 컴맨더 모브젝트에 보내교, 컴맨더 오브젝트는 HTML 문서를 파싱하여 합성엔진 제어용 TAG를 추출한다. 제어용 TAG에는 음성합성 데이터베이스 변경 및 합성음의 길이 또는 피치조절 파라미터 등의 정보를 갖고 있어 동적으로 합성음을 제어할 수 있다. 또한 컴맨더 오브젝트는 HTML 문서 내부의 특정 태그로 지정된 문장을 추출하여 전처리 과정을 수행한 후 합성엔진을 위한 컴맨드 스트림을 발생한다. 음성합성엔진은 컴맨드 스트림을 훼치(Fetch)하여 명령어를 해석하고 해당 명령어를 상응하는 멤버함수를 실행하여 음성을 합성한다. 컴맨더 오브젝트와 음성합성엔진은 각각 독립적인 객체로 설계하여 이식성과 유연성을 높인다.

  • PDF

비선형 다중스케일 필터링을 사용한 비디오 객체 분할에 관한 연구 (A Study on Video Object Segmentation using Nonlinear Multiscale Filtering)

  • 이웅희;김태희;이규동;정동석
    • 한국통신학회논문지
    • /
    • 제28권10C호
    • /
    • pp.1023-1032
    • /
    • 2003
  • MPEG-4와 같은 객체 기반 부호화는 멀티미디어 응용을 위한 다양한 내용 기반 기능들을 제공한다. 압축 효율의 향상과 더불어 이러한 기능들이 지원되도록 하기 위해서는 비디오 데이터의 각 프레임은 비디오 객체로 분할되어야 한다. 본 논문에서는 비선형 다중스케일 필터링과 시공간 정보를 사용한 효과적인 비디오 객체 분할 기법을 제안한다. 제안된 방법은 안정화된 역 확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)에 기반한 비선형 다중스케일 필터링을 사용하여 공간적 분할을 수행한다. 또한 구해진 초기 분할된 영역들은 인접 영역 그래프 (Region Adjacency Graph : RAG)를 사용하여 병합된다. 본 논문에서는 통계적 유의성 검사(Statistical significance test)와 시변 메모리(Time-variant memory)를 시간적 분할 방법으로 사용하며 구해진 공간적 분할과 시간적 분할을 결합하여 최종 객체 영역을 효과적으로 분할한다. 본 논문에서 제안된 공간적 분할 방법은 기존의 형태학적 Watershed 알고리즘에 비해 잡음에 강인한 분할 특성을 나타내었으며 기존의 A. Neri의 방법과 비교하였을 때, 최종 분할된 객체 영역의 정확도 비율이 Akiyo는 43%, Claire는 29% 정도 향상됨을 확인할 수 있었다.

의미론적 분할 기반 모델을 이용한 조선소 사외 적치장 객체 자동 관리 기술 (Segmentation Foundation Model-based Automated Yard Management Algorithm)

  • 정민규;노정현;김장현;하성헌;강태선;이병학;강기룡;김준현;박진선
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.52-61
    • /
    • 2024
  • 조선소에서는 사외 적치장의 관리를 위해 일정 주기로 Unmanned Aerial Vehicle (UAV)을 이용해 항공영상을 획득하고, 이를 사람이 판독하여 적치장 현황을 파악한다. 이러한 방법은 넓은 면적의 사외 적치장 현황을 파악하는 데 상당한 시간과 인력을 요구한다. 본 논문에서는 이러한 문제점을 해결하고 정확한 사외 적치장 현황을 파악하기 위해 사전 학습된 의미론적 분할 기반 모델(Foundation Model)을 활용한 자동 관리 기술을 제안한다. 또한, 조선소 사외 적치장의 경우 관련 부품이나 장비를 포함한 공개 데이터셋이 충분하지 않기 때문에, 의미론적 분할 기반 모델에 필요한 객체 프롬프트(Prompt)를 생성하기 위한 소규모 사외 적치장 객체 데이터셋을 직접 구축하였다. 이를 이용해 객체 검출기를 소규모 데이터셋에 추가 학습하여 초기 객체 후보를 추출하고, 의미론적 분할 기반 모델인 Segment Anything Model (SAM)의 프롬프트로 활용해 정확한 의미론적 분할 결과를 얻는다. 더 나아가, 지속적인 적치장 데이터셋 수집을 위해 SAM을 활용한 훈련 데이터 생성 파이프라인을 제안한다. 본 연구에서 제안한 방법은 기존의 의미론적 분할 방법과 비교하여 평균적 4.00%p, SegFormer에 비해 5.08%p 높은 성능을 달성하였다.

복수객체의 윤곽추출을 위한 스네이크 분리 및 연결 알고리즘의 실험적 분석 (Experimental Analysis of Algorithms of Splitting and Connecting Snake for Extracting of the Boundary of Multiple Objects)

  • ;황재용;장종환
    • 정보처리학회논문지B
    • /
    • 제19B권4호
    • /
    • pp.221-224
    • /
    • 2012
  • 복수객체의 윤곽추출을 위해 스네이크를 분리하고 연결하는 대표적인 방법이 스네이크 포인트의 거리를 이용한 최소거리방법이다. 이 방법은 객체 위상에 따라 스네이크를 분리하지 못하는 경우가 발생한다. 본 논문에서는 스네이크를 분리하지 못하는 경우를 실험적으로 증명하고 스네이크 세그먼트의 벡터를 이용한 새로운 방법이 스네이크를 성공적으로 분리 및 연결함을 실험적으로 보임으로써 최소거리방법의 문제점을 해결하였다. 하나의 영상 안에 3개 및 5개 객체가 있는 실험영상에 실험을 하여 제안한 방법이 우수하다는 것을 보여준다.

언어(특히 의미)와 인지과학 (Language (Meaning) and Cognitive Science)

  • 이정민
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.23-27
    • /
    • 2005
  • 언어 특히 의미에 대한 연구와 마음의 구조를 연구하는 인지과학이 어떻게 중요한 관계를 가지고 발전하는가를 살펴보기로 한다. 언어의 구조는 마음의 구조의 일부라고 본 촘스키의 입장에 동조하면서도 의미의 구조에 대해서 소극적인 입장에 서는 그의 입장에서 자유롭게 벗어나 발전하고 있는 의미에 대한 연구를 조명하고 전망하기로 한다. 언어의 의미는 내면적(internal)인 것인가 외부적(external)인 것인가 의미 내용(content)과 맥락(context)의 관계는 어떠한가, 왜 정보구조가 중요한가 등을 점검한다.

  • PDF

XSL-FO를 이용한 PostScript Converter에 관한 연구 (A study of Postscript Converter using XSL-FO)

  • 유동석;최호찬;이진영;김차종
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.109-112
    • /
    • 2003
  • 인터넷 사용중 인쇄를 하였을 때 만족스러운 결과를 가지지 못하는 것은 스크린 상의 page와 인쇄물의 page들이 다르게 나타나기 때문이다. HTML과 CSS는 브라우저 기반의 정보를 표현하는데 있어 적합하고 충분하지만, 인쇄기 반의 정보를 표현하는데는 부족하다. 그래서 사용되는 것이 XSL-FO(XSL Formatting Object) 이다. 고품질의 출력과 출력장치에 무관한 인쇄에 있어서 PostScript가 사용되고 있다. 본 논문에서는 XML-FA 와 Postscript의 장점을 이용해 사용자가 원하는 결과물을 갖는 것과, XML문서의 XML-FA 와 Postscript의 Segment간의 대응 관계를 분석하고 매핑시킴으로써 Postscript로 변환의 기술을 연구하였다. 변환 결과로 기존 인쇄물 보다 더 나은 결과물을 얻을 수 있었다.

  • PDF

기하학적 동적 외곽선 모델을 이용한 X-ray 단층촬영영상의 영상추출 (Segmentation of Computed Tomography using The Geometric Active Contour Model)

  • 장동표;김선일
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1997년도 추계학술대회
    • /
    • pp.541-545
    • /
    • 1997
  • This paper presents a modified geometric active contour model or edge detection and segmentation of computed tomography(CT) scan images. The method is based on the level setup approach developed by Osher and Sethian and the modeling of propagation fronts with curvature dependent speeds by Malladi. Based on above algorithms, the geometric active contour is obtained through a particular level set of hypersurface lowing along its gradient force and curvature force. This technique retains the attractive feature which is topological and geometric flexibility of the contour in recovering objects with complex shapes and unknown topologies. But there are limitations in this algorithm which are being not able to separate the object with weak difference from neighbor object. So we use speed limitation filter to overcome those problems. We apply a 2D model to various synthetic cases and the three cases of real CT scan images in order to segment objects with complicated shapes and topologies. From the results, the presented model confirms that it attracts very naturally and efficiently to the desired feature of CT scan images.

  • PDF