• 제목/요약/키워드: Object Manipulation

검색결과 173건 처리시간 0.024초

작물 수확 자동화를 위한 시각 언어 모델 기반의 환경적응형 과수 검출 기술 (Domain Adaptive Fruit Detection Method based on a Vision-Language Model for Harvest Automation)

  • 남창우;송지민;진용식;이상준
    • 대한임베디드공학회논문지
    • /
    • 제19권2호
    • /
    • pp.73-81
    • /
    • 2024
  • Recently, mobile manipulators have been utilized in agriculture industry for weed removal and harvest automation. This paper proposes a domain adaptive fruit detection method for harvest automation, by utilizing OWL-ViT model which is an open-vocabulary object detection model. The vision-language model can detect objects based on text prompt, and therefore, it can be extended to detect objects of undefined categories. In the development of deep learning models for real-world problems, constructing a large-scale labeled dataset is a time-consuming task and heavily relies on human effort. To reduce the labor-intensive workload, we utilized a large-scale public dataset as a source domain data and employed a domain adaptation method. Adversarial learning was conducted between a domain discriminator and feature extractor to reduce the gap between the distribution of feature vectors from the source domain and our target domain data. We collected a target domain dataset in a real-like environment and conducted experiments to demonstrate the effectiveness of the proposed method. In experiments, the domain adaptation method improved the AP50 metric from 38.88% to 78.59% for detecting objects within the range of 2m, and we achieved 81.7% of manipulation success rate.

경계선 기반의 대화형 영상분할 시스템 (Edge based Interactive Segmentation)

  • 윤현주;이상욱
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제8권2호
    • /
    • pp.15-22
    • /
    • 2002
  • 영상분할이란 영상내의 이미지 상의 특정한 의미가 있는 영역으로 나누는 영상처리 방법을 일컫는다. 이미지 합성이나 분석을 위해서는 구분된 영역이 최대한 인간이 의미를 부여할 수 있는 물체를 나타내는 것이 바람직하나, 현재의 컴퓨터에의한 자동 영상이해 기법으로는 그 학문적 및 기술적인 한계로 인하여 영역의 분할이 수치적인 의미 이상을 가지게하기 어렵다. 따라서, 사용자가 결정적인 물체 경계의 정보를 제공하고 그에 기반하여 처리하는 HCI(Human Computer Interaction)개념을 도입하면 효과적인 결과를 얻을 수 있다. 기존의 "지능형 가위" (Intelligent Scissors)나 스네이크 (Snake) 방법 등에서도 사용자의 입력이 결과에 결정적인 역할을 하는 것을 보여준다 [1][2]. 본 논문은 기존의 방법에 비하여 미세한 영역의 경계를 추출 및 추적을 향상할 수 있는 효율적인 대화형 영상분할 기법을 제안한다. 제시된 방법은 지능형 가위의 개념에 일부 기반하나 안정된 경계선 추출을 위하여 이미 영상처리분야에서 확립된 캐니 경계 검출법(Canny Edge Detector)을 사용한다. 그리고 캐니 경계 검출법으로 잘 탐지되지 않는 경계선 부분에 대한 검출을 위하여 경계 "재봉법"(Sewing Method)을 제시하였으며, 작업 효과와 효율을 증진 시키기 위하여 인접 화소들을 검색하는 순서와 검색 대상 화소를 지정하는 5-방향 경계 추적 방법(5-Direction Edge-Following Method)을 제안하였다.

  • PDF

초음파 펄스에코 신호의 3차원 처리 (Three-Dimensional Processing of Ultrasonic Pulse-Echo Signal)

  • 송문호;손상락;조정호;성제중;안형근;장순재
    • 비파괴검사학회지
    • /
    • 제23권5호
    • /
    • pp.464-474
    • /
    • 2003
  • 비파괴 시험을 위한 3차원 구조의 초음파 영상에는 다양한 결함을 명백하게 보여줄 수 있을 만큼 상세하고 쉽게 알아볼 수 있는 정보가 제공되어야 한다. 수년 동안 원자력 발전소에서 사용된 금속관에 발견되는 소규모의 균열은 전형적인 결함들인데, 이러한 밀리미터 이하의 균열이나 결함은 최종 3차원 영상에서 묘사되어야만 의미 있는 검사가 될 것이다. 향상된 선명도와 그에 따른 결함의 발견 과정의 한 단계로써, 펄스에코(pulse-echo) 초음파를 사용한 3차원 영상제작 기술을 제안한다. 이 기술은 필요한 스캐닝과 펄스에코 데이터의 처리과정을 통한 검사로 3차원 물체의 3차원 영상을 생성하는데, 2차원 위너필터(Wiener fille.)에 의해 초음파 빔을 선명하게 하는 기술을 포함한다. 제안하는 위너필터는 빔의 전달에서 펄스에코 데이터를 초음파 빔 방향의 수직방향에 따라 필터링한다. 이 3차원 처리과정은 결함의 선명성을 증진시키고 사용자에게 3차원 구조물의 좌우 회전 및 축 회전과 같은 조작 능력을 제공한다. 이러한 조작 능력은 3차원에서 다양한 결함들의 크기와 위치의 분명한 묘사를 가능하게 한다.

데스크탑 환경에서의 3차원 상호작용을 위한 비전기반 인터랙션 도구의 설계 (Design of Vision-based Interaction Tool for 3D Interaction in Desktop Environment)

  • 최유주;이선민;유효선;노영섭
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.421-434
    • /
    • 2008
  • 컴퓨터 그래픽스, 가상현실 및 증강현실 기술이 발전됨에 따라, 이들 기술을 기반으로 하는 다양한 응용 분야에서 3차원 공간에서의 객체 선택 및 조작 등의 3차원 인터랙션 기능들이 요구되고 있다. 본 논문은 고가의 데스크탑용 3차원 마우스 기능을 시뮬레이션 할 수 있는 비전 기반의 3차원 인터랙션 프레임워크를 제안한다. 제안 프레임워크는 3색 LED를 이용하여 특수하게 제작된 인터랙션 도구를 포함하며, 비디오 시퀀스로부터 LED의 위치 및 색상을 인식하여 다양한 마우스 이벤트와 6 자유도(Degree Of Freedom)의 인터랙션을 지원한다. 제안 도구는 고가이며 숙련된 조작을 필요로 하는 기존의 3차원 마우스에 비하여 직관적이고 편리하여 별도의 학습이나 훈련 없이 사용될 수 있다. 본 논문에서는 제안 프레임워크를 구성하는 3색 LED를 이용한 포인터 제작 방법, 포인터의 3차원 위치 및 방향 계산법, 비디오 영상에서의 LED 색상분석 기법에 대하여 설명한다. 또한, 계산된 3차원 위치 및 방향에 대한 오차 측정 결과를 보임으로써 제안 도구의 정확성 및 유용성을 검증한다.

PC 기반 MPEG-4 비디오 코덱 구현을 위한 하드웨어 아키텍쳐 (Hardware Architecture for PC-based MPEG-4 Video CODEC)

  • 곽진석;임영권;박상규;김진웅
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.86-93
    • /
    • 1997
  • 현재 급속히 성장하고 있는 다양한 멀티미디어 응용 분야들은 기존의 MPEG-1 및 MPEG-2에서는 제공할 수 없는 객체 기반의 영상 표현 및 조작 등의 새로운 기능들을 요구하고 있다. 이러한 기능들을 수용하기 위해 표준화가 진행 중인 MPEG-4 비디오는 하나의 영상을 여러개의 객체들로 분할한 뒤 각각의 영상 객체들을 독립적으로 부호화 함으로써 각 객체에 대한 사용자의 용이한 조작을 허용한다. 반면에 MPEG-4 비디오의 복잡하고 융통성 있는 구조는 VLSI 기술을 이용한 전용 하드웨어의 구현을 매우 어렵게 하며, 프로그램이 가능한 범용 DSP로 구현할 경우에도 높은 압축율을 제공하기 위해 요구되는 많은 계산량으로 인해 성능면에서 큰 제약을 받는다. 본 논문에서는 많은 계산량을 요구하는 동시에 융통성 있는 구조를 갖는 MPEG-4 비디오 코덱을 구현하기 위한 방법으로 프로그램이 가능한 고성능 DSP와 많은 계산량이 요구되는 움직임추정 및 보상을 수행하기 위한 전용 칩으로 구성된 하드웨어 아키텍쳐를 제안한다.

  • PDF

A Study on Infra-Technology of RCP Mobility System

  • Kim, Seung-Woo;Choe, Jae-Il;Im, Chan-Young
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1435-1439
    • /
    • 2004
  • Most recently, CP(Cellular Phone) has been one of the most important technologies in the IT(Information Tech-nology) field, and it is situated in a position of great importance industrially and economically. To produce the best CP in the world, a new technological concept and its advanced implementation technique is required, due to the extreme level of competition in the world market. The RT(Robot Technology) has been developed as the next generation of a future technology. Current robots require advanced technology, such as soft computing, human-friendly interface, interaction technique, speech recognition, object recognition etc. unlike the industrial robots of the past. Therefore, this paper explains conceptual research for development of the RCP(Robotic Cellular Phone), a new technological concept, in which a synergy effect is generated by the merging of IT & RT. RCP infra consists of $RCP^{Mobility}$ $RCP^{Interaction}$, $RCP^{Integration}$ technologies. For $RCP^{Mobility}$, human-friendly motion automation and personal service with walking and arming ability are developed. $RCP^{Interaction}$ ability is achieved by modeling an emotion-generating engine and $RCP^{Integration}$ that recognizes environmental and self conditions is developed. By joining intelligent algorithms and CP communication network with the three base modules, a RCP system is constructed. Especially, the RCP mobility system is focused in this paper. $RCP^{Mobility}$ is to apply a mobility technology, which is popular robot technology, to CP and combine human-friendly motion and navigation function to CP. It develops a new technological application system of auto-charging and real-world entertainment function etc. This technology can make a CP companion pet robot. It is an automation of human-friendly motions such as opening and closing of CPs, rotation of antenna, manipulation and wheel-walking. It's target is the implementation of wheel and manipulator functions that can give service to humans with human-friendly motion. So, this paper presents the definition, the basic theory and experiment results of the RCP mobility system. We confirm a good performance of the RCP mobility system through the experiment results.

  • PDF

테이핑 요법으로 호전된 요통환자의 요추전만도 변화 1례 (Change of Lumbar Lordotic angle by Taping Therapy on Low Back Pain Patient with Lumbar Hyperlordosis ; A Case Report)

  • 윤유석;이종수;문상현
    • 대한추나의학회지
    • /
    • 제4권1호
    • /
    • pp.157-165
    • /
    • 2003
  • Low back pain (LBP) is a significant in today's society, with lifetime include factors associated with LBP ar reporter. Among the causes, aberration of posture may play a role in the development of LBP. Many investigators have assessed the curvature of spine in standing posture. But LBP is associated with Lumber Hyperlordosis of Hyperlordosis is controversial Subjects: In conservative treatment(acupuncture, herb med, manipulation & TENS. exercise, potural correction) for a 40 years old woman who had low back pain(V AS) be caused by decrease lumbar lordotic angie. Objectives: The object is change of lumbar lordotic angle of a 40 years old woman who had low back pain with Lumbar hyperlordosis, In conservative treatment. Method: In conservative treatment, We added taping therapy(mechanical correction taping of Kinesio Taping) about Lumbar Lordosis. Conclusion: We experienced a 40 years old woman who had love pack pain with Lumbar hyperlordosis. In conservative treatment, Her pain was Improved by additional taping therapy In company with decrease of Lumbar Lordosis. 1. abnormal spinal curvature, specially lumbar hyperlordosis act on induction & perpetuation agent for low back pain 2. In a patient had low back pain with lumbar hyperlordosis, change of lumbar lordotic angle is of utility value for the effect of treatment and assessment of prognosis. 3. pain control is more relative with change of lumbosacral angle than lumbar lordotic angle, in patient had low back pain with lumbar hyperlordosis. 4. mechanical taping therapy with elastic adhesive tape is effective for patient had low back pain with lumbar hyperlordosis

  • PDF

디지로그 북 저작을 위한 감각형 조작 도구를 이용한 직조작 기반의 3D 객체의 이동궤적 삽입 및 편집 기술 (Direct Manipulation based Trajectory Inserting and Editing Methods for ARtalet Authoring Tool)

  • 하태진;이영호;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.497-501
    • /
    • 2009
  • 디지로그 북(Digilog book)은 서적과 디지털 콘텐츠을 융합함으로써, 아날로그적 감성과 디지털 오감을 함께 제공하는 증강현실기반 차세대 출판물이다. 디지로그 북을 저작할 수 있는 저작도구 소프트웨어인 아틀렛(ARtalet)은 최상위 레벨 사용자 인터페이스의 기능을 갖춘 저작 도구로서, 증강현실환경에서 3 차원 사용자 인터페이스를 이용한 직관적인 저작 환경을 제공한다. 본 논문은 아틀렛을 이용한 3D 객체에 정적 속성 저작 이후, 이동궤적과 같은 움직임 속성을 저장/편집 하거나 이미 저장된 이동궤적 템플릿을 3D 객체에 삽입할 수 있는 저작 기법을 제안한다. 카메라 추적된 조작 도구인 프롭(prop)으로 3D 객체를 선택 후, 기준 평면인 책으로부터의 상대적인 좌표 변환 행렬을 시간의 흐름에 따라 실시간으로 저장한다. 저장된 이동궤적은 템플릿으로 관리되며 사용자가 원하는 3D 객체에 중복 삽입이 가능함으로 다양한 조합의 이동궤적을 생성할 수 있다. 본 논문에서 제안된 기술을 활용하여, 기존의 정적인 3D 객체에 움직임 속성을 삽입하여 책의 이야기를 창의적으로 꾸밀 수 있게 하여 독자의 흥미를 높일 것으로 기대한다.

  • PDF

감성 메타데이터를 활용한 지능형 캐릭터 시스템 (Intelligent Character System using Emotion Metadata)

  • 한종성;이완복;경병표;이동열;유석호;이경재
    • 한국콘텐츠학회논문지
    • /
    • 제9권3호
    • /
    • pp.99-107
    • /
    • 2009
  • 최근 IT와 네트워크 기술이 발전하고, 유무선 네트워킹을 통한 개인 간 교류가 매우 활성화됨에 따라, 개인의 개성과 감성을 잘 표현할 수 있는 시스템이 각광 받고 있다. 특히 휴대인터넷이 발달하면서 모바일을 중심으로 개인화된 시스템에 대한 요구가 증가하고 있다. 이에 발맞추어 사용자의 감성을 표현하는 지능형 캐릭터시스템을 감성인자 메타데이터 검색방법으로 구현하였다. 이 검색방법은 감성인자 근접도 측정을 통해 다양한 감성표현을 가능하게 함으로써 텍스트 기반의 기존 검색방식을 보완하고 개인의 감성을 표현하는 툴로 유용하게 사용될 수 있으며 지능형 캐릭터 시스템은 모바일 단말기에 탑재되어 다양한 서비스에 활용될 수 있을 것이다.

타원체상에서 경계획선을 위한 중간점계산의 정확도 (Accuracy of Mid Point Computation for Boundary Delimitation on Ellipsoid)

  • 김병국;이종기;김정기
    • 한국측량학회지
    • /
    • 제19권4호
    • /
    • pp.365-372
    • /
    • 2001
  • 나라사이의 경계를 결정하기 위한 일반적인 방법은 등거리원칙이다. 등거리원칙은 각각의 기준선 또는 기준점의 경계에서 일정한 거리까지를 경계로 정하는 방법이다. 본 연구에서는 등거리 원칙을 기본으로 하는 알고리즘으로 폭넓게 사용되고 있는 Two-Point 알고리즘과 Three-Point 알고리즘을 정립한 후, 알고리즘을 적용한 결과와 오차를 확인할 수 있는 경계 획선 프로그램을 개발하였다. 이 프로그램은 인공지물이나 지형지물이 없어 경계를 결정하기 어려운 해양경계 획선시 특히 유용하게 사용될 수 있다. 그 중간점 계산결과 타원체상에서 등거리원칙에 기초한 알고리즘을 적용하면, 지도 투영에 의한 어떤 왜곡도 없이 적용할 수 있고 평면이나 구에서 적용한 것 보다 오차가 적었다. 경계 획선 프로그램 개발을 통하여 도면을 이용한 수작업에 의한 여러 오차를 제거 할 수 있고, 해양경계협상시 신속히 대처할 수 있다. 또한, 기준선의 기준점 위치에러는 계산된 중간선의 중간점으로 전파되는 것을 확인할 수 있었고 그 오차를 확인하여 적합한 기준면을 설정 할 수 있었다.

  • PDF