• 제목/요약/키워드: 영상기반

검색결과 11,662건 처리시간 0.05초

고령 운전자 조건부 운전면허 발급을 위한 평가 시나리오 개발 프레임워크 (A Framework of Test Scenario Development for Issuance of Conditional Driver's Licenses for Elderly Drivers)

  • 김상수;정연식
    • 한국ITS학회 논문지
    • /
    • 제23권1호
    • /
    • pp.134-145
    • /
    • 2024
  • 본 연구의 목적은 조건부 운전면허 발급에 필요한 평가 시나리오 개발 프레임워크를 제안하는 것이다. 이를 위해 프레임워크는 5단계로 구성하였다. 1단계에서는 고령 운전자에 의한 충돌사고의 주요 요인을 사고빈도와 심각도 측면에서 교통사고 특성에 대한 문헌을 검토하였다. 2단계는 도로교통공단 교통사고분석시스템 사고 자료를 활용하여 비고령, 초기 고령, 후기 고령 집단별 교통사고 특성에 대한 분석을 수행하였다. 이를 통해 고령 운전자 등 고위험군 교통사고 유형을 도출하였다. 3단계는 고위험군 교통사고 유형에 해당하는 블랙박스 영상을 분석하여 사고가 발생한 상황에 대해 기술한 교통사고 스토리를 도출하였다. 4단계는 다양한 시나리오 개발을 위해 도출된 사고 스토리의 유형을 분류하여 여러 가지 사고 상황을 구분하였다. 5단계는 최근 다양한 자율주행차량 평가 시나리오 개발에 활용되고 있는 PEGASUS 5-Layer 형식을 적용하여 시나리오를 제시하였다. 본 연구의 결과는 향후 조건부 운전면허 발급을 위한 운전능력 평가시나리오 개발의 기반으로 활용될 것으로 기대된다.

핵의학 영상에서 계수기반 체적변화 추적에 관한 고찰 (A Study on the Tracking of Count-Based Volumetric Changes in Nuclear Medicine Imaging)

  • 김지현;이주영;박훈희
    • 핵의학기술
    • /
    • 제28권1호
    • /
    • pp.57-69
    • /
    • 2024
  • Purpose: Quantitative analysis through count measurement in nuclear medicine planar images is limited by analysis techniques that are useful for obtaining various clinical information or by organ overlap or artifacts in actual clinical practice. On the other hand, the use of SPECT tomography images is quantitative analysis using volume rather than planar, which is not only free from problems such as projection overlap, but also has excellent quantitative accuracy. In the use of developing SPECT quantitative analysis technology, this study aims to compare the accuracy of quantitative analysis between ROI of the conventional planar images and VOI of the SPECT tomographic images in evaluating the count change happened by the volume change of the source. Materials and Methods: A 99mTcO4- source(200.17 MBq) was filled with sterilized water in the syringe to create a phantom with an inner diameter volume of 60 cc, and a planar image and a SPECT image were obtained by reducing the volume by 15 cc (25%) respectively. ROI and VOI(threshold: 1~45%, 5% interval) were set for each image obtained to estimate true count and measure the total count, and compared with the preseted volumetric change rate(%). Results: When volume changes of 25%, 50%, and 75% occurred in the initial volume of 60 cc(100%) of the phantom, the average count changes of the measured planar image were 26.8%, 53.2%, 77.5%, and the average count changes of the SPECT image were 24.4%, 50.9%, and 76.8%. In this case, the VOI size(cm3) set showed an average change rate of 25.4%, 51.1%, and 76.6%. The highest threshold value for the accuracy of radioactive concentration by VOI size (average error -1.03%) was 35%, and the VOI size of the same threshold had an error of -17.1% on average compared to the actual volume. Conclusion: On average, the count-based volumetric change rate in nuclear medicine images was able to track changes more accurately using VOI than ROI, but there was no significant difference with relatively similar value. However, the accuracy of radioactive concentration according to individual VOI sizes did not match, but it is considered that a relatively accurate quantitative analysis can be expected when the size of VOI is set smaller than the actual volume.

물리적 모델링 합성법에 기반을 둔 줄 없는 기타 구현 (Implementation of Non-Stringed Guitar Based on Physical Modeling Synthesis)

  • 강명수;조상진;정의필
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.119-126
    • /
    • 2009
  • 본 논문에서 제안한 줄 없는 기타는 크게 레이저 현과 프렛, 음 합성 알고리듬과 프로세서로 구성된다. 레이저 현은 레이저 모듈과 포토다이오드를 이용하여 스트로크와 아르페지오를 표현할 수 있도록 하였고, 프렛은 전압 분배기를 이용하여 구현하였다. 몸통은 물리적 모델링 합성법을 이용하였기 때문에 줄 없는 기차에는 울림통의 역학을 하는 물리적인 몸통이 없다. 제안한 기타의 프렛은 실제 프렛을 동일하게 표현할 수 있어 기존의 코드 글러브를 이용한 로드 표현뿐 아니라 실제 기타와 같은 솔로 연주도 가능하다. 해머링 온, 풀링 오프, 슬라이딩과 같이 프렛 변화가 있는 연주음은 전압 분배기로부터 받은 프렛의 정보를 파라미터로 사용하여 합성한다. 연구법에 따른 음의 피치 변화는 디지털 도파관 모델에서 파동의 전파 속도 변화로 표현하였다. 이 합성 모델은 동일 프렛에서 현의 장력을 변화시켜 연주하는 비브라토 음도 합성 할 수 있다. 레이저 현과 프렛으로부터 받아들인 정보를 합성 알고리듬의 파라미터로 변환하여 기타 음을 생성하고 이를 실시간으로 출력할 수 있도록 TMS320F2812를 사용하였다. 웹에 공개한 동영상에는 제안한 알고리듬과 인터페이스를 이용하여 실시간으로 합성한 '아리랑' 연주를 볼 수 있다. 제안한 알고리듬이 피치 변화를 표현하는 기타 솔로 연주법에 효과적이고 줄 없는 기타로 실시간 연주가 가능함을 확인할 수 있다.

실시간 영상이미지 분석을 통한 아스팔트 콘크리트 포장의 노면 상태 인식 및 블랙아이스 예방시스템 (Real-time Road Surface Recognition and Black Ice Prevention System for Asphalt Concrete Pavements using Image Analysis)

  • 정회평;송호민;최영철
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제28권1호
    • /
    • pp.82-89
    • /
    • 2024
  • 블랙 아이스는 인지하기가 매우 어렵고 도로 노면의 마찰력이 감소하여 자동차 사고를 유발한다. 도로 노면의 블랙아이스 방지를 위한 다양한 연구가 수행되었으나, 실시간으로 블랙아이스를 식별하고 운전자에게 경고하는 시스템에 대한 연구는 매우 미흡한 실정이다. 본 논문에서는 아스팔트 도로 노면의 상태를 실시간적으로 식별하기 위해 이미지기반 분석 시스템을 개발하였다. 이를 위해 각 아스팔트 도로 노면 이미지에 대해 데이터 세트를 구축한 다음 딥러닝을 통해 노면의 상태를 건조, 젖음, 블랙아이스, 눈 노면 상태로 식별하였다. 또한, 이미지 분석결과와 더불어 도로 노면 상태의 최종판별을 위해 실제 노면에서 측정된 온도와 습도 데이터를 사용하였다. 도로 노면의 특성이 블랙아이스로 판정이 나면, 도로에 설치된 염수 분사장치가 자동으로 작동하도록 하였다. 본 연구에서 개발된 아스팔트 콘크리트 포장에 대한 노면 상태 식별 시스템과 블랙아이스 자동 예방 시스템은 운전자의 안전운행을 보장하고 교통사고 발생률을 낮출 수 있을 것으로 기대된다.

디지털 미디어 환경에서 색상을 인지하는 색채 속성 연구 (A Study on Colour Properties for Colour Recognition in Digital Media Environments)

  • 홍지영
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권3호
    • /
    • pp.9-14
    • /
    • 2024
  • 색의 기본이 되는 구성 요소는 색상, 명도, 채도로 정의된다. 시지각 특성을 기초로 연구한 먼셀 표색계의 경우 색상(Hue), 명도(Value), 채도(Chroma)로 분류하였으며 세 가지 속성에 대하여 기록하는 방법에는 시감에 중점을 두어 색표를 기준으로 기록하는 현색계와 수치상으로 정확하게 기록하여 변색 우려가 없는 혼색계로 구분할 수 있다. 색을 전달하고 표현하는데 있어 색채 용어는 매우 중요하게 사용되며 색채는 색상, 명도, 채도의 조합에 따라 색상을 구분하고 정의할 수 있다. 현재 다양한 미디어 매채의 개발로 인해 이전에 구현할 수 없던 색의 범위까지 표현할 수 있게 되었으며 디지털 중심의 색채 연구가 좀 더 세분화 되어 색채를 지각하는 특성에 대한 기초연구가 필요하다. 본 연구는 디스플레이에서 시지각 기반 먼셀 표색계의 대표 10가지 색상을 대상으로 각 색상을 인지하는 명도와 채도의 범주에 대해 알아보고자 정신물리학 실험을 진행하고 이를 분석하였다. 본 연구는 진행된 실험 결과를 분석하여 색채 인지 특성에 대한 기초 연구 자료로써 유의미 여부를 정의한 후 향후 연구방향을 제시한다.

무인 이동체를 이용한 폐광산 갱도 및 수몰 갱도의 3차원 형상화 위한 적용성 평가 (Evaluation of Applicability for 3D Scanning of Abandoned or Flooded Mine Sites Using Unmanned Mobility)

  • 김수로;박관인;김상욱;백승한
    • 터널과지하공간
    • /
    • 제34권1호
    • /
    • pp.1-14
    • /
    • 2024
  • 폐광산의 갱도 입구를 통해 고속 라이다(Light Detection And Ranging, LiDAR) 장비가 탑재된 무인이동체를 투입하여 폐광의 갱도를 형상화하기 위한 기술이 제안되었다. 직경이 1.5 m 이상인 좁은 갱도에 바닥이 슬러지 형태로 미끄럽고 장애물이 있는 환경에서 무인 이동체를 운영할 때 고려할 사항을 검토하였다. 육상환경 이동을 위해 4족 보행 로봇을 활용하였으며 항공 환경 이동을 위해 쿼드콥터 드론이 활용되었다. 수중환경의 갱도에 투입하기 위해서 수중 드론이 사용되었다. 무인 이동체를 실제 광산 현장에 투입하여 폐광 현장용 이동체가 고려해야 할 변수들을 도출하였다. 폐광산 갱도 형상화용 센서로서 2차원 영상 기반의 solid-state 라이다가 사용되었다. 방사형으로 측정되는 라이다의 특성을 고려하여 고정 경사각을 두어 회전시켜 운영하여 갱도 형상화를 위한 효율성을 높이고 동시에 장애물 감지도 같이 수행할 수 있도록 제안하였다. Solid-state 라이다를 이용하여 측정데이터로부터 센서의 자세와 로봇의 자세를 반영하여 현실 좌표계 데이터로 변환하기 위한 계산기법이 도출되었다. 라이다 센서와 무인 비행체가 결합하여 실제 현장에 투입하여 갱도 형상을 추출하였다. 마지막으로 실제 현장에서 효용성을 높이기 위한 요소를 도출하였다.

효율적인 개방형 어휘 3차원 개체 분할을 위한 클래스-독립적인 3차원 마스크 제안과 2차원-3차원 시각적 특징 앙상블 (Class-Agnostic 3D Mask Proposal and 2D-3D Visual Feature Ensemble for Efficient Open-Vocabulary 3D Instance Segmentation)

  • 송성호;박경민;김인철
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.335-347
    • /
    • 2024
  • 개방형 어휘 3차원 포인트 클라우드 개체 분할은 3차원 장면 포인트 클라우드를 훈련단계에서 등장하였던 기본 클래스의 개체들뿐만 아니라 새로운 신규 클래스의 개체들로도 분할해야 하는 어려운 시각적 작업이다. 본 논문에서는 중요한 모델 설계 이슈별 기존 모델들의 한계점들을 극복하기 위해, 새로운 개방형 어휘 3차원 개체 분할 모델인 Open3DME를 제안한다. 첫째, 제안 모델은 클래스-독립적인 3차원 마스크의 품질을 향상시키기 위해, 새로운 트랜스포머 기반 3차원 포인트 클라우드 개체 분할 모델인 T3DIS[6]를 마스크 제안 모듈로 채용한다. 둘째, 제안 모델은 각 포인트 세그먼트별로 텍스트와 의미적으로 정렬된 시각적 특징을 얻기 위해, 사전 학습된 OpenScene 인코더와 CLIP 인코더를 적용하여 포인트 클라우드와 멀티-뷰 RGB 영상들로부터 각각 3차원 및 2차원 특징들을 추출한다. 마지막으로, 제안 모델은 개방형 어휘 레이블 할당 과정동안 각 포인트 클라우드 세그먼트별로 추출한 2차원 시각적 특징과 3차원 시각적 특징을 상호 보완적으로 함께 이용하기 위해, 특징 앙상블 기법을 적용한다. 본 논문에서는 ScanNet-V2 벤치마크 데이터 집합을 이용한 다양한 정량적, 정성적 실험들을 통해, 제안 모델의 성능 우수성을 입증한다.

의약 용기의 품질 검사를 위한 머신비전을 적용한 다중 카메라 인라인 검사 시스템 개발 (Development of a Multi-Camera Inline System using Machine Vision System for Quality Inspection of Pharmaceutical Containers)

  • 이태윤;윤석문;이승호
    • 전기전자학회논문지
    • /
    • 제28권3호
    • /
    • pp.469-473
    • /
    • 2024
  • 본 논문은 의약 용기의 품질 검사를 위한 머신비전을 적용한 다중 카메라 인라인 검사 시스템 개발을 제안한다. 제안하는 기법은 다중 카메라를 통해 의약 용기를 다방면으로 촬영하여 더욱 정확히 의약 용기의 품질을 검사한다. 또한, 촬영된 의약 용기의 데이터를 기반으로 의약 용기의 치수 및 결함을 검사하여 불량 발생 시 사용자에게 알람이 가고 직접 불량 의약 용기를 제거하는 머신비전을 적용한 인라인 시스템으로 품질 검사의 효율성을 증대시킬 수 있다. 머신비전을 적용한 다중 카메라 인라인 검사 시스템의 제작은 4단계로 나뉜다. 첫 번째로 의약 용기를 흡입 고정 또는 용기를 회전하는 제품 제어부를 설계 및 제작한다. 두 번째로 제품을 이동 및 촬영, 불량 제품일 경우에 배출하는 시스템 본체를 설계 및 제작한다. 세 번째로 모든 시스템을 제어하는 임베디드 보드의 제어 로직을 설계 및 제작한다. 네 번째로 시스템 본체에서 촬영된 이미지를 영상 처리를 사용하여 의약 용기의 불량 검출이 가능한 사용자 GUI를 설계 및 제작한다. 제안된 머신비전을 적용한 다중 카메라 인라인 검사 시스템의 성능을 평가하기 위하여 공인시험기관에서 실험한 결과는, 의약 용기의 치수 측정 오차 범위가 -0.30~0.28(외경), -0.11~0.57(전장) 이내로 세계 최고 수준인 1mm 보다 우수한 결과를 달성하였고, 시스템 반복 동작의 안정성으로는 100%로 측정되었다. 따라서, 본 논문에서 제안한 의약 용기의 품질 검사를 위한 머신비전을 적용한 다중 카메라 인라인 검사 시스템의 효용성이 입증되었다.

트랜스포머 기반 모델의 한국어 음성인식 성능 비교 연구 (A comparative study on the performance of Transformer-based models for Korean speech recognition)

  • 오창한;김민서;박기영;송화전
    • 말소리와 음성과학
    • /
    • 제16권3호
    • /
    • pp.79-86
    • /
    • 2024
  • 트랜스포머 모델은 텍스트, 영상 등 순차적 입력 데이터에서 의미 있는 정보를 추출하는 데 뛰어난 성과를 보여주었으며, 음성인식 분야에서도 종단형 모델로서 주목받고 있다. 본 연구에서는 트랜스포머 음성인식 모델과 이를 개선한 컨포머, E-브랜치포머 모델을 한국어 음성인식에 적용하여 성능을 비교하였다. AIHub에 공개된 한국어 음성 데이터를 활용하여 약 7,500시간의 훈련셋을 마련하고, ESPnet 툴킷을 활용하여 트랜스포머, 컨포머, E-브랜치포머 모델을 훈련하고 성능을 평가하였다. 또한, 인식 단위로 음절과 서브워드를 사용하는 경우를 비교하고, Byte Pair Encoding의 토큰 수 변화에 따른 성능 차이를 분석하였다. 실험 결과, E-브랜치포머가 한국어 음성인식에서 가장 우수한 성능을 보였으며, 컨포머는 트랜스포머보다 우수하였으나 긴 발화에 대해서는 성능 저하가 확인되었다. 이러한 성능 저하의 원인으로 인코더-디코더의 크로스 어텐션 정렬 과정에 오차가 발생함을 확인하였다. 또한, 서브워드 인식 단위를 사용하면서 토큰 수를 조정할 때의 성능 변화에 대한 분석을 통해 최적의 설정을 찾고자 하였다. 본 연구는 모델의 정확도와 처리 속도를 종합적으로 평가하였으며, 이를 통해 한국어 음성인식의 효율성을 극대화할 수 있는 방법을 모색하였다. 대규모 한국어 음성인식 모델의 학습과 컨포머의 인식 오류 개선 연구에 기여할 수 있을 것으로 기대된다. 또한, 향후 연구 방향으로는 다양한 한국어 음성 데이터셋을 활용한 추가 실험과 더불어, 컨포머의 구조적 개선을 통한 인식 성능 향상을 목표로 한다.

생명현상 관찰에서 나타나는 인과적 의문 생성의 ERF 특성 : MEG 연구 (ERF Components Patterns of Causal Question Generation during Observation of Biological Phenomena : A MEG Study)

  • 권석원;권용주
    • 과학교육연구지
    • /
    • 제33권2호
    • /
    • pp.336-345
    • /
    • 2009
  • 이 연구의 목적은 생명현상 관찰에서 나타나는 인과적 의문 생성 ERF components를 개발하는 것이다. 이를 위해 우선 인지심리적 방법으로 생명현상 기반의 인과적 의문생성 유발 사진 과제를 개발하였다. 이를 활용해 전기생리적 방법인 MEG(Magnetoencephalography) 두뇌 영상 기기를 이용하여 시계열적 두뇌 처리과정에 기초한 인과적 의문의 ERF(Event Related Fields) 패턴을 확인할 수 있었다. 생명현상 기반의 인과적 의문생성 유발 사진은 과학교육 전문가와 과학교육연구진으로 구성된 인원의 R&D 방식으로 개발되었다. 과제는 생물군 유형에 따라 동물(A, animal), 미생물(M, microbe), 식물(P, plant)과제로 분류 형태를 나누고, 생물 개체 수준의 유형에 따라 개체간 상호작용(i, interaction), 단일 개체(a, all), 개체 일부(p, part)로 구분하여 총 100장에 대한 인과적 의문 유발 사진을 완성하였다. 이후 서울대학병원 MEG 센터팀과의 세미나 과정을 통해 MEG 과제용 패러다임을 개발하고, 과학교육 전공 여자 대학원생 5명(M=26.4, SD=2.30)을 대상으로 인과적 의문생성간 MEG data를 수집하였다. 이를 통해 인과적 의문 유형별 고유 특성을 확인하기 위해 MEG ERF components 분석을 실시하였다. 인과적 의문 생성시 나타나는 ERF components 분석 결과 M1(100~130ms), M2(220~280ms), M3(320~390ms), M4(460~520ms) 총 4개 components 패턴이 발견되었다. M1과 M2의 경우 인과적 의문 사진 과제 제시에 따라 피험자가 관찰하는 동안 보고 되는 것으로 dipole fitting 과정을 통해 두뇌 활성 영역을 확인해 본 것처럼 시각령이 위치하는 후두엽에 걸쳐 확인되었다. M3 components의 경우 인과적 의문에 대한 불확실감을 해소하기 위해 장기기억 저장소로부터 경험 상황을 가지고 오는 귀추의 과정을 반영한다고 볼 수 있다. 이는 이전 경험상황을 분석하는 단계에 해당하며 학생들이 가설을 생성할 때 가장 큰 어려움을 경험하여 교사의 적절한 도움이 요구되는 부분이다. M4 components는 장기 기억 속의 경험 상황에서 인과적 의문에 대한 설명자를 표상하는 단계에 해당하는 것으로 인과적 의문 생성 후 가설을 만드는 전 단계에 해당 한다고 할 수 있다. 본 연구는 확인된 인과적 의문 생성시 나타나는 MEG ERF components와 latency 시간을 통해 인과적 의문 생성에 어려움을 호소하는 학생들에 대한 개별적 교수 처치와 더불어 고등인지 영역의 ERF 연구의 기초를 마련하였다는데 의의가 있다고 하겠다.

  • PDF