• 제목/요약/키워드: Images, processing

검색결과 4,224건 처리시간 0.035초

군사용 지능형 영상 판독 시스템에서의 빔서치를 활용한 문장 추천 (Sentence Recommendation Using Beam Search in a Military Intelligent Image Analysis System)

  • 나형선;전태현;강형석;안진현;임동혁
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.521-528
    • /
    • 2021
  • 군사 분야에서 사용 중인 기존 영상 판독 시스템은 판독관들이 직접 영상을 분석 및 식별하여 관련 내용을 보고서에 작성하고 전파하는 방식으로 진행되는데 이 과정에서 반복 작업이 빈번하여 업무 과부하가 발생한다. 본 논문에서는 이러한 문제를 해결하고자, 기존의 문장 단위로 동작하는 Seq2Seq 모델을 단어 단위로 동작할 수 있는 알고리즘을 제안하고, Attention 기법을 적용해 정확도를 향상시키고자 한다. 또한 Beam 탐색 기법을 응용하여 특정 지역의 과거 식별내용을 바탕으로 현재 식별 문장을 다양하게 추천하고자 한다. 실험을 통해 Beam 탐색 기법이 기존 Greedy 탐색 기법보다 효과적으로 문장을 추천하는 것을 확인하였고, Beam의 크기가 클 때 추천의 정확도가 높아지는 것을 확인하였다.

COSPACES EDU를 통한 중국 둔황 원시벽화 메타버스 연구 (A study on metaverse of China's Dunhuang Frescoes through COSPACES EDU)

  • 유보아;오승환
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.463-470
    • /
    • 2021
  • 중국의 둔황 벽화는 자연과 인위적인 요소로 인하여 점점 퇴화되고 있으며 중국 둔황 벽화에 대한 보호연구는 1990년부터 벽화의 디지털 트랜스포메이션을 실시하였다. 그러나 값비싼 연구비용이 필요하고 대부분 관람객들은 디지털미디어에서 관람을 수동적으로 받아들이며 메타버스형 참여가 부족했다고 판단된다. 본 연구는 둔황 고굴 벽화를 연구범위로 정하고, 메타버스를 위해 COSPACES EDU 플랫폼에서 프로토타입을 제작하였다. 둔황벽화를 3차원으로 변환시키고 동굴모형에 이미지를 매핑하여 관광과 교육을 위한 코블록스 블록을 개발하는 등의 절차를 통하여 구현하였다. 또한 사례 연구를 통해 비싼 개발비용을 사용하지 않는 구체적인 방법론을 제시하여 몰입형 둔황벽화 세계를 쉽게 구축하고 관광 콘텐츠와 교육효과를 높이기 위한 프로세스를 개발 제안하였다. 그리고 100개의 유저 체험 설문 피드백을 기준으로 개선해야 할 연구 방향은 문화제 디테일에 대한 퀄리티를 강화하는 것으로 나타났다. 향후 연구를 통해 이를 보완, 최적화해야 할 것으로 판단된다.

RGBD 카메라 기반의 Human-Skeleton Keypoints와 2-Stacked Bi-LSTM 모델을 이용한 낙상 탐지 (Fall Detection Based on 2-Stacked Bi-LSTM and Human-Skeleton Keypoints of RGBD Camera)

  • 신병근;김응호;이상우;양재영;김원겸
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.491-500
    • /
    • 2021
  • 본 연구에서는 MS Kinect v2 RGBD 카메라 기반의 Human-Skeleton Keypoints와 2-Stacked Bi-LSTM 모델을 이용하여 낙상 행위를 탐지하는 방법을 제안한다. 기존의 연구는 RGB 영상에서 OpenPose 등의 딥러닝 모델을 이용하여 골격 정보를 추출한 후 LSTM, GRU 등의 순환신경망 모델을 이용해 인식을 수행하였다. 제안한 방법은 카메라로부터 골격정보를 바로 전달 받아 가속도 및 거리의 2개의 시계열 특징을 추출한 후 2-Stacked Bi-LSTM 모델을 이용하여 낙상 행위를 인식하였다. 어깨, 척추, 골반 등 주요 골격을 대상으로 중심관절을 구하고 이 중심관절의 움직임 가속도와 바닥과의 거리를 특징으로 제안하였다. 추출된 특징은 Stacked LSTM, Bi-LSTM 등의 모델과 성능비교를 수행하였고 GRU, LSTM 등의 기존연구에 비해 향상된 검출 성능을 실험을 통해 증명하였다.

다중카메라를 이용한 곡면 스크린의 패턴 레이저 좌표 추적 방법 설계와 해석 연구 (A Study on Design and Interpretation of Pattern Laser Coordinate Tracking Method for Curved Screen Using Multiple Cameras)

  • 조진표;김정호;정용배
    • Journal of Platform Technology
    • /
    • 제9권4호
    • /
    • pp.60-70
    • /
    • 2021
  • 본 논문은 2채널 이상의 다중 카메라를 사용하는 곡면 스크린 사격 시스템에서 패턴 레이저 영상의 좌표를 안정적으로 추적할 수 있는 방법을 제안하였다. 이 방법은 HMD 사격 방식을 대체할 수 있는 다중 스크린 사격 방식에 적용시 매우 효과적으로 타겟점을 추적 및 획득할 수 있다. 개별 카메라로부터 획득한 변형이 심한 곡면 스크린의 영상을 영상 정규화, 영상 이진화 및 노이즈 제거를 통해 보정한다. 이 보정된 영상을 매칭점을 기준으로 사격의 탄착점 추적에 용의한 유클리드 공간 맵으로 생성하여 적용한다. 실험한 결과, 곡면 스크린 사격 시스템에서 패턴 레이저의 영상 좌표를 안정적으로 추출하였고, 실세계 좌표 위치와 광대역 유클리드 맵의 타켓점 위치 오차를 최소화하였다. 실험을 통해 제안한 방법의 신뢰성을 확인하였다.

Assessment and Comparison of Three Dimensional Exoscopes for Near-Infrared Fluorescence-Guided Surgery Using Second-Window Indocyanine-Green

  • Cho, Steve S.;Teng, Clare W.;Ravin, Emma De;Singh, Yash B.;Lee, John Y.K.
    • Journal of Korean Neurosurgical Society
    • /
    • 제65권4호
    • /
    • pp.572-581
    • /
    • 2022
  • Objective : Compared to microscopes, exoscopes have advantages in field-depth, ergonomics, and educational value. Exoscopes are especially well-poised for adaptation into fluorescence-guided surgery (FGS) due to their excitation source, light path, and image processing capabilities. We evaluated the feasibility of near-infrared FGS using a 3-dimensional (3D), 4 K exoscope with near-infrared fluorescence imaging capability. We then compared it to the most sensitive, commercially-available near-infrared exoscope system (3D and 960 p). In-vitro and intraoperative comparisons were performed. Methods : Serial dilutions of indocyanine-green (1-2000 ㎍/mL) were imaged with the 3D, 4 K Olympus Orbeye (system 1) and the 3D, 960 p VisionSense Iridium (system 2). Near-infrared sensitivity was calculated using signal-to-background ratios (SBRs). In addition, three patients with brain tumors were administered indocyanine-green and imaged with system 1, with two also imaged with system 2 for comparison. Results : Systems 1 and 2 detected near-infrared fluorescence from indocyanine green concentrations of >250 ㎍/L and >31.3 ㎍/L, respectively. Intraoperatively, system 1 visualized strong near-infrared fluorescence from two, strongly gadolinium-enhancing meningiomas (SBR=2.4, 1.7). The high-resolution, bright images were sufficient for the surgeon to appreciate the underlying anatomy in the near-infrared mode. However, system 1 was not able to visualize fluorescence from a weakly-enhancing intraparenchymal metastasis. In contrast, system 2 successfully visualized both the meningioma and the metastasis but lacked high resolution stereopsis. Conclusion : Three-dimensional exoscope systems provide an alternative visualization platform for both standard microsurgery and near-infrared fluorescent guided surgery. However, when tumor fluorescence is weak (i.e., low fluorophore uptake, deep tumors), highly sensitive near-infrared visualization systems may be required.

광학 위성 영상 기반 선박탐지의 정확도 개선을 위한 딥러닝 초해상화 기술의 영향 분석 (Impact Analysis of Deep Learning Super-resolution Technology for Improving the Accuracy of Ship Detection Based on Optical Satellite Imagery)

  • 박성욱;김영호;김민식
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.559-570
    • /
    • 2022
  • 광학 위성 영상의 공간해상도가 낮게 되면 크기가 작은 객체들의 경우 객체 탐지의 어려움이 따른다. 따라서 본 연구에서는 위성 영상의 공간해상도를 향상시키는 초해상화(Super-resolution) 기술이 객체 탐지 정확도 향상에 대한 영향이 유의미한지 알아보고자 하였다. 쌍을 이루지 않는(unpaired) 초해상화 알고리즘을 이용하여 Sentinel-2 영상의 공간해상도를 3.2 m로 향상시켰으며, 객체 탐지 모델인 Faster-RCNN, RetinaNet, FCOS, S2ANet을 활용하여 초해상화 적용 유무에 따른 선박 탐지 정확도 변화를 확인했다. 그 결과 선박 탐지 모델의 성능 평가에서 초해상화가 적용된 영상으로 학습된 선박 탐지 모델들에서 Average Precision (AP)가 최소 12.3%, 최대 33.3% 향상됨을 확인하였고, 초해상화가 적용되지 않은 모델에 비해 미탐지 및 과탐지가 줄어듦을 보였다. 이는 초해상화 기술이 객체 탐지에서 중요한 전처리 단계가 될 수 있다는 것을 의미하고, 객체 탐지와 더불어 영상 기반의 다른 딥러닝 기술의 정확도 향상에도 크게 기여할 수 있을 것으로 기대된다.

k-근접 이웃 및 비전센서를 활용한 프리팹 강구조물 조립 성능 평가 기술 (Assembly Performance Evaluation for Prefabricated Steel Structures Using k-nearest Neighbor and Vision Sensor)

  • 방현태;유병준;전해민
    • 한국전산구조공학회논문집
    • /
    • 제35권5호
    • /
    • pp.259-266
    • /
    • 2022
  • 본 논문에서는 프리팹 구조물의 품질관리를 위한 딥러닝 및 비전센서 기반의 조립 성능 평가 모델을 개발하였다. 조립부 검출을 위해 인코더-디코더 형식의 네트워크와 수용 영역 블록 합성곱 모듈을 적용한 딥러닝 모델을 사용하였다. 검출된 조립부 영역 내의 볼트홀을 검출하고, 볼트홀의 위치 값을 산정하여 k-근접 이웃 기반 모델을 사용하여 조립 품질을 평가하였다. 제안된 기법의 성능을 검증하기 위해 조립부 모형을 3D 프린팅을 이용하여 제작하여 조립부 검출 및 조립 성능 예측 모델의 성능을 검증하였다. 성능 검증 결과 높은 정밀도로 조립부를 검출하였으며, 검출된 조립부내의 볼트홀의 위치를 바탕으로 프리팹 구조물의 조립 성능을 5% 이하의 판별 오차로 평가할 수 있음을 확인하였다.

AWGN 환경에서 로컬 스티어링 커널과 블록매칭에 기반한 디지털 필터 알고리즘 (Digital Filter Algorithm based on Local Steering Kernel and Block Matching in AWGN Environment)

  • 천봉원;김남호
    • 한국정보통신학회논문지
    • /
    • 제25권7호
    • /
    • pp.910-916
    • /
    • 2021
  • 현대 사회는 4차 산업혁명의 영향에 의해 다양한 디지털 통신 장비가 사용되고 있다. 이에 따라 데이터 전송 과정에서 발생하는 잡음제거에 관심이 높아지고 있으며, 효율적으로 영상을 복원하기 위한 연구가 진행되고 있다. 본 논문에서는 디지털 이미지 전송 과정에서 발생하는 AWGN을 제거하기 위한 필터링 알고리즘을 제안한다. 제안한 알고리즘은 영상에서 강하게 나타나는 AWGN을 제거하기 위해 블록매칭에 따라 입력화소의 주변에서 비슷한 패턴을 가진 영역을 선별하여 유사성이 높은 화소를 분류한다. 선별된 화소는 로컬 스티어링 커널로 구한 가중치를 적용하여 추정값을 정하며, 센터마스크의 표준편차에 따라 입력화소값을 가감하여 최종출력을 구한다. 제안한 알고리즘을 평가하기 위해 기존 AWGN 제거 알고리즘들과 시뮬레이션하였으며, 확대영상과 PSNR을 사용하여 비교 분석하였다.

키밸류 저장소 성능 제어를 위한 삭제 키 분리 LSM-Tree (A Tombstone Filtered LSM-Tree for Stable Performance of KVS)

  • 이은지
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.17-22
    • /
    • 2022
  • 최근 웹 서비스의 확산과 함께 데이터의 형태는 더욱 다양해지고 있다. 이미지, 동영상, 텍스트 등 데이터를 저장하는 형태 뿐 아니라 해당 데이터를 표현하는 속성 및 메타데이터 등도 개수 및 형태가 데이터 별로 상이하다. 이러한 비정형 데이터를 효율적으로 처리하기 위해 키밸류 스토어(Key-Value Store)의 사용이 확산되고 있다. LSM-Tree(Log Structured Merge Tree)는 다양한 상용 키밸류 스토어의 핵심 자료구조이다. LSM-Tree 는 모든 쓰기 및 삭제 연산을 로그 방식으로 기록함으로써 소량의 쓰기에 높은 성능을 제공하도록 최적화 되어 있다. 그러나 최근 유효성 만료 데이터의 대용량 삭제 연산이 LSM-Tree에 특수 키밸류 데이터로 삽입됨에 따라 사용자 요청의 지연시간 및 처리속도가 저하된다는 문제점이 있다. 본 논문은 기존 LSM-Tree의 장점을 모두 유지하면서도 삭제된 키를 주요 트리 구조에서 분리하여 상기 문제를 해결하는 Filtered LSM-Tree (FLSM-Tree)를 제안한다. 제안하는 기법은 상용 키밸류 저장소인 LevelDB에 구현되었으며 성능 평가에서 읽기 성능이 최대 47% 향상됨을 보인다.

허밍: DeepJ 구조를 이용한 이미지 기반 자동 작곡 기법 연구 (Humming: Image Based Automatic Music Composition Using DeepJ Architecture)

  • 김태헌;정기철;이인성
    • 한국멀티미디어학회논문지
    • /
    • 제25권5호
    • /
    • pp.748-756
    • /
    • 2022
  • Thanks to the competition of AlphaGo and Sedol Lee, machine learning has received world-wide attention and huge investments. The performance improvement of computing devices greatly contributed to big data processing and the development of neural networks. Artificial intelligence not only imitates human beings in many fields, but also seems to be better than human capabilities. Although humans' creation is still considered to be better and higher, several artificial intelligences continue to challenge human creativity. The quality of some creative outcomes by AI is as good as the real ones produced by human beings. Sometimes they are not distinguishable, because the neural network has the competence to learn the common features contained in big data and copy them. In order to confirm whether artificial intelligence can express the inherent characteristics of different arts, this paper proposes a new neural network model called Humming. It is an experimental model that combines vgg16, which extracts image features, and DeepJ's architecture, which excels in creating various genres of music. A dataset produced by our experiment shows meaningful and valid results. Different results, however, are produced when the amount of data is increased. The neural network produced a similar pattern of music even though it was a different classification of images, which was not what we were aiming for. However, these new attempts may have explicit significance as a starting point for feature transfer that will be further studied.