• 제목/요약/키워드: Computer vision technology

검색결과 666건 처리시간 0.026초

CNN 기반 전이학습을 이용한 뼈 전이가 존재하는 뼈 스캔 영상 분류 (Classification of Whole Body Bone Scan Image with Bone Metastasis using CNN-based Transfer Learning)

  • 임지영;도탄콩;김수형;이귀상;이민희;민정준;범희승;김현식;강세령;양형정
    • 한국멀티미디어학회논문지
    • /
    • 제25권8호
    • /
    • pp.1224-1232
    • /
    • 2022
  • Whole body bone scan is the most frequently performed nuclear medicine imaging to evaluate bone metastasis in cancer patients. We evaluated the performance of a VGG16-based transfer learning classifier for bone scan images in which metastatic bone lesion was present. A total of 1,000 bone scans in 1,000 cancer patients (500 patients with bone metastasis, 500 patients without bone metastasis) were evaluated. Bone scans were labeled with abnormal/normal for bone metastasis using medical reports and image review. Subsequently, gradient-weighted class activation maps (Grad-CAMs) were generated for explainable AI. The proposed model showed AUROC 0.96 and F1-Score 0.90, indicating that it outperforms to VGG16, ResNet50, Xception, DenseNet121 and InceptionV3. Grad-CAM visualized that the proposed model focuses on hot uptakes, which are indicating active bone lesions, for classification of whole body bone scan images with bone metastases.

Ensemble-based deep learning for autonomous bridge component and damage segmentation leveraging Nested Reg-UNet

  • Abhishek Subedi;Wen Tang;Tarutal Ghosh Mondal;Rih-Teng Wu;Mohammad R. Jahanshahi
    • Smart Structures and Systems
    • /
    • 제31권4호
    • /
    • pp.335-349
    • /
    • 2023
  • Bridges constantly undergo deterioration and damage, the most common ones being concrete damage and exposed rebar. Periodic inspection of bridges to identify damages can aid in their quick remediation. Likewise, identifying components can provide context for damage assessment and help gauge a bridge's state of interaction with its surroundings. Current inspection techniques rely on manual site visits, which can be time-consuming and costly. More recently, robotic inspection assisted by autonomous data analytics based on Computer Vision (CV) and Artificial Intelligence (AI) has been viewed as a suitable alternative to manual inspection because of its efficiency and accuracy. To aid research in this avenue, this study performs a comparative assessment of different architectures, loss functions, and ensembling strategies for the autonomous segmentation of bridge components and damages. The experiments lead to several interesting discoveries. Nested Reg-UNet architecture is found to outperform five other state-of-the-art architectures in both damage and component segmentation tasks. The architecture is built by combining a Nested UNet style dense configuration with a pretrained RegNet encoder. In terms of the mean Intersection over Union (mIoU) metric, the Nested Reg-UNet architecture provides an improvement of 2.86% on the damage segmentation task and 1.66% on the component segmentation task compared to the state-of-the-art UNet architecture. Furthermore, it is demonstrated that incorporating the Lovasz-Softmax loss function to counter class imbalance can boost performance by 3.44% in the component segmentation task over the most employed alternative, weighted Cross Entropy (wCE). Finally, weighted softmax ensembling is found to be quite effective when used synchronously with the Nested Reg-UNet architecture by providing mIoU improvement of 0.74% in the component segmentation task and 1.14% in the damage segmentation task over a single-architecture baseline. Overall, the best mIoU of 92.50% for the component segmentation task and 84.19% for the damage segmentation task validate the feasibility of these techniques for autonomous bridge component and damage segmentation using RGB images.

생성적 적대 신경망을 활용한 부분 위변조 이미지 생성에 관한 연구 (A Study on Image Creation and Modification Techniques Using Generative Adversarial Neural Networks)

  • 송성헌;최봉준;문미경
    • 한국전자통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.291-298
    • /
    • 2022
  • 생성적 적대 신경망(Generative Adversarial Networks, GAN)은 내부의 두 신경망(생성망, 판별망)이 상호 경쟁하면서 학습하는 네트워크이다. 생성자는 현실과 가까운 이미지를 만들고, 구분자는 생성자의 이미지를 더 잘 감별하도록 프로그래밍 되어있다. 이 기술은 전체 이미지 X를 다른 이미지 Y로 생성, 변환 및 복원하기 위해 다양하게 활용되고 있다. 본 논문에서는 원본 이미지에서 부분 이미지만 추출한 후, 이를 자연스럽게 다른 객체로 위변조할 수 있는 방법에 관해 기술한다. 먼저 원본 이미지에서 부분 이미지만 추출한 후, 기존에 학습시켜놓은 DCGAN 모델을 통해 새로운 이미지를 생성하고, 이를 전체적 스타일 전이(overall style transfer) 기술을 사용하여 원본 이미지의 질감과 크기에 어울리도록 리스타일링(re-styling) 한 후, 원본 이미지에 자연스럽게 결합하는 과정을 거친다. 본 연구를 통해 원본 이미지의 특정 부분에 사용자가 원하는 객체 이미지를 자연스럽게 추가/변형할 수 있음으로써 가짜 이미지 생성의 또 다른 활용 분야로 사용될 수 있을 것이다.

Worker Safety in Modular Construction: Investigating Accident Trends, Safety Risk Factors, and Potential Role of Smart Technologies

  • Khan, Muhammad;Mccrary, Evan;Nnaji, Chukwuma;Awolusi, Ibukun
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.579-586
    • /
    • 2022
  • Modular building is a fast-growing construction method, mainly due to its ability to drastically reduce the amount of time it takes to construct a building and produce higher-quality buildings at a more consistent rate. However, while modular construction is relatively safer than traditional construction methods, workers are still exposed to hazards that lead to injuries and fatalities, and these hazards could be controlled using emerging smart technologies. Currently, limited information is available at the intersection of modular construction, safety risk, and smart safety technologies. This paper aims to investigate what aspects of modular construction are most dangerous for its workers, highlight specific risks in its processes, and propose ways to utilize smart technologies to mitigate these safety risks. Findings from the archival analysis of accident reports in Occupational Safety and Health Administration (OSHA) Fatality and Catastrophe Investigation Summaries indicate that 114 significant injuries were reported between 2002 and 2021, of which 67 were fatalities. About 72% of fatalities occurred during the installation phase, while 57% were caused by crushing and 85% of crash-related incidents were caused by jack failure/slippage. IoT-enabled wearable sensing devices, computer vision, smart safety harness, and Augment and Virtual Reality were identified as potential solutions for mitigating identified safety risks. The present study contributes to knowledge by identifying important safety trends, critical safety risk factors and proposing practical emerging methods for controlling these risks.

  • PDF

Joint Reasoning of Real-time Visual Risk Zone Identification and Numeric Checking for Construction Safety Management

  • Ali, Ahmed Khairadeen;Khan, Numan;Lee, Do Yeop;Park, Chansik
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.313-322
    • /
    • 2020
  • The recognition of the risk hazards is a vital step to effectively prevent accidents on a construction site. The advanced development in computer vision systems and the availability of the large visual database related to construction site made it possible to take quick action in the event of human error and disaster situations that may occur during management supervision. Therefore, it is necessary to analyze the risk factors that need to be managed at the construction site and review appropriate and effective technical methods for each risk factor. This research focuses on analyzing Occupational Safety and Health Agency (OSHA) related to risk zone identification rules that can be adopted by the image recognition technology and classify their risk factors depending on the effective technical method. Therefore, this research developed a pattern-oriented classification of OSHA rules that can employ a large scale of safety hazard recognition. This research uses joint reasoning of risk zone Identification and numeric input by utilizing a stereo camera integrated with an image detection algorithm such as (YOLOv3) and Pyramid Stereo Matching Network (PSMNet). The research result identifies risk zones and raises alarm if a target object enters this zone. It also determines numerical information of a target, which recognizes the length, spacing, and angle of the target. Applying image detection joint logic algorithms might leverage the speed and accuracy of hazard detection due to merging more than one factor to prevent accidents in the job site.

  • PDF

Aruco marker 기반 건설 현장 작업자 위치 파악 적용성 분석 (Scholarly Assessment of Aruco Marker-Driven Worker Localization Techniques within Construction Environments)

  • 최태훈;김도근;장세준
    • 한국건축시공학회지
    • /
    • 제23권5호
    • /
    • pp.629-638
    • /
    • 2023
  • 본 논문에서는 건설현장 작업자의 실내 위치 추적을 위한 새로운 방법을 소개한다. 전통적으로 GPS및 NTRIP과 같은 기술은 주로 야외에서 효과적인 위치 확인을 제공하는 데 사용되었습니다. 그러나 이러한 기술은 실내에서 사용할 경우 정확도가 떨어지는 문제가 있습니다. 이러한 문제를 해결하기 위해 본 논문에서는 Aruco marker를 활용하여 작업자의 위치를 추적하는 방법을 제안한다. Aruco marker는 작업자와 마커 사이의 거리를 측정하는 데 사용됩니다. 이 새로운 접근 방식은 기존 위치 확인 방법에 비해 더욱 정확한 실내 위치 확인을 제공합니다. 작업자 위치를 실시간으로 확인할 수 있어 작업 일정을 최적화하고 작업자 간 협업을 촉진합니다. 따라서 Aruco marker를 활용한 실내 측위 방식은 기존의 기술의 문제점을 보완하는 실내 위치 확인 시스템으로 활용될 수 있다.

로봇 인터페이스 활용을 위한 가속도 센서 기반 제스처 인식 (Accelerometer-based Gesture Recognition for Robot Interface)

  • 장민수;조용석;김재홍;손주찬
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.53-69
    • /
    • 2011
  • 로봇 자체 또는 로봇에 탑재된 콘텐츠와의 상호작용을 위해 일반적으로 영상 또는 음성 인식 기술이 사용된다. 그러나 영상 음성인식 기술은 아직까지 기술 및 환경 측면에서 해결해야 할 어려움이 존재하며, 실적용을 위해서는 사용자의 협조가 필요한 경우가 많다. 이로 인해 로봇과의 상호작용은 터치스크린 인터페이스를 중심으로 개발되고 있다. 향후 로봇 서비스의 확대 및 다양화를 위해서는 이들 영상 음성 중심의 기존 기술 외에 상호보완적으로 활용이 가능한 인터페이스 기술의 개발이 필요하다. 본 논문에서는 로봇 인터페이스 활용을 위한 가속도 센서 기반의 제스처 인식 기술의 개발에 대해 소개한다. 본 논문에서는 비교적 어려운 문제인 26개의 영문 알파벳 인식을 기준으로 성능을 평가하고 개발된 기술이 로봇에 적용된 사례를 제시하였다. 향후 가속도 센서가 포함된 다양한 장치들이 개발되고 이들이 로봇의 인터페이스로 사용될 때 현재 터치스크린 중심으로 된 로봇의 인터페이스 및 콘텐츠가 다양한 형태로 확장이 가능할 것으로 기대한다.

건강추천시스템(HRS) 연구 동향: 인용네트워크 분석과 GraphSAGE를 활용하여 (Research Trends of Health Recommender Systems (HRS): Applying Citation Network Analysis and GraphSAGE)

  • 장하렴;유지수;양성병
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.57-84
    • /
    • 2023
  • 현대사회는 정보통신기술 및 빅데이터 기술의 발전으로 누구나 인터넷을 통해 손쉽게 방대한 데이터를 얻고 활용할 수 있는 시대로, 양질의 데이터를 수집하는 능력을 넘어 수많은 정보 속에서 올바른 데이터만을 선별하는 능력이 더욱 중요해지고 있다. 이러한 기조는 학계에서도 이어지고 있는데, 축적되는 연구물 속에서 양질의 연구를 선별하여 올바른 지식구조를 형성하기 위해, 다양한 연구 분야에서 체계적 고찰(systematic review) 및 비체계적 고찰(non-systematic review)과 같은 문헌연구(literature review)가 수행되고 있다. 한편, 코로나19 팬데믹 이후 의료산업에서도 그동안 합의에 이르지 못했던 원격의료가 제한적으로나마 허용되고, 인공지능 및 빅데이터 기술이 응용된 건강추천시스템(health recommender systems: HRS)과 같은 새로운 의료서비스가 각광을 받고 있다. 하지만, 실무적으로 HRS가 미래 의료산업 발전을 이끌 중요한 기술로 평가받고 있음에도 불구하고, 학술적인 문헌연구는 다른 분야에 비해 매우 부족한 실정이다. 더불어 HRS는 학제적 성격이 강한 융합 분야임에도 불구하고, 기존의 문헌연구는 비체계적 고찰과 체계적 고찰 방법만을 주로 활용하여 이뤄졌기 때문에, 다른 연구 분야와의 상호작용이나 동적인 관계를 유추하기에는 한계가 존재한다. 이에, 본 연구에서는 인용네트워크 분석(citation network analysis: CNA)을 활용하여 HRS 및 주변 연구 분야의 전체적인 네트워크 구조를 파악하였다. 또한, 이 과정에서 최신 논문이 인용 관계가 잘 나타나지 않는 문제를 보완하기 위해 GraphSAGE 알고리즘을 적용함으로써, HRS 연구에 있어 'recommender system', 'wireless & IoT', 'computer vision', 'text mining' 등과 같은 연구 분야들의 중요도가 높아지고 있음을 파악하였으며, 이와 동시에 개인화(personalization) 및 개인정보보호(privacy) 등과 같은 새로운 키워드가 주요 이슈로 등장하고 있음을 확인하였다. 본 연구를 통해 HRS 연구 커뮤니티의 구조를 파악하고, 관련된 연구 동향을 살펴보며, 미래 HRS 연구 방향을 설계함에 있어 실질적인 통찰을 제공할 수 있을 것으로 기대한다.

공동체 형성에 있어서 뉴미디어아트의 사회적 역할에 대한 고찰 (The Social Implication of New Media Art in Forming a Community)

  • 김희영
    • 미술이론과 현장
    • /
    • 제14호
    • /
    • pp.87-124
    • /
    • 2012
  • This paper focuses on the social implication of new media art, which has evolved with the advance of technology. To understand the notion of human-computer interactivity in media art, it examines the meaning of "cybernetics" theory invented by Norbert Wiener just after WWII, who provided "control and communication" as central components of his theory of messages. It goes on to investigate the application of cybernetics theory onto art since the 1960s, to which Roy Ascott made a significant contribution by developing telematic art, utilizing the network of telecommunication. This paper underlines the significance of the relationship between human and machine, art and technology in transforming the work of art as a site of communication and experience. The interactivity in new media art transforms the viewer into the user of the work, who is now provided free will to make decisions on his or her action with the work. The artist is no longer a godlike figure who determines the meaning of the work, yet becomes another user of his or her own work, with which to interact. This paper believes that the interaction between man and machine, art and technology can lead to various ways of interaction between humans, thereby restoring a sense of community while liberating humans from conventional limitations on their creativity. This paper considers the development of new media art more than a mere invention of new aesthetic styles employing advanced technology. Rather, new media art provides a critical shift in subverting the modernist autonomy that advocates the medium specificity. New media art envisions a new art, which would embrace impurity into art, allowing the coexistence of autonomy and heteronomy, embracing a technological other, thereby expanding human relations. By enabling the birth of the user in experiencing the work, interactive new media art produces an open arena, in which the user can create the work while communicating with the work and other users. The user now has freedom to visit the work, to take a journey on his or her own, and to make decisions on what to choose and what to do with the work. This paper contends that there is a significant parallel between new media artists' interest in creating new experiences of the art and Jacques Ranci$\grave{e}$re's concept of the aesthetic regime of art. In his argument for eliminating hierarchy in art and for embracing impurity, Ranci$\grave{e}$re provides a vision for art, which is related to life and ultimately reshapes life. Ranci$\grave{e}$re's critique of both formalist modernism and Jean-Francois Lyotard's postmodern view underlines the social implication of new media art practices, which seek to form "the common of a community."

  • PDF

무안경식 입체 모니터를 이용한 지형공간 데이터의 디스플레이 기법 (Geospatial Data Display Technique for Non-Glasses Stereoscopic Monitor)

  • 이선근;이동천
    • 한국측량학회지
    • /
    • 제26권6호
    • /
    • pp.599-609
    • /
    • 2008
  • 전자 및 디스플레이 기술의 진보에 따라 공간정보 분야는 급속히 발전되고 있으며, 다양한 공간정보 콘텐츠의 3차원 입체화가 기술이 상용화되고 있다. 공간정보기술은 여러 분야에서 의사결정에 중요한 역할을 하고 있지만, 3차원 데이터 및 결과물은 2차원 평면상에서 시각화되고 있다. 그러나 실세계 공간에 존재하는 지형지물 등 다양한 3차원 객체들을 2차원 평면에서 시각화한 결과를 기반으로 의사결정에 활용하는 것은 한계가 있다. 그러므로 본 연구에서는 3차원의 객체를 실감적이고 입체적으로 디스플레이 하기 위하여 가상의 3차원 공간 좌표계를 형성하였다. 입체 디스플레이를 위한 공간좌표계상에서 관측자의 위치, 방향, 영상의 크기 및 중복도, 축척 등을 동적으로 설정할 수 있도록 공선조건식을 적용하여 관측자의 동적인 시점을 고려하여 신속하게 입체영상을 생성하고 디스플레이 할 수 있는 방법을 개발하였다. 생성된 3차원 대상물의 회전, 이동 및 축척변화에 대응되는 다양한 관측자 시점에서 실시간 입체영상을 생성하였으며, 또한 flying-trough 및 walking-trough를 시뮬레이션할 수 있는 입체 동영상 제작 알고리즘을 구현하였다. 3차원 대상물을 입체로 디스플레이하기 위해서는 양안시차의 원리에 의해 대상물을 좌안 및 좌측영상으로 분리하고 무안경식, 편광식, 여색방식 등의 입체시 기법을 적용하여 동시에 디스플레이하여야 한다. 본 연구는 입체 모니터상에서 실감적 입체 디스플레이 기법을 구현하여 실세계에 존재하는 3차원 대상물을 효율적이고 실감적으로 생성하므로써 지형공간 데이터의 입체 시각화를 향상시킬 수 있다. 특히 차세대 모니터인 무안경식 입체 모니터에 디스플레이 할 수 있는 지형공간 데이터의 입체 콘텐츠 제작 방법을 개발하여 무안경식 모니터의 GIS 분야에서의 활용 가능성을 연구하는데 목적이 있다.