• 제목/요약/키워드: 학습영상

검색결과 2,574건 처리시간 0.029초

CNN 은닉층 증가에 따른 인공지능 정확도 평가: 뇌출혈 CT 데이터 (Evaluation of Artificial Intelligence Accuracy by Increasing the CNN Hidden Layers: Using Cerebral Hemorrhage CT Data)

  • 김한준;강민지;김은지;나용현;박재희;백수은;심수만;홍주완
    • 한국방사선학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-6
    • /
    • 2022
  • 딥러닝은 다량의 데이터 속에서 핵심적인 내용을 요약해 학습하는 알고리즘의 집합으로 의료영상 분야에서 병변을 진단하는 목적으로 사용되기 위해 발전하고 있다. 본 논문에서는 뇌출혈 진단 정확성을 평가하기 위해 CNN을 이용해 뇌실질 CT 영상과 뇌출혈이 의심되는 뇌실질 CT의 진단 정확도를 도출하였다. 은닉층 수에 따른 정확도를 비교한 결과 은닉층이 증가할수록 정확도가 높아졌다. 본 연구에서 도출된 CT 뇌출혈 유무 분석 결과는 앞으로 의료영상 분야와 인공지능 접목에 관한 연구에서 기초 자료로 사용될 것으로 사료된다.

PET 검출기의 디지털 위치 신호 측정을 위한 딥러닝 적용 방법 (Deep Learning Applied Method for Acquisition of Digital Position Signal of PET Detector)

  • 조병두;이승재
    • 한국방사선학회논문지
    • /
    • 제16권6호
    • /
    • pp.697-702
    • /
    • 2022
  • PET에서 영상화를 위해서는 검출기에 입사한 감마선과 상호작용한 섬광 픽셀의 위치를 측정해야한다. 이를 위해서 기존 시스템에서는 섬광 픽셀의 평면 영상을 획득하여, 각 섬광 픽셀이 영상화된 영역을 분리한 후, 섬광 픽셀의 위치를 특정하여 디지털 신호로 획득한다. 본 연구에서는 검출기의 광센서에서 형성되는 신호를 바탕으로 딥러닝 방법을 적용하여, 여러 절차를 거치지 않고 직접 디지털 신호로 획득하는 방법을 개발하였다. 이에 대한 검증 및 위치 측정의 정확도 평가를 위해 DETECT2000 시뮬레이션을 수행하였다. 6 × 6 섬광 픽셀 배열과 4 × 4 광센서를 사용하여 검출기를 구성하였으며, 섬광 픽셀의 중심에서 감마선 이벤트를 발생시켜, 앵거 식을 통해 4채널의 신호로 합산하였다. 획득된 신호를 사용하여 딥러닝 모델을 학습한 후, 섬광 픽셀의 서로 다른 깊이 방향에서 발생된 감마선 이벤트에 대한 위치를 측정하였다. 그 결과 모든 섬광 픽셀 및 위치에서 정확한 결과를 보였다. 본 연구에서 개발한 방법을 PET 검출기에 적용할 경우, 보다 편리하게 섬광 픽셀의 위치를 디지털 신호로 측정할 수 있을 것이다

시계열 위성영상과 머신러닝 기법을 이용한 산림 바이오매스 및 배출기준선 추정 (Machine-learning Approaches with Multi-temporal Remotely Sensed Data for Estimation of Forest Biomass and Forest Reference Emission Levels)

  • 이용규;이정수
    • 한국산림과학회지
    • /
    • 제111권4호
    • /
    • pp.603-612
    • /
    • 2022
  • 본 연구는 다중시기 위성영상과 머신러닝 알고리즘을 이용하여 준국가수준의 시계열 산림바이오매스량을 추정하였으며, 이를 바탕으로 산림배출기준선 설정하여 비교·분석하였다. 머신러닝기반의 산림바이오매스 추정 모델을 구축하기 위하여 Landsat TM 위성영상과 유럽항공우주국에서 제공하는 Biomass Climate Change Initiative 정보를 이용하였으며, 머신러닝 알고리즘은 비모수 학습모델인 k-Nearest Neighbor(kNN)과 의사결정나무 기반의 Random Forest(RF)를 적용하였다. 또한, 추정된 산림바이오매스량은 Forest reference emission levels(FREL) 자료와 비교하였다. 머신러닝 알고리즘 별 산림바이오매스 추정 모델을 비교해보면, 최적의 kNN 모델과 RF 모델의 Root Mean Square Error (RMSE)는 각각 35.9와 34.41였으며, RF모델이 kNN모델보다 상대적으로 우수하였다. 또한, FREL, kNN, RF 모델 별 산림배출기준선의 기울기는 각각 약 -33천ton, -253천ton, -92천ton으로 설정되었다.

얼굴 메이크업을 도와주는 지능형 스마트 거울 앱의설계 (Design of an Intellectual Smart Mirror Appication helping Face Makeup)

  • 오선진;이윤석
    • 문화기술의 융합
    • /
    • 제8권5호
    • /
    • pp.497-502
    • /
    • 2022
  • 최근 젊은 세대를 중심으로 정보의 유통이나 공유 수단으로 텍스트보다는 비주얼 기반의 정보 전달을 선호하는 경향이 뚜렷하며, 인터넷상의 유투브나 1인 방송 등을 통한 정보의 유통이 일상화되고 있다. 즉, 젊은 세대들은 대부분의 원하는 정보를 이러한 유통 과정을 거쳐 습득하게 되며 활용하는 상황이다. 또한, 많은 젊은 세대들은 자신을 개성있게 꾸미고 장식하는 데에 매우 과감하고 적극적이다. 얼굴 화장이나 헤어 스타일링 및 패션 연출에 있어 남녀구분 없이 적극적인 표현과 시도를 통해 개인의 개성을 거리낌이 없이 연출하는 경향이 있다. 특히, 얼굴 메이크업은 여자들은 물론이고 최근 남자들 사이에서도 관심의 대상이 되고 있으며, 자신의 개성을 표출할 수 있는 중요한 수단으로 인식되는 상황이다. 본 연구에서는 이러한 시대적 흐름에 발맞추어 자신의 독특한 개성을 나타내기 위한 얼굴메이크업을 연출하기 위해 자신의 얼굴 모양, 헤어 컬러 및 스타일, 피부 톤, 패션 스타일과 의상 컬러 등과 잘 어울리는 얼굴 메이크업을 구현하도록 인터넷상의 유명한 전문 메이크업 아티스트 들의 유투브나 1인 방송 영상 중 관련영상을 효율적으로 검색하여 추천하고, 사용자의 평소 검색 패턴과 외모 특징들을 학습시켜 축적된 정보를 바탕으로 최적의 솔루션을 제공할 수 있도록 인공지능 기법을 도입하며, 추천된 영상을 통해 자세한 메이크업 과정을 실제 단계별로 수행하면서 메이크업 스킬을 습득하도록 하는 지능형 스마트 거울 앱을 설계하고 구현하고자 한다.

컴퓨터 단층촬영 영상에서 3번 요추부 슬라이스 검출을 위한 최적화 기반 딥러닝 모델 (Optimization-based Deep Learning Model to Localize L3 Slice in Whole Body Computerized Tomography Images)

  • 채성원;조재현;박예은;정진형;김성진;최안렬
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.331-337
    • /
    • 2023
  • 본 논문에서는 근감소증의 발병 여부와 정도를 확인하기 위해 3번 요추부 (L3) CT 영상을 검출하는 딥러닝 모델을 제안하는 것이다. 또한, CT 데이터 내에 L3 레벨과 L3 레벨이 아닌 부분의 데이터 불균형으로 인한 성능 저하의 문제점을 오버샘플링 비율과 클래스 가중치를 설계변수로 하는 최적화 기법을 제시하고자 한다. 모델 학습 및 검증을 위하여 강릉아산병원에 내원한 전립선암 환자 104명, 방광암 환자 46명의 총 150명의 전신 CT 영상이 활용되었다. 딥러닝 모델은 ResNet50을 활용하였으며, 최적화기법의 설계변수로는 모델 하이퍼파라미터 5종과 데이터 증강비율 및 클래스 가중치로 선정하였다. 제안하는 최적화 기반의 L3 레벨 추출 모델은 대조군 (하이퍼파라미터 5종만을 최적화한 모델)과 비교하여 중간 L3 오차가 약 1.0 슬라이스 감소한 것을 확인할 수 있었다. 본 연구결과를 통하여 정확한 L3 슬라이스 검출이 가능하며, 추가적으로 데이터 증강을 통한 오버 샘플링과 클래스 가중치 조절을 통해 데이터 불균형 문제를 효과적으로 해결할 수 있는 가능성을 제시할 수 있다.

뮤직비디오 브라우징을 위한 중요 구간 검출 알고리즘 (Salient Region Detection Algorithm for Music Video Browsing)

  • 김형국;신동
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.112-118
    • /
    • 2009
  • 본 논문은 모바일 단말기, Digital Video Recorder (DVR) 등에 적용할 수 있는 뮤직비디오 브라우징 시스템을 위한 실시간 중요 구간 검출 알고리즘을 제안한다. 입력된 뮤직비디오는 음악 신호와 영상 신호로 분리되어 음악 신호에서는 에너지기반의 음악 특징값 최고점기반의 구조분석을 통해 음악의 후렴 구간을 포함하는 음악 하이라이트 구간을 검출하고, SVM AdaBoost 학습방식에서 생성된 모델을 이용해 음악신호를 분위기별로 자동 분류한다. 음악신호로부터 검출된 음악 하이라이트 구간과 영상신호로부터 검출된 가수, 주인공의 얼굴이 나오는 영상장면을 결합하여 최종적으로 중요구간이 결정된다. 제안된 방식을 통해 사용자는 모바일 단말기나 DVR에 저장되어 있는 다양한 뮤직비디오들을 분위기별로 선택한 후에 뮤직비디오의 30초 내외의 중요구간을 빠르게 브라우징하여 자신이 원하는 뮤직비디오를 선택할 수 있게 된다. 제안된 알고리즘의 성능을 측정하기 위해 200개의 뮤직비디오를 정해진 수동 뮤직비디오 구간과 비교하여 MOS 테스트를 실행한 결과 제안된 방식에서 검출된 중요 구간이 수동으로 정해진 구간보다 사용자 만족도 측면에서 우수한 결과를 나타내었다.

두개골 측방향 X-선 촬영에서 정확도 향상을 위한 촬영 보조 기구의 유용성 평가 (Evaluation of Usefulness of Assertive Devices to Improve the Accuracy in Skull lateral X-ray Projection)

  • 장보석
    • 한국방사선학회논문지
    • /
    • 제18권2호
    • /
    • pp.153-159
    • /
    • 2024
  • 일반 X-선 촬영에서 경험이 없는 비숙련자의 경우, 검사 실패의 경험을 통해 숙련되는 과정을 겪는다. 이것은 불필요한 의료 피폭 가중의 문제를 유발한다. 본 연구에서는 배치 전 비숙련 방사선사가 임상 숙련도를 높일 수 있는 방안으로, 시각적, 공간적 보조 장치를 이용한 두개골 측방향 촬영 실습을 통해, 촬영 보조장치 사용에 따른 정확도와 유용성을 평가하였다. 육안적 관찰과 학습에 의존해서 촬영한 경우 영상 왜곡을 나타내는 회전 이격도 7.85 ± 1.45 mm, 기울임 이격도 4.84 ± 0.5 mm였다. 시각적 보조 장치를 이용해서 실습한 경우 회전 이격도 4.4 ± 0.76 mm, 기울임 이격도 3.01 ± 0.87mm였다. 공간적 보정 기구를 이용해서 실습한 경우 회전과 기울임 이격도는 5.2 ± 0.69 mm, 3.33 ± 0.61 mm로 나타났다. 배치 후 작업 환경과 동일한 조건에서 경험적 촬영 실습에 의한 영상 왜곡은 5.4% 감소하였으나, 기울임에 의한 영상 왜곡은 1.2% 증가하였다. 시각적 보조 장치를 이용해서 실습한 경우, 경험적 촬영 실습보다 회전이격도 40.1% 기울임 이격도 30.7% 감소하였다. 공간적 보정 기구를 사용할 경우, 기존의 경험적 실습 방식보다 회전 이격도 41.7%, 기울임 이격도 23.7% 감소하였다. 따라서 비숙련 방사선사의 배치 전 시각적, 공간적 촬영 보조 기구를 이용한 실습은 배치 후 검사 정확도 향상과 재촬영률 감소에 도움을 줄 수 있을 것으로 사료된다.

YOLOv5 및 다항 회귀 모델을 활용한 사과나무의 착과량 예측 방법 (Estimation of fruit number of apple tree based on YOLOv5 and regression model)

  • 곽희진;정윤주;전익조;이철희
    • 전기전자학회논문지
    • /
    • 제28권2호
    • /
    • pp.150-157
    • /
    • 2024
  • 본 논문은 딥러닝 기반 객체 탐지 모델과 다항 회귀모델을 이용하여 사과나무에 열린 사과의 개수를 예측할 수 있는 새로운 알고리즘을 제안한다. 사과나무에 열린 사과의 개수를 측정하면 사과 생산량을 예측할 수 있고, 농산물 재해 보험금 산정을 위한 손실을 평가하는 데에도 활용할 수 있다. 사과 착과량 측정을 위해 사과나무의 앞면과 뒷면을 촬영하였다. 촬영된 사진에서 사과를 식별하여 라벨링한 데이터 세트를 구축하였고, 이 데이터 세트를 활용하여 1단계 객체 탐지 방식의 CNN 모델을 학습시켰다. 그런데 사과나무에서 사과가 나뭇잎, 가지 등으로 가려진 경우 영상에 포착되지 않아 영상 인식 기반의 딥러닝 모델이 해당 사과를 인식하거나 추론하는 것이 어렵다. 이 문제를 해결하기 위해, 우리는 두 단계로 이루어진 추론 과정을 제안한다. 첫 번째 단계에서는 영상 기반 딥러닝 모델을 사용하여 사과나무의 양쪽에서 촬영한 사진에서 각각의 사과 개수를 측정한다. 두 번째 단계에서는 딥러닝 모델로 측정한 사과 개수의 합을 독립변수로, 사람이 실제로 과수원을 방문하여 카운트한 사과 개수를 종속변수로 설정하여 다항 회귀 분석을 수행한다. 본 논문에서 제안하는 2단계 추론 시스템의 성능 평가 결과, 각 사과나무에서 사과 개수를 측정하는 평균 정확도가 90.98%로 나타났다. 따라서 제안된 방법은 수작업으로 사과의 개수를 측정하는 데 드는 시간과 비용을 크게 절감할 수 있다. 또한, 이 방법은 딥러닝 기반 착과량 예측의 새로운 기반 기술로 관련 분야에서 널리 활용될 수 있을 것이다.

객체 탐지 딥러닝 기법을 활용한 필지별 조사 방안 연구 (Detecting high-resolution usage status of individual parcel of land using object detecting deep learning technique )

  • 전정배
    • 지적과 국토정보
    • /
    • 제54권1호
    • /
    • pp.19-32
    • /
    • 2024
  • 본 연구에서는 드론영상을 기반으로 YOLO 알고리즘을 통해 시설물과 농경지를 대상으로 객체탐지를 실시하고, 이를 법정지목과 비교를 수행하여 영상기반의 조사 가능성을 검토하였다. YOLO 알고리즘을 통해 객체를 탐지한 결과 건축물의 경우에는 기존 수치지형도에서 제공하고 있는 건축물 중 96.3%에 해당하는 객체를 탐지하는 것으로 분석되었다. 또한 수치지형도에서는 건축물이 위치하지 않지만, 영상에서 건축물이 존재하는 136개의 건축물을 추가로 탐지하는 것으로 나타나 정확도가 높은 것으로 나타났다. 비닐하우스의 경우에는 총 297개를 탐지했으나, 일부 과수형 비닐하우스의 경우에 탐지율이 낮은 것으로 분석되었다. 마지막으로 농경지는 가장 낮은 탐지율을 보였다. 농경지는 시설물 대비 넓은 면적과 불규칙한 형상으로 학습데이터의 일관성이 낮아 정확도가 시설물에 비해 작은 것으로 판단된다. 따라서 농경지의 경우에는 박스형태의 탐지가 아닌 Segmentation 탐지가 더욱 효과적으로 활용될 것으로 보인다. 마지막으로 탐지된 객체를 법정지목과 비교를 수행하였다. 그 결과 건축물이 입지가 어려운 농경지 및 임야에서 건축물이 존재하는 것으로 분석되었다. 그러나 이 건축물이 불법으로 활용됨을 파악하기 위해선 행정정보와 연계가 필요할 것으로 보여진다. 따라서 현재 수준에서는 건축물이 입지하기 어려운 필지에 건축물의 존재유무를 객관적으로 판단할 수 있는 수준까지 조사가 가능한 것으로 볼 수 있다.

다시기 Landsat TM 영상과 기계학습을 이용한 토지피복변화에 따른 산림탄소저장량 변화 분석 (Change Analysis of Aboveground Forest Carbon Stocks According to the Land Cover Change Using Multi-Temporal Landsat TM Images and Machine Learning Algorithms)

  • 이정희;임정호;김경민;허준
    • 한국지리정보학회지
    • /
    • 제18권4호
    • /
    • pp.81-99
    • /
    • 2015
  • 가속되는 지구온난화로 인해 한반도 주변의 탄소순환에 대한 명확한 이해의 필요성이 제기되고 있다. 산림은 이산화탄소의 주요 흡수원으로 지상 탄소량의 대부분을 저장하고 있어 이에 대한 추정이 필요하다. 우리나라에서는 국가산림자원조사의 표본점에서 측정되는 헥타르당 임목축적량을 활용하여 산림 탄소저장량을 추정한다. 하지만 탄소저장량은 요약된 수치 형태로 발표하고 있어 탄소저장량의 공간적 분포를 파악하는 것이 어렵다. 본 연구에서는 토지피복변화가 빠르고 국가산림자원조사 표본점 배치가 부족한 도시지역을 대상으로 UNFCCC의 Approach 3와 Tier 3를 충족하는 격자 기반 산림탄소저장량을 추정하였다. 토지피복변화 및 산림탄소저장량은 1991, 1992, 2010, 2011년에 취득된 Landsat 5 TM 영상과 고해상도 항공사진, 제 3차 및 제 5, 6차 국가산림자원조사 자료를 이용하여 추정하였다. 토지피복변화는 기계학습을 이용하여 변화된 토지피복과 변화되지 않은 토지피복 항목을 한 번에 분류하여 추정하였으며, 산림탄소저장량은 반사도, 밴드비율, 식생지수, 지형변수를 입력변수로 하여 기계학습을 통해 추정하였다. 연구 결과, 산림이 그대로 산림으로 유지되는 지역의 경우 33.23tonC/ha의 흡수를 하였으며 비산림이 산림으로 변한 지역의 경우 이보다 큰 36.83tonC/ha의 흡수가 진행된 것으로 추정되었다. 산림이 비산림으로 바뀐 경우에는 -7.35tonC/ha로, 배출이 일어난 것으로 추정되었다. 본 연구를 통하여 토지피복변화에 따른 산림탄소저장량 변화를 정량적으로 이해할 수 있었으며, 향후 효율적인 산림관리에 기여할 수 있을 것으로 판단된다.