통합 검색 | Korea Science

시내버스 승하차 의도분석 기반 사고방지 AI 시스템 연구 (A study on accident prevention AI system based on estimation of bus passengers' intentions)

박성환;변선오;박정훈
- 스마트미디어저널
- /
- 제12권11호
- /
- pp.57-66
- /
- 2023
본 논문에서는 시내버스 내 CCTV 시스템을 활용, 비전AI 기반의 승하차 승객 의도를 예측하여 사고방지가 가능한 시스템에 대해 연구한 내용을 기술한다. 본 시스템은 YOLOv7 Pose 모델과 Object Tracking 기술을 활용하여 버스 내부의 승객을 감지하고 추적하며, LSTM 모델을 활용하여 승객의 승하차 여부를 예측한다. 시스템은 버스 내 CCTV 단말기 상에 설치 가능하여 운전 중 어느 때에나 승하차 여부 예측 결과를 시각적으로 확인할 수 있으며, 운전자에게 자동 알람을 주어 승하차 시 일어날 수 있는 사고를 예방할 수 있다. 테스트 결과, 승객의 승차 의도를 분석하는 채널 A와 하차 의도를 예측하는 채널 C에서 각각 0.81과 0.79의 정확도를 달성하였으며, 실시간성을 보장하기 위해 GPU 환경에서 초당 최소 5 프레임 이상의 분석이 가능하다는 것을 확인하였다. 본 알고리즘을 통해 시내버스 운행 중의 승객 승하차 과정을 모니터링하고, 그 안전과 편의성에 도움을 줄 것으로 생각된다. 추후 하드웨어가 발전하고, DB를 통해 데이터가 많이 수집된다면, 이 또한 다양한 안전 관련 지표로의 확장이 가능할 것이다. 더불어 본 알고리즘은 추후 자율주행 버스 상용화 시, 인간을 대신하여 승객 안전에 더욱 핵심적인 역할을 수행할 것이라 생각되며, 기타 지하철 및 승객이 내리고 탈 수 있는 모든 대중교통 환경에의 확장 또한 가능하여 대중교통의 안전화에 도움을 줄 것으로 생각한다.
https://doi.org/10.30693/SMJ.2023.12.11.57 인용 PDF

RawNet3를 통해 추출한 화자 특성 기반 원샷 다화자 음성합성 시스템 (One-shot multi-speaker text-to-speech using RawNet3 speaker representation)

한소희;엄지섭;김회린
- 말소리와 음성과학
- /
- 제16권1호
- /
- pp.67-76
- /
- 2024
최근 음성합성(text-to-speech, TTS) 기술의 발전은 합성음의 음질을 크게 향상하였으며, 사람의 음성에 가까운 합성음을 생성할 수 있는 수준에 이르렀다. 특히, 다양한 음성 특성과 개인화된 음성을 제공하는 TTS 모델은 AI(artificial intelligence) 튜터, 광고, 비디오 더빙과 같은 분야에서 널리 활용되고 있다. 따라서 본 논문은 훈련 중 보지 않은 화자의 발화를 사용하여 음성을 합성함으로써 음향적 다양성을 보장하고 개인화된 음성을 제공하는 원샷 다화자 음성합성 시스템을 제안했다. 이 제안 모델은 FastSpeech2 음향 모델과 HiFi-GAN 보코더로 구성된 TTS 모델에 RawNet3 기반 화자 인코더를 결합한 구조이다. 화자 인코더는 목표 음성에서 화자의 음색이 담긴 임베딩을 추출하는 역할을 한다. 본 논문에서는 영어 원샷 다화자 음성합성 모델뿐만 아니라 한국어 원샷 다화자 음성합성 모델도 구현하였다. 제안한 모델로 합성한 음성의 자연성과 화자 유사도를 평가하기 위해 객관적인 평가 지표와 주관적인 평가 지표를 사용하였다. 주관적 평가에서, 제안한 한국어 원샷 다화자 음성합성 모델의 NMOS(naturalness mean opinion score)는 3.36점이고 SMOS(similarity MOS)는 3.16점이었다. 객관적 평가에서, 제안한 영어 원샷 다화자 음성합성 모델과 한국어 원샷 다화자 음성합성 모델의 P-MOS(prediction MOS)는 각각 2.54점과 3.74점이었다. 이러한 결과는 제안 모델이 화자 유사도와 자연성 두 측면 모두에서 비교 모델들보다 성능이 향상되었음을 의미한다.
https://doi.org/10.13064/KSSS.2024.16.1.067 인용 PDF

Automatic Detection and Classification of Rib Fractures on Thoracic CT Using Convolutional Neural Network: Accuracy and Feasibility

Qing-Qing Zhou;Jiashuo Wang;Wen Tang;Zhang-Chun Hu;Zi-Yi Xia;Xue-Song Li;Rongguo Zhang;Xindao Yin;Bing Zhang;Hong Zhang
- Korean Journal of Radiology
- /
- 제21권7호
- /
- pp.869-879
- /
- 2020
Objective: To evaluate the performance of a convolutional neural network (CNN) model that can automatically detect and classify rib fractures, and output structured reports from computed tomography (CT) images. Materials and Methods: This study included 1079 patients (median age, 55 years; men, 718) from three hospitals, between January 2011 and January 2019, who were divided into a monocentric training set (n = 876; median age, 55 years; men, 582), five multicenter/multiparameter validation sets (n = 173; median age, 59 years; men, 118) with different slice thicknesses and image pixels, and a normal control set (n = 30; median age, 53 years; men, 18). Three classifications (fresh, healing, and old fracture) combined with fracture location (corresponding CT layers) were detected automatically and delivered in a structured report. Precision, recall, and F1-score were selected as metrics to measure the optimum CNN model. Detection/diagnosis time, precision, and sensitivity were employed to compare the diagnostic efficiency of the structured report and that of experienced radiologists. Results: A total of 25054 annotations (fresh fracture, 10089; healing fracture, 10922; old fracture, 4043) were labelled for training (18584) and validation (6470). The detection efficiency was higher for fresh fractures and healing fractures than for old fractures (F1-scores, 0.849, 0.856, 0.770, respectively, p = 0.023 for each), and the robustness of the model was good in the five multicenter/multiparameter validation sets (all mean F1-scores > 0.8 except validation set 5 [512 x 512 pixels; F1-score = 0.757]). The precision of the five radiologists improved from 80.3% to 91.1%, and the sensitivity increased from 62.4% to 86.3% with artificial intelligence-assisted diagnosis. On average, the diagnosis time of the radiologists was reduced by 73.9 seconds. Conclusion: Our CNN model for automatic rib fracture detection could assist radiologists in improving diagnostic efficiency, reducing diagnosis time and radiologists' workload.
https://doi.org/10.3348/kjr.2019.0651 인용 PDF

웨이블릿 변환과 기계 학습 접근법을 이용한 수위 데이터의 노이즈 제거 비교 분석 (Comparative analysis of wavelet transform and machine learning approaches for noise reduction in water level data)

황유관;임경재;김종건;신민환;박윤식;신용철;지봉준
- 한국수자원학회논문집
- /
- 제57권3호
- /
- pp.209-223
- /
- 2024
4차 산업혁명 시대에 접어들어 데이터 기반의 의사결정이 보편화되고 있다. 하지만 데이터 품질이 확보되지 않은 채 수행되는 데이터 분석은 왜곡된 결과를 낳을 가능성이 존재한다. 수자원 관리의 기초가 되는 수위 데이터도 마찬가지로 결측, 스파이크, 잡음 등 다양한 품질 문제를 가진다. 본 연구에서는 잡음으로 인해 발생하는 데이터 품질 문제를 해결하고자 하였다. 잡음은 데이터의 트렌드 분석을 어렵게 하고 비정상적인 이상치를 생성할 가능성이 있다. 본 연구는 이러한 문제를 해결하기 위해 Wavelet Transform을 이용한 잡음 제거 접근 방안을 제안한다. Wavelet Transform은 신호처리에 주로 사용되는 방법으로 잡음 제거에 효과적인 것으로 알려져 있으며 수집된 데이터의 정답 데이터(True value) 수집을 요구하지 않으므로 시간과 비용을 줄일 수 있다는 점에서 적용이 용이한 편이다. 본 연구는 Wavelet Transform의 성능 평가를 위해 대표적인 머신러닝 기반 잡음 제거 방법인 Denoising Autoencoder와 성능 비교를 수행하였다. 그 결과 Wavelet Transform 중 Coiflets 함수는, Denoising Autoencoder에 비해 Mean Absolute Error, Mean Absolute Percentage Error, Mean Squared Error 등 모든 측면에서 우수한 성능을 보이는 것으로 나타났다. 이러한 결과는 환경에 맞는 적절한 웨이블릿 함수의 선택을 통한 잡음 문제를 효과적으로 해결할 수 있음을 시사한다. 본 연구는 수위 데이터의 품질을 향상시켜 수자원 관리 결정의 신뢰성에 기여하는 강력한 도구로서 Wavelet Transform의 잠재력을 확인한 의의가 있다.
https://doi.org/10.3741/JKWRA.2024.57.3.209 인용 PDF

GEase-K: 부가 정보를 활용한 선형 및 비선형 오토인코더 기반의 추천시스템 (GEase-K: Linear and Nonlinear Autoencoder-based Recommender System with Side Information)

이태범;이승학;마민정;조윤호
- 지능정보연구
- /
- 제29권3호
- /
- pp.167-183
- /
- 2023
최근 추천시스템 분야에서는 희소한 데이터를 효과적으로 모델링하기 위한 다양한 연구가 진행되고 있다. GLocal-K(Global and Local Kernels for Recommender Systems)는 그중 하나의 연구로 전역 커널과 지역 커널을 결합하여 데이터의 전역적인 패턴과 개별 사용자의 특성을 모두 고려해 사용자 맞춤형 추천을 제공하는 모델이다. 하지만 GLocal-K는 커널 트릭을 사용하기 때문에 매우 희소한 데이터에서 성능이 떨어지고 부가 정보를 사용하지 않아 새로운 사용자나 아이템에 대한 추천을 제공하는 데 어려움이 있다. 본 논문에서는 이러한 GLocal-K의 단점을 극복하기 위해 EASE(Embarrassingly Shallow Autoencoders for Sparse Data) 모델과 부가 정보를 활용한 GEase-K(Global and EASE kernels for Recommender Systems) 모델을 제안한다. 우선 GLocal-K의 지역 커널 대신 EASE를 활용하여 매우 희소한 데이터에서 추천 성능을 높이고자 하였다. EASE는 단순한 선형 연산 구조로 이루어져 있지만, 규제화와 아이템 간 유사도 학습을 통해 매우 희소한 데이터에서 높은 성능을 내는 오토인코더이다. 다음으로 Cold Start 완화를 위해 부가 정보를 활용하였다. 학습 과정에서 부가 정보를 추가하기 위해 조건부 오토인코더 구조를 적용하였으며 이를 통해 사용자-아이템 간의 유사성을 더 잘 파악할 수 있도록 하였다. 결론적으로 GEase-K는 선형 구조와 비선형 구조의 결합, 부가 정보의 활용을 통해 매우 희소한 데이터와 Cold Start 상황에서 강건한 모습을 보인다. 실험 결과, GEase-K는 매우 희소한 GoodReads, ModCloth 데이터 세트에서 RMSE, MAE 평가 지표 기준 GLocal-K 보다 높은 성능을 보였다. 또한 GoodReads, ModCloth 데이터 세트를 4개의 집단으로 나누어 실험한 Cold Start 실험에서도 GLocal-K 대비 Cold Start 상황에서 좋은 성능을 보였다.
https://doi.org/10.13088/jiis.2023.29.3.167 인용 PDF

오버레이 멀티캐스팅에서 트리의 스위칭을 고려한 빠른 멤버 가입 방안에 관한 연구 (Fast Join Mechanism that considers the switching of the tree in Overlay Multicast)

조성연;노경택;박명순
- 정보처리학회논문지C
- /
- 제10C권5호
- /
- pp.625-634
- /
- 2003
인터넷 멀티캐스팅 기술은 지난 10여년간의 기술 발전에도 불구하고 아직 본격적인 서비스 보급이 이루어지지 못하고 있다. 주된 이유는 멀티캐스트 라우팅에서의 트래픽 제어, 글로벌 인터넷에서의 멀티캐스트 주소 할당, 멀티캐스트 신뢰전송 기법 등의 문제가 아직 해결되지 않았기 때문이다. 최근 인터넷 방송, 실시간 증권정보 서비스 등의 멀티캐스트 응용 서비스에 대한 요구가 급격히 증가함에 따라, 새로운 인터넷 멀티캐스팅 기술로써 오버레이 멀티캐스팅이 개발되고 있다 본 논문은 오버레이 멀티캐스팅 기술을 살펴보고, 새로운 멤버가 그룹에 가입하는데 걸리는 시간을 단축하는 방안을 제안한다. 기존의 방식은 잠재적인 부모 노드를 발견하기 위해서 한번에 트리의 한 레벨씩을 검색해 내려갔으며, 이로 인하여 긴 가입 지연 시간이 야기되었다. 또한, 트리의 매 레벨에서 자신과 가까운 노드를 잠재적인 부모 노드로 지적함으로써, 최적의 부모 노드를 선택하려고 노력하였지만 실제로 노드의 제한 차수로 인하여 자신과 가장 가까운 잠재적인 부모 노드를 선택하지 못하였으며, 이로 인해 트리의 효율성이 떨어졌다. 본 논문에서는 이러한 가입 지연 시간을 감소시키고, 생성된 트리의 효율성을 높이기 위해서, 트리의 두 레벨씩 검색하는 방안을 제안한다. 이 방식은 가입 요청 메시지를 자신의 자식 노드에게 전달하는 방식으로, 평상시에 트리 유지를 위한 추가적인 오버헤드 없이, 가입 요청이 왔을 때 검색 메시지의 수를 증가시켜서, 빠르게 가입을 완료한다. 또한, 더 많은 노드를 검색함으로써 좀 더 효율적인 트리를 생성하게 도와준다. 제안하늘 방안의 성능을 평가하기 위해서, 그룹의 멤버 수와 제한 차수를 기준으로 검색 시간 및 검색한 노드의 수 그리고 트리 스위칭 횟수를 측정하였다. 시뮬레이션 결과에서 제안한 기법이 기존의 방식에 비해서 가입 지연 시간을 단축시켰으며, 좀 더 효율적인 트리를 생성하는 것을 볼 수 있었다.본 연구결과 이소플라본은 전립선암 환자의 혈중 지질 패턴과 항산화체계를 개선시키는 효과를 보였다. 따라서 이소플라본이 지질대사에 미치는 영향과 항산화작용기전에 대한 보다 심층적인 연구가 이루어져야 할 것이며, 보다 많은 전립선암 환자를 대상으로 이소플라본 섭취에 따른 장기적인 임상실험연구가 이루어져 이소플라본이 전립선암 환자의 삶의 질을 향상시킬 수 있는지에 대한 다각적인 검토가 필요하다고 본다. 중 참가성 , 흥미성, 지속성, 대인관계 4개의 측정항목에서 높은 증가율을 보여 치료효과가 큰 것으로 판단된다. 원예 치료 실시 후의 자체설문지 평가결과 원예 활동을 통해서 달라진 점은 개인적으로 가족, 이웃 간의 긍정적인 변화를 이끌어내고 있다는 것을 발견할 수 있었고 다양한 원예프로그램이 인상깊었다고 하였으며 다음진행에 추가적으로 야외에서 진행할 프로그램에 대한 욕구가 표출되었다. 이것을 통해 개인적 치료경험과 가족, 이웃 간의 지지망 형성이 중요하며 긍정적인 영향을 주었다는 것을 볼 수 있었다. 또한 다양한 원예치료프로그램의 적용과 야외 활동을 조화롭게 적용한다면 성공적인 프로그램 진행에 도움을 될 것으로 판단된다. 이상의 결과를 종합하면 정신지체장애인에게 원예치료 프로그램을 실시한 이후에 원예에 대한 관심이 높고 자아존중 감이 향상되었으며 원예치료 프로그램에 대한 높은 만족도를 보였고 원예치료에 대한 참가성, 흥미성, 지속성, 대인관계성에서 높은 증가율을 보여 치료프로그램의 개입이 유의미한 효과가 있는 것으로 나타났다. 이러한 결과들 볼 때 의도적인 원예치료활동을 통해서 심신의 치료를 경험하$\infty$I 자존감이 향상되며 회원 상호관계를 통한 사회부적응문제를 치료하여 사회성이 향상될 것이라는 목표에 대한 높은 달성정도를 볼 수 있다. 또한 지속적이고 흥미를 유발하는 원예치 료 프로그램을 적용한다면 심리적, 신체적, 정서적 치료효과가 높은 향상을 보이고 자신감과
https://doi.org/10.3745/KIPSTC.2003.10C.5.625 인용 PDF KSCI

오운선수작위엄고대언인영득금패(奥运选手作为广告代言人赢得金牌), 비새중화비새후적고표개격상양(比赛中和比赛后的股票价格上扬) (Olympic Advertisers Win Gold, Experience Stock Price Gains During and After the Games)

Tomovick, Chuck;Yelkur, Rama
- 마케팅과학연구
- /
- 제20권1호
- /
- pp.80-88
- /
- 2010
相当多的调查目的是为了证明股东资产值和一些市场战略之间的关系. 之前的研究包括关于股票价格表现和广告之间的关系, 顾客服务学, 新产品介绍, 研究与开发, 名人转让, 品牌感知, 品牌价值评估, 公司名称变化, 以及运动相关的赞助者地位. 另一个据调查可以对股东资产值产生影响的因素是内含特殊体育事件的电视广告, 例如超级杯. 调查指出以超级杯为题材做了广告的公司股票价值都有所提升. 报告给出广告投资和股东价值提升之间的关系, 作为既普通又特殊的事件, 令人吃惊的是调查关注的奥林匹克运动会的相关广告投资以及之后的效果对股东价值的影响效果较小. 然而调查结果显示奥林匹克运动会的主办地却备受关注, 另外所受关注的是赛事的电视广播进行期间广告的财政稳固. 著名的包括Peters (2008), Pfanner (2008), Saini (2008), and KellerFay Group (2009). 这篇论文提出了有关在2000, 2004以及2008年夏季奥林匹克运动会期间在美国国家广播中进行过电视广告宣传的客户的研究.以下为所验证的五个假设: 假设一: 2008, 2004和2000年在美国电视广播中播放奥运广告的公司股票价格在同期比斯坦普500股票价格指数表现要好. 假设二: 奥运相关股票价格比斯坦普500股票价格指数在整个广告播放期间都表现的更好, 播放期间是指从奥运开始前的周一到当年年底. 假设三: 奥运相关股票价格比斯坦普500股票价格指数长期都表现的更好, 长期是指从奥运开始前的周一第二年的年中. 假设四: 在没有奥运会的期间, 奥运相关股票价格和斯坦普500股票价格指数间没有明显差异. 假设五: 在美国电视广播中播放奥运广告的公司的当年年报比其他非奥运年份要好. 本研究记录在过去三届奥运会期间做广告公司的股票价格(北京奥运, 雅典好运, 悉尼奥运). 我们通过Google和电视网络(例如NBC)来确定这些广告. NBC在过去的三届奥运会获得了在美国转播权. 我们使用互联网来确定这些做过广告的品牌的母公司. 股票价格是通过使用Yahoo财经频道来获得的. 本文所使用的所有的信息都是被公开的信息. 总共有117个奥运广告在2008, 2004和2000年在美国播放. 细节可以从图例1中获得. 结果表明这些奥运相关股票在奥运期间以及奥运前期比斯坦普500股票价格指数表现要好. 相同的结果也可以在奥运开始以后到当年年底, 以及之后半年的记录中获得. 价格压力, 信号理论, 高收视率, 以及企业的刺激战略都对这一个结果有着贡献. 论文最后为广告商和研究者提出了建议并对以后的研究提出了方向.

이동 컴퓨팅 환경에서 멀티미디어 트래픽의 효율적 지원을 위한 대역폭 예약 및 호 수락 제어 메커니즘 (Bandwidth Reservation and Call Admission Control Mechanisms for Efficient Support of Multimedia Traffic in Mobile Computing Environments)

최창호;김성조
- 한국정보과학회논문지:정보통신
- /
- 제29권6호
- /
- pp.595-612
- /
- 2002
이동 컴퓨팅에서 고 수준의 QoS를 보장하기 위한 가장 중요한 이슈 중의 하나가 셀에서 가용할 수 있는 대역폭의 부족으로 인한 핸드-오프 종료를 감소시키는 것이다. 각 셀은 핸드-오프 호들을 위해 이웃 셀들에게 대역폭 예약을 요청하며, 예약된 대역폭은 신규 호가 아닌 핸드-오프 호들을 위해 사용된다. 핸드-오프 호를 위해 대역폭을 너무 많이 예약한다면 신규 호의 블록킹 확률이 증가하므로, 예약할 대역폭의 크기를 정확히 결정하는 것이 중요하다. 따라서, 이동 컴퓨팅 환경에서 적절한 크기의 대역폭 예약과 호 수락 제어를 통해 QoS 보장하는 것이 필수적이다. 본 논문에서는 이동 컴퓨팅 환경에서 멀티미디어 트래픽에게 지속적인 QoS를 보장하기 위해 대역폭 예약과 호 수락 제어 메커니즘을 제안하였다. 본 논문은 적절한 크기의 대역폭 예약을 위해 이동성 그래프와 2-계층 셀 구조를 기반으로 한 적응적 대역폭 예약을 제안한다. 전자는 클라이언트가 다음에 이동할 셀을 예측하는 반면, 후자는 핸드-오프 확률이 높은 클라이언트에게만 적응적 대역폭 예약 메커니즘을 적용한다. 본 논문은 클라이언트의 현재 셀과 PNC(Predicted Next Cell)에 호 수락 테스트를 수행하는 호 수락 제어를 제안하며, 이 메커니즘은 계산 및 네트워크 오버헤드를 줄일 수 있다. 본 논문에서 제시된 대역폭 예약 및 호 수락 제어 메커니즘의 성능을 평가하기 위해, 신규 호 블록킹률, 핸드-오프 호 종료율, 대역폭 이용율을 측정하였다. 시뮬레이션 결과, 본 논문의 호 수락 제어 메커니즘의 성능이 NR-CAT2, FR-CAT2, AR-CAT2와 같은 기존의 메커니즘들보다 우수함을 알 수 있었다.
PDF KSCI

지진하중을 받는 I형 곡선거더 단경간 교량의 대리모델 기반 전역 민감도 분석 (Surrogate Model-Based Global Sensitivity Analysis of an I-Shape Curved Steel Girder Bridge under Seismic Loads)

전준태;손호영;주부석
- 한국재난정보학회 논문집
- /
- 제19권4호
- /
- pp.976-983
- /
- 2023
연구목적: 지진하중을 받는 교량 구조물의 동적 거동은 지진파의 특성 혹은 재료 및 기하학적 특성과 같은 많은 불확실성에 영향을 받는다. 하지만 모든 불확실성 인자가 교량 구조물의 동적 거동에 중요한 영향을 미치진 않는다. 영향성이 낮은 불확실성 인자까지 고려한 확률론적 내진성능 평가는 많은 계산비용이 요구되기 때문에 교량의 동적 거동에 미치는 영향을 고려하여 불확실성 인자는 식별되어야 한다. 따라서 본 연구는 I형 곡선 거더를 갖는 단경간 교량의 동적 거동에 영향을 미치는 주요 매개변수를 식별하기 위해 전역민감도 분석을 수행하였다. 연구방법: 지진파의 불확실성과 곡선 교량의 재료 및 기하학적 불확실성을 고려하여 유한요소 해석을 수행하였으며 해석결과를 기반으로 대리모델을 작성하였다. 결정계수와 같은 성능평가지료를 이용하여 대리모델을 평가하였으며 최종적으로 대리모델 기반의 전역 민감도 분석을 수행하였다. 연구결과: 지진하중을 받는 I형 곡선 거더의 응력응답에 가장 큰 영향을 미치는 불확실성 인자는 최대지반가속도(PGA), 교각의 높이(h), 강재의 항복응력(fy) 순으로 나타났다. PGA, h, fy의 주효과 민감도 지수는 각각 0.7096, 0.0839, 0.0352로 나타났으며 총 민감도 지수는 각각 0.9459, 0.1297, 0.0678로 나타났다. 결론: I형 곡선 거더의 응력응답은 입력운동의 불확실성에 대한 영향성이 지배적이며 각 불확실성 인자 사이의 교호작용에 큰 영향을 받는다. 따라서 입력운동의 개수 및 intensity measure과 같은 입력운동의 불확실성에 대한 추가적인 민감도 분석과 곡선거더의 개수 및 곡률과 같은 구조적 불확실성까지 고려한 총 민감도 분석은 필요하다.
https://doi.org/10.15683/kosdi.2023.12.31.976 인용 PDF HTML

이물 객체 탐지 성능 개선을 위한 딥러닝 네트워크 기반 저품질 영상 개선 기법 개발 (Development of deep learning network based low-quality image enhancement techniques for improving foreign object detection performance)

엄기열;민병석
- 인터넷정보학회논문지
- /
- 제25권1호
- /
- pp.99-107
- /
- 2024
경제성장과 산업 발전에 따라 반도체 제품부터 SMT 제품, 전기 배터리 제품에 이르기 까지 많은 전자통신 부품들의 제조과정에서 발생하는 철, 알루미늄, 플라스틱 등의 이물질로 인해 제품이 제대로 동작하지 않거나, 전기 배터리의 경우 화재를 발생하는 문제까지 심각한 문제로 이어질 가능성이 있다. 이러한 문제를 해결하기 위해 초음파나 X-ray를 이용한 비파괴 방법으로 제품 내부에 이물질이 있는지 판단하여 문제의 발생을 차단하고 있으나, X-ray 영상을 취득하여 이물질이 있는지 판정하는 데에도 여러 한계점이 존재한다. 특히. 크기가 작거나 밀도가 낮은 이물질들은 X-Ray장비로 촬영을 하여도 보이지 않는 문제점이 있고, 잡음 등으로 인해 이물들이 잘 안 보이는 경우가 있으며, 특히 높은 생산성을 가지기 위해서는 빠른 검사속도가 필요한데, 이 경우 X-ray 촬영시간이 짧아지게 되면 신호 대비 잡음비율(SNR)이 낮아지면서 이물 탐지 성능이 크게 저하되는 문제를 가진다. 따라서, 본 논문에서는 저화질로 인해 이물질을 탐지하기 어려운 한계를 극복하기 위한 5단계 방안을 제안한다. 첫번째로, Global 히스토그램 최적화를 통해 X-Ray영상의 대비를 향상시키고, 두 번째로 고주파 영역 신호의 구분력을 강화하기 위하여 Local contrast기법을 적용하며, 세 번째로 Edge 선명도 향상을 위해 Unsharp masking을 통해 경계선을 강화하여 객체가 잘 구분되도록 한다, 네 번째로, 잡음 제거 및 영상향상을 위해 Resdual Dense Block(RDB)의 초고해상화 방법을 제안하며, 마지막으로 Yolov5 알고리즘을 이용하여 이물질을 학습한 후 탐지한다. 본 연구에서 제안하는 방식을 이용하여 실험한 결과, 저밀도 영상 대비 정밀도 등의 평가기준에서 10%이상의 성능이 향상된다.
https://doi.org/10.7472/jksii.2024.25.1.99 인용 PDF HTML

검색결과 764건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)